Submitted by ogi on Wed, 2004-10-13 12:22
Като предварителна стъпка в прехода към WordPress 1.2, реших да си оправя базата данни на WordPress. Проблемът беше с едни стари остатъци, които трябва да се превърнат в Уникод. За разлика от Йовко обаче, става въпрос за неща като К. Нямаше как без скрипт, и в случая избрах Perl като царя на механизираната текстообработка. Не можах да го натикам в един регулярен израз всичко, но и така е добре ;-) Нужен е Perl 5.8.
#!/usr/bin/perl
binmode( STDIN, ":utf8" );
binmode( STDOUT, ":utf8" );
while (<>) {
while (/(&#([0-9]+);)/) {
my $c = pack("U", $2);
s/$1/$c/g;
}
print;
}
Comments
(без заглавие)
Впоследствие се оказа, че е нужна една корекция. Кодовете по-малки от 256 по-добре въобще да не се преобразуват.