Submitted by ogi on Wed, 2004-10-13 12:22    
  
  Като предварителна стъпка в прехода към WordPress 1.2, реших да си оправя базата данни на WordPress. Проблемът беше с едни стари остатъци, които трябва да се превърнат в Уникод. За разлика от Йовко обаче, става въпрос за неща като К. Нямаше как без скрипт, и в случая избрах Perl като царя на механизираната текстообработка. Не можах да го натикам в един регулярен израз всичко, но и така е добре ;-) Нужен е Perl 5.8.
#!/usr/bin/perl
binmode( STDIN, ":utf8" );
binmode( STDOUT, ":utf8" );
while (<>) {
        while (/(&#([0-9]+);)/) {
                my $c = pack("U", $2);
                s/$1/$c/g;
        }
        print;
}
Comments
(без заглавие)
Впоследствие се оказа, че е нужна една корекция. Кодовете по-малки от 256 по-добре въобще да не се преобразуват.