You are here

Стандартизирането на българска клавиатура

През "Ново 20":http://novo20.com/ попаднах на "статията на Йовко Ламбрев за проваленото стандартизиране на преработените подредби за БДС и фонетична подредба":http://yovko.net/archives/1518. Преди всичко бях зашеметен, че нещо, което от 2 години се обявява за БДС стандарт, всъщност не е стандарт. Сигурно някъде там в текста е написано, че е проектостандарт, но примерно аз съм останал заблуден.

Иначе по самия проектостандарт разместването на букви и в БДС и фонетичната беше безсмислено и крайно неудобно. На мен в предложения стандарт ми харесваше, че средното тире е част от клавиатурата – както и „българските кавички“, и разбира се удареното И. От последното наистина имаше голяма нужда.

Създателите на предварителния проект имат "своя оценка на отхвърлянето":http://metodii.com/bg_Novina.html. Там ми направи впечатление, че говорят за добавяне на всички ударени гласни към Unicode. Това е неправилно и се надявам да не мине пред Unicode. Причината да има такива съставни знаци в Unicode е, че тях вече ги има в някакво кодиране и така да има съответствие едно към едно с Unicode. Има си комбиниращ знак за ударение, който може да се добави след всяка буква. Това, че има проблеми със софтуера, си е проблем на софтуера.

Обновяване 2009-03-25: "За кирилицата с любов!":http://psabev.blogspot.com/2007/08/blog-post_6656.html на Петър Събев

Comments

Да, разумното надделя в случая, аз също се надявам и със съставните ударения в Уникод да стане така и да не добавят излишни предварително комбинирани символи. А пък случаят с налаганата в момента транслитерация е далеч по-трагичен...

За ``и с ударение'', не става ясно ти за кое си: U+045D (един code point) или комбинация на ``и'' с U+0300 (grave accent)? Или просто ти харесва, че би го имало на клавиатурата?

Удареното И е в Unicode заради някаква кодова таблица на македонците. Според мене във файловете трябва да се използва съставния запис, с добавен комбиниращ знак за ударение. А клавиатурата трябва да има начин за изпращане на ударени гласни, т.е. чрез някакъв модификатор. То и няма място за заделяне на клавиши.

Има една госпожа, която твърди, че не ни е нужно И ударено, защото можело да си пишем Й. Тук попадам на човек, който твърди, че ударените гласни не трябва да влизат в Unicode, защото можело да пишем вместо И ударено, първо едно И и след това символа за ударение. Ами то господине тогава и Й не ни е нужно, защото то се получава като комбинация от символите И и вълничка. Вместо да слагаме на клавиатурата Й може да сложим символа за вълничка и с него да пишем Е с вълничка, М с вълничка и каквото още ни хрумне, но с вълничка разбира се.

Вярно е, че в Unicode съществуват символи модификатори, чрез които можете да сложите вълничка, човка или ударение на произволен символ. Например можете да напишете 100 заградено в кръгче с вълничка и ударение върху него. Наистина може, не се шегувам. Друг е въпроса как това ще се изобрази върху екрана. Всяка програма слага тези модификатори както намери за добре и затова те не се използват практически никъде. Ако видите подобна комбинация в някои текст веднага ще я познаете, защото изглежда ужасно, сякаш аз съм го нарисувал на ръка.

Няма как да оставим на компютрите вместо нас да рисуват И ударено и Й. Тази работа трябва да бъде свършена от художници и тези символи да влезнат в шрифтовете. Разгледайте шрифтовете, които са инсталирани на вашия компютър и ще видите, че както вълничката на Й, така и ударението на И ударено са различни в различните шрифтове. Разгледайте и други символи с ударение и вълничка. Не можете да намерите А ударено и Ъ ударено, защото тях просто ги няма в Unicode и затова няма как да влязат в който и да е шрифт - дори и сам да си го направите, пак не може! Вместо кирилското А ударено вижте латинското, нето го има и присъства в почти всички шрифтове. Много хора се принуждават да пишат латинско А ударено вместо кирилското, както и много хора са принудени да пишат 4 вместо Ч. В действителност тези символи си приличат, ама 4 не е Ч, както и латинското А с ударение не е кирилско то А с ударение.

1. Й е една от 30-те букви на азбуката. И ударено не е отделна буква от азбуката. Unicode се занимава с букви и символи, а не с глифове. Това го знае всеки, който се е интересувал от добавяне в Unicode.

2. Технически комбинацията И + ударение може да се замени с нов глиф, а не да е съчетаване на 2 глифа. Но и да е съчетаване, то винаги може да се направи да изглежда добре (позиционирането на ударението може да е различно за всяка комбинация), изисква се само дизайнерът на шрифта да обърне внимание на това. Това го знае всеки, който се е интересувал от създаване на цифрови шрифтове.

Радвам се, че сте съгласен с мен, че Й трябва да се пише с един символ, а не като И плюс вълничка. Сега за И ударено. Тази буква, не е изброена в българската азбука, но е част от езика и затова за нея има отделен символ. Например във френския език се ползва латинското E с тежко и с остро ударение и затова тези символи са включени в Unicode, макар и да не са част от френската азбука. Подобен е и случаят с Ё. Тази буква не е част от руската азбука, дори тя обикновено не се пише, а се заменя с Е. Въпреки това тази буква е включена в Unicode и не се заменя с Е плюс "две точки отгоре".

Ако И ударено не беше включено в Unicode нямаше да можем да го включим и в стандарта, защото и Windows и Linux за момента не поддържат възможността с натискането на един клавиш да се въведат два символа. Надявам се, че не предлагате да пишем И ударено натискайки за целта последователно И и след това клавиш за ударение?

Трябва ли да се включат в Unicode останалите шест ударени гласни (И и Е ударени вече ги има). Определено да, защото те са част от българския език. Става дума само за 12 Unicode символа (шест малки и шест главни букви). Ако извоюваме включването на тези 12 символа в Unicode, българският език ще стане равноправен на френския и на китайския и ще бъде изцяло поддържан в Unicode. (Всъщност май и китайския не е поддържан изцяло, но там проблемите са по-сериозни.)

Съгласен съм с вас, че проблемите при използването на модифициращите символи са изцяло технически и че един ден, след около сто години тези проблеми ще бъдат решени и тогава ще можем спокойно да пишем Й и И ударено по този начин. Все пак нека погледнем към днешния ден и да потърсим решение, което работи сега. Ние не искаме нищо друго освен - символите които са част от жив език да влезнат в Unicode и то само ако има техническа възможност за това. Действително за китайския няма такава техническа възможност, но за българския има. Ние не искаме да включваме символи, които са извън езика. Например не искаме да добавяме Ж ударено. Ако на някои му хрумне да напише този символ, то той ще трябва да използва за целта вашите любими модификатори.

"...For compatibility with pre-existing standards, there are characters that are equivalently represented either as sequences of code points or as a single code point called a composite character. For example, the i with 2 dots in naïve could be presented either as i + diaeresis (0069 0308) or as the composite character i + diaeresis (00EF)..." - http://www.unicode.org/standard/where/#Duplicates

"...Finally, normalization form NFC (the composed form favored for use on the Web) is frozen—no new letter combinations can be added to it..." - http://www.unicode.org/faq/char_combmark.html#13

По същество гласните с ударения са модификации. Колкото до пълната поддръжка на българския език чрез поддържане на ударения, за това е нужно и участието на създаващите шрифтове, системи за въвеждане на знаци и може би приложения. Тази поддръжка и без друго ще трябва да се направи, ако се добавят ударените гласни в Unicode. Както вече стана ясно, според мен добавянето на нови знаци в Unicode е излишно. Това ще повиши техническите изисквания, където има редактиране на текст, но който иска качествена поддръжка на български език, трябва да използва и качествени инструменти.

Добавянето на ударените гласни определено няма да е лесно. Както личи от цитата, който сте дали, таблицата вече е замразена и който е добавил какво му е било нужно, добре, а който не е, да е.

Тук не обсъждаме дали ще е трудно или лесно това да се направи, а дали е добре да се направи и дали това е нужно за да може пълноценно да се пише на български. Като казвам, да се пише на български имам предвид не само вестници и e-mail писма, но и по-сложни неща, като речници и детски читанки.

Разбира се, трябва да се действа и за това ударените гласни да влезнат в шрифтовете. Поне за И ударено имаме известен напредък, но още сме далеч от нужното ниво на поддръжка. Сега когато напишете И ударено обикновено се появява квадратче или И ударено, но в друг шрифт, което обикновено изглежда ужасно грозно.

User login