Интернет и алфавиты языков России

В настоящее время подавляющее большинство народов России пользуется письменностями на основе русского алфавита. Некоторые языки приняли русский алфавит в неизмененном виде, но в большинстве случаев к нему добавлен ряд дополнительных и диакритизированных букв. В целом их количество в языках бывшего СССР достигает 70.

Кириллические кодировки, используемые в Интернете (КОИ8, Windows CP 1251 и другие), были созданы на основе латинского и русского алфавитов. Впоследствии к ним были добавлены специальные буквы украинского, белорусского, сербского и македонского языков. Потребностями таких крупных народов, как, например, азербайджанцы, казахи или узбеки, составители стандартов, похоже, не интересовались - хотя бы потому, что на кодовых страницах уже не осталось свободных мест для новых дополнительных букв.

В результате многие народы с письменностями на русской основе были оставлены на волю судьбы - вернее, коммерческих фирм и народных умельцев, которые принялись создавать компютерные шрифты для отдельных языков. В таком подходе много отрицательных сторон. Создание качественных шрифтов требует профессиональных навыков, большого труда и немалых денег. Национальные шрифты чаще всего намного уступают по качеству от, допустим, бесплатно распространяемых майкрософтовских шрифтов. Крупные фирмы не заитересованы в изготовлении богатого выбора шрифтов для относительно малочисленных и малоплатежоспособных клиентов. К тому же, из-за отсутствия даже национальных стандартов, кодировки шрифтов получаются различными. Например, в одном казахском шрифте маленькая буква перевернутое "е" занимает позицию 128, в другом 132, в третьем 157, в четвертом 184 и так далее. Текст, набранный первым шрифтом, не может быть прочитан или распечатан вторым, третим или четвертым. Для каждого шрифта требуются отдельные раскладки клавиатуры. Шрифтовые проблемы задерживают создание систем для проверки правописания, компютерных словарей, веб-сайтов на национальных языках. Таким образом, отсутствие стандартизации наносит прямой вред функциональному развитию языков России и СНГ.

Для решения проблемы национальных алфавитов существует несколько вариантов. Наиболее перспективным из них представляется Unicode - международный стандарт, поддерживающий все существующие системы письма - в том числе алфавиты почти всех языков России. В кириллической части стандарта Unicode 3.0 пока отсутствуют дополнительные буквы лишь некоторых языков Севера и Дальнего Востока. Во время написания этих строк (декабрь 2000 г.), однако, для большинства из нас Unicode остается делом будущего. Операционные системы Windows 95 и 98, например, поддерживают Unicode лишь на уровне кодовых страниц, и для этих платформ имеются немногие собственно юникодовые программы и шрифты с необходимыми дополнительными буквами.

Другой вариант - создание альтернативных многоязычных кириллических кодировок для отдельных платформ (прежде всего речь идет об операционных системах Windows и Mackintosh). Примером такой кодировки является Cyrillic Asian, разработанная фирмой Paratype. В ней представлены дополнительные буквы языков Центральной Азии, Казахстана, Азербайджана и некоторых республик Российской федерации. Дополнительные буквы этой кодировки занимают юникодовые позиции специальных букв украинского, сербского и других языков, а также некоторых малоупотребительных математических и других символов. Таким образом, Cyrillic Asian заменяет стандартную кириллическую кодировку и может быть признана лишь временным решением проблемы. Автором этой заметки предложена такая же система для ряда уральских языков.

К числу временных решений мы должны также отнести создание национальных стандартов. Пока единствнным примером является татарская кодировка, утвержденная постановлением кабинета министров Республики Татарстан в 1996 г. Для нее существуют свободно распространяемые раскладки клавиатуры и шрифты, в которых татарские буквы заменяют специальные буквы сербского и македонского языков. С технической точки зрения такое решение признается вполне удовлетворительным. Конечно же, условием создания национальных стандартов является заинтересованность местных властей. Отсутствие таковых в других республиках свидетельствует о той заботе, которую их руководители проявляют к родным языкам.

Из-за технических проблем или по своей ленивости многие до сих пор пользуются латинской транскрипцией, особенно в электронной почте. Это касается не только национальных языков, но и великого и могучего. На латинице созданы веб-сайты, например, на башкирском, осетинском, татарском языках. Каждый автор пользуется своей собственной транскрипцией, и в результате возникает большая путаница.

С начала 1990-х гг. некоторые бывшие советские республики (Азербайджан, Молдавия, Туркменистан, Узбекистан) официально перешли на латинское письмо. В 1992 г. был принят чеченский алфавит на латинской основе, с осени 2000 г. на латиницу переходит Татарстан. Одной из причин введения латинского письма называется необходимость вхождения этих народов в мировое информационное пространство. При этом игнорируются трудности, связанные с заменой алфавитов, и тот факт, что латиница сама по себе не имеет существенных преимуществ по сравнению с кириллицей. С точки зрения Интернета удобность новых национальных алфавитов на латинской основе полностью зависит от того, поддерживаются ли они существующими стандартными кодировками (Latin 1, Latin 2 и т.д.).

Для прибалтийских стран, например, создана специальная балтийская кодировка. Молдавия с принятием румынского алфавита попала в центрально-европейскую зону (Latin 2). Техническая поддержка этим языкам, в принципе, обеспечена, но с параллельным использованием русского языка возникают некоторые проблемы. Алфавит, принятый в Азербайджане, отличается от турецкого лишь одной буквой, в результате чего азербайджанцы не могут пользоваться стандартными турецкими кодировками (для иллюстрации см. заметку Standardizing Azeri fonts в журнале Azerbaijan international). Такие же технические проблемы возникли в Узбекистане, где первоначально был утвержден алфавит с множеством дополнительных букв. Впоследствии узбеки отбросили все специальные буквы - решение, которое напоминает худшие времена насильственного перевода национальных письменностей с латиницы на русскую графику в конце 1930-х гг. В новом алфавите татарского языка также имеются буквы, которых нет в существующих кодировках, в результате чего многие татары пользуются модифицированным турецким алфавитом в турецкой кодировке. В чеченский алфавит включено 15 дополнительных букв, часть которых, кажется, не представлена даже в стандарте Unicode.

Так, что же делать? Во-первых, давайте не будем портить родные языки. Там, где это возможно, следует пользоваться существующими и официально принятыми алфавитами и орфографиями. Если такой возможности нет, необходимо стремиться к унификации систем практической транскрипции на латинской или русской основе. В этой связи хочется отметить, например, систему кириллической транскрипции казахского языка, предложенную Андреем Сергеевым, которая может применяться и для ряда других тюркских языков. Любопытно, что такая транскрипция почти не отличается от орфографий близкородственных кумыкского и ногайского языков.

Во-вторых, давайте не будем заниматься прожектерством, выдумыванием глобальных решений (да, речь идет о переходе на латиницу), которые, вместо одних проблем, могут привести к созданию целого ряда новых. Необходимо стремиться к стандартизации шрифтов, к созданию национальных и, в идеале, многоязычных (по языковым группам или ареалам) стандартов на основе широко используемых русских кодировок. Но такие решения будут носить лишь временный характер. В перспективе, будем надеяться, проблемы, связанные с кириллическими алфавитами, исчезнут вместе с полным переходом на стандарт Unicode.


Автор проекта [email protected]