Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Советские кириллицы в 8-битных кодировках

Автор Python, февраля 11, 2013, 19:04

0 Пользователи и 1 гость просматривают эту тему.

Python

Возможно, основная причина постсоветской латинизации письменностей народов бывшего СССР — не идеологический «цивилизационный выбор», а вполне осязаемые технические проблемы, связанные с испольованием кириллиц — имею в виду проблему кодировок. И если для русского языка ситуация выглядит вполне нормальной, а украинский и белорусский периодически сталкиваются с частичной несовместимостью некоторых распространенных кодировок с их алфавитами, то для неславян ситуация выглядит куда более сложно. Да, конечно, Юникод существует, и это делает проблему кодировок менее актуальной, чем 10-20 лет назад, но старый софт, работающий с 8-битными кодировками, используется до сих пор. Так, любая современня Windows 7 или 8 поставляется с устаревшей реализацией командной строки, в которой полноценная работа с современными кодировками невозможна. Несмотря на распространенность utf-8, восьмибитные кодировки (преимущественно koi8 и windows-1251) продолжают использоваться в электронной почте. И т.д., и т.п.

Хотелось бы разобраться, как проблема 8-битных символьных кодировок была решена для разных языков бывшего СССР, и была ли решена вообще, например, для языков народов РФ. Какие распространенные кодировки здесь существуют?
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

Wolliger Mensch

Цитата: Python от февраля 11, 2013, 19:04
...но старый софт, работающий с 8-битными кодировками, используется до сих пор. Так, любая современня Windows 7 или 8 поставляется с устаревшей реализацией командной строки, в которой полноценная работа с современными кодировками невозможна.

Вы читали про чувашскую комиссию и про латинские буквы в чувашском компьютерном наборе? И это сейчас. А что говорить про двадцать лет взад. Нет, указанные вами причины никак не могли повлиять. Перевод на латиницу был связан с политическими причинами.
«Вот интересно, каких лингвистических жемчуг можно найти в море отодвинутых книг», Ян Гавлиш.
«Впредь прошу помнить, что придумал игру не для любых ассоциаций, а для семантически оправданных. Например, чтó это такое: ,,рулетке" — ,,выпечке"?? Тем более, что сей ляпсус я сам совершил...», Марбол
«Ветхий Завет написан на иврите и частично на армейском», Vesle Anne
«МЛ(ять)КО ... ПЛ(ять)NЪ», Тася
«Вот откроет этот спойлер, например, Марго, ничего не подозревая, а потом будут по всему форуму блюющие смайлики...», Авал
«Томан приличный мужчина. Правда по патриархальным меркам слегка голодранец», Vesle Anne
«Возможен ли фонетический переход "ж" в "п с придыханием"», forest

Python

Латинские доп. буквы в кириллическом тексте стали доступны с распространением юникодицы. 15 лет назад такое комбинирование было возможно лишь в «продвинутых» форматах типа .doc — обычные же текстовые редакторы тогда еще не знали utf-8. Почта — тоже только 8-битная, с регулярным «неугадыванием» кодировки.

Если чуваш пишет электронное письмо на чувашском, то как он выкручивается? Ставит обычные русские буквы на месте похожих чувашских? Или, может, отдельные чувашские программисты пытались как-то решить эту проблему?..
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

Python

Википедия упоминает две казахские кодировки:
Цитировать
CT PK 920-91 for DOS (a modification of code page 866)
CT PK 1048—2002 for Windows (a modification of code page 1251)
Большинство сайтов, где упоминаются эти кодировки, — либо викизеркала, либо вопросы без ответов :(
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

Hellerick

Я в Лингвовики опубликовал описание татарской кодировки. Она основана на windows-1251, но югославские буквы в ней заменены татарскими. В свое время попадался словарь, написанный в этой кодировке. Кажется она была весьма распространена в 90-е, и, разумеется, требовала специальных татарских шрифтов.

Python

Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

Timiriliyev

Для якутского существовало то, что назвали "псевдо".

ЦитироватьУрут сахалыы буукубалар туспа куодтара суох этэ. Ол итэҕэһи суох гынаары биһиги уолаттарбыт элбэхтик туттуллубат си-бэлиэлэр (символлар) куодтарыгар саха буукубаларын "баайан" биэрбиттэрэ. Оннук хас да ньыма үөскээбитэ.

ЦитироватьРаньше у якутских букв не было отдельных кодов. Чтобы устранить эту проблему, наши ребята "привязали" к кодам редко используемых символов якутские буквы. Так возникло несколько методов письма.

Разумеется, использовался палёный шрифт, который эту кодировку "поддерживает". Здесь, на ЛФ, в 2004 году в теме про якутский язык обсуждали подобное.

ЦитироватьНеправильные кодировки - это всякого рода модификации устаревших однобайтовых (восьмибитных) кодировок, типа cp1251 или Latin-1. Подобные pseudo-кодировки не поддерживаются, да и не поддерживались никогда, большинством компьютерных программ.
Правда — это то, что правда для Вас.

Geoalex

Цитата: Timiriliev от июля 28, 2013, 19:26
Для якутского существовало то, что назвали "псевдо".

ЦитироватьУрут сахалыы буукубалар туспа куодтара суох этэ. Ол итэҕэһи суох гынаары биһиги уолаттарбыт элбэхтик туттуллубат си-бэлиэлэр (символлар) куодтарыгар саха буукубаларын "баайан" биэрбиттэрэ. Оннук хас да ньыма үөскээбитэ.

ЦитироватьРаньше у якутских букв не было отдельных кодов. Чтобы устранить эту проблему, наши ребята "привязали" к кодам редко используемых символов якутские буквы. Так возникло несколько методов письма.

Разумеется, использовался палёный шрифт, который эту кодировку "поддерживает". Здесь, на ЛФ, в 2004 году в теме про якутский язык обсуждали подобное.

ЦитироватьНеправильные кодировки - это всякого рода модификации устаревших однобайтовых (восьмибитных) кодировок, типа cp1251 или Latin-1. Подобные pseudo-кодировки не поддерживаются, да и не поддерживались никогда, большинством компьютерных программ.

Помню, были в стародавние времена забавные якутские сайты, где вместо ҕ писали 5, а вместо ө - 8.  :)

Timiriliyev

Цитата: Geoalex от июля 28, 2013, 19:43
Помню, были в стародавние времена забавные якутские сайты, где вместо ҕ писали 5, а вместо ө - 8.  :)
Это не стародавние времена, это всё ещё суровая реальность.
Правда — это то, что правда для Вас.

Red Khan

Очень-очень давно, для того чтобы смотреть татарские страницы в интернете нужно было устанавливать специальный шрифт. Пример такой страницы можно найти здесь.

Red Khan

Цитата: Wolliger Mensch от февраля 11, 2013, 19:56
Цитата: Python от февраля 11, 2013, 19:04
...но старый софт, работающий с 8-битными кодировками, используется до сих пор. Так, любая современня Windows 7 или 8 поставляется с устаревшей реализацией командной строки, в которой полноценная работа с современными кодировками невозможна.

Вы читали про чувашскую комиссию и про латинские буквы в чувашском компьютерном наборе? И это сейчас. А что говорить про двадцать лет взад. Нет, указанные вами причины никак не могли повлиять. Перевод на латиницу был связан с политическими причинами.
А разве чуваши переходили на латиницу?  :???

Geoalex

Цитата: Red Khan от июля 28, 2013, 20:12
Вы читали про чувашскую комиссию и про латинские буквы в чувашском компьютерном наборе? И это сейчас. А что говорить про двадцать лет взад. Нет, указанные вами причины никак не могли повлиять. Перевод на латиницу был связан с политическими причинами.
А разве чуваши переходили на латиницу?  :???
[/quote]

Нет, просто было официально рекомендовано при компьютерном наборе чувашских текстов использовать не кириллические буквы ӑ ӗ ҫ ӳ, а латинские ă ĕ ç ÿ.

Karakurt

Мягко-твердые знаки вместо ӑ ӗ, щ вместо ҫ - почему бы не сделать?

Timiriliyev

Правда — это то, что правда для Вас.

Geoalex

Цитата: Karakurt от июля 28, 2013, 20:26
Мягко-твердые знаки вместо ӑ ӗ, щ вместо ҫ - почему бы не сделать?

Зачем уродовать свою историческую письменность?


Python

Если просто отбросить диакритики, чувашский текст можно будет прочитать?
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр