Пока некоторые несознательные товарищи бурлят про смену кириллического шила на латинское мыло, я озаботился о применении к русскому языку подлинно универсального письма — символов так.наз. «арабских цифр».
Подходим научно. Статистически.
Букв/Звуков/Фонем в русском языке много, цифр мало. Надо хоть немного уменьшить их количество.
Практического смысла в различии Й/Ъ/Ь нет, объединим их и обозначим, например, апострофом. Пусть тот же символ будет обозначать смягчение перед непередними гласными, и его отсутствие перед непередними. Т.е. Ё='О, Ы='И, Э='Е, Ю='У, Я='А. Двойной апостроф, таким образом, обозначит звук [й] перед гласными:
бельё =
бел''о и т.п.
Используем некоторые стандартные приемы латиниц: упростим двойные согласные, расщепим Ц=ТС и Щ=СЧ, отменим мягкие знаки после шипящих, упростим ТСЯ/ТЬСЯ и т.п.
Осталось 24 символа (включая апостроф). Восемь самых распространенных (', А, Е, И, Н, О, С, Т) обозначим одной цифрой (от 0 до 7); оставшиеся две цифры (8 и 9) объявим диакритическими, которые в сочетании с прочими цифрами позволяют кодировать менее распространенные символы.
Осталось четыре неиспользованных кода (88, 89, 98 и 99). Можно использовать их для самых распространенных буквосочетаний (например так: АЛ=88, КО=89, ПО=98, РО=99; имеет смысл рассматривать только сочетания, которые не состоят из «одноциферных букв»). Но, пожалуй, лучше их вообще не использвать — т.к. использование цифр 8 и 9 в недиакритической функции затрудняет парсинг текста.
Итак, таблица:
Пример текста:
Владельца постоялого двора можно было понять: если и вправду к полудню разыграется трёхдневная метель, то было бы глупо лишаться единственного богатого постояльца. Новые путники за это время вряд ли прибудут, а этот, ежели останется на днёвку, уже никуда не денется. Потому и не жалел трактирщик красноречия, обещая господину путешественнику настоящую горскую кухню («Вепрятина с грибами, милорд! Последние в этом году свежие грибы и первый вепрь, затравленный по пороше! Такое попробовать – сегодня или никогда!») и вино урожая двадцать восьмого года («Бочку уже выкапывают!»).
| 81871832870761 91567501875825 83815921 9058445 8003875 91540170: 26873 3 8191921818393 86 9158793834093 92185038292127601 79205958342814101 90272870, 75 8003875 8003 828793915 87397170601 283346781245825 80582175825 91567501870761. 4581032 9193743863 851 0275 819229001 81920183 873 91923809383937, 1 02757, 2842873 5671427601 41 83405818693, 93842 438693831 42 832427601. 915759093 3 42 84187287 7921867392696386 8692164592296301, 5802696101 8256915833493 91937297267812438693 416750169693093 8259268693093 8693954093 (8129192017341 6 82923801903, 9038759283! 915687283432 81 027590 8258393 68128432 829238003 3 9129281030 81291920, 8517921818724030 915 915925972! 718652 9159192580581170 6282583401 3873 4386582831!) 3 81345 9392584101 838118376170 81560905825 825831 (805968693 93842 810386191038110937!).
|
В среднем, по сравнению с кириллическим, число символов в тексте увеличивается на 37%. Я думаю, это вполне приемлемая цена за неоспоримый достигнутый прорыв в коммуникационной универсальности.
Следующий шаг — замена знаков препинания арифметическими действиями.
0001010000110100000010100110010011110100000001100000000011000100000001010010100100100000110000010011110010100001100
0000000000110000000101000111010100111000010101010000000100100000010010010000000011010101010110010110100001010010010
0000101100100011000111000000000111101010100100000111101110100000001111101010000101001000101000000110101010100111000
0110010010011101100011 :donno:
Цитата: Hellerick от сентября 22, 2012, 13:11
939192567390 8381504032 658287164032,
1 8103 42 75870865 42 9391925673873, 45 26965 3 873974093093 835801813873.
9528787292386, 1 9159629093 41835 696 9218580381170 41 696‽ 812830 0275 96 41835 9218580370 41 7696 3873 831842 70696.
86186 9042 418352875, 9675 902401 91567501445 81 9162818393 81039228510937, 91925675 802637, 80938393 9017292370601 41 90583292167939293 — 82181-82181-82181
Цитата: Hellerick от сентября 23, 2012, 19:46
42 91540187 875823863.
493 76 0275 19492386171 3 8103 205 92185875843873 41 6567181870109369632 7 3 6, 7186 96 0275 75842 19492386171 7 3 696, 1 8157 696 86186 92185 919256750 85819386, 85196290 2825 921686871830381170?
Цитата: Hellerick от сентября 22, 2012, 13:11
Можно использовать их для самых распространенных буквосочетаний (например так: АЛ=88, КО=89, ПО=98, РО=99; имеет смысл рассматривать только сочетания, которые не состоят из «одноциферных букв»).
А по какому принципу вы выбрали эти сочетания?
Это просто самые часто встречающиеся двубуквенные сочетания, в которых хотя бы одна буква неодноциферная, или с учётом количества сэкономленных цифр.
Например, здесь (http://dict.ruslang.ru/freq.php?act=show&dic=freq_2letters&title=%D7%E0%F1%F2%EE%F2%ED%EE%F1%F2%FC%20%E4%E2%F3%E1%F3%EA%E2%E5%ED%ED%FB%F5%20%F1%EE%F7%E5%F2%E0%ED%E8%E9) (я скопировал эти данные в гугл-докс (https://docs.google.com/spreadsheets/d/1RRf5NIF1d0k9VonrByQXfUGu3tO41rYFu6gmg75IlSg/edit?usp=sharing)) сочетание
пр имеет чуть бо́льшую частоту, чем
ал, при этом ещё экономятся целых две цифры.
Цитата: Тайльнемер от мая 8, 2014, 05:25
Это просто самые часто встречающиеся двубуквенные сочетания, в которых хотя бы одна буква неодноциферная,
По-моему, так.
Но я не стал развивать эту идею, решив, что для читабельности текста лучше оставить за восьмеркой и девяткой исключительно «диакритическую» функцию.