Лингвофорум

Лингвоблоги => Личные блоги => Блоги => Hellerick => Тема начата: Hellerick от сентября 22, 2012, 13:11

Название: Наиболее оптимальная русская цифровица
Отправлено: Hellerick от сентября 22, 2012, 13:11
Пока некоторые несознательные товарищи бурлят про смену кириллического шила на латинское мыло, я озаботился о применении к русскому языку подлинно универсального письма — символов так.наз. «арабских цифр».

Подходим научно. Статистически.

Букв/Звуков/Фонем в русском языке много, цифр мало. Надо хоть немного уменьшить их количество.

Практического смысла в различии Й/Ъ/Ь нет, объединим их и обозначим, например, апострофом. Пусть тот же символ будет обозначать смягчение перед непередними гласными, и его отсутствие перед непередними. Т.е. Ё='О, Ы='И, Э='Е, Ю='У, Я='А. Двойной апостроф, таким образом, обозначит звук [й] перед гласными: бельё = бел''о и т.п.

Используем некоторые стандартные приемы латиниц: упростим двойные согласные, расщепим Ц=ТС и Щ=СЧ, отменим мягкие знаки после шипящих, упростим ТСЯ/ТЬСЯ и т.п.

Осталось 24 символа (включая апостроф). Восемь самых распространенных (', А, Е, И, Н, О, С, Т) обозначим одной цифрой (от 0 до 7); оставшиеся две цифры (8 и 9) объявим диакритическими, которые в сочетании с прочими цифрами позволяют кодировать менее распространенные символы.

Осталось четыре неиспользованных кода (88, 89, 98 и 99). Можно использовать их для самых распространенных буквосочетаний (например так: АЛ=88, КО=89, ПО=98, РО=99; имеет смысл рассматривать только сочетания, которые не состоят из «одноциферных букв»). Но, пожалуй, лучше их вообще не использвать — т.к. использование цифр 8 и 9 в недиакритической функции затрудняет парсинг текста.

Итак, таблица:


'0
А1
Е2
И3
Н4
О5
С6
Т7
   
Б80
В81
Г82
Д83
Ж84
З85
К86
Л87
   
М90
П91
Р92
У93
Ф94
Х95
Ч96
Ш97

Пример текста:


Владельца постоялого двора можно было понять: если и вправду к полудню разыграется трёхдневная метель, то было бы глупо лишаться единственного богатого постояльца. Новые путники за это время вряд ли прибудут, а этот, ежели останется на днёвку, уже никуда не денется. Потому и не жалел трактирщик красноречия, обещая господину путешественнику настоящую горскую кухню («Вепрятина с грибами, милорд! Последние в этом году свежие грибы и первый вепрь, затравленный по пороше! Такое попробовать – сегодня или никогда!») и вино урожая двадцать восьмого года («Бочку уже выкапывают!»).

81871832870761 91567501875825 83815921 9058445 8003875 91540170: 26873 3 8191921818393 86 9158793834093 92185038292127601 79205958342814101 90272870, 75 8003875 8003 828793915 87397170601 283346781245825 80582175825 91567501870761. 4581032 9193743863 851 0275 819229001 81920183 873 91923809383937, 1 02757, 2842873 5671427601 41 83405818693, 93842 438693831 42 832427601. 915759093 3 42 84187287 7921867392696386 8692164592296301, 5802696101 8256915833493 91937297267812438693 416750169693093 8259268693093 8693954093 (8129192017341 6 82923801903, 9038759283! 915687283432 81 027590 8258393 68128432 829238003 3 9129281030 81291920, 8517921818724030 915 915925972! 718652 9159192580581170  6282583401 3873 4386582831!) 3 81345 9392584101 838118376170 81560905825 825831 (805968693 93842 810386191038110937!).

В среднем, по сравнению с кириллическим, число символов в тексте увеличивается на 37%. Я думаю, это вполне приемлемая цена за неоспоримый достигнутый прорыв в коммуникационной универсальности.

Следующий шаг — замена знаков препинания арифметическими действиями.
Название: Наиболее оптимальная русская цифровица
Отправлено: Artiemij от сентября 22, 2012, 13:29
0001010000110100000010100110010011110100000001100000000011000100000001010010100100100000110000010011110010100001100
0000000000110000000101000111010100111000010101010000000100100000010010010000000011010101010110010110100001010010010
0000101100100011000111000000000111101010100100000111101110100000001111101010000101001000101000000110101010100111000
0110010010011101100011 :donno:
Название: Наиболее оптимальная русская цифровица
Отправлено: arseniiv от сентября 22, 2012, 18:10
952878729292386, 26965!
Название: Наиболее оптимальная русская цифровица
Отправлено: Hellerick от сентября 22, 2012, 18:17
Цитата: Hellerick от сентября 22, 2012, 13:11
939192567390 8381504032 658287164032,

1 8103 42 75870865 42 9391925673873, 45 26965 3 873974093093 835801813873.
Название: Наиболее оптимальная русская цифровица
Отправлено: Валентин Н от сентября 22, 2012, 21:53
Цитата: http://lingvoforum.net/index.php?action=profile;u=2733296371093/9139793 915-148287306863, 96371093 915-4290276863, 3691146863 3 915927938218706863. 8058722-902422 91543901093 870938050 82292901468630, 925901468630 3873 68718101468630 01850386. 9557287560 8003 91583417592270 81 863710686590.
Название: Наиболее оптимальная русская цифровица
Отправлено: Валентин Н от сентября 23, 2012, 14:19
9528787292386, 1 9159629093 41835 696 9218580381170 41 696‽ 812830 0275 96 41835 9218580370 41 7696 3873 831842 70696.
Название: Наиболее оптимальная русская цифровица
Отправлено: Валентин Н от сентября 23, 2012, 19:23
86186 9042 418352875, 9675 902401 91567501445 81 9162818393 81039228510937, 91925675 802637, 80938393 9017292370601 41 90583292167939293 — 82181-82181-82181
Название: Наиболее оптимальная русская цифровица
Отправлено: Валентин Н от сентября 23, 2012, 19:24
Цитата: Валентин Н от сентября 23, 2012, 14:19
9528787292386, 1 9159629093 41835 696 9218580381170 41 696‽ 812830 0275 96 41835 9218580370 41 7696 3873 831842 70696.
191
Название: Наиболее оптимальная русская цифровица
Отправлено: Hellerick от сентября 23, 2012, 19:46
Цитата: Валентин Н от сентября 23, 2012, 14:19
9528787292386, 1 9159629093 41835 696 9218580381170 41 696‽ 812830 0275 96 41835 9218580370 41 7696 3873 831842 70696.

42 91540187 875823863.
Название: Наиболее оптимальная русская цифровица
Отправлено: Валентин Н от сентября 23, 2012, 21:14
Цитата: Hellerick от сентября 23, 2012, 19:46
42 91540187 875823863.
493 76 0275 19492386171 3 8103 205 92185875843873 41 6567181870109369632 7 3 6, 7186 96 0275 75842 19492386171 7 3 696, 1 8157 696 86186 92185 919256750 85819386, 85196290 2825 921686871830381170?
Название: Наиболее оптимальная русская цифровица
Отправлено: Валентин Н от апреля 6, 2014, 21:21
Тальнемер вспомнил про треугольницу, а я вот тоже вспомнил :dayatakoy:
Название: Наиболее оптимальная русская цифровица
Отправлено: Тайльнемер от мая 8, 2014, 05:25
Цитата: Hellerick от сентября 22, 2012, 13:11
Можно использовать их для самых распространенных буквосочетаний (например так: АЛ=88, КО=89, ПО=98, РО=99; имеет смысл рассматривать только сочетания, которые не состоят из «одноциферных букв»).
А по какому принципу вы выбрали эти сочетания?
Это просто самые часто встречающиеся двубуквенные сочетания, в которых хотя бы одна буква неодноциферная, или с учётом количества сэкономленных цифр.
Например, здесь (http://dict.ruslang.ru/freq.php?act=show&dic=freq_2letters&title=%D7%E0%F1%F2%EE%F2%ED%EE%F1%F2%FC%20%E4%E2%F3%E1%F3%EA%E2%E5%ED%ED%FB%F5%20%F1%EE%F7%E5%F2%E0%ED%E8%E9) (я скопировал эти данные в гугл-докс (https://docs.google.com/spreadsheets/d/1RRf5NIF1d0k9VonrByQXfUGu3tO41rYFu6gmg75IlSg/edit?usp=sharing)) сочетание пр имеет чуть бо́льшую частоту, чем ал, при этом ещё экономятся целых две цифры.
Название: Наиболее оптимальная русская цифровица
Отправлено: Hellerick от мая 8, 2014, 06:01
Цитата: Тайльнемер от мая  8, 2014, 05:25
Это просто самые часто встречающиеся двубуквенные сочетания, в которых хотя бы одна буква неодноциферная,

По-моему, так.

Но я не стал развивать эту идею, решив, что для читабельности текста лучше оставить за восьмеркой и девяткой исключительно «диакритическую» функцию.