Author Topic: Наиболее оптимальная русская цифровица  (Read 3494 times)

0 Members and 1 Guest are viewing this topic.

Offline Hellerick

  • Blogger
  • *
  • Posts: 27442
  • Gender: Male
Пока некоторые несознательные товарищи бурлят про смену кириллического шила на латинское мыло, я озаботился о применении к русскому языку подлинно универсального письма — символов так.наз. «арабских цифр».

Подходим научно. Статистически.

Букв/Звуков/Фонем в русском языке много, цифр мало. Надо хоть немного уменьшить их количество.

Практического смысла в различии Й/Ъ/Ь нет, объединим их и обозначим, например, апострофом. Пусть тот же символ будет обозначать смягчение перед непередними гласными, и его отсутствие перед непередними. Т.е. Ё='О, Ы='И, Э='Е, Ю='У, Я='А. Двойной апостроф, таким образом, обозначит звук [й] перед гласными: бельё = бел''о и т.п.

Используем некоторые стандартные приемы латиниц: упростим двойные согласные, расщепим Ц=ТС и Щ=СЧ, отменим мягкие знаки после шипящих, упростим ТСЯ/ТЬСЯ и т.п.

Осталось 24 символа (включая апостроф). Восемь самых распространенных (', А, Е, И, Н, О, С, Т) обозначим одной цифрой (от 0 до 7); оставшиеся две цифры (8 и 9) объявим диакритическими, которые в сочетании с прочими цифрами позволяют кодировать менее распространенные символы.

Осталось четыре неиспользованных кода (88, 89, 98 и 99). Можно использовать их для самых распространенных буквосочетаний (например так: АЛ=88, КО=89, ПО=98, РО=99; имеет смысл рассматривать только сочетания, которые не состоят из «одноциферных букв»). Но, пожалуй, лучше их вообще не использвать — т.к. использование цифр 8 и 9 в недиакритической функции затрудняет парсинг текста.

Итак, таблица:

'0
А1
Е2
И3
Н4
О5
С6
Т7
   
Б80
В81
Г82
Д83
Ж84
З85
К86
Л87
   
М90
П91
Р92
У93
Ф94
Х95
Ч96
Ш97

Пример текста:

Владельца постоялого двора можно было понять: если и вправду к полудню разыграется трёхдневная метель, то было бы глупо лишаться единственного богатого постояльца. Новые путники за это время вряд ли прибудут, а этот, ежели останется на днёвку, уже никуда не денется. Потому и не жалел трактирщик красноречия, обещая господину путешественнику настоящую горскую кухню («Вепрятина с грибами, милорд! Последние в этом году свежие грибы и первый вепрь, затравленный по пороше! Такое попробовать – сегодня или никогда!») и вино урожая двадцать восьмого года («Бочку уже выкапывают!»).
81871832870761 91567501875825 83815921 9058445 8003875 91540170: 26873 3 8191921818393 86 9158793834093 92185038292127601 79205958342814101 90272870, 75 8003875 8003 828793915 87397170601 283346781245825 80582175825 91567501870761. 4581032 9193743863 851 0275 819229001 81920183 873 91923809383937, 1 02757, 2842873 5671427601 41 83405818693, 93842 438693831 42 832427601. 915759093 3 42 84187287 7921867392696386 8692164592296301, 5802696101 8256915833493 91937297267812438693 416750169693093 8259268693093 8693954093 (8129192017341 6 82923801903, 9038759283! 915687283432 81 027590 8258393 68128432 829238003 3 9129281030 81291920, 8517921818724030 915 915925972! 718652 9159192580581170  6282583401 3873 4386582831!) 3 81345 9392584101 838118376170 81560905825 825831 (805968693 93842 810386191038110937!).

В среднем, по сравнению с кириллическим, число символов в тексте увеличивается на 37%. Я думаю, это вполне приемлемая цена за неоспоримый достигнутый прорыв в коммуникационной универсальности.

Следующий шаг — замена знаков препинания арифметическими действиями.

Offline Artiemij

  • Posts: 8005
  • Gender: Male
0001010000110100000010100110010011110100000001100000000011000100000001010010100100100000110000010011110010100001100
0000000000110000000101000111010100111000010101010000000100100000010010010000000011010101010110010110100001010010010
0000101100100011000111000000000111101010100100000111101110100000001111101010000101001000101000000110101010100111000
0110010010011101100011 :donno:
Я тартар!

Offline arseniiv

  • Posts: 14946
    • ::
952878729292386, 26965!

Offline Hellerick

  • Blogger
  • *
  • Posts: 27442
  • Gender: Male
939192567390 8381504032 658287164032,

1 8103 42 75870865 42 9391925673873, 45 26965 3 873974093093 835801813873.

Offline Валентин Н

  • Posts: 35654
  • Gender: Male
96371093/9139793 915-148287306863, 96371093 915-4290276863, 3691146863 3 915927938218706863. 8058722-902422 91543901093 870938050 82292901468630, 925901468630 3873 68718101468630 01850386. 9557287560 8003 91583417592270 81 863710686590.
Нижниь ıндэкс в ҷıсʌах — степень тıсяҷı.
Препинания авторские!

9528787292386, 1 9159629093 41835 696 9218580381170 41 696‽ 812830 0275 96 41835 9218580370 41 7696 3873 831842 70696.
Нижниь ıндэкс в ҷıсʌах — степень тıсяҷı.
Препинания авторские!

86186 9042 418352875, 9675 902401 91567501445 81 9162818393 81039228510937, 91925675 802637, 80938393 9017292370601 41 90583292167939293 — 82181-82181-82181
Нижниь ıндэкс в ҷıсʌах — степень тıсяҷı.
Препинания авторские!

9528787292386, 1 9159629093 41835 696 9218580381170 41 696‽ 812830 0275 96 41835 9218580370 41 7696 3873 831842 70696.
191
Нижниь ıндэкс в ҷıсʌах — степень тıсяҷı.
Препинания авторские!

Offline Hellerick

  • Blogger
  • *
  • Posts: 27442
  • Gender: Male
9528787292386, 1 9159629093 41835 696 9218580381170 41 696‽ 812830 0275 96 41835 9218580370 41 7696 3873 831842 70696.

42 91540187 875823863.

Offline Валентин Н

  • Posts: 35654
  • Gender: Male
42 91540187 875823863.
493 76 0275 19492386171 3 8103 205 92185875843873 41 6567181870109369632 7 3 6, 7186 96 0275 75842 19492386171 7 3 696, 1 8157 696 86186 92185 919256750 85819386, 85196290 2825 921686871830381170?
Нижниь ıндэкс в ҷıсʌах — степень тıсяҷı.
Препинания авторские!

Тальнемер вспомнил про треугольницу, а я вот тоже вспомнил :dayatakoy:
Нижниь ıндэкс в ҷıсʌах — степень тıсяҷı.
Препинания авторские!

Offline Тайльнемер

  • Posts: 12736
  • Σοι υν βυρρο. Ix bin æn ézl
Можно использовать их для самых распространенных буквосочетаний (например так: АЛ=88, КО=89, ПО=98, РО=99; имеет смысл рассматривать только сочетания, которые не состоят из «одноциферных букв»).
А по какому принципу вы выбрали эти сочетания?
Это просто самые часто встречающиеся двубуквенные сочетания, в которых хотя бы одна буква неодноциферная, или с учётом количества сэкономленных цифр.
Например, здесь (я скопировал эти данные в гугл-докс) сочетание пр имеет чуть бо́льшую частоту, чем ал, при этом ещё экономятся целых две цифры.

Offline Hellerick

  • Blogger
  • *
  • Posts: 27442
  • Gender: Male
Это просто самые часто встречающиеся двубуквенные сочетания, в которых хотя бы одна буква неодноциферная,

По-моему, так.

Но я не стал развивать эту идею, решив, что для читабельности текста лучше оставить за восьмеркой и девяткой исключительно «диакритическую» функцию.

 

With Quick-Reply you can write a post when viewing a topic without loading a new page. You can still use bulletin board code and smileys as you would in a normal post.

Note: this post will not display until it's been approved by a moderator.
Name: Email:
Verification:
Type the letters shown in the picture
Listen to the letters / Request another image
Type the letters shown in the picture:
√49 Напишите ответ строчными буквами:
«Сто одёжек, все без застёжек» — что это?: