Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Сравнение латиниц-26

Автор okruzhor, сентября 22, 2012, 17:48

0 Пользователи и 1 гость просматривают эту тему.

Bhudh

Цитата: okruzhor от сентября 23, 2012, 11:26пьяный сэр койот разъярённо поёт из-за миазмов бульона

Pihahnwj sehr kojot razuhahrohnno pooht iz-za miazmov bulihona.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Timiriliyev

Может быть это будет оффтоп, но запишу-ка я свои текущие мысли здесь, пока не забыл.

ГЛАСНЫЕ
а   a
э   eh
о   o
у   u
и   i
ы   w
я   ia
е   e
ё   io
ю   iu

иа   iha
ио   iho
иу   ihu

ьо   oh

ъ   yh
ь   y
й   j


СОГЛАСНЫЕ
б   b
в   v
г   g
д   d
ж   zh
з   z
к   k
л   l
м   m
н   n
п   p
р   r
с   s
т   t
ф   f
х   ch
ц   c
ч   q
ш   x
щ   xh


Вариант №2 для англофонов:
б   b
в   v
г   g
д   d
ж   zh
з   z
к   k
л   l
м   m
н   n
п   p
р   r
с   s
т   t
ф   f
х   kh (x?)
ц   c
ч   ch
ш   sh
щ   x (xh?)


Pyianwj sehr Kojot razyhiarionno poiot iz-za mihazmov bulohna.
Правда — это то, что правда для Вас.

okruzhor

Timiriliev ,

я добавлю Ваш новый вариант (или заменю старый) в 1-м посте , как только Вы скажете .

Хм... Я как бы вручную работаю викой :-) Ну хоть нет и не будет войны правок !

Alone Coder

Цитата: cetsalcoatle от сентября 23, 2012, 04:54
Итак, "сионист"
1)Можно для таких случаев расширить употребление "j" - Sjionist 
2)Оставить как есть - тут по смыслу понятно, что это явно не "сёнист" (см. правило выше)
3)Можно немую "i" заменить опострофом(или любым другим символом), тогда "i" будет обозначать только "и".
Или взять из украинского алфавита " ї "
4)Можно просто внести в список исключений (fialka, piastr)
5) si'onist
6) syonist
7) использовать для "ё" не io, а что-то другое. Например, ie.

cetsalcoatle

Цитата: okruzhor от сентября 23, 2012, 11:26
cetsalcoatle ,

дайте пожалуйста ссылку на полное точное изложение Вашей латиницы .

Я хочу собрать (в 1-м посте этой ветки) транслитерации-26 :

   по которым иностранец (после быстрого знакомства с правилами чтения по-русски) мог бы прочитать латинизированный текст вслух ;
   и чтобы тупой (без лингвистического анализа и возможно помнящий лишь единичные исключения) транслятор мог бы конвертировать 100% взаимно-однозначно .

Для таких транслитов было бы интересно сравнить :

   компактность ;
   интуитивность -- мотивированность , мнемоничность ;
   удобочитаемость (без лишнего напряжения) ;
   цельность -- количество исключений и шансы появления новых исключений в обозримом будущем ;
   и т.д. .

Целые категории исключений (вроде "фиалка" -- есть ли полный список подобных слов ?) -- это здесь чересчур .

Компактность можно оценивать лишь для полной записи -- без пропусков , понятных только для русскоязычного .

Оказалось , что в отрывке про тигрёнка нет некоторых важных примеров . Добавляю ещё 1 тест-фразу : пьяный сэр койот разъярённо поёт из-за миазмов бульона

1)по которым иностранец (после быстрого знакомства с правилами чтения по-русски) мог бы прочитать латинизированный текст вслух ;
2)чтобы тупой (без лингвистического анализа и возможно помнящий лишь единичные исключения) транслятор мог бы конвертировать 100% взаимно-однозначно.
3)удобочитаемость
4)Свободно конвертируется компьютером

Okruzhor, должен признать, что проект утопичен, если пользоваться только набором символов латиница-26 т.к. Один из параграфов будет несоблюдён: если заменить мягкость посредством диакритики оставшимися символами латиницы-26, получится текст визуально чуждый носителям славянских языков. А если оставить диакритику - громоздко.

Также не знаю по какому алгоритму компьютер будет определять мягкие звуки в кириллице

Пример:
Моя третья пробная латиница с дикритикой (для 100%-й фонетической записи)

a b v g d (je) (jo) ž z (i) j k l m n o p r s t u f x c č š y e (ju) (ja)
ä b̦ v̦ g̦ d̦             ž̦ z̦       ķ ļ m̦ n̦ ö p̦ ŗ ş ţ ü f̦ x̦ c̦ č̦ ș̌ i ё
Подстрочная диакритика - мягкость согласных
Умляуты - мягкость гласных
Шипящие - свистящий согласный (или аффриката) + гачек или "h"

Рассказ про тигрёнка в третий раз периписывать не буду.
А про койота:
пьяный сэр койот разъярённо поёт из-за миазмов бульона
p̦janyj ser kojot pazjaŗönno pojöt iz-za miazmov buļona

Также мой пример - ньокки  n̦okki



okruzhor

Цитата: cetsalcoatle от сентября 23, 2012, 20:57
Okruzhor, должен признать, что проект утопичен, если пользоваться только набором символов латиница-26 т.к. Один из параграфов будет несоблюдён: если заменить мягкость посредством диакритики оставшимися символами латиницы-26, получится текст визуально чуждый носителям славянских языков. А если оставить диакритику - громоздко.

Это не утопия , а обычная ситуация противоречивых требований . Придётся уточнять приоритеты и подбирать баланс . Обязательные требования -- латиница-26 , однозначность , обратимость . Как и следовало ожидать , труднее всего обеспечивается удобочитаемость , мнемоничность прямого и обратного преобразований . Пока имхо все представленные латиницы интенсивно отлаживаются и оптимизируются , поэтому детально сравнивать рановато . Но все они реализуют требования , конечно с различным балансом приоритетов . Надеюсь , соседство взаимно стимулирует .

> Также не знаю по какому алгоритму компьютер будет определять мягкие звуки в кириллице

Пока все 3 представленных латиницы -- транслиты ; их алгоритмы работают с буквами , а не с фонемами . Поэтому такой вопрос не ставится и не решается .

Я начинал с фонематической транскрипции , но пришёл к строгому однозначному обратимому транслиту .

Фонематическую латиницу легко сделать односторонне однозначной ; однако для обращения вручную нужно знать русский язык . Алгоритм строгого автоматического обращения был бы сложнее , чем хотелось бы . Но если такой алгоритм будет хорошо реализован , тогда фонетическая латиница сможет конкурировать с орфографической во всех сферах применения .

cetsalcoatle

Просто транслит? Так ведь проще некуда :donno:
a b v g d je jo zh z i j k l m n o p r s t u f x c ch sh (shj - условно) ъ y ь e ju ja

Нужно только определиться с символами для "ъ" и "ь"

Когда они употребляются?

-"ъ" в качестве разделительного знака между согласной и гласной на границе приставки и корня
Есть альтернативы?
-Да.
Из сербского алфавита буква Ъ была исключена в середине XIX века в ходе реформы Вука Караджича; разделительный знак перед йотированными гласными там не нужен, так как йот пишется явно, а твёрдые и мягкие согласные обозначаются разными буквами: подјармити (под + јармити) — пођачити (по + ђачити, от ђак «ученик»).


Последний вопрос -"ь"
Как употребляется?
В русском языке мягкий знак используется:
1)после большинства согласных для обозначения их мягкости (граб — грабь, кров — кровь, лад — ладь, вяз — вязь, мол — моль, лом — ломь, кон — конь, цеп — цепь, жар — жарь, вес — весь, бит — бить, граф — графь);
2)перед гласными, сверх того, выступает как разделительный знак; при этом е, ё, ю, я (факультативно и и) читаются йотированно; иногда йотируются и другие гласные (каньон — ка[н'јо]н);
3)после шипящих мягкость не обозначает (она либо есть, либо нет в зависимости от самой буквы), но, даже если не имеет разделительного значения, по традиции используется в известных категориях слов: им. и вин. пад. ед. ч. существительных женского рода: рожь, тушь, вещь и т. п.,
4)повелительное наклонение некоторых глаголов: режь, разрушь, прячь, морщь (также во множ. ч.: режьте и др.; в возвратной форме: режься, режьтесь и др.);

Нас интересуют два аспекта: разделение мягкого согласного и гласного, и собственно мягкость согласного
Но для него нет альтернатив ни в латинице, ни в южнославянских алфавитах (чтобы продуктивно употребить в латинице)
Ясно одно: этот символ должен быть отличным от символов алфавита за которыми уже закреплено определённое  фонетическое значение, а также этот символ должен быть удобно читаем.

Возможные пути решения:
1) Оставить как есть: bulьоn, nьokki, topь
2) Использовать оставшиеся буквы (q, w) bulqon, nqokki, topq
3) Использовать опостроф или подстрочную диакритику bul'on, n'okki, top' (в принципе очень даже отличное решение)



okruzhor

 > Просто транслит? Так ведь проще некуда

Сначала сделайте , затем оценивайте :-)

Например , как Вы различите "ая" и "айа" (в слове "майа" , кажется ещё что-то здесь пробегало , а может в будущем другие появятся) ? Нужна строгая взаимная однозначность .

И затем гляньте , сколько у Вас диграфов , насколько частотные буквы они обозначают , как сквозь них придётся продираться при чтении ?

Интересно , что после достаточной отладки латиницы-26 становятся похожими друг на друга :-) Я например был уверен , что никогда не изменю W=ш , а вот пришлось , оптимизация заставила .

cetsalcoatle

Цитата: okruzhor от сентября 23, 2012, 22:55
> Просто транслит? Так ведь проще некуда

Сначала сделайте , затем оценивайте :-)

Например , как Вы различите "ая" и "айа" (в слове "майа" , кажется ещё что-то здесь пробегало , а может в будущем другие появятся) ? Нужна строгая взаимная однозначность .

И затем гляньте , сколько у Вас диграфов , насколько частотные буквы они обозначают , как сквозь них придётся продираться при чтении ?

Интересно , что после достаточной отладки латиницы-26 становятся похожими друг на друга :-) Я например был уверен , что никогда не изменю W=ш , а вот пришлось , оптимизация заставила .
>Например , как Вы различите "ая" и "айа" (в слове "майа")
А зачем различать-то: мая(р.п) и майа произносятся как [маja] и [маj:a] соответственно, это же просто транслит, а не фонетическая запись. Можно просто писать majja :donno:
> И затем гляньте , сколько у Вас диграфов , насколько частотные буквы они обозначают , как сквозь них придётся продираться при чтении ?
Три диграфа-то всего :negozhe:

Okruzhor, оставьте просто каноничные "ъ" и "ь", да и не заморачивайтесь. :) Ну и что, что в латинице нет этих знаков - прогресс не стоит на месте.

cetsalcoatle

Можно использовать "q" "w" вмсто "ь" и "ъ"
Но тогда текст будет не читаем

Вывод: уложиться в транслит-26 без диакритики, сохраняя читабельность нельзя! :umnik:

okruzhor

Цитата: cetsalcoatle от сентября 23, 2012, 23:21
> Например , как Вы различите "ая" и "айа" (в слове "майа")

А зачем различать-то: мая(р.п) и майа произносятся как [маja] и [маj:a] соответственно, это же просто транслит, а не фонетическая запись. Можно просто писать majja :donno:

Значит Вы делаете ставку на то , что в русских текстах нет и никогда не будет "йй" ? Оййй... Ну ладно .

> a b v g d je jo zh z i j k l m n o p r s t u f x c ch sh (shj - условно) ъ y ь e ju ja

> Три диграфа-то всего :negozhe:

Я насчитал 8 . Плюс незавершёнка -- значит будут ещё . Причём буква JE=е катастрофически частотна

> Okruzhor, оставьте просто каноничные "ъ" и "ь", да и не заморачивайтесь. :) Ну и что, что в латинице нет этих знаков - прогресс не стоит на месте.

Вы сейчас говорите , что латиница-26 не нужна ? Когда не нужна , тогда кириллица и только кириллица . Вы хотите сочинять латиницы ради эстетики ? "Ха! Это не мой проект" (ц) Серендипити

cetsalcoatle

> Я насчитал 8 . Плюс незавершёнка -- значит будут ещё . Причём буква JE=е катастрофически частотна
Уточню: диграф - это когда 2 буквы, а звук 1
Je - это не буква и не диграф, а просто сочетание букв. Я просто сразу на место расставил эквиваленты кириллицы
Shj - я же сказал условно, на деле отдельная  буква для "щ" не нужна - это будет просто sh + знак мягкости
Так что всё-таки 3 диграфа.

> Вы сейчас говорите , что латиница-26 не нужна ?
А почему должно быть именно 26, это что какая-то сакральная цифра?


>тогда кириллица и только кириллица
И в фонетическом варианте: йолка, бэьлка  ;)

>Вы хотите сочинять латиницы ради эстетики ?
Упаси Гумбольдт, делать мне больше нечего!
Просто я создавал латиницы прежде всего для носителей языка, а не для иностранцев и компьютеров. И то - интереса ради. :)

Timiriliyev

Цитата: ОкрузъорВы хотите сочинять латиницы ради эстетики ?
Типа того. Пытаюсь найти золотую середину между красотой и удобством, так сказать.
Правда — это то, что правда для Вас.

okruzhor

 > Просто я создавал латиницы прежде всего для носителей языка

То есть полную замену кириллице во всех нишах кириллицы ? Тогда конечно , как и для чистой эстетики , 26 ничем не лучше 27 или 42 .

Однако даже после гипотетического полного перехода русского языка на такую латиницу , будет востребована обратимая русская латиница-26 для технических нужд . Нет ли у Вас желания посочинять ещё и техническую латиницу ?

> Пытаюсь найти золотую середину между красотой и удобством, так сказать.

А вот это полностью вписывается в данную подборку латиниц . Если конечно "удобство" включает в себя применимость в технических нуждах и ==> строгую взаимную однозначность . Сейчас Ваша 3-я латиница такова .

cetsalcoatle

>Нет ли у Вас желания посочинять ещё и техническую латиницу ?

Чисто техническая латиница:

Шаблон:
a b v g d je jo zh z i j к l m n o p r s t u f x c ch sh щ ъ у ь e ju ja

Три диграфа: zh - ж, sh - ш, ch - ч

еёюя: в начале слова - сочетание букв je, jo, ju, ja; после согласных = согласный + мягкий знак + e, o, u, a.

щ: ш + мягкий знак

ь: q

ъ: w

Итог: a b v g d e zh z i j k l m n o p r s t u f x c ch sh w y q

Тестируйте наздоровье! :)

Hellerick

Цитата: cetsalcoatle от сентября 24, 2012, 18:01
щ: ш + мягкий знак

В том, что я понимаю под «технической латиницей», это недопустимо — она должна передавать мягкие знаки после шипящих в кириллице.

Цитата: cetsalcoatle от сентября 24, 2012, 18:01
Итог: a b v g d e zh z i j k l m n o p r s t u f x c ch sh w y q

Что с Э, Ю, Я?

cetsalcoatle

Цитата: Hellerick от сентября 24, 2012, 18:15
Цитата: cetsalcoatle от сентября 24, 2012, 18:01
щ: ш + мягкий знак

В том, что я понимаю под «технической латиницей», это недопустимо — она должна передавать мягкие знаки после шипящих в кириллице.

Цитата: cetsalcoatle от сентября 24, 2012, 18:01
Итог: a b v g d e zh z i j k l m n o p r s t u f x c ch sh w y q

Что с Э, Ю, Я?
1) Ещё один диграф "sc" решает вопрос.
2) Э=е, Е=je, Ю=ju, Я=ja. Я всё выше подробно расписал по этому поводу.

a b v g d je jo zh z i j k l m n o p r s t u f x c ch sh sc w y q e ju ja

okruzhor

Цитата: cetsalcoatle от сентября 24, 2012, 18:01
еёюя: в начале слова - сочетание букв je, jo, ju, ja; после согласных = согласный + мягкий знак + e, o, u, a.

щ: ш + мягкий знак

ь: q

ъ: w

Итог: a b v g d e zh z i j k l m n o p r s t u f x c ch sh w y q
Тогда что такое Ваше Y ? Как у Вас транслируются "поэт" , "гаер" , "стайер" , "майор" , "шьёт" , "Нью-Йорк"?

> Тестируйте наздоровье!

Извините , Вы сами тестировали ?

> Ещё один диграф "sc" решает вопрос.

панятнинька

cetsalcoatle

Y=ы

poet, gajer, stajer, major, shjot, Nqju-Jork :???

При вашем подходе 1 буква в кириллице=1 букве в латинице

a b v g d eh oh zh z i j k l m n o p r s t u f x c ch sh sc w y q e uh ah ровно 26 латинских сиволов = 32 буквам кириллицы

Poet, gaehr, stajehr, major, shqoht, Nquh-Jork

146% обратимость, вот только носителям такое извращение нужно как телеге 5 колесо :donno:

Не вижу смысла, уж лучше действительно оставить кириллицу
Neh vizhu smysla uzh luchsheh dejstvitelqno ostavitq kirillicu

По уродски выглядит ваша конвертируемая латиница-26, не так ли?


Hellerick

Цитата: cetsalcoatle от сентября 24, 2012, 18:47
Не вижу смысла, уж лучше действительно оставить кириллицу

Техническая латиница нужна для  технических целей.
Это не письменность. Это ответ на технические ограничения.

cetsalcoatle

Ну тогда я с этой задачей справился :dayatakoy:

Ждём другие варианты :UU:

okruzhor

Цитата: cetsalcoatle от сентября 24, 2012, 18:47
a b v g d eh oh zh z i j k l m n o p r s t u f x c ch sh sc w y q e uh ah ровно 26 латинских сиволов = 32 буквам кириллицы

Poet, gaehr, stajehr, major, shqoht, Nquh-Jork
Бесценный = бещенный ?

> Не вижу смысла, уж лучше действительно оставить кириллицу

> Neh vizhu smysla uzh luchsheh dejstvitelqno ostavitq kirillicu

Вы так говорите , как будто кириллица -- это плохо :-)

> По уродски выглядит ваша конвертируемая латиница-26, не так ли?

Некоторый ущерб красоте (по сравнению с кириллицей) имхо есть во всех здешних латиницах-26 . Насколько он велИк и важен -- ещё будем сравнивать и обсуждать .

> При вашем подходе 1 буква в кириллице=1 букве в латинице

Во всех здешних латиницах (а также в кириллице) есть диграфы . Если же Вы говорите о взаимной однозначности , то да , это явно записано в стартовом посте .

Hellerick

Техническая:

a b v g d e yo zh z i j k l m n o p r s t u f x c ch sh shh qq yi q eh yu ya
poeht gaer stajer major shqyot Nqyu-Jork

Система фейлит при передаче двойного мягкого знака, но и черт с ним.

Bhudh

Цитата: Hellerick от сентября 24, 2012, 19:19Система фейлит при передаче двойного мягкого знака
А также сочетаний обоих знаков.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

cetsalcoatle

Спасибо за идею Hellerick!

Щ=shh

Окончательный вариант:

a b v g d eh oh zh z i j k l m n o p r s t u f x c ch sh shh w y q e uh ah

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
√49:
ALT+S — отправить
ALT+P — предварительный просмотр