Банальные мысли об обратимости и латинице-26

Автор Bhudh, сентября 19, 2012, 23:47

0 Пользователи и 1 гость просматривают эту тему.

Bhudh

Как я заметил вконтакте, для обратимой латиницы достаточно взять 25 латинских букв как есть, а 26-ую использовать в качестве элемента (левого или правого — неважно, желательно только, чтобы везде одинаково) в восьми диграфах.
Это минимальное условие, при выполнении которого выходит по сути транслит.
(Обычно берут больше одной буквы для вспомогательных элементов.)

Бо́льшая часть букв латиницы имеет устоявшееся значение в транслите (min 20).
Все транслитные латиницы отличаются друг от друга только способами применения "неоднозначных" букв.
Этих букв обычно 6: h j q w x y. (Любители польско-немецкого стиля могут заменить w на v.)
Так как обычно берут более и далее по тексту, расширяя возможности транслита до уровня транслитерации китайского, некоторые из неудобных букв могут вовсе не использоваться, и латиница-26 превращается в латиницу-24, а то и -23. Я постараюсь поступить более последовательно и использовать её всю.

Если подумать, какая из этих букв наименее "нужна" для обозначения одной русской буквы: не может использоваться ни "по традиции", ни "по подобию", ни "по похожести" — придём к общепринятому варианту: h.
(Некоторые используют её в роли х, но если одновременно использовать её и в диграфах, обратимость с кириллицей может накрыться тазом. Да и букву икс становится жалко: её либо выбрасывают, либо используют как ш, щ или того хуже... Простите мой субъективизм.)


Переходим к субъективной части.
Распределим остаток в 5 букв по остатку из 13-ти.
            Буква j. Пусть йот останется йотом: й.
            Буква q. Похожа на ч визуально, да и исторически немалая часть... Заодно высвободим диграф ch, пригодится...
            Буква w. Я знаю, что визуально похожа. Но фонетически нуль. Исторически это uu. Далее → ū →  ы. Да будет.
            Буква x. Пусть хи останется хи: х.
            Буква y. Самая многострадальная. Самая многозначная, туды её в качель. Гласная полугласная согласная... Вы помните, что две самые частые вакансии уже заняты? Вот-вот. Нечего её туда пихать. Большинство языков её не так используют. Тюркские, германские, древнегреческие, IPA... Нувыпонели: ю.

Плавно переходим к диграфам.
Что у нас с гласными?
Половина имеет устоявшиеся варианты: а и у е о.
Половина их не имеет:                               я ы ю э ё.
Oops! А две-то у нас ужо определены! Куды ж ихние диграфы девать? А возьмём да и ничтоже сумняшеся присобачим на бывшие гласные, благо освободились как раз самые подходящие: ih = ь и uh = ъ.
Соответственно, ё э я будут oh eh ah. Ох-ох-ох...
Согласные. Тоже имеют устойчивые транслиты ж и ш.
Итого у нас осталась такая же многострадальная ща, которой мы и подарим позаимствованный у ч диграф.
Будем считать, что это такое блюдо: «с мягкое по-японски».


Итоговая таблица:
абвгдеёжзийклмнопрстуфхцчшщъыьэюя
abvgdeohzhzijklmnoprstufxcqshchuhwihehyah


P. S. Скрипты транслитерации и прогон тонн текстов через них можете сделать самостоятельно, мне, к сожалению, пора спать...
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо



okruzhor

ЦитироватьИтоговая таблица:
а   б   в   г   д   е   ё   ж   з   и   й   к   л   м   н   о   п   р   с   т   у   ф   х   ц   ч   ш   щ   ъ   ы   ь   э   ю   я

a   b   v   g   d   e   oh   zh   z   i   j   k   l   m   n   o   p   r   s   t   u   f   x   c   q   sh   ch   uh   w   ih   eh   y   ah
Bhudh ,

давайте поищем объективность в субъективности . Чтобы не ограничиваться "мне беспричинно симпатичнее вот это решение" а добраться хотя бы до более абстрактных аргументов "мне беспричинно приоритетнее вот эта ценность" .

Для Вас кажется очень важна интуитивная понятность англофону (хотя "щ"=CH нарушает её) ; для меня -- компактность , поэтому я исключил диграфы для частотных "ь" и "ш" .

Кроме того , я ценю системность , мнемоничность . Например имхо плохо делать "ю" единичной буквой , а "я" -- диграфом ; или "х"=X по графическому сходству , но "ш"=SH и "ы"=W .

Вы ссылаетесь на греческое "хи" ; но у начертания "ш" более древняя история , а "w" похоже на него . Т.е. Вы цените лишь историческую непрерывность , но не цените возврат к исторической истине ?

Больше не могу выявить концептуально-аксиологических различий . Ваш ход :-)

Timiriliyev

Эх... как же мне нравится сам творческий процесс составления алфавитов. :yes:
Создам-ка я здесь на ходу, свою латиницу-26, полностью обратимую.
Ч Ш Ж Щ -> Q X Zh Xh
Й -> J
Х Ц -> Ch C

А Э О И Ы У -> A Eh O I Ih U (ê î)
Е Ё Ю Я -> E Oh Uh Ah (ë ü ä)
Ъ Ь -> Hh Y

Vot ah na glazach u vsech, po-bihstromu, naklohpal svouh latinicu-25. Vot ä na glazach u vsech, po-bîstromu, naklëpal svoü latinicu-30.

подъезд - podhhezd
вьюга - vyuhga (vyüga)
метель - metely
ещё - exhoh (exhë)
шар - xar
щи - xhi
значение - znaqenie


Koroqe govorah, poluqilosy qto-to pinyinepodobnoe. :green:
Правда — это то, что правда для Вас.

Bhudh

Цитата: okruzhor от сентября 20, 2012, 00:41Для Вас кажется очень важна интуитивная понятность англофону (хотя "щ"=CH нарушает её)
Правильно, что «кажется». Это просто оттого, что часть соответствий привычна именно по "английскому" транслиту (хотя большинство вообще по общему для всех транслитов, но так как читают обычно английский, то...).
Буква q тоже англичанину будет не слишком понятна. Мне лично она тоже не совсем нравится, Timiriliev верно отметил, что при введении в транслит он становится пиньинеподобным. Ну так это и получается оттого, что кроме пиньиня они нигде не используется!
Однако вспоминаю, что что < *qĭ-tŏ ≡ *kʷĭ-tŏ — и антипатия немного остывает...

Цитата: okruzhor от сентября 20, 2012, 00:41Кроме того , я ценю системность , мнемоничность . Например имхо плохо делать "ю" единичной буквой , а "я" -- диграфом ; или "х"=X по графическому сходству , но "ш"=SH и "ы"=W .
Я тоже ценю системность. Поэтому и использовал всю латиницу ;D.
Однако гляжу и на другие письменности. В каких языках ÿ и ä оба обозначаются без диакритик?
А в каких ÿ без диакритики, а ä диакритикой или диграфом? То-то же. Вторых заметно больше. И исторически y понятна (причём, замечу, не англичанам, а немцам! ну и образованным в истории своего языка грекам).
(А письмен, где и ÿ и ä диграфами, навскидку даже и вспомнить не смог...)

Цитата: okruzhor от сентября 20, 2012, 00:41Вы ссылаетесь на греческое "хи" ; но у начертания "ш" более древняя история , а "w" похоже на него . Т.е. Вы цените лишь историческую непрерывность , но не цените возврат к исторической истине ?
Ɣм... Однако χ не просто похожа, она источник х!
А вот w источником ш никак не является, тогда уж лучше сразу её не транслитерировать... Чтобы ש в латиницу не вводить. Дико неинтуитивна дубльвэ в роли ша. Так что «исторической истины» здесь не вижу...
Но и мою англичане тоже поймут только те, кто валлийский знает и историю родного языка (в меньшей степени). Ну не оглядывался я на англичан. Но оглядывался на «историческую истину» :green:.

P. S. Просьба ко всем: цитируйте таблицу — таблицей! Ну не попадают табличные тэги в быстрый ответ при выделении мышей!
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

mnashe

Цитата: arseniiv от сентября 19, 2012, 23:53
Не нравится только Q!
У меня как раз тут никаких возражений.
Цитата: Bhudh от сентября 20, 2012, 06:51
Timiriliev верно отметил, что при введении в транслит он становится пиньинеподобным
Я уже лет 10 её так использую, пиньинеподобности не вижу.

Меня слегка напрягает вот это:
Цитата: okruzhor от сентября 20, 2012, 00:41
Например имхо плохо делать "ю" единичной буквой , а "я" -- диграфом
Но bhudh уже ответил на это.

Цитата: Bhudh от сентября 20, 2012, 06:51
А вот w источником ш никак не является, тогда уж лучше сразу её не транслитерировать... Чтобы ש в латиницу не вводить. Дико неинтуитивна дубльвэ в роли ша. Так что «исторической истины» здесь не вижу...
Это как раз то, что мне больше всего не нравится в моей системе. Хоть я её и выбрал на роль w, дабы избежать диграфов, она всё равно меня раздражает.


В общем, мне нравится.
Читается, наверно, не очень удобно, но если нужна именно обратимая транслитерация — вполне приемлемо, лучше прочих систем.
Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!

Lugat


Lugat

Цитата: Timiriliev от сентября 20, 2012, 04:56
Koroqe govorah, poluqilosy qto-to pinyinepodobnoe. :green:
Vw imeete skazatih qto-to ploxoe za pinihin?  :o
Sdelajte nam tak, qtobw praktiqeski mozhno bwlo posmotretih na Vashu sistemu. Nu, tipa, kakova ona v qtenii bolihshix tekstov. Dlah ehtogo berohte transliterator, qto ah vwlozhil, izvlekaete ego na raboqij stol, tam v papoqke so skriptami otkrwvaete skript lybwm tekstovikom, lishih bw podderzhival unikod, i vnosite v spisok zamenw na svoj vkus. Togda na html-straniqke mashinka mgnovenno vwdast produkt transliteracii — transliterat.  :yes:

DarkMax2

Tej wojny nikt za nas nie wygra! © Wiedźmin III
Коли зчинять лемент: "Хто ж знав?!" — відповімо: "Ми".

З моїх снів ти утечеш над ранок,
Терпка, як аґрус, солодка, як біз.
Хочу снить чорні локи сплута́ні,
Фіалкові очі, мокрі від сліз.

Timiriliyev

Цитата: Lugat от сентября 20, 2012, 09:41
Vw imeete skazatih qto-to ploxoe za pinihin?  :o
Я ничего не имею против пиньиня. :dunno:

Цитата: Lugat от сентября 20, 2012, 09:41
izvlekaete ego na raboqij stol
Зачем рабочий стол-то засорять? ;)

Цитата: Lugat от сентября 20, 2012, 09:41
skript lybwm tekstovikom
Очень хороший текстовик - Notepad++, как раз для программиста. :yes:

Цитата: Lugat от сентября 20, 2012, 09:41
Nu, tipa, kakova ona v qtenii bolihshix tekstov.
Цитата: 25Ahvnaah inicializaciah imeet dva osnovnihch nedostatka. Vo-pervihch, ona mozhet bihty
primenena lixy dlah obhhektov klassov, vse qlenih kotorihch otkrihtih (t.e. ehta
inicializaciah ne podderzhivaet inkapsulahcii dannihch i abstraktnihch tipov – ich ne
bihlo v ahzihke C, otkuda ona zaimstvovana). A vo-vtorihch, takaah forma trebuet vmexatelystva programmista, qto uveliqivaet veroahtnosty poahvleniah oxibok (zabihl
vkluhqity spisok inicializacii ili pereputal porahdok sledovaniah inicializatorov v
nohm).
Tak nuzhno li primenahty ahvnuuh inicializaciuh vmesto konstruktorov? Da. Dlah
nekotorihch prilozhenij bolee ehffektivno ispolyzovaty spisok dlah inicializacii
bolyxich struktur postoahnnihmi znaqeniahmi. K primeru, mih mozhem takim obrazom
postroity palitru cvetov ili vkluhqity v tekst programmih fiksirovannihe koordinatih
verxin i znaqeniah v uzlach slozhnoj geometriqeskoj modeli. V podobnihch sluqaahch
inicializaciah vihpolnahetsah vo vremah zagruzki, qto sokraxhaet zatratih vremeni na zapusk
konstruktora, dazhe esli on opredelohn kak vstroennihj. Ehto osobenno udobno pri rabote s
globalynihmi obhhektami.
Odnako v obxhem sluqae predpoqtitelynihm metodom inicializacii ahvlahetsah
konstruktor, kotorihj garantirovanno budet vihzvan kompilahtorom dlah kazhdogo obhhekta
do ego pervogo ispolyzovaniah. V sleduuhxhem razdele mih poznakomimsah s konstruktorami
detalyno.
Цитата: 30Əvnaə inicializaciə imeet dva osnovnîch nedostatka. Vo-pervîch, ona mozhet bîty
primenena lixy dlə obhhektov klassov, vse qlenî kotorîch otkrîtî (t.e. êta
inicializaciə ne podderzhivaet inkapsuləcii dannîch i abstraktnîch tipov – ich ne
bîlo v əzîke C, otkuda ona zaimstvovana). A vo-vtorîch, takaə forma trebuet vmexatelystva programmista, qto uveliqivaet veroətnosty poəvleniə oxibok (zabîl
vklüqity spisok inicializacii ili pereputal porədok sledovaniə inicializatorov v
nëm).
Tak nuzhno li primenəty əvnuü inicializaciü vmesto konstruktorov? Da. Dlə
nekotorîch prilozhenij bolee êffektivno ispolyzovaty spisok dlə inicializacii
bolyxich struktur postoənnîmi znaqeniəmi. K primeru, mî mozhem takim obrazom
postroity palitru cvetov ili vklüqity v tekst programmî fiksirovannîe koordinatî
verxin i znaqeniə v uzlach slozhnoj geometriqeskoj modeli. V podobnîch sluqaəch
inicializaciə vîpolnəetsə vo vremə zagruzki, qto sokraxhaet zatratî vremeni na zapusk
konstruktora, dazhe esli on opredelën kak vstroennîj. Êto osobenno udobno pri rabote s
globalynîmi obhhektami.
Решил юзать шву место а-умляута, ибо красиво (для меня). :green:

Вот тут и появились сомнения насчёт hh :-\ Хорошо хоть зъ редко встречается.

Цитата: И назадЯвная инициализация имеет два основных недостатка. Во-первых, она может быть
применена лишь для объектов классов, все члены которых открыты (т.е. эта
инициализация не поддерживает инкапсуляции данных и абстрактных типов – их не
было в языке Ц, откуда она заимствована). А во-вторых, такая форма требует вмешательства программиста, что увеличивает вероятность появления ошибок (забыл
включить список инициализации или перепутал порядок следования инициализаторов в
нём).
Так нужно ли применять явную инициализацию вместо конструкторов? Да. Для
некоторых приложений более эффективно использовать список для инициализации
больших структур постоянными значениями. К примеру, мы можем таким образом
построить палитру цветов или включить в текст программы фиксированные координаты
вершин и значения в узлах сложной геометрической модели. В подобных случаях
инициализация выполняется во время загрузки, что сокращает затраты времени на запуск
конструктора, даже если он определён как встроенный. Это особенно удобно при работе с
глобальными объектами.
Однако в общем случае предпочтительным методом инициализации является
конструктор, который гарантированно будет вызван компилятором для каждого объекта
до его первого использования. В следующем разделе мы познакомимся с конструкторами
детально.
Правда — это то, что правда для Вас.

Alone Coder

Цитата: Bhudh от сентября 19, 2012, 23:47
  Буква q. Похожа на ч визуально, да и исторически немалая часть... Заодно высвободим диграф ch, пригодится...
"q" разве что для "к" (ну или "х") подойдёт, остальные ассоциации только у русских.

Цитата: Bhudh от сентября 19, 2012, 23:47
Буква y. Самая многострадальная. Самая многозначная, туды её в качель. Гласная полугласная согласная... Вы помните, что две самые частые вакансии уже заняты? Вот-вот. Нечего её туда пихать. Большинство языков её не так используют. Тюркские, германские, древнегреческие, IPA... Нувыпонели: ю.
Что ж вы на полпути остановились :)
            "       U                                   U   U
a b v g d e e g z i i k l m n o p r s t u f x ts c x sc o w e h y j
а б в г д е ё ж з и й к л м н о п р с т у ф х ц  ч ш щ  ъ ы ь э ю я

Lugat

Цитата: Timiriliev от сентября 20, 2012, 10:35
Очень хороший текстовик - Notepad++, как раз для программиста. :yes:
Ehto kotorwj s xameleonqikom? Smotrel. Gde-to valahetsah u menah v programmax.
No mne bolihshe nravitsah Emeditor, on dazhe gigovwe isxodniki — dsl-fajlw dlah slovarah Lingvo otkrwvaet.

Lugat

Цитата: Alone Coder от сентября 20, 2012, 11:02
Что ж вы на полпути остановились :)
            "       U                                   U   U
a b v g d e e g z i i k l m n o p r s t u f x ts c x sc o w e h y j
а б в г д е ё ж з и й к л м н о п р с т у ф х ц  ч ш щ  ъ ы ь э ю я

Мы тут говорили за обратимость, а у Вас система необратима. Будет щ путаться со счц — с тс...  :(
U-шки над буквами, я так понял, диакритики?

arseniiv

Что есть лучшего? — Сравнив прошедшее, свести его с настоящим.

Bhudh

Цитата: Timiriliev от сентября 20, 2012, 10:35Вот тут и появились сомнения насчёт hh :-\ Хорошо хоть зъ редко встречается.
Не понял. А в чём сомнения-то? Одинарная h-то не используется!

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Bhudh

Prikolihno poluqaetsah...
Vwtih, vitih, vihyga, vwuqitih, vwuditih.
Pitih, pihahnica, pianino, pahtnistwj.
Bwtih, bitih, bihy, Bianki, Bihahnki.
Blud, blydo, blahdih, bylletenih...

Bwk tupogub, tupogubenihkij bwqok, u bwka bela guba bwla tupa.
Qetwre qohrnenihkix qumazenihkix qertohnka qertili qohrnwmi qernilami qertohzh.

Suheshih zhe echoh ehtix mahgkix francuzskix bulok, da vwpej qay.
Shirokaah ehlektrifikaciah yzhnwx gubernij dast mochnwj tolqok poduhohmu selihskogo xozahjstva.
Ehj, zhlob! Gde tuz? Prahqih ynwx suhohmchic v shkaf.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Bhudh

Цитата: okruzhor от сентября 20, 2012, 00:41для меня -- компактность , поэтому я исключил диграфы для частотных "ь" и "ш" .
Полезно было бы ещё исключить диграфы для частотных ст, ск и ый/ий, например.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Alone Coder

Цитата: Lugat от сентября 20, 2012, 20:22
Мы тут говорили за обратимость, а у Вас система необратима.
Среди действующих стандартов нет ни одного в строгом смысле обратимого.

Цитата: Lugat от сентября 20, 2012, 20:22
U-шки над буквами, я так понял, диакритики?
Ага. Необязательные.

Bhudh

Цитата: Alone Coder от сентября 21, 2012, 18:00Среди действующих стандартов нет ни одного в строгом смысле обратимого.
Возьмите этот стандартом — будет. :eat:
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Hellerick

Ya odno vremya balovalsya s takoj sistemoj:

a b v g d e yo zh z i j k l m n o p r s t u f x c ch sh xh qh ih q eh yu ya

'q' — ehto perevernutyj myagkij znak.

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо


Lugat

Поразмышляв над системой Bhudha, решил ввести некоторые коррективы для пущей читабельности и вообще смотрибельности.
Идеи таковы:
Разделим в написании йотированные гласные, и гласные после мягких согласных.
Для йотированных — оставим йот.
Мягкость же обозначим  буквой «y».
Твердый знак — ненужен, — обычный «j» после согласных и достаточно.
Ну и список замен для транслитератора выглядит так:
ЦитироватьCyrillicConsonants,"ъя","ja","",
CyrillicConsonants,"ъю","ju","",
CyrillicConsonants,"ъе","je","",
CyrillicConsonants,"ъё","jo","",
CyrillicConsonants,"ъи","ji","",
CyrillicConsonants,"ья","yja","",
CyrillicConsonants,"ью","yju","",
CyrillicConsonants,"ье","yje","",
CyrillicConsonants,"ьё","yjo","",
CyrillicConsonants,"ьи","yi","",
CyrillicConsonants,"э","eh","",
CyrillicConsonants,"е","e","",
CyrillicConsonants,"ё","yo","",
CyrillicConsonants,"ю","yu","",
CyrillicConsonants,"я","ya","",
"а","a",
"б","b",
"в","v",
"г","g",
"д","d",
"ж","zh",
"з","z",
"йа","ya",
"йо","yo",
"йу","yu",
"й","j",
"к","c",
"л","l",
"м","m",
"н","n",
"о","o",
"п","p",
"р","r",
"с","s",
"т","t",
"у","u",
"ф","f",
"х","x",
"ц","q",
"ч","ch",
"ш","sh",
"щ","xh",
"ы","w",
"и","i",
"ь","y",
"ъ","",
"э","e",
"е","je",
"ё","jo",
"ю","ju",
"я","ja"
Чтобы при обратной транслитерации слова йог, йод, Дайана не превратились в ёг, ёд, Даяна — внесено отдельное написание для йо, йа, ну и йу на всякий случай.
Примеры текстов из стихов Тагора — кладу под спойлер:

Примечание: Поскольку выложенный текст стихов не ёфицирован, а ёфицировать пока некогда, то транслитерировано без «ё», тогда и в обратной транслитерации будет без «ё». Прошу извинить за неудобства.  :-[

Ну и естественно — транслитератор в аттачменте.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр