Убираем диакритики! Ограничиваемся стандартной клавиатурой!
ć, ś, etc. = cj, sj, etc.
ł = l
l = li (перед гласной), lj (в других случаях)
ż = zs
ó = ou
ou = o'u
ą = ay (или oy), ę = ey
Вроде бы ничего не забыл?
Цитата: Earl от января 14, 2019, 20:07
Убираем диакритики! Ограничиваемся стандартной клавиатурой!
ć, ś, etc. = cj, sj, etc.
ł = l
l = li (перед гласной), lj (в других случаях)
ż = zs
ó = ou
ou = o'u
ą = ay (или oy), ę = ey
Вроде бы ничего не забыл?
Ł → w, ó → u, ą → on/o, ę → en/e. По-моему, так намного проще.
Да, но я старался сохранить историческое правописание там, где оно есть. Так-то можно и rz, и ch убрать, но жалко как-то.
Осталось теперь транслитератор запилить.
Чего там пилить-то, десять строк кода.
Цитата: Bhudh от января 14, 2019, 21:06
Чего там пилить-то, десять строк кода.
Так что же вы ждёте?
Цитата: Валентин Н от января 14, 2019, 21:28Так что же вы ждёте?
Так Вам же нужен, Вы и пилите.
У меня один польский транслитератор уже есть. В кириллицу.
Сейчас вот думаю польскую мандариницу слепить.
Цитата: Bhudh от января 14, 2019, 21:51У меня один польский транслитератор уже есть. В кириллицу.
А взглянуть на него можно? :) Вообще, меня всегда удивляло, что поляки используют латиницу, когда кириллица для них зело́ удобнее.
Это фактически js-версия транслитератора Hellerickʼа с http://pastebin.com/7arAKvMW (//http://).
/*
Polish Cyrillic script, converter algorithm
Polska Cyrilica, algorytm przemiany
Польская кириллица, алгоритм замены
By Hellerick, http://pastebin.com/7arAKvMW
Доработано Bhudh
*/
function PolCyrTrans(str){
function repLemma(pair){
var from=pair[0], to=pair[1];
if('^.|$)([*+?'.indexOf(from)+1){from='\\'+from;};
if(from.constructor!==RegExp){from = RegExp(from,'g');};
str = str.replace(from,to);
}
var transArr = [
[/([CĆDJLŃRSŚŹŻ])/g,function(w){return'‾'+w.toLowerCase();}],
[/\b(ad|bez|kon|nad|ob|od|pod|pół|ponad|poz|przed|przeciw|roz|sub|w|współ|wszech|wz|z|zd)j/g,'$1ъj'],
[/di([aąeęioóu])/g,'dïj$1'],
[/li([aąeęioóu])/g,'łьj$1'],
[/ri([aąeęioóu])/g,'rïj$1'],
[/ti([aąeęioóu])/g,'tïj$1'],
[/dzi([aąeęoóu])/g,'dь$1'],
[/ci([aąeęoóu])/g,'tь$1'],
/* [/l([aąeęoóu])/g,'łь$1'], */
[/di/g,'dï'], [/ri/g,'rï'],
[/ti/g,'tï'], [/cj/g,'cïj'],
[/dj/g,'dïj'], [/nj/g,'nïj'],
[/rj/g,'rïj'], [/sj/g,'sïj'],
[/tj/g,'tïj'], [/zj/g,'zïj'],
[/([bdfghkłmnprstwz])i([aąeęoóu])/g,'$1ь$2'],
[/dź/g,'dь'], [/rz/g,'rь'],
[/ć/g,'tь'], [/l/g,'łь'],
[/ń/g,'nь'], [/ś/g,'sь'],
[/ź/g,'zь'], [/dzi/g,'di'],
[/rьy/g,'ri'], [/ci/g,'ti'],
[/łьi/g,'łi'], [/ьji/g,'ьi'],
[/ï?ji/g,'ïi'], [/([dtsz])ь([bdfghkłmnprstwz][iь])/g,'$1$2'],
[/łьł([iь])/g,'łł$1'], [/([bcdfghjkłmnprstwzż])j/g,'$1ьj'],
[/[ьij]a/g,'я'], [/[ьij]ą/g,'ю'], /*[/[ьij]ą/g,'ѭ'],*/
[/[ьij]e/g,'е'], [/[ьij]ę/g,'я'], /*[/[ьij]ę/g,'ѩ'],*/
[/[ьij]o/g,'ё'], [/[ьij]ó/g,'е'], /*[/[ьij]ó/g,'ѐ'],*/
[/[ьij]u/g,'ю'], [/ch/g,'х'],
[/cz/g,'ч'], [/sz/g,'ш'],
[/шч/g,'щ'],
/*'óꙋ' 'óо'*/ 'óу'
],/*
transMono = [
'aąbcdeęfghiïjkłmnopqrstuvwxyzżAĄBCDEĘFGHIÏJKŁMNOPQRSTUVWXYZŻ',
'аѫбцдэѧфгхиійклмнопкрстуввхызжАѪБЦДЭѦФГХИІЙКЛМНОПКРСТУВВХЫЗЖ'
],*/
transMono = [
'aąbcdeęfghiïjkłmnopqrstuvwxyzżAĄBCDEĘFGHIÏJKŁMNOPQRSTUVWXYZŻ',
'аубцдеяфгхиийклмнопкрстуввхызжАЯБЦДЭЮФГХИИЙКЛМНОПКРСТУВВХЫЗЖ'
];
transArr.forEach(repLemma);
for(var i=0,l=transMono[0].length;i< l;i++)
repLemma([transMono[0][i],transMono[1][i]]);
repLemma([/\n/g,'<br>']);
repLemma([/\‾(.)/g,function(w){return w[1].toUpperCase();}]);
str = str.replace(/ сю([^а-яё])/g,' ся$1')
.replace(/ ся([^а-яё])/g,'ся$1');
return str;
}
/* End of Polish transliterator */
Цитата: ОригиналKonwersja – stosowane w technologii chemicznej określenie procesów jednostkowych, mających na celu zmianę właściwości przekształcanych materiałów w wyniku różnych reakcji chemicznych, prowadzonych w aparatach zwanych konwertorami (zwykle w wysokiej temperaturze, pod wysokim ciśnieniem lub z użyciem katalizatorów). W czasie konwersji zachodzą różne reakcje chemiczne, np.
Цитата: РезультатКонверсия – стосоване в технолёгии хемичней окреслене процесув едностковых, маюцых на целю змяня властивости прекшталцаных материялув в вынику ружных реакции хемичных, провадзоных в апаратах званых конверторами (звыкле в высокей температуре, под высоким тисненем люб з ужытем катализаторув). В часе конверсии заходзу ружне реакцие хемичне, нп.
Цитата: Результат арх.Конвэрсія – стосованэ в тэхнолёгии хэмичнэй окрэслене процэсув едностковых, маюцых на цэлю змянѧ властивости прекшталцаных матэріялув в вынику ружных рэакціи хэмичных, провадзоных в апаратах званых конвэрторами (звыкле в высокей тэмпэратуре, под высоким тисненем люб з ужытем катализаторув). В часе конвэрсіи заходзѫ ружнэ рэакціе хэмичнэ, нп.
Мой вариант (затрагивающий только буквы с диакритиками, все остальные остаются без изменений, как в современном польском):
ź, ś, ć, ń = zj, sj, cj, nj
ł = lh
ż = xz (как и остальные диграфы для шипящих, заканчивается на z, но вариант zz отпадает, а из чего-то способного звучать з-подобно остается только x)
ą, ę = ahn, ehn или anh, enh ( хотелось бы как-то выразить назализированность, а просто an или am создаст неоднозначности, поэтому триграфы)
ó = oy
Цитата: Python от января 15, 2019, 10:53
... а просто an или am создаст неоднозначности, поэтому триграфы
Например?
Bhudh, очень похоже на беларусский :)
Под него, как я понимаю, Хеллерик и делал.
Цитата: Wolliger Mensch от января 15, 2019, 12:16
Цитата: Python от января 15, 2019, 10:53
... а просто an или am создаст неоднозначности, поэтому триграфы
Например?
Да много их, хоть piątek - piontek. В Вашем варианте выйдет полное совпадение, а это разные слова. И с аn легко подобрать примеры.
Цитата: Python от января 15, 2019, 10:53
Мой вариант (затрагивающий только буквы с диакритиками, все остальные остаются без изменений, как в современном польском):
ź, ś, ć, ń = zj, sj, cj, nj
ł = lh
ż = xz (как и остальные диграфы для шипящих, заканчивается на z, но вариант zz отпадает, а из чего-то способного звучать з-подобно остается только x)
ą, ę = ahn, ehn или anh, enh ( хотелось бы как-то выразить назализированность, а просто an или am создаст неоднозначности, поэтому триграфы)
ó = oy
Всё хорошо, но триграфы уж больно громоздко. Мне и мои диграфы ay и ey кажутся уродливыми, но что ж тут поделаешь...
Цитата: Earl от января 15, 2019, 21:31
Да много их, хоть piątek - piontek. В Вашем варианте выйдет полное совпадение, а это разные слова.
Разные в произношении? :pop:
Цитата: Wolliger Mensch от января 15, 2019, 22:02
Цитата: Earl от января 15, 2019, 21:31
Да много их, хоть piątek - piontek. В Вашем варианте выйдет полное совпадение, а это разные слова.
Разные в произношении? :pop:
В произношении одинаковые. Но зачем без нужды увеличивать количество омонимов? Задача создать польское фонетическое правописание как бы не ставилась. Ставилась задача убрать диакритики, при минимально возможных изменениях актуального правописания.
Цитата: Earl от января 15, 2019, 23:04
Но зачем без нужды...
Прочтите заголовок ветки. Прикиньте. :yes: ;D
Earl, не спорьте с этими людьми, ибо они весьма надменны от своего ума. Инакомыслие они не признают.
Покажите лучше образец текста согласно Вашим представлениям.
Цитата: Python от января 15, 2019, 10:53
ż = xz (как и остальные диграфы для шипящих, заканчивается на z, но вариант zz отпадает, а из чего-то способного звучать з-подобно остается только x)
Пусть будет GZ — ведь возникает на месте ошипления G.
Boug ~ bogzek
Цитата: Hellerick от января 16, 2019, 06:59
... на месте ошипления G.
Это как? G в шипах?! :o
Цитата: sergebsl от января 16, 2019, 00:08
Earl, не спорьте с этими людьми, ибо они весьма надменны от своего ума. Инакомыслие они не признают.
То есть, если Эрл раскритиковал чужой вариант, «весьма надменен» тот, кого он критиковал? :what: Л — логика. :fp:
Цитата: sergebsl от января 16, 2019, 00:08
Покажите лучше образец текста согласно Вашим представлениям.
Пожалуйста. Но мне понравилась идея Хеллерика ż = gz. Так более "по-польски" выйдет. ść = scj, а не sjcj, так как sć невозможно.
Poljska, Rzeczpospolita Poljska (RP) – panjstwo unitarne w Europie Sjrodkowej, pologzone mieydzy Morzem Baltyckim na poulnocy a Sudetami i Karpatami na poludniu, w przewagzajaycej czeysjci w dorzeczu Wisly i Odry. Od poulnocy Poljska graniczy z Rosjay (z jej obwodem kaliningradzkim) i Litway, od wschodu z Bialorusiay i Ukrainay, od poludnia ze Slowacjay i Czechami, od zachodu z Niemcami. Wieykszouscj poulnocnej granicy Poljski wyznacza wybrzegze Morza Bałtyckiego. Poljska Wylayczna Strefa Ekonomiczna na Baltyku graniczy ze strefami Danii i Szwecji.
Цитата: Bhudh от января 15, 2019, 19:44
Под него, как я понимаю, Хеллерик и делал.
На белорусский это становится похоже только в вашей обработке.
Цитата: Wolliger Mensch от января 14, 2019, 20:49
Ł → w, ó → u, ą → on/o, ę → en/e. По-моему, так намного проще.
Цитата: Wolliger Mensch от января 15, 2019, 12:16
Цитата: Python от января 15, 2019, 10:53
... а просто an или am создаст неоднозначности, поэтому триграфы
Например?
Цитата: Wolliger Mensch от января 15, 2019, 22:02
Цитата: Earl от января 15, 2019, 21:31
Да много их, хоть piątek - piontek. В Вашем варианте выйдет полное совпадение, а это разные слова.
Разные в произношении? :pop:
Вы знаете, здесь есть некоторая неоднозначность в источниках. В большинстве описаний, которые я читал, польские /ɔ̃/, /ɛ̃/ действительно не противопоставляются /ɔ/, /ɛ/.
Однако, вот что пишет польская википедия:
Цитата: Fonetyka języka polskiego – Wikipedia, wolna encyklopedia от
Fonem /ŋ/ ma dwa główne alofony. Głoska [ŋ] pojawia się jedynie przed [k] i [g], poza tym za alofon /ŋ/ uważa się także [w̃] (lub ɰ̃), które jest drugim składnikiem dyftongów nosowych. W języku polskim połączenia [nk], [ng] kontrastują z [ŋk], [ŋɡ], np. piosenka [pʲɔˈsɛ̃n̪ka] wobec ręka [ˈrɛ̃ŋka]. W wymowie południowo-wschodniej Polski kontrast taki nie istnieje i wyrazy te tworzą rym dokładny.
Фонема /ŋ/ имеет два основных аллофона. Согласный [ŋ] появляется только перед [k] и [g], кроме того, аллофоном /ŋ/ также считается [w̃] (или ɰ̃), который является вторым компонентом носовых дифтонгов. В польском языке комбинации [nk], [nɡ] контрастируют с [ŋk], [ŋɡ], например, piosenka [pʲɔˈsɛ̃n̪ka], но ręka [ˈrɛ̃ŋka]. В произношении юго-восточной Польши такого контраста не существует, и эти слова образуют совершенную рифму.
Цитата: StanislavGalkin1984 от марта 2, 2019, 05:32
Вы знаете, здесь есть некоторая неоднозначность в источниках. В большинстве описаний, которые я читал, польские /ɔ̃/, /ɛ̃/ действительно не противопоставляются /ɔ/, /ɛ/.
Я хотел сказать, не противопоставляются /ɔn/, /ɛn/.