Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Наиболее оптимальная английская кириллица

Автор Hellerick, октября 20, 2015, 21:43

0 Пользователи и 1 гость просматривают эту тему.

Bhudh

Цитата: Bhudh от октября 21, 2015, 13:55flower — фʌаѵе
Цитата: Hellerick от октября 22, 2015, 03:44
Цитата: bvs от октября 21, 2015, 20:27father - фоѕер?
*Проверил транскриптор*
К моему удивлению, да.
Я тоже удивляюсь. Почему безударное -er просто транслитерируется? Из-за ротированности? На фʌаѵе-то замечания не последовало...
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Hellerick

Цитата: Bhudh от октября 22, 2015, 14:24
Я тоже удивляюсь. Почему безударное -er просто транслитерируется?

А почему бы и нет? Иначе слова были бы слишком неузнаваемы.

Эксперименты с неротацией я оставлю на прожект нарочито антиорфографической письменности.

Bhudh

Цитата: Hellerick от октября 22, 2015, 15:32А почему бы и нет?
Цитата: Hellerick от октября 22, 2015, 03:43Начав отображать немые согласные мы вступаем на опасную территорию, которая грозит похоронить идею совершенной письменности.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Hellerick

Даже в неротических диалектах финальный /r/ всё равно проявляется перед словами на гласную. Это не немой.

Wolliger Mensch

Цитата: Hellerick от октября 22, 2015, 17:18
Даже в неротических диалектах финальный /r/ всё равно проявляется перед словами на гласную. Это не немой.

Он появляется и просто в зиянии — типизовался как вставной согласный.
«Вот интересно, каких лингвистических жемчуг можно найти в море отодвинутых книг», Ян Гавлиш.
«Впредь прошу помнить, что придумал игру не для любых ассоциаций, а для семантически оправданных. Например, чтó это такое: ,,рулетке" — ,,выпечке"?? Тем более, что сей ляпсус я сам совершил...», Марбол
«Ветхий Завет написан на иврите и частично на армейском», Vesle Anne
«МЛ(ять)КО ... ПЛ(ять)NЪ», Тася
«Вот откроет этот спойлер, например, Марго, ничего не подозревая, а потом будут по всему форуму блюющие смайлики...», Авал
«Томан приличный мужчина. Правда по патриархальным меркам слегка голодранец», Vesle Anne
«Возможен ли фонетический переход "ж" в "п с придыханием"», forest

Hellerick

Мой транскриптор говорит, что слово putting должно писаться "пътiнг".
Удивился. Словари это произношение поддерживают.
Не подскажете, это верно для всех putting или только для какого-то особого значения?

Vertaler

Цитата: Hellerick от октября 23, 2015, 17:08
Мой транскриптор говорит, что слово putting должно писаться "пътiнг".
Удивился. Словари это произношение поддерживают.
Не подскажете, это верно для всех putting или только для какого-то особого значения?
Которое с ъ — это от to putt ('загонять мяч в лунку' или 'чпокать'), а не от to put.
Стрч прст в крк и вынь сухим.

Тайльнемер

Я думал, только для putting ← putt.

А как работает ваш транслитератор?

Hellerick

Цитата: Vertaler от октября 23, 2015, 17:21
Которое с ъ — это от to putt ('загонять мяч в лунку' или 'чпокать'), а не от to put.

А ну я так и думал. В словарях про это почему-то никаких пометок не было.

Цитата: Тайльнемер от октября 23, 2015, 17:22
А как работает ваш транслитератор?

Основные данные по произношению берутся из "Carnegie Mellon Pronouncing Dictionary" где каждой словоформе сопоставлено произношение в машиночитаемой форме.
Этот словарь пропускается через кучу regex выражений, которые переводят произношение на кириллицу, а потом, сравнивая произношение с элементами оригинального написания вносят корректировку в кириллическую орфографию.

Например: orthocorrect(w, r'LLY$', r'л+[иі]$', r'ллі') означает:
Если слово в латинице оканчивается на "LLY", а в кириллической транскрипции на "лi", "ллi", "ли" или "лли", то кириллическое окончание надо заменить на "ллi".

На основе этих преобразований формируется Основной словарь. При изменении правил преобразования приходится заново перегенерировать Основной словарь. (Словарь Carnegie при этом принципиально никак мною не модифицируется.)

Кроме того есть еще Пользовательский словарь более высокого приоритета, в который я вношу лично мне нужные словоформы и их переводы в законченном виде.

Для слов, которые не нашлись ни в одном словаре есть таблица транслитерации.

Оригинал кодируемого текста хранится в html-виде. Если какое-то слово читается необычно (например, read в прошедшем времени как ред), то я помещаю после него метку типа <!--2-->, которая учитывается в Пользовательском словаре. Файл пропарсивается, делится на тэги/нетэги, слова/неслова, конвертируется, расстанавливаются мягкие переносы — и вуаля.

Bhudh

Цитата: Hellerick от октября 23, 2015, 17:53Например: orthocorrect(w, r'LLY$', r'л+[иі]$', r'ллі') означает
А много ль раз повторяется вызов orthocorrect в коде? :???
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо


Bhudh

О_о Заmapить нельзя, что ли⁈
В моих транслитераторах либо map или максимум пара-тройка их, либа функция, работающая с массивом.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо


Bhudh

Кагбе оптимизация и рефакторизация, не говоря о прощечтении.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Hellerick

 "Ѵен Мар­ні Ѵоз Ѕер" после вычитки двенадцати глав:
https://yadi.sk/i/2YTGc46SjxSKC
Книжка, кстати, нравится.

Обратил внимание, что у меня фактически нет слов, оканчивающихся на О или Е, зато много слов на OV или EI. Напрашивается, что второй элемент таких дифтонгов на конце слов можно не писать. Но вот при добавлении окончания он будет проявляться. Непонятно, стоит ли такие дебри городить.

Сердце противится написанию "true" как "трiу" вместо "тру". Но терпит "drew" как "дрiу". Хотя разум подсказывает, что там должно быть одно и то же.

Hellerick

Интересные явления:

Некоторые слова становятся омографами. Например, "deafened" и "defend" оба пишутся "дефенд" и различаются только ударением.

Но некоторые слова разным ударением перестают быть омографами. Например, существительное "subject" пишется "събџект", а глагол — "сѵбџект".

Demetrius

Цитата: Hellerick от октября 26, 2015, 10:45
Например, "deafened" и "defend" оба пишутся "дефенд" и различаются только ударением.
Не хотите их диакритически дизамбигуировать?

DarkMax2

Цитата: DarkMax2 от января 16, 2014, 11:52
Цитата: DarkMax2 от мая 18, 2013, 15:03
/ɪ/ - /iː/ = і - и
/ʊ/ - /uː/ = у - ӯ
/e/ - /ɜː/ = е - ē (ер)
/ʌ/ - /ɑː/ = а - ā
/ə/ - /æ/ = ъ - ѣ
/ɒ/ - /ɔː/ = о - ѡ

правда /ə/ и /æ/ - это "short vowels".

RPGAm
ineedинид
ɪɪbidібід
eɛbedебед
ææbackѣбѣк
ɒ(ɑ)boxобоѯ
ɔːɔpawѡпѡ
ɑːɑbraāбрā
ʊʊgoodугуд
ufoodӯфӯд
ʌʌbutабат
ɜːɜrbirdерберд
əəcommaъ
(ɪ)ɨrosesі
bayеібеі
əʊroadъуръуд
cryāікрāі
cowāукāу
ɔɪɔɪboyѡібѡі
ɪə(ɪr)fearірфір
ɛə(ɛr)fairерфер
ʊə(ʊr)lureурлур

А с согласными, думаю, всё и так понятно.
Tej wojny nikt za nas nie wygra! © Wiedźmin III
Коли зчинять лемент: "Хто ж знав?!" — відповімо: "Ми".

З моїх снів ти утечеш над ранок,
Терпка, як аґрус, солодка, як біз.
Хочу снить чорні локи сплута́ні,
Фіалкові очі, мокрі від сліз.

Hellerick

Цитата: Demetrius от октября 26, 2015, 10:46
Цитата: Hellerick от октября 26, 2015, 10:45
Например, "deafened" и "defend" оба пишутся "дефенд" и различаются только ударением.
Не хотите их диакритически дизамбигуировать?

Пока что у меня единственный знак ударения в тексте стоит: де́фенд.

Было бы здорово разруливать обографы с помощью какой-нибудь диакритики, но непонятно, по какому принципу ее ставить.

Wolliger Mensch

«Вот интересно, каких лингвистических жемчуг можно найти в море отодвинутых книг», Ян Гавлиш.
«Впредь прошу помнить, что придумал игру не для любых ассоциаций, а для семантически оправданных. Например, чтó это такое: ,,рулетке" — ,,выпечке"?? Тем более, что сей ляпсус я сам совершил...», Марбол
«Ветхий Завет написан на иврите и частично на армейском», Vesle Anne
«МЛ(ять)КО ... ПЛ(ять)NЪ», Тася
«Вот откроет этот спойлер, например, Марго, ничего не подозревая, а потом будут по всему форуму блюющие смайлики...», Авал
«Томан приличный мужчина. Правда по патриархальным меркам слегка голодранец», Vesle Anne
«Возможен ли фонетический переход "ж" в "п с придыханием"», forest

Hellerick

Подумалось, что буквам нужны названия.


А    аз
Ббѵкі
Введі
Гглагел
Ддоброѵ
Еест
Жживеті
Зземлі
Ѕѕелоѵ
Ииџі
Ііот
Ккакоѵ
Лліуді
Ммісліті
Ннаш
Оон
Ппокоі
Ръртс
Ссловоѵ
Ттѵердоѵ
Уук
Ффърт
Ххър
Ччърв
Џџърві
Шша
Ъър
Ѡомега
Ѳѳита
Ѵѵѵџітс

Или попробовать что-нибудь более приближенное к английской основе придумать?  :???

Hellerick

Обнаружил, что транскриптор пытается передавать "lived" как "лаiвд".
Словаре такое произношение указано в качестве альтернативного. Тоже какое-то редкое значение?

Тайльнемер


Hellerick

"Отпрямоэфиренный."  :???
Как-то трудно представить ситуацию, когда такое слово оказалось предпочтительнее обычного "лаiв".

Wolliger Mensch

Цитата: Hellerick от октября 28, 2015, 05:35
"Отпрямоэфиренный."  :???
Как-то трудно представить ситуацию, когда такое слово оказалось предпочтительнее обычного "лаiв".

А от- зачем? Просто «выпущенный в прямом эфире».
«Вот интересно, каких лингвистических жемчуг можно найти в море отодвинутых книг», Ян Гавлиш.
«Впредь прошу помнить, что придумал игру не для любых ассоциаций, а для семантически оправданных. Например, чтó это такое: ,,рулетке" — ,,выпечке"?? Тем более, что сей ляпсус я сам совершил...», Марбол
«Ветхий Завет написан на иврите и частично на армейском», Vesle Anne
«МЛ(ять)КО ... ПЛ(ять)NЪ», Тася
«Вот откроет этот спойлер, например, Марго, ничего не подозревая, а потом будут по всему форуму блюющие смайлики...», Авал
«Томан приличный мужчина. Правда по патриархальным меркам слегка голодранец», Vesle Anne
«Возможен ли фонетический переход "ж" в "п с придыханием"», forest

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр