Author Topic: Татарский транслитератор (Kiril - Latin, Latin - Kiril)  (Read 25219 times)

0 Members and 1 Guest are viewing this topic.

Offline AminBay

  • Posts: 422
  • Gender: Male
Немного доработал Описание правил транслитерации с кириллицы в стандартную латиницу, начатое Alessandro.

1) расставляем ğ и q.
га, го, гу, гы > ğa, ğo, ğu, ğı
га, го, гу (если далее следуют ә,ө,ү, ь или и) > ğә, ğө, ğü
гый >  ği
гыль > ğel

ка, ко, ку, кы > qa, qo, qu, qı
ка, ко, ку, кый(если далее следуют ә,ө,ү,ь или и) > qә, qө, qü, qi
кый (в остальных случаях)> qı
кыйль > qil

аг, ог, уг, ыг, ыйг > ağ, oğ, uğ, ığ, iğ
әг, өг, үг, иг > әg, өg, üg, ig

ак, ок, ук, ык, ыйк > аq, оq, uq, ıq, iq
әк, өк, үк, ик > әk, өk, ük, ik

гать, гыять, гыя > ğәt, ğiәt, ğiә
кать, кыять, кыя > qәt, qiәt, qıya

гъ > ğ
къ > q

2) обрабатываем е, ю, я в начале слога.
В начале слова, а также после гласных, ь и ъ
е/ю/я > ye/yü/yә, если сразу перед, сразу после, через одну или через две буквы следуют ә, е, и, ө, ү,ъ или ь
е/ю/я > e/ü/ә, если после и.
е/ю/я > yı/yu/ya в остальных случаях

3) преобразуем твёрдые гласные в мягкие, там, где это нужно.
Если после буквы а/о/у/ы/ый сразу, через одну или через две буквы идёт ә, е, и, ө, ү или ь, то она заменяется на ә/ө/ü/e/i соответственно.

4) преобразование у,ү.
Если прямо перед буквой идут ә/ө/ü/e/i, то они заменяются на w.
В остальных случаях на u/ü соответственно.

5) преобразование в.
Заменяется на w.

6) преобразование ц.
В начале слова и после согласных заменяется на s. В остальных случаях на ts.

7) преобразование щ.
Заменяется на şç.
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Offline murator

  • Posts: 2071
  • Gender: Male
Разве на suzlek.ru это уже не сделано?

Offline AminBay

  • Posts: 422
  • Gender: Male
Разве на suzlek.ru это уже не сделано?
Yuq, anda tekst yәki web-bitne әylәnderep bulmıy şul. :no:
Süzlәp-süzlәp kenә.
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Offline murator

  • Posts: 2071
  • Gender: Male
Да, гафу ит, я перепутал, там есть транслитератор для получения текста со специфическими символами из текста на обычной раскладке (кириллической или латинской).
http://www.suzlek.ru/suzlek/main.letters

Offline Alessandro

  • Posts: 2765
  • Gender: Male
    • Alem-i Medeniye
Вопросы.
- Насколько я понимаю, в официальной латинице ый передаётся через ıy, в Заманалифе с помощью специальной буквы í. А у вас вот написано "кый (в остальных случаях)> qı". Разве не qıy?
- гыя > ğiə ... кыя > qıya  Во-первых, почему по-разному? Во-вторых, гыя/кыя ведь могут передавать и ğıya/qıya, и ğiə/qiə разве нет?
- ие, ию, ия > ie, iü, iə Точно не iye, iyü, iyə?
- Касательно ц > s в начале слова и после согласных. Это действительно официальное правило?
Спасибо, что дочитали.

Offline AminBay

  • Posts: 422
  • Gender: Male
Вопросы.
- Насколько я понимаю, в официальной латинице ый передаётся через ıy, в Заманалифе с помощью специальной буквы í. А у вас вот написано "кый (в остальных случаях)> qı". Разве не qıy?
- гыя > ğiə ... кыя > qıya  Во-первых, почему по-разному? Во-вторых, гыя/кыя ведь могут передавать и ğıya/qıya, и ğiə/qiə разве нет?
- ие, ию, ия > ie, iü, iə Точно не iye, iyü, iyə?
- Касательно ц > s в начале слова и после согласных. Это действительно официальное правило?

По латинской орфографии (у меня перед глазами офиц. издание):
-ый передается как -ıy со всеми буквами, кроме к и г (q/ğ) - после них пишется как "i" . Например, казый - qazıy, но Искакый - İsxaqi.

- в татарском есть лишь 3 слова на "кыя": кыя/qıya (скала) и кыяс/qıyas (аналогия) и кыямәт/qıyәmәt (судный день). Слов на "гыя" нет, но используется как частица -гыя в арабских заимствованиях (что-то вроде "шәргыя", "җәмгыяви" - там везде идёт как ğiə ). Попытался стандартизировать этот случай .... :what:

-ие, ию, ия > ie, iü, iə - да, это точно так. Причиной указан "принцип экономии". Пример приводится такой: кием - kiem (не "kiyem").

- да, по офиц. изданию. Примером дано: цирк - sirk, вакцина - vaksina
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Offline Alessandro

  • Posts: 2765
  • Gender: Male
    • Alem-i Medeniye
4) преобразование у,ү.
Если прямо перед буквой идут ә/ө/ü/e/i, то они заменяются на w.
В остальных случаях на u/ü соответственно.
Разве не после всех гласных, а только после мягких?! Я думал саклау > saqlaw, ауыл > awıl и т.д.
Спасибо, что дочитали.

Offline AminBay

  • Posts: 422
  • Gender: Male
4) преобразование у,ү.
Если прямо перед буквой идут ә/ө/ü/e/i, то они заменяются на w.
В остальных случаях на u/ü соответственно.
Разве не после всех гласных, а только после мягких?! Я думал саклау > saqlaw, ауыл > awıl и т.д.
Точно, + пары к ним: а/о/ы/.
А вот авыл - awıl ( у нас пишется авыл - через в).
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Offline Alessandro

  • Posts: 2765
  • Gender: Male
    • Alem-i Medeniye
ый превращается в i не только после, но и перед ğ, q?
Спасибо, что дочитали.

И ещё, кстати... Пункт 3... Я его там написал, а сейчас думаю - он нужен вообще?
Спасибо, что дочитали.

Наваял жаваскриптик. Вот, можете тестировать http://medeniye.org/tatartranslit/index.htm

Чтобы сделать нормальный транслитератор, кстати, нужно составить страшенной длины список исключений... Например слова с g, k в твёрдых словах (типа komitet, optika, pedagog), слова с буквой v (vokzal, vagon)... В нашем (крымскотатарском) скрипте слова-исключения исчисляются уже сотнями.
Спасибо, что дочитали.

Во что превращается буква ё?
Во что превращаются ю, я после согласных?
Спасибо, что дочитали.

Offline Ванько

  • Posts: 4379
  • Gender: Male
Например слова с g, k в твёрдых словах (типа komitet, optika, pedagog), слова с буквой v (vokzal, vagon)...
А нельзя ли ввести практику «переваривания» иностранных слов?
Lingvoforum has ruined my life.
-------------------------
ЛФ — это вообще к лингвистике мало имеет отношение. © RawonaM

Offline AminBay

  • Posts: 422
  • Gender: Male
ый превращается в i не только после, но и перед ğ, q?
Alessandro! Zur rәxmәt!! :=

1)Да, есть такое.
2)ё преобразуется всегда в yo, а ю, я после согласных - строго в yu, ya; в начале слова (если есть далее знак ь) - в yü, yә, в остальных случаях - в yu, ya.
Иллюстрация:
Пётр - Pyotr
Маня - Manya
ямь - yәm
як - yaq
3)Также хотелось бы добавить:
үе > üe
ья, ью > ya, yu
як, яг, юк, юг > yaq, yağ, yuq, yuğ
Иллюстрация:
килүе - kilüe
көньяк - kөnyaq.
4) Соответствия букв такие:
ө-ө
ә-ә
ң-ŋ
ү-ü
5) Со словами - исключениями....решено бороться: поголовно все эти слова(типа komitet, optika, pedagog) отатариваются ( становятся kinәşmә/mәslixәt, küzlekxanә/küzlәweç, tәrbiәçe/mөğәllim). Даже слово "respublika" норовит стать cөmhüriәt.

А в транслитераторе для Qırımtele много исключений набралось?
Может, я их переведу на наш диалект?
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

ый превращается в i не только после, но и перед ğ, q?
Тут такие варианты:
(более офиц. вариант)
ыйк > ıyq
ыйг > ıyğ

Садыйк - Sadıyq
алыйк - alıyq
(менее)
ыйк > iq
Балтыйк - Baltiq
Садыйк - Sadiq


-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Offline Alessandro

  • Posts: 2765
  • Gender: Male
    • Alem-i Medeniye
Проверяйте...

ө-ө
ә-ә
ң-ŋ
ү-ü
Сделал, но вообще, конечно... У всех ö и ñ, ан нет, специально сделаем по-другому, чтоб не как у родственников было. Лишь бы выпендриться... Как соввласть ругать, которая всем одни и те же звуки разными буквами пообозначала, это мы завсегда, а как самим алфавит делать, так сами ничуть не лучше.  :wall:
Спасибо, что дочитали.

А в транслитераторе для Qırımtele много исключений набралось?
Может, я их переведу на наш диалект?
Для направления кириллица > латиница где-то полторы сотни. Но вам от них никакой пользы, потому что у нас разные правила транслитерации и, соответственно, разные исключения. В крымскотатарском проблема с отсутствием в кириллице букв для ö, ü (они передаются с помощью о,ё и у,ю). Чтобы комедия не превращалась в kömediya, бульдозер в büldozer, университет в üniversitet и т.д., нужны списки исключений. Ну плюс ещё какое-какие слова, но их мало.
А у вас проблемы с v, k, g, ye, соответственно и исключения другие.
Спасибо, что дочитали.

Offline AminBay

  • Posts: 422
  • Gender: Male
Проверяйте...

ө-ө
ә-ә
ң-ŋ
ү-ü
Сделал, но вообще, конечно... У всех ö и ñ, ан нет, специально сделаем по-другому, чтоб не как у родственников было. Лишь бы выпендриться... Как соввласть ругать, которая всем одни и те же звуки разными буквами пообозначала, это мы завсегда, а как самим алфавит делать, так сами ничуть не лучше.  :wall:

 :green:
Ну эти буквы ä,ö и ñ у нас есть, но только для компьютерных применений на программах, не поддреживающих Юникод.
Обижаться не стоит - вы же односторонне перешли на латину (блин, чего ж мы вместе не собрались и один алфавит не составили, и вместе не перешли, куды Всемирный Конгресс Татар смотрел..??).
Букву ә решено сохранить - как историческую преемственность: она была в иске имля, была в яналифе, была в кириллике, и сейчас есть. Нечто вроде символа тат. языка.
У нас буква ä - чрезвычайно частотная. Так что с ней весь текст пестрит ой-ой-ой как!
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

А в транслитераторе для Qırımtele много исключений набралось?
Может, я их переведу на наш диалект?
Для направления кириллица > латиница где-то полторы сотни.
А транслитератор обратный латин > кирил - это правила наоборот, или я что-то путаю? :???
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Проверяйте...
Сейчас протестировал - всё замечательно.
Парочка дополнений:
я (отдельное)> yә
яки > yәki
ияк, ияг > iәk, iәg
яу, яү > yaw, yәw
гыят, гате, кате, каяте > ğiәt, ğәte, qәte, qәyәte
ыйк > ıyq
ц (после согласных) > s
аек, аегы > ayıq, ayığı
гае > ğәye
Из штриховых моментов:
Әюпова -Әpowa
Ягъни - YAğni
В татарских текстах частенько попадаются башкирские вкрапления.
Можно сделать простые однозначные замены:
ҙ > đ
ғ > ğ
ҡ > q
ҫ > ś


-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Offline Alessandro

  • Posts: 2765
  • Gender: Male
    • Alem-i Medeniye
Обижаться не стоит - вы же односторонне перешли на латину (блин, чего ж мы вместе не собрались и один алфавит не составили, и вместе не перешли, куды Всемирный Конгресс Татар смотрел..??).
Насколько я знаю, новый тюркский латинский алфавит был утверждён в 1991 году на международном конгрессе в Баку. Тогда решили, что это будет турецкий алфавит плюс ä, ñ, q, x и ещё какие-то буквы для башкирских ҙ и ҫ. Через год в 1992-м по просьбе азербайджанской стороны ä заменили на ə. Но вся бяка в том, что никто кроме крымских татар и азербайджанцев этого прооекта не придерживается: узбеки, туркмены, татары сделали себе алфавиты с отклонениями от него. Причём в случае с узбекским ещё можно понять: там выбрали другой принцип (диграфы вместо диакритик), но у туркмен и татар принцип тот же самый. Просто взяли и непонятно зачем выбрали буквы не такие как у родственных народов. В туркменском случае вообще уродство какое-то получилось, уж простите за резкость.

Букву ә решено сохранить - как историческую преемственность: она была в иске имля, была в яналифе, была в кириллике, и сейчас есть. Нечто вроде символа тат. языка.
У нас буква ä - чрезвычайно частотная. Так что с ней весь текст пестрит ой-ой-ой как!
Тут я полностью согласен - заманалифные тексты, пестрящие буквой ä выглядят не очень красиво, да и от руки писать с таким количеством умляутов трудно. Поэтому и азербайджанцы оперативно вернули букву ə назад.
С ñ vs ŋ тоже ещё как-то можно спорить. В конце концов именно такое начертание есть только в крымскотатарском, в туркменскм почти такое, но чуть отличающееся (ň), а больше ни у кого этой буквы нет.
Но с ö, которая есть во всех без исключения современных тюркских латиницах, выбравших "диакритический" принцип зачем было велосипед изобретать?
Спасибо, что дочитали.

Парочка дополнений:
Хорошо, сделаю в ближайшее время.

PS
На всякий случай: я сам не крымский татарин. Сочувствующий, скажем так.  ::)
Спасибо, что дочитали.

Offline AminBay

  • Posts: 422
  • Gender: Male
Насколько я знаю, новый тюркский латинский алфавит был утверждён в 1991 году на международном конгрессе в Баку. Тогда решили, что это будет турецкий алфавит плюс ä, ñ, q, x и ещё какие-то буквы для башкирских ҙ и ҫ. Через год в 1992-м по просьбе азербайджанской стороны ä заменили на ə. Но вся бяка в том, что никто кроме крымских татар и азербайджанцев этого прооекта не придерживается: узбеки, туркмены, татары сделали себе алфавиты с отклонениями от него. Причём в случае с узбекским ещё можно понять: там выбрали другой принцип (диграфы вместо диакритик), но у туркмен и татар принцип тот же самый. Просто взяли и непонятно зачем выбрали буквы не такие как у родственных народов. В туркменском случае вообще уродство какое-то получилось, уж простите за резкость.
Я думаю, что каждый народ должен выбрать себе алфавит сам - чтоб не было претензий, мол, "нам его эти (наим-е) подкинули". Вот мы же ненавидим кириллику за то, что её нам навязали.
Туркменский "ужас" я видел на этикетках. Но... недавно увидел саммит "Yepek yulı", проходивший в Ашгабаде и изменил своё мнение: за спиной Медведева ничего себе, стильненко смотрятся эти буковки 8-). Сразу можно сказать, какой это язык.
Уникальность при глобализме дорогого стоит!

Quote
Тут я полностью согласен - заманалифные тексты, пестрящие буквой ä выглядят не очень красиво, да и от руки писать с таким количеством умляутов трудно. Поэтому и азербайджанцы оперативно вернули букву ə назад.
С ñ vs ŋ тоже ещё как-то можно спорить. В конце концов именно такое начертание есть только в крымскотатарском, в туркменскм почти такое, но чуть отличающееся (ň), а больше ни у кого этой буквы нет.
Но с ö, которая есть во всех без исключения современных тюркских латиницах, выбравших "диакритический" принцип зачем было велосипед изобретать?
Насчёт буквы ö - раз оставили ә, то почему бы и ө не оставить?
Немного пролетели с Юникодом - там ө то ли африканская, то ли ещё где-то сидит. Но Юникод каждый год дополняется. Подушка безопасности в виде "ä,ö, ñ для комп. применений" у нас есть.
Вы не татар? А я хотел было с Уразой-байрам поздравить- всё равно Mөbarәk bulsın! :)
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Offline Alessandro

  • Posts: 2765
  • Gender: Male
    • Alem-i Medeniye
Внёс соотв. исправления.

Вопросы:
- В сочетаниях типа иг, ик буквы г, к могут обозначать ğ, q? Например ика нужно транслитить как iqa или как ika?
- Буквы а, о, у могут обозначать ə, ö, ü в каких-либо иных случаях кроме как для передачи твёрдости предшествующих г и к?

ҙ > đ
ҫ > ś
Вы точно уверены? Просто как-то странно. Логичнее было бы либо đ и ŧ, либо ź и ś.
Спасибо, что дочитали.

Насчёт буквы ö - раз оставили ә, то почему бы и ө не оставить?
Потому что во всех тюркских латиницах используется ö, и ни в одной нет ө.

Я думаю, что каждый народ должен выбрать себе алфавит сам - чтоб не было претензий, мол, "нам его эти (наим-е) подкинули".
Безусловно. Но зачем, я не могу понять, при прочих равных из двух букв вместо той, которая у всех родственных народов есть, выбирать ту, которой ни у одного из них нет?

А туркменский алфавит - это таки жесть. Даже один факт наличия в алфавите буквы ç при отсутсвии с уже сам по себе показывает "мудрость" его составителей.  :wall:
Спасибо, что дочитали.

 

With Quick-Reply you can write a post when viewing a topic without loading a new page. You can still use bulletin board code and smileys as you would in a normal post.

Note: this post will not display until it's been approved by a moderator.
Name: Email:
Verification:
Type the letters shown in the picture
Listen to the letters / Request another image
Type the letters shown in the picture:
√49 Напишите ответ строчными буквами:
«Сто одёжек, все без застёжек» — что это?: