Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Татарский транслитератор (Kiril - Latin, Latin - Kiril)

Автор AminBay, сентября 18, 2009, 09:55

0 Пользователи и 1 гость просматривают эту тему.

Alessandro

Цитата: AminBay от сентября 20, 2009, 16:33А транслитератор обратный латин > кирил - это правила наоборот, или я что-то путаю? :???
Да нет, не совсем наоборот...
Там, я так понимаю, главный вопрос с правилами расстановки мягких знаков.
А в остальном по идее всё просто: yə, ya > я, yı, ye > е, yü, yu > ю, ğə > га, qə > ка ну и т.д. Если я ничего не упустил...
Спасибо, что дочитали.

AminBay

Цитата: AminBay от сентября 18, 2009, 09:55
Немного доработал Описание правил транслитерации с кириллицы в стандартную латиницу, начатое Alessandro.

1) расставляем ğ и q.
га, го, гу (если далее следуют ә,ө,ү, ь или и) > ğә, ğө, ğü
ка, ко, ку, кый(если далее следуют ә,ө,ү,ь или и) > qә, qө, qü, qi

1. Надо бы дополнить так:
га, го, гу (если далее следуют ә,ө,ү,е, ь или и) > ğә, ğө, ğü

2. А вот слово кодрәт упорно не хочет подчиняться  правилу на "ка, ко, ку, кый" ;D - становится qodrәt вместо qөdrәt.

3. В слове СЕНТЯБРЬ (в верхнием регистре) буква "я" также упорствует > SENTЯBR
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

*אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

AminBay

Цитата: Alessandro от сентября 21, 2009, 00:16
Вопросы:
- В сочетаниях типа иг, ик буквы г, к могут обозначать ğ, q? Например ика нужно транслитить как iqa или как ika?
- Буквы а, о, у могут обозначать ə, ö, ü в каких-либо иных случаях кроме как для передачи твёрдости предшествующих г и к?

Цитата: AminBay от сентября 20, 2009, 19:55ҙ > đ
ҫ > ś
Вы точно уверены? Просто как-то странно. Логичнее было бы либо đ и ŧ, либо ź и ś.

1. Буквы ğ, q  в татарских словах обозначать не могут - всегда будет ika. Правда, есть слово-исключение (арабское) икамәт > iqәmәt.

2.Да, вся проблема с этими "к" и "г", которые в себе несут по 2 звука, и из-за них происходит на письме эта катавасия с а, о, у...

3.Насчёт башкирского не уверен. Точно знаю, что буква đ была для звука ҙ в яналифе 20-30-х гг. Для звука ҫ была буква наподобие старорусской "фиты". Посмотрю, какая сейчас латина у башкир. Видимо, вы правы, надо выбрать одну из пар.

По-моему, транслит латин-кирил должен быть легче.
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

*אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

AminBay

Цитата: Alessandro от сентября 21, 2009, 00:25
Цитата: AminBay от сентября 20, 2009, 20:57Насчёт буквы ö - раз оставили ә, то почему бы и ө не оставить?
Потому что во всех тюркских латиницах используется ö, и ни в одной нет ө.

Безусловно. Но зачем, я не могу понять, при прочих равных из двух букв вместо той, которая у всех родственных народов есть, выбирать ту, которой ни у одного из них нет?

А туркменский алфавит - это таки жесть. Даже один факт наличия в алфавите буквы ç при отсутсвии с уже сам по себе показывает "мудрость" его составителей.  :wall:

Раз есть закон и одобрено Академией наук Татарстана, Институтом Тат. языка им . Ибрагимова - значит, какие-то причины были. Может преемственность или удобство написания? :donno:
Да и "татарский вопрос в РФ" - это политический вопрос, вопрос существования страны "Rusiә".
Даже в таком самостийно-татаризированном варианте русские СМИ объявили о "переходе татар на турецкий алфавит", "о турецкой экспансии", "о подрывной деятельности Анкары в Поволжье". Чего только стоят заседания Федерального Собрания по вопросу латиницы нашего языка и вердикт Конституц. Суда РФ - "угроза единству и целостности страны"!
Вообще Qazan не любит оглядываться на кого бы то ни было.
Мне важна официальность - самопала с тат.латиной в Татнете хватает выше крыши.
Пока будем пользоваться этим.
Туркменский на латине мне показался занятным, в принципе понимаемость есть, одну-две буквы картину не меняют особо.
Будем уважать их выбор - вон кыргызы вообще на кирилике остановились как вкопанные.
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

*אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Alessandro

Баги исправлены.

Цитата: AminBay от сентября 21, 2009, 18:58Раз есть закон и одобрено Академией наук Татарстана, Институтом Тат. языка им . Ибрагимова - значит, какие-то причины были.
Собственно, к ним и претензии. К названным организациям.

Цитата: AminBay от сентября 21, 2009, 18:58
Туркменский на латине мне показался занятным, в принципе понимаемость есть, одну-две буквы картину не меняют особо.
Будем уважать их выбор - вон кыргызы вообще на кирилике остановились как вкопанные.
Да не, понимаемость-то конечно есть, куда она денется. Чтоб понимаемость исчезла, это нужно звук а буквой b обозначать или как-нить ещё совсем изощрённо извратиться. Но наряду с понятностью видна и, извините, дурость составителей этого чудо-алфавита. Даже если на соседей вообще не оглядываться, можно было бы разумнее алфавит составить.
И мне кажется, что это не столько их выбор, сколько самодурство покойника Туркменбаши.

Цитата: AminBay от сентября 21, 2009, 18:51По-моему, транслит латин-кирил должен быть легче.
Ну, напишите правила - сделаю скрипт.

Вообще как-то странно, что за столько лет существования татарской латиницы ни на одном сайте нет такого сервиса.  :???
Спасибо, что дочитали.

murator

Цитата: AminBay от сентября 18, 2009, 12:37
- в татарском есть лишь 3 слова на "кыя": кыя/qıya (скала) и кыяс/qıyas (аналогия) и кыямәт/qıyәmәt (судный день).
И-и-и, бәхетсез кыяр онытканың бар :'(

Ванько

Цитата: Alessandro от сентября 21, 2009, 19:58
Вообще как-то странно, что за столько лет существования татарской латиницы ни на одном сайте нет такого сервиса.
http://www.lexilogos.com/clavier/multilingue.htm
Напишите автору сайта, он добавит. Там у него очень простой скрипт, вы сами можете его написать, вот для туркменского есть к примеру – http://www.lexilogos.com/clavier/turkmen_conversion.htm
Lingvoforum has ruined my life.
-------------------------
ЛФ — это вообще к лингвистике мало имеет отношение. © RawonaM

AminBay

Цитата: Alessandro от сентября 21, 2009, 19:58
Баги исправлены.
Zur rәxmәt!

ЦитироватьДа не, понимаемость-то конечно есть, куда она денется. Чтоб понимаемость исчезла, это нужно звук а буквой b обозначать или как-нить ещё совсем изощрённо извратиться. Но наряду с понятностью видна и, извините, дурость составителей этого чудо-алфавита. Даже если на соседей вообще не оглядываться, можно было бы разумнее алфавит составить.
И мне кажется, что это не столько их выбор, сколько самодурство покойника Туркменбаши.
Не будем трогать покойников, urınnarı cәnnәttә bulsın.
Какой народ - такой правитель. Какой правитель - такие законы. Какие законы - такие алфавиты. :eat: Сейчас там зуботехник руководит.

Цитата: AminBay от сентября 21, 2009, 18:51По-моему, транслит латин-кирил должен быть легче.
ЦитироватьНу, напишите правила - сделаю скрипт.
Вообще как-то странно, что за столько лет существования татарской латиницы ни на одном сайте нет такого сервиса.  :???

Да нет, сервисы были. Но во-первых, не на офиц. латине, а во-вторых, с собственными орфографиями разработчиков, в-третьих, они закрылись.
Если позволите, напишу правила для латин-кирил.
Murator! Dөres, qıyar, qiyәfәt bar tağın. :)
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

*אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Alessandro

Цитата: AminBay от сентября 21, 2009, 18:51
Цитата: Alessandro от сентября 21, 2009, 00:16- В сочетаниях типа иг, ик буквы г, к могут обозначать ğ, q? Например ика нужно транслитить как iqa или как ika?
1. Буквы ğ, q  в татарских словах обозначать не могут - всегда будет ika. Правда, есть слово-исключение (арабское) икамәт > iqәmәt.
Ещё вот, похоже, табигать - tabiğət.
Спасибо, что дочитали.

AminBay

Цитата: Alessandro от сентября 22, 2009, 19:58
Цитата: AminBay от сентября 21, 2009, 18:51
Цитата: Alessandro от сентября 21, 2009, 00:16- В сочетаниях типа иг, ик буквы г, к могут обозначать ğ, q? Например ика нужно транслитить как iqa или как ika?
1. Буквы ğ, q  в татарских словах обозначать не могут - всегда будет ika. Правда, есть слово-исключение (арабское) икамәт > iqәmәt.
Ещё вот, похоже, табигать - tabiğət.
Ну, это последнее слово подходит к учтённому нами ранее правилу на  -гать/кать. Если что таких слов не особо много, их можно забить в исключения.
Alessandro, не могли бы вы вкратце объяснить, как можно сделать транслитератор веб-страниц по имеющемуся транслитератору текстов?
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

*אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Alessandro

Цитата: AminBay от сентября 23, 2009, 11:23
Цитата: Alessandro от сентября 22, 2009, 19:58Ещё вот, похоже, табигать - tabiğət.
Ну, это последнее слово подходит к учтённому нами ранее правилу на  -гать/кать. Если что таких слов не особо много, их можно забить в исключения.
Я спрашивал про сочетания ика, ига вне зависимости от каких-либо иных ранее сформулированных нами правил.
Тут просто всё зависит от того, в каком порядке эти правила поставить в скрипте. Если сначала ига > iga, ика > ika, а потом га > ğa/ğə, ка > qa/qə, то будет analitika и tabigat, а если наоборот, то analitiqa и tabiğət. В первом случае придётся заносить в исключения слово табигать, во втором - слово аналитика. Надо подумать, какой из этих случаев приведёт к меньшему числу исключений. Подозреваю, что второй.

Цитата: AminBay от сентября 23, 2009, 11:23
Alessandro, не могли бы вы вкратце объяснить, как можно сделать транслитератор веб-страниц по имеющемуся транслитератору текстов?
Боюсь, что я не мог бы. Я в технической тороне дела не очень разибраюсь. JavaScript для транслитерации сделал несколько лет назад, разобравшись в том, как работают там с регулярными выражениями, и теперь вот могу по заданным правилам скрипты ваять. А вообще программист из меня никакой. Сейчас попробую спросить знающих людей.
Спасибо, что дочитали.

bismigalis

AminBay, по просьбе Alessandro, объясняю как я сделал транслитерацию веб-страниц налету.

Во-первых, после того как вы сделаете транслитератор на javascript, его надо будет переписать на PHP. Имея на руках PHP версию, остальное дело техники. Я написал небольшой скрипт на PHP (20строк) который делает следующее:
1. Получает страницу с заданного адреса. Адрес передаётся в скрипт в параметре q.
2. Полученная страница, это просто строка, в терминах PHP, пропускаем её через функцию транслитерации.
3. В полученной строке, подменяем ссылки (они ведут на сервер, где находится сайт) на ссылки ведущие на наш скрипт. Это что бы при клике по ссылке, получать также транслитерованную страницу.
4. Отдаем страницу браузеру


Comp1089

Я считаю, что всё-таки лучше ö т:к. латинская ɵ (latin small/capital letter barred o) в большинстве случаев  либо вообще не поддерживается, либо выглядит ужасно. А кириллическая (cyrillic letter barred o) в латинице - не очень нормально, будут например трудности в Википедии с cyr-lat ботами итд.

AminBay

Цитата: Alessandro от сентября 27, 2009, 00:03
Цитата: AminBay от сентября 23, 2009, 11:23
Цитата: Alessandro от сентября 22, 2009, 19:58Ещё вот, похоже, табигать - tabiğət.
Ну, это последнее слово подходит к учтённому нами ранее правилу на  -гать/кать. Если что таких слов не особо много, их можно забить в исключения.
Я спрашивал про сочетания ика, ига вне зависимости от каких-либо иных ранее сформулированных нами правил.
Тут просто всё зависит от того, в каком порядке эти правила поставить в скрипте. Если сначала ига > iga, ика > ika, а потом га > ğa/ğə, ка > qa/qə, то будет analitika и tabigat, а если наоборот, то analitiqa и tabiğət. В первом случае придётся заносить в исключения слово табигать, во втором - слово аналитика. Надо подумать, какой из этих случаев приведёт к меньшему числу исключений. Подозреваю, что второй.

Цитата: AminBay от сентября 23, 2009, 11:23
Alessandro, не могли бы вы вкратце объяснить, как можно сделать транслитератор веб-страниц по имеющемуся транслитератору текстов?
Боюсь, что я не мог бы. Я в технической тороне дела не очень разибраюсь. JavaScript для транслитерации сделал несколько лет назад, разобравшись в том, как работают там с регулярными выражениями, и теперь вот могу по заданным правилам скрипты ваять. А вообще программист из меня никакой. Сейчас попробую спросить знающих людей.
Zur rәxmәt, duslar!
Спасибо за объяснения!

Alessandro! Я думаю, лучше взять  второй способ, т.е. отдать приоритет словам на  -ğət. Это будет наиболее разумный и оптимальный вариант.
Башк. буквы, думаю, надо конвертировать так:
ҙ > ź
ғ > ğ
ҡ > q
ҫ > ś


Bismigalis! Есть ли возможность конвертации javascript в php? Или надо писать алгоритм заново на php?
Правильно я понимаю, что для этого дела нужен отдельная веб-страница, подойдёт в таком формате - //www.веб-страница.narod.ru ?

Comp1089 правильно отметил про неудобность латинской буквы ɵ. Я думаю, может быть сделать 2-хвариантный транслитератор Latin Ә / Ä: alfa-вариант с (ә, ө, ŋ) и beta-аналог с (ä, ö, ñ).
Ведь действительно, может браузер не поддерживать офиц. латинскую графику или проблемы со шрифтами могут быть, опять-же Вики...
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

*אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

bismigalis

ЦитироватьЕсть ли возможность конвертации javascript в php? Или надо писать алгоритм заново на php?
Правильно я понимаю, что для этого дела нужен отдельная веб-страница, подойдёт в таком формате - //www.веб-страница.narod.ru ?

Сам алгоритм замены на PHP подойдёт от крымскотатарской версии, нужно будет только изменить несколько файлов под татарский язык, а именно:
- файл с константами
- файл с исключениями
- файл с регулярными выражениями

Alessandro делал PHP версию он больше знает. Я от него получил готовую PHP версию.

Веб страницы не достаточно, нужно чтобы на сервере стоял PHP, соответственно //narod.ru не подойдёт. Можно найти бесплатный хостинг с PHP, сейчас есть такие.

Alessandro

Цитата: bismigalis от сентября 28, 2009, 11:18Alessandro делал PHP версию он больше знает. Я от него получил готовую PHP версию.
На самом деле делал не я, делал форумчанин AlefZet, я только помогал. Но его (AlefZet'а) давным-давно не видать в сети.
Но в любом случае у нас уже есть образец - работающий скрипт для крымскотатарских текстов. Нужно только, как уже было сказано, регэкспы и список исключений поменять на татарские.
Спасибо, что дочитали.

AminBay

Цитата: Alessandro от сентября 28, 2009, 18:24
Но в любом случае у нас уже есть образец - работающий скрипт для крымскотатарских текстов. Нужно только, как уже было сказано, регэкспы и список исключений поменять на татарские.
Мне сделать список исключений или не надо? :)
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

*אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Timming

Друзья, после прочтения этой ветки у меня в голове наконец-то начала складываться стройная картина татарской транслитерации. Рәхмәт сезгә =)

Я попытался систематизировать все правила, которые вы тут привели. Их можно посмотреть вот здесь. Комментарии можете оставлять здесь, так как страница заблокирована, дабы уберечь ее от вандализма.

Comp1089


Alessandro

Потому что автоматически отличить русское/европейское слово от татарского невозможно. Если хотите иметь качественную транслитерацию, все слова с буквой v нужно заносить в список исключений.
Спасибо, что дочитали.


Alessandro

Ну, если его кто-нибудь его составит, то будет... Я татарского языка не знаю, если что. Понимаю кое-как, но не более того.
Спасибо, что дочитали.

Comp1089

- v xәref belәn bөten süzlәr (Rәxmәt, Alessandro)
- iğa/iğә, iqa/ika - вроде решили, что analitika ləkin təbiğət
Что ещё?

Comp1089

Я, пожалуй этим займусь, а уж потом перейдём к обр. конвертации. Если что неясно - спрошу здесь

Alessandro

Вот с обратной конвертацией, кстати, караул будет с исключениями...
К примеру, букву ц автоматически восстановить не получится. В крымскотатарском она всегда ts и то пришлось помучиться, чтобы ts = ц от ts = тс отличать, а тут придётся все слова с ц в исключения записывать.
Спасибо, что дочитали.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр