Author Topic: Татарский транслитератор (Kiril - Latin, Latin - Kiril)  (Read 25218 times)

0 Members and 1 Guest are viewing this topic.

Offline Alessandro

  • Posts: 2765
  • Gender: Male
    • Alem-i Medeniye
А транслитератор обратный латин > кирил - это правила наоборот, или я что-то путаю? :???
Да нет, не совсем наоборот...
Там, я так понимаю, главный вопрос с правилами расстановки мягких знаков.
А в остальном по идее всё просто: yə, ya > я, yı, ye > е, yü, yu > ю, ğə > га, qə > ка ну и т.д. Если я ничего не упустил...
Спасибо, что дочитали.

Offline AminBay

  • Posts: 422
  • Gender: Male
Немного доработал Описание правил транслитерации с кириллицы в стандартную латиницу, начатое Alessandro.

1) расставляем ğ и q.
га, го, гу (если далее следуют ә,ө,ү, ь или и) > ğә, ğө, ğü
ка, ко, ку, кый(если далее следуют ә,ө,ү,ь или и) > qә, qө, qü, qi

1. Надо бы дополнить так:
га, го, гу (если далее следуют ә,ө,ү,е, ь или и) > ğә, ğө, ğü

2. А вот слово кодрәт упорно не хочет подчиняться  правилу на "ка, ко, ку, кый" ;D - становится qodrәt вместо qөdrәt.

3. В слове СЕНТЯБРЬ (в верхнием регистре) буква "я" также упорствует > SENTЯBR
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Вопросы:
- В сочетаниях типа иг, ик буквы г, к могут обозначать ğ, q? Например ика нужно транслитить как iqa или как ika?
- Буквы а, о, у могут обозначать ə, ö, ü в каких-либо иных случаях кроме как для передачи твёрдости предшествующих г и к?

ҙ > đ
ҫ > ś
Вы точно уверены? Просто как-то странно. Логичнее было бы либо đ и ŧ, либо ź и ś.

1. Буквы ğ, q  в татарских словах обозначать не могут - всегда будет ika. Правда, есть слово-исключение (арабское) икамәт > iqәmәt.

2.Да, вся проблема с этими "к" и "г", которые в себе несут по 2 звука, и из-за них происходит на письме эта катавасия с а, о, у...

3.Насчёт башкирского не уверен. Точно знаю, что буква đ была для звука ҙ в яналифе 20-30-х гг. Для звука ҫ была буква наподобие старорусской "фиты". Посмотрю, какая сейчас латина у башкир. Видимо, вы правы, надо выбрать одну из пар.

По-моему, транслит латин-кирил должен быть легче.
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Насчёт буквы ö - раз оставили ә, то почему бы и ө не оставить?
Потому что во всех тюркских латиницах используется ö, и ни в одной нет ө.

Безусловно. Но зачем, я не могу понять, при прочих равных из двух букв вместо той, которая у всех родственных народов есть, выбирать ту, которой ни у одного из них нет?

А туркменский алфавит - это таки жесть. Даже один факт наличия в алфавите буквы ç при отсутсвии с уже сам по себе показывает "мудрость" его составителей.  :wall:

Раз есть закон и одобрено Академией наук Татарстана, Институтом Тат. языка им . Ибрагимова - значит, какие-то причины были. Может преемственность или удобство написания? :donno:
Да и "татарский вопрос в РФ" - это политический вопрос, вопрос существования страны "Rusiә".
Даже в таком самостийно-татаризированном варианте русские СМИ объявили о "переходе татар на турецкий алфавит", "о турецкой экспансии", "о подрывной деятельности Анкары в Поволжье". Чего только стоят заседания Федерального Собрания по вопросу латиницы нашего языка и вердикт Конституц. Суда РФ - "угроза единству и целостности страны"!
Вообще Qazan не любит оглядываться на кого бы то ни было.
Мне важна официальность - самопала с тат.латиной в Татнете хватает выше крыши.
Пока будем пользоваться этим.
Туркменский на латине мне показался занятным, в принципе понимаемость есть, одну-две буквы картину не меняют особо.
Будем уважать их выбор - вон кыргызы вообще на кирилике остановились как вкопанные.
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Offline Alessandro

  • Posts: 2765
  • Gender: Male
    • Alem-i Medeniye
Баги исправлены.

Раз есть закон и одобрено Академией наук Татарстана, Институтом Тат. языка им . Ибрагимова - значит, какие-то причины были.
Собственно, к ним и претензии. К названным организациям.

Туркменский на латине мне показался занятным, в принципе понимаемость есть, одну-две буквы картину не меняют особо.
Будем уважать их выбор - вон кыргызы вообще на кирилике остановились как вкопанные.
Да не, понимаемость-то конечно есть, куда она денется. Чтоб понимаемость исчезла, это нужно звук а буквой b обозначать или как-нить ещё совсем изощрённо извратиться. Но наряду с понятностью видна и, извините, дурость составителей этого чудо-алфавита. Даже если на соседей вообще не оглядываться, можно было бы разумнее алфавит составить.
И мне кажется, что это не столько их выбор, сколько самодурство покойника Туркменбаши.

По-моему, транслит латин-кирил должен быть легче.
Ну, напишите правила - сделаю скрипт.

Вообще как-то странно, что за столько лет существования татарской латиницы ни на одном сайте нет такого сервиса.  :???
Спасибо, что дочитали.

Offline murator

  • Posts: 2071
  • Gender: Male
- в татарском есть лишь 3 слова на "кыя": кыя/qıya (скала) и кыяс/qıyas (аналогия) и кыямәт/qıyәmәt (судный день).
И-и-и, бәхетсез кыяр онытканың бар :'(

Offline Ванько

  • Posts: 4379
  • Gender: Male
Вообще как-то странно, что за столько лет существования татарской латиницы ни на одном сайте нет такого сервиса.
http://www.lexilogos.com/clavier/multilingue.htm
Напишите автору сайта, он добавит. Там у него очень простой скрипт, вы сами можете его написать, вот для туркменского есть к примеру – http://www.lexilogos.com/clavier/turkmen_conversion.htm
Lingvoforum has ruined my life.
-------------------------
ЛФ — это вообще к лингвистике мало имеет отношение. © RawonaM

Offline AminBay

  • Posts: 422
  • Gender: Male
Баги исправлены.
Zur rәxmәt!

Quote
Да не, понимаемость-то конечно есть, куда она денется. Чтоб понимаемость исчезла, это нужно звук а буквой b обозначать или как-нить ещё совсем изощрённо извратиться. Но наряду с понятностью видна и, извините, дурость составителей этого чудо-алфавита. Даже если на соседей вообще не оглядываться, можно было бы разумнее алфавит составить.
И мне кажется, что это не столько их выбор, сколько самодурство покойника Туркменбаши.
Не будем трогать покойников, urınnarı cәnnәttә bulsın.
Какой народ - такой правитель. Какой правитель - такие законы. Какие законы - такие алфавиты. :eat: Сейчас там зуботехник руководит.

По-моему, транслит латин-кирил должен быть легче.
Quote
Ну, напишите правила - сделаю скрипт.
Вообще как-то странно, что за столько лет существования татарской латиницы ни на одном сайте нет такого сервиса.  :???

Да нет, сервисы были. Но во-первых, не на офиц. латине, а во-вторых, с собственными орфографиями разработчиков, в-третьих, они закрылись.
Если позволите, напишу правила для латин-кирил.
Murator! Dөres, qıyar, qiyәfәt bar tağın. :)
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Offline Alessandro

  • Posts: 2765
  • Gender: Male
    • Alem-i Medeniye
- В сочетаниях типа иг, ик буквы г, к могут обозначать ğ, q? Например ика нужно транслитить как iqa или как ika?
1. Буквы ğ, q  в татарских словах обозначать не могут - всегда будет ika. Правда, есть слово-исключение (арабское) икамәт > iqәmәt.
Ещё вот, похоже, табигать - tabiğət.
Спасибо, что дочитали.

Offline AminBay

  • Posts: 422
  • Gender: Male
- В сочетаниях типа иг, ик буквы г, к могут обозначать ğ, q? Например ика нужно транслитить как iqa или как ika?
1. Буквы ğ, q  в татарских словах обозначать не могут - всегда будет ika. Правда, есть слово-исключение (арабское) икамәт > iqәmәt.
Ещё вот, похоже, табигать - tabiğət.
Ну, это последнее слово подходит к учтённому нами ранее правилу на  -гать/кать. Если что таких слов не особо много, их можно забить в исключения.
Alessandro, не могли бы вы вкратце объяснить, как можно сделать транслитератор веб-страниц по имеющемуся транслитератору текстов?
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Offline Alessandro

  • Posts: 2765
  • Gender: Male
    • Alem-i Medeniye
Ещё вот, похоже, табигать - tabiğət.
Ну, это последнее слово подходит к учтённому нами ранее правилу на  -гать/кать. Если что таких слов не особо много, их можно забить в исключения.
Я спрашивал про сочетания ика, ига вне зависимости от каких-либо иных ранее сформулированных нами правил.
Тут просто всё зависит от того, в каком порядке эти правила поставить в скрипте. Если сначала ига > iga, ика > ika, а потом га > ğa/ğə, ка > qa/qə, то будет analitika и tabigat, а если наоборот, то analitiqa и tabiğət. В первом случае придётся заносить в исключения слово табигать, во втором - слово аналитика. Надо подумать, какой из этих случаев приведёт к меньшему числу исключений. Подозреваю, что второй.

Alessandro, не могли бы вы вкратце объяснить, как можно сделать транслитератор веб-страниц по имеющемуся транслитератору текстов?
Боюсь, что я не мог бы. Я в технической тороне дела не очень разибраюсь. JavaScript для транслитерации сделал несколько лет назад, разобравшись в том, как работают там с регулярными выражениями, и теперь вот могу по заданным правилам скрипты ваять. А вообще программист из меня никакой. Сейчас попробую спросить знающих людей.
Спасибо, что дочитали.

Offline bismigalis

  • Newbie
  • Posts: 3
  • Gender: Male
AminBay, по просьбе Alessandro, объясняю как я сделал транслитерацию веб-страниц налету.

Во-первых, после того как вы сделаете транслитератор на javascript, его надо будет переписать на PHP. Имея на руках PHP версию, остальное дело техники. Я написал небольшой скрипт на PHP (20строк) который делает следующее:
1. Получает страницу с заданного адреса. Адрес передаётся в скрипт в параметре q.
2. Полученная страница, это просто строка, в терминах PHP, пропускаем её через функцию транслитерации.
3. В полученной строке, подменяем ссылки (они ведут на сервер, где находится сайт) на ссылки ведущие на наш скрипт. Это что бы при клике по ссылке, получать также транслитерованную страницу.
4. Отдаем страницу браузеру


Comp1089

  • Guest
Reply #37 on: September 27, 2009, 13:58
Я считаю, что всё-таки лучше ö т:к. латинская ɵ (latin small/capital letter barred o) в большинстве случаев  либо вообще не поддерживается, либо выглядит ужасно. А кириллическая (cyrillic letter barred o) в латинице - не очень нормально, будут например трудности в Википедии с cyr-lat ботами итд.

Offline AminBay

  • Posts: 422
  • Gender: Male
Ещё вот, похоже, табигать - tabiğət.
Ну, это последнее слово подходит к учтённому нами ранее правилу на  -гать/кать. Если что таких слов не особо много, их можно забить в исключения.
Я спрашивал про сочетания ика, ига вне зависимости от каких-либо иных ранее сформулированных нами правил.
Тут просто всё зависит от того, в каком порядке эти правила поставить в скрипте. Если сначала ига > iga, ика > ika, а потом га > ğa/ğə, ка > qa/qə, то будет analitika и tabigat, а если наоборот, то analitiqa и tabiğət. В первом случае придётся заносить в исключения слово табигать, во втором - слово аналитика. Надо подумать, какой из этих случаев приведёт к меньшему числу исключений. Подозреваю, что второй.

Alessandro, не могли бы вы вкратце объяснить, как можно сделать транслитератор веб-страниц по имеющемуся транслитератору текстов?
Боюсь, что я не мог бы. Я в технической тороне дела не очень разибраюсь. JavaScript для транслитерации сделал несколько лет назад, разобравшись в том, как работают там с регулярными выражениями, и теперь вот могу по заданным правилам скрипты ваять. А вообще программист из меня никакой. Сейчас попробую спросить знающих людей.
Zur rәxmәt, duslar!
Спасибо за объяснения!

Alessandro! Я думаю, лучше взять  второй способ, т.е. отдать приоритет словам на  -ğət. Это будет наиболее разумный и оптимальный вариант.
Башк. буквы, думаю, надо конвертировать так:
ҙ > ź
ғ > ğ
ҡ > q
ҫ > ś


Bismigalis! Есть ли возможность конвертации javascript в php? Или надо писать алгоритм заново на php?
Правильно я понимаю, что для этого дела нужен отдельная веб-страница, подойдёт в таком формате - www.веб-страница.narod.ru ?

Comp1089 правильно отметил про неудобность латинской буквы ɵ. Я думаю, может быть сделать 2-хвариантный транслитератор Latin Ә / Ä: alfa-вариант с (ә, ө, ŋ) и beta-аналог с (ä, ö, ñ).
Ведь действительно, может браузер не поддерживать офиц. латинскую графику или проблемы со шрифтами могут быть, опять-же Вики...
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Offline bismigalis

  • Newbie
  • Posts: 3
  • Gender: Male
Quote
Есть ли возможность конвертации javascript в php? Или надо писать алгоритм заново на php?
Правильно я понимаю, что для этого дела нужен отдельная веб-страница, подойдёт в таком формате - www.веб-страница.narod.ru ?

Сам алгоритм замены на PHP подойдёт от крымскотатарской версии, нужно будет только изменить несколько файлов под татарский язык, а именно:
- файл с константами
- файл с исключениями
- файл с регулярными выражениями

Alessandro делал PHP версию он больше знает. Я от него получил готовую PHP версию.

Веб страницы не достаточно, нужно чтобы на сервере стоял PHP, соответственно narod.ru не подойдёт. Можно найти бесплатный хостинг с PHP, сейчас есть такие.

Offline Alessandro

  • Posts: 2765
  • Gender: Male
    • Alem-i Medeniye
Alessandro делал PHP версию он больше знает. Я от него получил готовую PHP версию.
На самом деле делал не я, делал форумчанин AlefZet, я только помогал. Но его (AlefZet'а) давным-давно не видать в сети.
Но в любом случае у нас уже есть образец - работающий скрипт для крымскотатарских текстов. Нужно только, как уже было сказано, регэкспы и список исключений поменять на татарские.
Спасибо, что дочитали.

Offline AminBay

  • Posts: 422
  • Gender: Male
Но в любом случае у нас уже есть образец - работающий скрипт для крымскотатарских текстов. Нужно только, как уже было сказано, регэкспы и список исключений поменять на татарские.
Мне сделать список исключений или не надо? :)
-Молодой человек, как пройти на улицу Габдулкадыра Инана?
- Әfәnde, monnan uŋğa, şunnan univermagqa taba tağın uŋğa, yul arqılı çığarğa, univermagnı uŋ yaqtan çitlәtep utәrgә, yuldan ozın toraq yortnı suldan urap uzıp anıŋ kisemenә qәdәr barırğa.
- Чо?!.

 *אני טטרי * मैं हूँ तातार * ฉันตาตาร์ * տատապ * თათა

Offline Timming

  • Newbie
  • Posts: 3
  • Gender: Male
Друзья, после прочтения этой ветки у меня в голове наконец-то начала складываться стройная картина татарской транслитерации. Рәхмәт сезгә =)

Я попытался систематизировать все правила, которые вы тут привели. Их можно посмотреть вот здесь. Комментарии можете оставлять здесь, так как страница заблокирована, дабы уберечь ее от вандализма.

Offline Comp1089

  • Posts: 106
  • Gender: Male
Sorawım bar: Nigə в-w konvertatsiya qəğeydəse bar, ә в-v (urıs hb. süzlәr өçen) yuq?

Offline Alessandro

  • Posts: 2765
  • Gender: Male
    • Alem-i Medeniye
Потому что автоматически отличить русское/европейское слово от татарского невозможно. Если хотите иметь качественную транслитерацию, все слова с буквой v нужно заносить в список исключений.
Спасибо, что дочитали.

Offline Timming

  • Newbie
  • Posts: 3
  • Gender: Male
А список исключений будет?

Offline Alessandro

  • Posts: 2765
  • Gender: Male
    • Alem-i Medeniye
Ну, если его кто-нибудь его составит, то будет... Я татарского языка не знаю, если что. Понимаю кое-как, но не более того.
Спасибо, что дочитали.

Offline Comp1089

  • Posts: 106
  • Gender: Male
- v xәref belәn bөten süzlәr (Rәxmәt, Alessandro)
- iğa/iğә, iqa/ika - вроде решили, что analitika ləkin təbiğət
Что ещё?

Я, пожалуй этим займусь, а уж потом перейдём к обр. конвертации. Если что неясно - спрошу здесь

Offline Alessandro

  • Posts: 2765
  • Gender: Male
    • Alem-i Medeniye
Вот с обратной конвертацией, кстати, караул будет с исключениями...
К примеру, букву ц автоматически восстановить не получится. В крымскотатарском она всегда ts и то пришлось помучиться, чтобы ts = ц от ts = тс отличать, а тут придётся все слова с ц в исключения записывать.
Спасибо, что дочитали.

 

With Quick-Reply you can write a post when viewing a topic without loading a new page. You can still use bulletin board code and smileys as you would in a normal post.

Note: this post will not display until it's been approved by a moderator.
Name: Email:
Verification:
Type the letters shown in the picture
Listen to the letters / Request another image
Type the letters shown in the picture:
√49 Напишите ответ строчными буквами:
«Сто одёжек, все без застёжек» — что это?: