Лингвофорум

Практический раздел: для изучающих языки, помощь студентам => Объявления => Topic started by: hameleon on November 6, 2008, 21:48

Title: Проект таджикско-персидской конверсии систем письма
Post by: hameleon on November 6, 2008, 21:48
Доброго времени суток!

По адресу http://www.tajpers.narod.ru описывается интересный лингвистический проект таджикских ученых по созданию автоматизированной системы таджикско-персидской конверсии текстов.
Title: Проект таджикско-персидской конверсии систем письма
Post by: Iskandar on November 6, 2008, 22:17
Основная трудность араб. > кирил. - огласовка кратких звуков, а особенно - изафета, с ним вообще справиться сложно, если он не огласован.

Трудность кирил. > араб. - различение избыточных букв в арабизмах, ну и с вокализмом там не всё гладко.

Короче, забить все слова как иероглифы (собственно арабо-персидская графика в значительной степени носит гетерографический характер) и конверсировать. А иначе как?

Впрочем, вон какие дядьки умные, они. наверное, что-то придумали...
Title: Проект таджикско-персидской конверсии систем письма
Post by: Lugat on November 9, 2008, 10:59
После того как вывесили на сайте онлайн-транслитератор надо объявлять, а не до того!
Афсӯс, ман инро надидам.
Title: Проект таджикско-персидской конверсии систем письма
Post by: арьязадэ on November 10, 2008, 03:31
вот законченный и работающий конвертер таджикская кириллица - персидский арабица сделанный иранцами:

http://www.pendar.net/convertor.asp
Title: Проект таджикско-персидской конверсии систем письма
Post by: Lugat on November 10, 2008, 12:54
Раҳмати калон, Ориёзода!
Лекин ман як чизро нафаҳмидам, ин мошинча суффиксро -и дар шакли «ی» мекунад. Ин саҳеҳ аст?
Title: Проект таджикско-персидской конверсии систем письма
Post by: Iskandar on November 10, 2008, 13:14
Изофатро? Нодуруст, албатта. Гуфсем-ку, ин мушкил мешавад.
Программа чи, байни и ва ӣ фарқашро намебинад?

Короче, недоработочка.
А вон те, прорекламированные изобретатели, как оказалось, велосипеда, неужели ничего о подобных, уже существующих программах не ведают?
Title: Проект таджикско-персидской конверсии систем письма
Post by: Lugat on November 11, 2008, 00:58
Ин барнома ҳам ҳарфро «ҳ» намебинад ва «ҳ»-ро монда меомад. Ӯ ҳанӯз дар дучандакӯнӣ ду ҳарфҳоро ба ҷои ташдид (шадда) менависад.
Title: Проект таджикско-персидской конверсии систем письма
Post by: арьязадэ on November 11, 2008, 05:58
Раҳмати калон, Ориёзода!
Лекин ман як чизро нафаҳмидам, ин мошинча суффиксро -и дар шакли «ی» мекунад. Ин саҳеҳ аст?

дуруд бар шумо огои Лугат,

хатти сириллики точики бар сари худ камбудихои зиёдеро доро аст. яке аз он камбудихо он аст ки хам "и"-и дароз ва хаи "и"-и кутох бо як харфи "и" навишта мешавад. барои хамин далел аст, ки баргардонандаи "Пиндор" наметавонад фаркро бубинад ва он хатто вожахои соддаеро ба монанди "бирав" бо харфи  ی  менависад.

хубии ин баргардонанда он аст, ки баъд аз баргаронидани матни точикии сириллик хар форсизабоне аз Ирон ва ё Афгонистон метавонад бе мушкили онро бихонад ва мутаваччех бишавад, ки сухан дар бораи чи меравад.

барои точикони Точикистону Узбакистон бошад хубии он дар он аст, ки онхо метавонанд матнеро бо хатти сириллик иншо бикунанд, баъд он матнро баргардонанд ба хатти форси, ва баъд аз он он матро каме вироиш бикунанд ва ба Ирон ва ё афгонистон бифиристанд.


Title: Проект таджикско-персидской конверсии систем письма
Post by: Tufon on November 28, 2008, 20:25
Уважаемые эксперты, я тут связался с разработчиками приславутого конвертора (который на народе.ру), и они мне выслали некоторые дополнительные материалы по своему проекту. Проанализировав их могу сказать, что они прекрасно знают о существовании Пендара и даже провели сравнительный анализ своей программы и пендаровской. Могу сказать, что конверсия пендара правильна только на 19%. Я естесвенно взял на себя смелость лично проверить и убедился, что пендар если не полное то извените меня за такое сравнение "фуфел" - конвертор - калька,т.е тупой перевод одной буквы в другую... Изафет, как отмечали тут все, у них ставится к месту и не к месту, тогда как есть четкие правила его отображения на персидском письме. Этот факт уже говорит что в иранском продукте нет никакого морфоанализатора... А наши ребята с народа ру, похоже полностью решили эту проблему. Плюс у иранцев практически нет отображения специфических букв арабизмов и вопросы коротких и длинных гласных у них полностью нерешены...  А вот те ребятки мало того каким то образом решили проблему транслитерации арабизмов, так еще и на процентов 75 решили вопрос с короткими и длинными гласными. Конечно продукт у них еще не полностью доведен до ума, но по сравнению с пендаром это небо и земля... И если, как тут отмечалось, пендаровский транслит может понять и иранец и афганец, но с трудом, то качество транслита этих ребят понимаетя в легкую (о чем свидетельствуют и таджики и иранцы и афганцы, я им показывал пару транслитирируемых текстов, которые отослал ребятам для оценки их проги).  Так что уважаемый Искандар, прежде чем говорить о "велосипеде", не лучше ли было самим сначала во всем разобраться, а потом делать заключения? Самая главная заслуга ребят, как я считаю, это качество транслита... Там похоже у них целый блок морфоанализатора встроен... Так что вот так... Судите сами.. Бо эхтиром, Туфон 
Title: Проект таджикско-персидской конверсии систем письма
Post by: Iskandar on November 28, 2008, 20:40
Господи, Туфонджон, да я ж прикалываюсь по-мелкому, а вы сразу близко к сердцу...
Если дела обстоят так, как вы говорите, то это здорово.
Title: Проект таджикско-персидской конверсии систем письма
Post by: Lugat on November 28, 2008, 20:52
Ну не томите, Туфон, выкладывайте ссылочку, где можно скачать транслитератор или, как следует из названия темы, конверсатор. А то рекламы много, а ничего нет, что очень настораживает.  :donno:
Title: Проект таджикско-персидской конверсии систем письма
Post by: Tufon on November 29, 2008, 23:40
А в принципе выкладывать то и нечего... Я просто связался по электронной почте с разработчиками (их ссылка дана в начале, и на их сайте есть их ящик). Они мне выслали кое какие дополнительные теоритические материалы (к стати часть из них уже опубликована на том же сайте, ну если что, то вот http://tajpers.narod.ru/article01.htm). Должен отметить, что они свой продукт пока не дают, т.к. он еще на доработке, но зато я высал им несколько материалов на таджикском языке и буквально через несколько часов получил ответ, те же докумены, но на персидском. К документам они приложили несколько скрин шотов работы своей программы, чтоб я убедился, что это работал автомат, а не переводчик. Я показал результат их деятельности знакомым приехавшим из Ирана и те были довольны качеством... Не скрою коя какие огрехи есть, и ребятам есть над чем работать, но в принципе все довольно прилично... А в одном из отосланых моих документов я вообще не нашел ошибок... Можете проверить сами... 
Title: Проект таджикско-персидской конверсии систем письма
Post by: Tufon on December 10, 2008, 22:22
Уважаемые, сообщаю просто ради итереса... На сайте разработчиков программы "разразилась" целая миниполеика по вопросу их раблты, где можно встретить высказывания как "за", так и критику... Если интересно зайлите - посмотрите...
Title: Проект таджикско-персидской конверсии систем письма
Post by: Шамсиддин on April 6, 2014, 01:52
Бародарони азиз!
Аз Шумо хоҳиш дорам, ки ягон барномаи табдили форсӣ ба кириллиро равон мекардед.
Дуруди Ҷаҳонофарин бар шумо бод!