Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Программа, огласовывающая арабский текст

Автор ali_hoseyn, апреля 20, 2014, 16:13

0 Пользователи и 1 гость просматривают эту тему.

ali_hoseyn

Наверное, каждый, кто изучал и изучает арабский язык, сталкивался с проблемой, хочется прочитать, а не можется. Появилась новая программа, огласовывающая арабский текст. Она доступна для скачивания на App Store, Google Play и онлайн.

http://harakat.multillect.com/

https://itunes.apple.com/us/app/harakat/id840162013?mt=8

https://play.google.com/store/apps/details?id=com.multillect.harakat

Вставляем в поле неогласованный текст, нажимаем кнопку, и voilà. Комплейны приветствуются.
dɛ jʃɛmtɛl sɒk'ɒt'rijəh swə jəfɒz

Marius


ali_hoseyn

Я непосредственно принимаю участие в разработке и развитии этой программы. Разумеется, есть ошибки, т.к. сама система расстановки огласовок флексии и разрешения графических альтернатив предполагает сложный многоуровневый морфологический и грамматико-синтаксический анализ. Ошибки будут устраняться по мере их выявления, в чем немалую поддержку нам могут оказать пользователи.
dɛ jʃɛmtɛl sɒk'ɒt'rijəh swə jəfɒz


mnashe

Ух ты!!! :=
Дико сложная вещь ведь.
Offtop
Для иврита тоже когда-то подобную штуку видел, נקדן называется. Вроде ошибок довольно много было; кажется, она предлагала выбрать варианты в сомнительных случаях; видимо, по-настоящему сложного анализа там не было.
Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!

ali_hoseyn

Да, сложная. Проблема даже не в самом характере ошибок (они, на самом деле, в большинстве своем легко решаемы в рамках доступных нам возможностей), а в огромном объеме текстов, которые надо перебрать вручную.

Было несколько попыток сделать для арабского подобную программу. Самая известная это проект Google Tashkeel, который закрылся в 2011 г. Выглядело это примерно так:



Не знаю, на каком уровне у них обстояли дела с флексией (на видео огласована только основа), но опция такая была предусмотрена.
dɛ jʃɛmtɛl sɒk'ɒt'rijəh swə jəfɒz

Awwal12

Да, вещь нужная. Гугль делает это откровенно хреново. Респект за линки. :)
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

ali_hoseyn

dɛ jʃɛmtɛl sɒk'ɒt'rijəh swə jəfɒz

ali_hoseyn

Какой-то саудиец разместил на ютубе видео с положительным отзывом о приложении :)

dɛ jʃɛmtɛl sɒk'ɒt'rijəh swə jəfɒz

mnashe

Несущественная мелочь: программа транслирует все \n в точки, в результате, если строчка заканчивается точкой, то точек становится две.
Попробовал надпись, прочитанную на позапозавчерашней прогулке:
خطر الغرق.
ابتعد.
Результат:
خَطَرَ الغَرَقُ.. اِبْتَعَدَ.Кстати, даммы во втором слове вроде не должно быть? Там же касра, по идее (родительный падеж)?
Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!

ali_hoseyn

Насчет первой части, неверно сработала альтернатива, и вместо существительного خَطَرٌ был выбран глагол خَطَرَ, соответственно الغَرَقُ было воспринято системой как подлежащее к глаголу. Слишком маленький контекст, не от чего оттолкнуться. Если первую часть еще можно поправить, то вторую - пока не знаю как, т.к. последовательность ابتعد может быть как 3 л. ед.ч. м.р. прошедшего времени (что и определилось), так и повелительным наклонением.
dɛ jʃɛmtɛl sɒk'ɒt'rijəh swə jəfɒz

mnashe

Интересно, что гугляторская озвучивалка, кажется, совершает ровно те же ошибки (xaṭara, ʔibtaʕada), но сам гуглятор переводит верно: The risk of drowning. Keep away.
Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!

ali_hoseyn

Поистине, дела (оцениваются) только по намерениям и, поистине, каждому человеку (достанется) только то, что он намеревался (обрести). (Хадис)
dɛ jʃɛmtɛl sɒk'ɒt'rijəh swə jəfɒz

Whitesky777


Whitesky777

Также неправильно огласовал «Я - источник жизни», огласовал как «Я - экспортер жизни» أنا مصدر الحياة)

ali_hoseyn

Цитата: Whitesky777 от апреля 28, 2014, 11:01Также неправильно огласовал
Почему Вы решили, что неправильно? Может, Вы думали, что пишете "источник жизни", а на самом деле написали "экспортер жизни"?
dɛ jʃɛmtɛl sɒk'ɒt'rijəh swə jəfɒz

Whitesky777

Цитата: ali_hoseyn от апреля 28, 2014, 12:00
Цитата: Whitesky777 от апреля 28, 2014, 11:01Также неправильно огласовал
Почему Вы решили, что неправильно? Может, Вы думали, что пишете "источник жизни", а на самом деле написали "экспортер жизни"?
مصدر может огласовываться как masdsar, либо как musaddir. Что интересно: я написал ранее هذا مصدر النفط  огласовал правильно, а то - нет.

ali_hoseyn

Подождите следующей пересборки. У нас в системе огласовывает так.
dɛ jʃɛmtɛl sɒk'ɒt'rijəh swə jəfɒz

Whitesky777

Это не существенно. Я просто искал максимально сложные варианты.

salma

Цитата: ali_hoseyn от апреля 20, 2014, 16:13
Наверное, каждый, кто изучал и изучает арабский язык, сталкивался с проблемой, хочется прочитать...

:= баракаллаху фик
رَّبِّ زِدْنِي عِلْمًا

salma

здравствуйте уважаемые. что с программой ? она не доступна . её не найти в гугл плей по названию
رَّبِّ زِدْنِي عِلْمًا

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр