Наверное, каждый, кто изучал и изучает арабский язык, сталкивался с проблемой, хочется прочитать, а не можется. Появилась новая программа, огласовывающая арабский текст. Она доступна для скачивания на App Store, Google Play и онлайн.
http://harakat.multillect.com/
https://itunes.apple.com/us/app/harakat/id840162013?mt=8
https://play.google.com/store/apps/details?id=com.multillect.harakat
Вставляем в поле неогласованный текст, нажимаем кнопку, и voilà. Комплейны приветствуются.
По виду так полезная вещица, спасибо за sharing.
Я непосредственно принимаю участие в разработке и развитии этой программы. Разумеется, есть ошибки, т.к. сама система расстановки огласовок флексии и разрешения графических альтернатив предполагает сложный многоуровневый морфологический и грамматико-синтаксический анализ. Ошибки будут устраняться по мере их выявления, в чем немалую поддержку нам могут оказать пользователи.
Спасибо!
Ух ты!!! :=
Дико сложная вещь ведь.
Для иврита тоже когда-то подобную штуку видел, נקדן называется. Вроде ошибок довольно много было; кажется, она предлагала выбрать варианты в сомнительных случаях; видимо, по-настоящему сложного анализа там не было.
Да, сложная. Проблема даже не в самом характере ошибок (они, на самом деле, в большинстве своем легко решаемы в рамках доступных нам возможностей), а в огромном объеме текстов, которые надо перебрать вручную.
Было несколько попыток сделать для арабского подобную программу. Самая известная это проект Google Tashkeel, который закрылся в 2011 г. Выглядело это примерно так:
Не знаю, на каком уровне у них обстояли дела с флексией (на видео огласована только основа), но опция такая была предусмотрена.
Да, вещь нужная. Гугль делает это откровенно хреново. Респект за линки. :)
Стараемся :) У нас с Гуглом немного разные подходы.
Какой-то саудиец разместил на ютубе видео с положительным отзывом о приложении :)
Несущественная мелочь: программа транслирует все \n в точки, в результате, если строчка заканчивается точкой, то точек становится две.
Попробовал надпись, прочитанную на позапозавчерашней прогулке:
خطر الغرق.
ابتعد.Результат:
خَطَرَ الغَرَقُ.. اِبْتَعَدَ.Кстати, даммы во втором слове вроде не должно быть? Там же касра, по идее (родительный падеж)?
Насчет первой части, неверно сработала альтернатива, и вместо существительного خَطَرٌ был выбран глагол خَطَرَ, соответственно الغَرَقُ было воспринято системой как подлежащее к глаголу. Слишком маленький контекст, не от чего оттолкнуться. Если первую часть еще можно поправить, то вторую - пока не знаю как, т.к. последовательность ابتعد может быть как 3 л. ед.ч. м.р. прошедшего времени (что и определилось), так и повелительным наклонением.
Интересно, что гугляторская озвучивалка, кажется, совершает ровно те же ошибки (xaṭara, ʔibtaʕada), но сам гуглятор переводит верно: The risk of drowning. Keep away.
Поистине, дела (оцениваются) только по намерениям и, поистине, каждому человеку (достанется) только то, что он намеревался (обрести). (Хадис)
«Две черепахи» не огласовал:) (سلحفاتين) (в вин. и р.п.)
Также неправильно огласовал «Я - источник жизни», огласовал как «Я - экспортер жизни» أنا مصدر الحياة)
Цитата: Whitesky777 от апреля 28, 2014, 11:01Также неправильно огласовал
Почему Вы решили, что неправильно? Может, Вы думали, что пишете "источник жизни", а на самом деле написали "экспортер жизни"?
Цитата: ali_hoseyn от апреля 28, 2014, 12:00
Цитата: Whitesky777 от апреля 28, 2014, 11:01Также неправильно огласовал
Почему Вы решили, что неправильно? Может, Вы думали, что пишете "источник жизни", а на самом деле написали "экспортер жизни"?
مصدر может огласовываться как masdsar, либо как musaddir. Что интересно: я написал ранее هذا مصدر النفط огласовал правильно, а то - нет.
Подождите следующей пересборки. У нас в системе огласовывает так.
Это не существенно. Я просто искал максимально сложные варианты.
Цитата: ali_hoseyn от апреля 20, 2014, 16:13
Наверное, каждый, кто изучал и изучает арабский язык, сталкивался с проблемой, хочется прочитать...
:= баракаллаху фик
здравствуйте уважаемые. что с программой ? она не доступна . её не найти в гугл плей по названию