Лингвофорум

Общий раздел => Ресурсы => Словари и переводчики => Тема начата: Филюс от января 19, 2013, 16:39

Название: Программа-переводчик через Google
Отправлено: Филюс от января 19, 2013, 16:39
Прошу всех, кто разбирается в лингвистике и просто тех, кто любит изучать языки, оценить программу-переводчик через Google - FK Text Translate.
Список языков сортируется сразу по двум параметрам - по количеству переводов с/на этот язык и по одному из трёх фиксированных параметров: по числу статей в Википедии, по числу просмотров статей в Википедии или по алфавиту. Есть поле для контрольного (обратного) перевода и ещё два поля для одновременного перевода текста собеседника.
Готов выслушать любые предложения.

Страницы программы:
http://soft.filyus.ru/fk-text-translator/
http://vk.com/fk_text_translator

Ссылка для загрузки:
http://filyus.ru/download/FK-Text-Translator.exe
Название: Программа-переводчик через Google
Отправлено: Rachtyrgin от января 19, 2013, 17:29
Прога вполне себе удобная. Понравилась.
Название: Программа-переводчик через Google
Отправлено: Rachtyrgin от января 20, 2013, 11:49
Эге, она автоматически распознает татарский как... русский. И даже читает. По русским правилам. Правда, звуки типа "ә" пропускает. За ненадобностью, наверное... Программеру на заметку!
Название: Программа-переводчик через Google
Отправлено: Demetrius от января 20, 2013, 11:50
Цитата: Rachtyrgin от января 20, 2013, 11:49
Эге, она автоматически распознает татарский как... русский. И даже читает. По русским правилам. Правда, звуки типа "ә" пропускает. За ненадобностью, наверное... Программеру на заметку!
Эта программа — всего лишь интерфейс к гуглопереводчику, так что Вы не по адресу
Название: Программа-переводчик через Google
Отправлено: Rachtyrgin от января 20, 2013, 11:56
Может быть, может быть... А вот, к примеру, слово "дәветләмә" прога воспринимает как македонский да еще и отображает латиницей. Македонский, по мнению Гугля - тюркский, что ли? С ума с ними сойдешь...
Название: Программа-переводчик через Google
Отправлено: Филюс от января 20, 2013, 14:52
Цитата: Rachtyrgin от января 20, 2013, 11:56
Может быть, может быть... А вот, к примеру, слово "дәветләмә" прога воспринимает как македонский да еще и отображает латиницей. Македонский, по мнению Гугля - тюркский, что ли? С ума с ними сойдешь...
Татарский Гуглом не поддерживается, а язык в нём определяется так, чтобы он не совпадал с языком, на который переводите. То есть при переводе, например, на русский он определит язык оригинала каким угодно, но только не русским.
Если вы знаете online-переводчик, который хорошо переводят татарский - сообщите, возможно, добавлю.
Название: Программа-переводчик через Google
Отправлено: Leo от января 20, 2013, 15:37
А этот переводчик загружать обязательно ? Можно как-нить так попробовать ?
Название: Программа-переводчик через Google
Отправлено: Demetrius от января 20, 2013, 15:51
Цитата: Rachtyrgin от января 20, 2013, 11:56
Может быть, может быть... А вот, к примеру, слово "дәветләмә" прога воспринимает как македонский да еще и отображает латиницей. Македонский, по мнению Гугля - тюркский, что ли? С ума с ними сойдешь...
Эх... А я почему-то ошибочно считал, что Вы программист...

Алгоритм определяет, на какой из поддерживаемых языков похож текст. И всё. Если вы предлагаете ему текст на неподдерживаемом языке, результаты будут неправильными, — это очевидно. Вы бы ему ещё науатль предложили.

Особенно странен Ваш комментарий «Македонский, по мнению Гугля - тюркский, что ли?». Программа вообще никак не учитывает родство языков, так как это банально не нужно для задачи определения языка.

Цитата: Leo от января 20, 2013, 15:37
А этот переводчик загружать обязательно ? Можно как-нить так попробовать ?
Это всего лишь альтернативных интерфейс к самому обычному http://translate.google.com/. И переводит он точно так же.
Название: Программа-переводчик через Google
Отправлено: Rachtyrgin от января 20, 2013, 17:23
Цитата: Demetrius от января 20, 2013, 15:51
Эх... А я почему-то ошибочно считал, что Вы программист...

У Вас такое горькое "эх" вырвалось. Я действительно программирую на яве, правда, делаю это для своего удовольствия. Я, конечно, не профессионал, но моих познаний должно хватить для того, чтобы понять алгоритм работы ГП. Вопрос в том, что я его не знаю. Если вы говорите, что он подбирает похожий язык, я Вам охотно верю... Я, кстати, разобрался, что происходит с македонским. Когда я смеялся над его "тюркостью", я имел в виду, что в македонском не может быть татарского слова "дәветләмә". Оказывается, все просто: вводим дәветләмә - получаем dәvetlәmә, вводим дегетче - получаем degetche, вводим мама - получаем мајка. Диагноз, собственно, ясен: если в словарной базе русского нет слова дәветләмә (а его там нет), ГП просто транслитит его латиницей... Осталось понять, как ГП определяет язык, или как приводит к похожему языку. Не тупо же по алфавиту?! Кстати, любопытная деталь: когда я зашел на ГП напрямую, без этого интерфейсика, ГП автоматически определил дәветләмә и дегетче, как болгарский.
Название: Программа-переводчик через Google
Отправлено: Demetrius от января 20, 2013, 17:30
Цитата: Rachtyrgin от января 20, 2013, 17:23
Вопрос в том, что я его не знаю. Если вы говорите, что он подбирает похожий язык, я Вам охотно верю...
А как ещё?

Естественно, если в программе при создании не добавили возможность определения татарского языка, откуда ей о нём узнать? :???

Не думаете же Вы, что для программы делали автоматическое расширение базы языков за счёт разбора статей из википедии?

Цитата: Rachtyrgin от января 20, 2013, 17:23
Осталось понять, как ГП определяет язык, или как приводит к похожему языку. Не тупо же по алфавиту?!
Обычно n-граммов достаточно.

Например, Tatoeba проверяет каждые сочетания из 5 букв на уникальность для опр. языка (то есть Tatoe, atoeb, toeba), если не удалось — то сочетания из 4 букв и т. д. Не думаю, что в Гугле алгоритм сильно отличается.
Название: Программа-переводчик через Google
Отправлено: Rachtyrgin от января 20, 2013, 18:02
http://mrtranslate.ru/guessers.php
Ссылка на другой алгоритм: Введенный текст разбивается на слова, и они сравниваются со словами из базы определителя. В результате подсчитывается количество совпадений слов разных языков, и выводится отчет в виде названия одного языка или списка языков, которые были признаны наиболее подходящими.

Однако, работа автоматического определителя языка не так проста: система должна учитывать лексические особенности языков, правила построения предложений, различия в диалектах, и другие особенности. Поэтому, сервисы автоматического определения языка предоставляются обычно разработчиками систем машинного перевода. Результат определения языка не может быть 100% точным. Обычно определитель языка также сообщает, с какой вероятностью ему удалось определить язык. Чем больше символов текста вы укажете, тем более точным будет определение.

Вообще, темка для меня интересная. Надо будет подчитать литературку...
Название: Программа-переводчик через Google
Отправлено: Demetrius от января 20, 2013, 18:10
Как-то этот другой алгоритм чрезмерно сложный, да и недостаточно универсален.
Название: Программа-переводчик через Google
Отправлено: Вадимий от января 20, 2013, 18:29
Цитата: Rachtyrgin от января 20, 2013, 18:02
http://mrtranslate.ru/guessers.php
Цитироватьmoli li awen
li linja lon supa ni
ala li toki

unknown

ЦитироватьEn la mondon venis nova sento,
Tra la mondo iras forta voko

Esperanto
українська мова :E:
unknow
Esperanto
Название: Программа-переводчик через Google
Отправлено: Rachtyrgin от января 20, 2013, 23:02
А Вы вот этого зверя пощупайте: http://www.polyglot3000.com/screens/main.png