Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.
Ограничения: максимум вложений в сообщении — 3 (3 осталось), максимальный размер всех файлов — 300 КБ, максимальный размер одного файла — 100 КБ
Снимите пометку с вложений, которые необходимо удалить
Перетащите файлы сюда или используйте кнопку для добавления файлов
Вложения и другие параметры
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр

Сообщения в этой теме

Автор Rachtyrgin
 - января 20, 2013, 23:02
А Вы вот этого зверя пощупайте: http://www.polyglot3000.com/screens/main.png
Автор Вадимий
 - января 20, 2013, 18:29
Цитата: Rachtyrgin от января 20, 2013, 18:02
http://mrtranslate.ru/guessers.php
Цитироватьmoli li awen
li linja lon supa ni
ala li toki

unknown

ЦитироватьEn la mondon venis nova sento,
Tra la mondo iras forta voko

Esperanto
українська мова :E:
unknow
Esperanto
Автор Demetrius
 - января 20, 2013, 18:10
Как-то этот другой алгоритм чрезмерно сложный, да и недостаточно универсален.
Автор Rachtyrgin
 - января 20, 2013, 18:02
http://mrtranslate.ru/guessers.php
Ссылка на другой алгоритм: Введенный текст разбивается на слова, и они сравниваются со словами из базы определителя. В результате подсчитывается количество совпадений слов разных языков, и выводится отчет в виде названия одного языка или списка языков, которые были признаны наиболее подходящими.

Однако, работа автоматического определителя языка не так проста: система должна учитывать лексические особенности языков, правила построения предложений, различия в диалектах, и другие особенности. Поэтому, сервисы автоматического определения языка предоставляются обычно разработчиками систем машинного перевода. Результат определения языка не может быть 100% точным. Обычно определитель языка также сообщает, с какой вероятностью ему удалось определить язык. Чем больше символов текста вы укажете, тем более точным будет определение.

Вообще, темка для меня интересная. Надо будет подчитать литературку...
Автор Demetrius
 - января 20, 2013, 17:30
Цитата: Rachtyrgin от января 20, 2013, 17:23
Вопрос в том, что я его не знаю. Если вы говорите, что он подбирает похожий язык, я Вам охотно верю...
А как ещё?

Естественно, если в программе при создании не добавили возможность определения татарского языка, откуда ей о нём узнать? :???

Не думаете же Вы, что для программы делали автоматическое расширение базы языков за счёт разбора статей из википедии?

Цитата: Rachtyrgin от января 20, 2013, 17:23
Осталось понять, как ГП определяет язык, или как приводит к похожему языку. Не тупо же по алфавиту?!
Обычно n-граммов достаточно.

Например, Tatoeba проверяет каждые сочетания из 5 букв на уникальность для опр. языка (то есть Tatoe, atoeb, toeba), если не удалось — то сочетания из 4 букв и т. д. Не думаю, что в Гугле алгоритм сильно отличается.
Автор Rachtyrgin
 - января 20, 2013, 17:23
Цитата: Demetrius от января 20, 2013, 15:51
Эх... А я почему-то ошибочно считал, что Вы программист...

У Вас такое горькое "эх" вырвалось. Я действительно программирую на яве, правда, делаю это для своего удовольствия. Я, конечно, не профессионал, но моих познаний должно хватить для того, чтобы понять алгоритм работы ГП. Вопрос в том, что я его не знаю. Если вы говорите, что он подбирает похожий язык, я Вам охотно верю... Я, кстати, разобрался, что происходит с македонским. Когда я смеялся над его "тюркостью", я имел в виду, что в македонском не может быть татарского слова "дәветләмә". Оказывается, все просто: вводим дәветләмә - получаем dәvetlәmә, вводим дегетче - получаем degetche, вводим мама - получаем мајка. Диагноз, собственно, ясен: если в словарной базе русского нет слова дәветләмә (а его там нет), ГП просто транслитит его латиницей... Осталось понять, как ГП определяет язык, или как приводит к похожему языку. Не тупо же по алфавиту?! Кстати, любопытная деталь: когда я зашел на ГП напрямую, без этого интерфейсика, ГП автоматически определил дәветләмә и дегетче, как болгарский.
Автор Demetrius
 - января 20, 2013, 15:51
Цитата: Rachtyrgin от января 20, 2013, 11:56
Может быть, может быть... А вот, к примеру, слово "дәветләмә" прога воспринимает как македонский да еще и отображает латиницей. Македонский, по мнению Гугля - тюркский, что ли? С ума с ними сойдешь...
Эх... А я почему-то ошибочно считал, что Вы программист...

Алгоритм определяет, на какой из поддерживаемых языков похож текст. И всё. Если вы предлагаете ему текст на неподдерживаемом языке, результаты будут неправильными, — это очевидно. Вы бы ему ещё науатль предложили.

Особенно странен Ваш комментарий «Македонский, по мнению Гугля - тюркский, что ли?». Программа вообще никак не учитывает родство языков, так как это банально не нужно для задачи определения языка.

Цитата: Leo от января 20, 2013, 15:37
А этот переводчик загружать обязательно ? Можно как-нить так попробовать ?
Это всего лишь альтернативных интерфейс к самому обычному http://translate.google.com/. И переводит он точно так же.
Автор Leo
 - января 20, 2013, 15:37
А этот переводчик загружать обязательно ? Можно как-нить так попробовать ?
Автор Филюс
 - января 20, 2013, 14:52
Цитата: Rachtyrgin от января 20, 2013, 11:56
Может быть, может быть... А вот, к примеру, слово "дәветләмә" прога воспринимает как македонский да еще и отображает латиницей. Македонский, по мнению Гугля - тюркский, что ли? С ума с ними сойдешь...
Татарский Гуглом не поддерживается, а язык в нём определяется так, чтобы он не совпадал с языком, на который переводите. То есть при переводе, например, на русский он определит язык оригинала каким угодно, но только не русским.
Если вы знаете online-переводчик, который хорошо переводят татарский - сообщите, возможно, добавлю.
Автор Rachtyrgin
 - января 20, 2013, 11:56
Может быть, может быть... А вот, к примеру, слово "дәветләмә" прога воспринимает как македонский да еще и отображает латиницей. Македонский, по мнению Гугля - тюркский, что ли? С ума с ними сойдешь...