Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Забавный глюк гуглопереводчика

Автор Alessandro, октября 5, 2012, 20:26

0 Пользователи и 1 гость просматривают эту тему.

Rachtyrgin

Выше Вадимий писал, что гугль работает через статистику, то бишь экстенсивным путем. Следовательно, в основе его механизма лежат коллокации + стемминг. Вычленить коллокации омонимов и работать с ними индивидуально действительно несложно.
Всякому остановленному фашисту для захвата его в плен можешь еще крикнуть:
«Хэндэ хох!» (Руки вверх!)
«Вафи хинлеги!» (Бросай оружие!)
«Абгезэсен!» (Слезай! — С машины, с лошади, с повозки.)
Если фашист не сразу исполняет твое приказание, крикни грознее и добавь:
«Бай флухтфэрзух вирт гэшози!» (Побежишь — буду стрелять!)
А. Афанасьев. В помощь партизану. Москва, 1942 г.

mnashe

Цитата: Вадимий от октября 18, 2012, 12:38
Я думал, что обработка текстов при разработке толмача — процесс практически автоматический, не требующий особенного вмешательства людей.
Думаю, так и есть.
Но над какими парами работать — указывают люди.
Соответственно, конечный переводчик может пользоваться лишь уже подготовленными парами.
Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!

Bhudh

Цитата: Rómendil от октября 18, 2012, 10:46изменить исходный язык на тот, в котором используется другая пиьсменность) транскрипция пишется для китайского языка
А если это иероглиф, отсутствующий в китайском?
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Python

Цитата: Тайльнемер от октября 18, 2012, 12:16
Цитата: Вадимий от октября 18, 2012, 10:32
Цитата: Bienna от октября 17, 2012, 19:10
Между теми, которые из разных групп, — да. Между внутри- же -групповыми языками вроде бы такого нет.
Вы имели в виду подгрупп. :)
И то, кажется, не везде работает.
Я не знаю, но мне кажется, что дело не в языковых группах. Гугл, возможно, пытается переводить через все пути, но на конечном результате больше сказывается тот путь, по которому у Гугла больше информации. В направлениях русский↔украинский и русский↔белорусский в базе Гугла очнь много переводов, а то что они при этом относятся к одной языковой подгруппе — совпадение.
Не думаю. При переводе англ. => укр. результат получается полностью идентичным англ. => рус. => укр., при непосредственном переводе был бы хоть минимум различий. Что интересно, укр.=>англ. переводится без участия русского (т.е., укр. => рус. => англ. дает немного другой результат). Во всяком случае, так было год назад — не думаю, что за это время что-то радикально улучшилось.
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

Python

ЦитироватьВ направлениях русский↔украинский и русский↔белорусский в базе Гугла очнь много переводов
Сомневаюсь. Перевод рус. => укр. маловосстребован из-за поголовного владения украинцев русским хотя бы на пассивном уровне, перевод укр. => рус. маловосстребован из-за непопулярности украинских авторов в России. Если наполнять базу текстами книг, англ. <=> укр. наполнить куда легче.
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

Вадимий

Так всяческое худло — не единственный источник параллельных.

huaxia

Гугл вообще иногда выдаёт парадоксы.
Вот попробуйте набить туда фразу на японском "誰も僕を好き" (Никто меня не любит), и получите совершенно обратное "Я люблю всех".

Hellerick

Цитата: huaxia от октября 19, 2012, 18:00
Вот попробуйте набить туда фразу на японском "誰も僕を好き" (Никто меня не любит), и получите совершенно обратное "Я люблю всех".

А где отрицание?
Я думаю, должно было быть что-то вроде 誰も僕を好きではない.

huaxia

упс, я думал отрицание там не нужно. не подумал. вот что значит 自分で勉強する。。。
すみません、グーグルさん!

Alessandro

Цитата: Python от октября 19, 2012, 17:09
ЦитироватьВ направлениях русский↔украинский и русский↔белорусский в базе Гугла очнь много переводов
Сомневаюсь. Перевод рус. => укр. маловосстребован из-за поголовного владения украинцев русским хотя бы на пассивном уровне, перевод укр. => рус. маловосстребован из-за непопулярности украинских авторов в России. Если наполнять базу текстами книг, англ. <=> укр. наполнить куда легче.
Думаю, что вы ошибаетесь. Очень часто сталкиваюсь в сети как с русскими текстами, содержащими явные следы машинного перевода с украинского (на новостных сайтах), так и с украинскими, содержащими явные следы машинного перевода с русского (не далее как пару часов назад наткнулся на официальном сайте горсовета Симферополя на шедевр: Наш рідний будинок – Сімферополь має давню історію і особливий неповторний вигляд).
Спасибо, что дочитали.

Rómendil

Цитата: Bhudh от октября 18, 2012, 19:37
Цитата: Rómendil от октября 18, 2012, 10:46изменить исходный язык на тот, в котором используется другая пиьсменность) транскрипция пишется для китайского языка
А если это иероглиф, отсутствующий в китайском?
Не поверите, но он находит чтения даже для таких иероглифов. Вот сейчас попытался "перевести" 畑 и 働 с русского на английский, так гугл подписал их как tián и dòng. Хотя при этом выдал предупреждение, что язык оригинала - японский.
Я не понимаю, он что, фонетики распознаёт? 田 и 動 в китайском так читаются.

Самое забавное - вбить 働く, гугл преспокойно выдаёт dòngku и даже не давится  :(

Демедемедеме

Цитата: Rómendil от октября 24, 2012, 21:45
Не поверите, но он находит чтения даже для таких иероглифов. Вот сейчас попытался "перевести" 畑 и 働 с русского на английский, так гугл подписал их как tián и dòng. Хотя при этом выдал предупреждение, что язык оригинала - японский.
Я не понимаю, он что, фонетики распознаёт?
Нет, конечно. Он просто ориентируется на китайские словари. http://www.zdic.net/zd/zi/ZdicE5Zdic83Zdic8D.htm http://www.zdic.net/zd/zi/ZdicE7Zdic95Zdic91.htm

Да чего уж там, в некоторых китайских словарях можно найти «иероглифы» N и Q. С чтением и толкованием, разумеется.

Bhudh

Цитата: Rómendil от октября 24, 2012, 21:45Самое забавное - вбить 働く, гугл преспокойно выдаёт dòngku и даже не давится
Вот гуглу бы "Определитель языков мира по письменностям" точно не помешал.
А то видит букву, не существующую в языке N и спокойнёхонько определяет язык как N...
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Демедемедеме

Цитата: Bhudh от октября 25, 2012, 00:23
Вот гуглу бы "Определитель языков мира по письменностям" точно не помешал.
А то видит букву, не существующую в языке N и спокойнёхонько определяет язык как N...
«Я не знаю, что по-украински значит мрія» — это украинский язык? А Ваш определитель сказал бы, что украинский.

Гугль всё правильно делает.

Bhudh

Ты предсказуем. А статистически попытаться определить хотя бы по буквам, какой язык, что мешает?
Если уж он заточен под слова...
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Демедемедеме

Цитата: Bhudh от октября 25, 2012, 06:46
А статистически попытаться определить хотя бы по буквам, какой язык, что мешает?
А что он по твоему делает?  :donno: Как раз статистически определяет по буквам.

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

watchmaker

Вспоминаю историю с гуглопереводчиком, которая произошла года три назад. Возможно, я когда-то кидал ее сюда, но не в этой теме. Вбиваю в него чешское vlaštovka и перевожу на русский. ГЛОТАТЬ... И никаких других вариантов. Долго не мог понять, пока не вспомнил про английский. SWALLOW! И это у них, видите ли, переводится только как ГЛОТАТЬ.

Зы, если ввести vlaštovky - пишет ЛАСТОЧКИ...

watchmaker

Пикец... ввожу русское "ласточка" - выдает: polykat, spolknout, polknout, polykání...

watchmaker

Добавлю. Глюк из первого поста повторился также для эстонского.

mnashe

Цитата: watchmaker от октября 25, 2012, 16:01
И это у них, видите ли, переводится только как ГЛОТАТЬ.
Не совсем так:
ОригиналПеревод
The swallow flies
The swallow flies and swallows flies
The swallow flies and swallows flies.
Swallows fly
Swallows fly and swallow flies
Ласточка летит
Ласточка мух и мух глотает
Ласточка мух и глотает мух.
Ласточки летают
Ласточки летают и глотать мух
Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!


watchmaker


Lugat

Да, надо бы гуглянам делать междусобойчики по группам языков, иначе это не дело. Между чешским и словацким — вполне сносно переводится. За украино-руссо-беларуссо уже говорили. Почему б не подключить к украино-руссо-беларуссо... Прям хоть коллективную заявку писать, что ли... :donno: Пусть бы объединили славянские, романские, ну и прочие группы языков.

Тута

ЦитироватьЭто — грубая, я бы сказал, стратегически грубая ошибка в проектировании бизнес-логики приложения. Английский здесь выступает языком-посредником для любых двух произвольно взятых пар языков. А здравый смысл подсказывает, что для таких пар должны существовать индивидуальные правила перевода...
Ты бы в матчасти сперва разобрался, стратег. Стратегически у них все верно: сначала главное, остальное потом. Главное - это английский, поэтому и первичные пары в первую очередь сделали с ним. Пары других языков сделают потихоньку лет за 20, торопиться некуда.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр