Author Topic: Забавный глюк гуглопереводчика  (Read 8847 times)

0 Members and 1 Guest are viewing this topic.

Offline Rachtyrgin

  • Posts: 1075
  • Gender: Male
Выше Вадимий писал, что гугль работает через статистику, то бишь экстенсивным путем. Следовательно, в основе его механизма лежат коллокации + стемминг. Вычленить коллокации омонимов и работать с ними индивидуально действительно несложно.
Всякому остановленному фашисту для захвата его в плен можешь еще крикнуть:
«Хэндэ хох!» (Руки вверх!)
«Вафи хинлеги!» (Бросай оружие!)
«Абгезэсен!» (Слезай! — С машины, с лошади, с повозки.)
Если фашист не сразу исполняет твое приказание, крикни грознее и добавь:
«Бай флухтфэрзух вирт гэшози!» (Побежишь — буду стрелять!)
А. Афанасьев. В помощь партизану. Москва, 1942 г.

Offline mnashe

  • Administrator
  • *
  • Posts: 44074
  • Gender: Male
Я думал, что обработка текстов при разработке толмача — процесс практически автоматический, не требующий особенного вмешательства людей.
Думаю, так и есть.
Но над какими парами работать — указывают люди.
Соответственно, конечный переводчик может пользоваться лишь уже подготовленными парами.
שָׁלוֹם עֲלֵיכֶם!

Offline Bhudh

  • Posts: 54584
  • Gender: Male
  • aka 蝎
    • Сайты по языкознанию
изменить исходный язык на тот, в котором используется другая пиьсменность) транскрипция пишется для китайского языка
А если это иероглиф, отсутствующий в китайском?
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Offline Python

  • Posts: 39256
  • Gender: Male
  • Aluarium agent
Между теми, которые из разных групп, — да. Между внутри- же -групповыми языками вроде бы такого нет.
Вы имели в виду подгрупп. :)
И то, кажется, не везде работает.
Я не знаю, но мне кажется, что дело не в языковых группах. Гугл, возможно, пытается переводить через все пути, но на конечном результате больше сказывается тот путь, по которому у Гугла больше информации. В направлениях русский↔украинский и русский↔белорусский в базе Гугла очнь много переводов, а то что они при этом относятся к одной языковой подгруппе — совпадение.
Не думаю. При переводе англ. => укр. результат получается полностью идентичным англ. => рус. => укр., при непосредственном переводе был бы хоть минимум различий. Что интересно, укр.=>англ. переводится без участия русского (т.е., укр. => рус. => англ. дает немного другой результат). Во всяком случае, так было год назад — не думаю, что за это время что-то радикально улучшилось.
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

Quote
В направлениях русский↔украинский и русский↔белорусский в базе Гугла очнь много переводов
Сомневаюсь. Перевод рус. => укр. маловосстребован из-за поголовного владения украинцев русским хотя бы на пассивном уровне, перевод укр. => рус. маловосстребован из-за непопулярности украинских авторов в России. Если наполнять базу текстами книг, англ. <=> укр. наполнить куда легче.
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

Offline Вадимий

  • Posts: 15019
  • Gender: Male
Так всяческое худло — не единственный источник параллельных.

Offline huaxia

  • Posts: 1321
Гугл вообще иногда выдаёт парадоксы.
Вот попробуйте набить туда фразу на японском "誰も僕を好き" (Никто меня не любит), и получите совершенно обратное "Я люблю всех".

Online Hellerick

  • Posts: 27465
  • Gender: Male
Вот попробуйте набить туда фразу на японском "誰も僕を好き" (Никто меня не любит), и получите совершенно обратное "Я люблю всех".

А где отрицание?
Я думаю, должно было быть что-то вроде 誰も僕を好きではない.

Offline huaxia

  • Posts: 1321
упс, я думал отрицание там не нужно. не подумал. вот что значит 自分で勉強する。。。
すみません、グーグルさん!

Offline Alessandro

  • Posts: 2767
  • Gender: Male
    • Alem-i Medeniye
Quote
В направлениях русский↔украинский и русский↔белорусский в базе Гугла очнь много переводов
Сомневаюсь. Перевод рус. => укр. маловосстребован из-за поголовного владения украинцев русским хотя бы на пассивном уровне, перевод укр. => рус. маловосстребован из-за непопулярности украинских авторов в России. Если наполнять базу текстами книг, англ. <=> укр. наполнить куда легче.
Думаю, что вы ошибаетесь. Очень часто сталкиваюсь в сети как с русскими текстами, содержащими явные следы машинного перевода с украинского (на новостных сайтах), так и с украинскими, содержащими явные следы машинного перевода с русского (не далее как пару часов назад наткнулся на официальном сайте горсовета Симферополя на шедевр: Наш рідний будинок – Сімферополь має давню історію і особливий неповторний вигляд).
Спасибо, что дочитали.

Online Rómendil

  • Posts: 749
  • Gender: Male
изменить исходный язык на тот, в котором используется другая пиьсменность) транскрипция пишется для китайского языка
А если это иероглиф, отсутствующий в китайском?
Не поверите, но он находит чтения даже для таких иероглифов. Вот сейчас попытался "перевести" 畑 и 働 с русского на английский, так гугл подписал их как tián и dòng. Хотя при этом выдал предупреждение, что язык оригинала - японский.
Я не понимаю, он что, фонетики распознаёт? 田 и 動 в китайском так читаются.

Самое забавное - вбить 働く, гугл преспокойно выдаёт dòngku и даже не давится  :(

Не поверите, но он находит чтения даже для таких иероглифов. Вот сейчас попытался "перевести" 畑 и 働 с русского на английский, так гугл подписал их как tián и dòng. Хотя при этом выдал предупреждение, что язык оригинала - японский.
Я не понимаю, он что, фонетики распознаёт?
Нет, конечно. Он просто ориентируется на китайские словари. http://www.zdic.net/zd/zi/ZdicE5Zdic83Zdic8D.htm http://www.zdic.net/zd/zi/ZdicE7Zdic95Zdic91.htm

Да чего уж там, в некоторых китайских словарях можно найти «иероглифы» N и Q. С чтением и толкованием, разумеется.

Offline Bhudh

  • Posts: 54584
  • Gender: Male
  • aka 蝎
    • Сайты по языкознанию
Самое забавное - вбить 働く, гугл преспокойно выдаёт dòngku и даже не давится
Вот гуглу бы "Определитель языков мира по письменностям" точно не помешал.
А то видит букву, не существующую в языке N и спокойнёхонько определяет язык как N
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Вот гуглу бы "Определитель языков мира по письменностям" точно не помешал.
А то видит букву, не существующую в языке N и спокойнёхонько определяет язык как N
«Я не знаю, что по-украински значит мрія» — это украинский язык? А Ваш определитель сказал бы, что украинский.

Гугль всё правильно делает.

Offline Bhudh

  • Posts: 54584
  • Gender: Male
  • aka 蝎
    • Сайты по языкознанию
Ты предсказуем. А статистически попытаться определить хотя бы по буквам, какой язык, что мешает?
Если уж он заточен под слова…
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

А статистически попытаться определить хотя бы по буквам, какой язык, что мешает?
А что он по твоему делает?  :donno: Как раз статистически определяет по буквам.

Offline Bhudh

  • Posts: 54584
  • Gender: Male
  • aka 蝎
    • Сайты по языкознанию
По всему тексту он определяет.
И очень часто неверно.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Offline watchmaker

  • Posts: 2011
  • Gender: Male
Вспоминаю историю с гуглопереводчиком, которая произошла года три назад. Возможно, я когда-то кидал ее сюда, но не в этой теме. Вбиваю в него чешское vlaštovka и перевожу на русский. ГЛОТАТЬ... И никаких других вариантов. Долго не мог понять, пока не вспомнил про английский. SWALLOW! И это у них, видите ли, переводится только как ГЛОТАТЬ.

Зы, если ввести vlaštovky - пишет ЛАСТОЧКИ...

Пикец... ввожу русское "ласточка" - выдает: polykat, spolknout, polknout, polykání...

Добавлю. Глюк из первого поста повторился также для эстонского.

Offline mnashe

  • Administrator
  • *
  • Posts: 44074
  • Gender: Male
И это у них, видите ли, переводится только как ГЛОТАТЬ.
Не совсем так:
ОригиналПеревод
The swallow flies
The swallow flies and swallows flies
The swallow flies and swallows flies.
Swallows fly
Swallows fly and swallow flies
Ласточка летит
Ласточка мух и мух глотает
Ласточка мух и глотает мух.
Ласточки летают
Ласточки летают и глотать мух
שָׁלוֹם עֲלֵיכֶם!

Offline Beul-binn

  • Posts: 253
  • Gender: Male

Offline watchmaker

  • Posts: 2011
  • Gender: Male
Ага, он таки видит показатель существительного... :-)

Offline Lugat

  • Posts: 13963
  • Gender: Male
Да, надо бы гуглянам делать междусобойчики по группам языков, иначе это не дело. Между чешским и словацким — вполне сносно переводится. За украино-руссо-беларуссо уже говорили. Почему б не подключить к украино-руссо-беларуссо… Прям хоть коллективную заявку писать, что ли… :donno: Пусть бы объединили славянские, романские, ну и прочие группы языков.

Тута

  • Guest
Quote
Это — грубая, я бы сказал, стратегически грубая ошибка в проектировании бизнес-логики приложения. Английский здесь выступает языком-посредником для любых двух произвольно взятых пар языков. А здравый смысл подсказывает, что для таких пар должны существовать индивидуальные правила перевода...
Ты бы в матчасти сперва разобрался, стратег. Стратегически у них все верно: сначала главное, остальное потом. Главное - это английский, поэтому и первичные пары в первую очередь сделали с ним. Пары других языков сделают потихоньку лет за 20, торопиться некуда.

 

With Quick-Reply you can write a post when viewing a topic without loading a new page. You can still use bulletin board code and smileys as you would in a normal post.

Note: this post will not display until it's been approved by a moderator.
Name: Email:
Verification:
Type the letters shown in the picture
Listen to the letters / Request another image
Type the letters shown in the picture:
√49 Напишите ответ строчными буквами:
«Сто одёжек, все без застёжек» — что это?: