Author Topic: Машинный перевод  (Read 633 times)

0 Members and 1 Guest are viewing this topic.

Offline novikovag

  • Posts: 59
« on: November 7, 2017, 04:57 »
Аноны, кто в теме, как обстоят дела в сабже? На сколько я понимаю, если язык чуть сложнее чем английский, то адекватного переводчика в принципе не существует. Даже у китаез и индусов, как то все вяло.

Offline Bhudh

  • Posts: 49432
  • Gender: Male
  • aka 蝎
    • Сайты по языкознанию
« Reply #1on: November 7, 2017, 18:33 »
Если писать так, как Вы, ни один переводчик в принципе не справится, так как воспримет «на сколько» в контексте сравнения ("на сколько A больше, чем B", например), а «как то» либо тоже в контексте сравнения ("это кресло не такое мягкое, как то»), либо как вводное выражение перед перечислением.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Online Валер

  • Posts: 16289
  • Gender: Male
« Reply #2on: November 7, 2017, 19:07 »
Мне показалось, что для переводчика также проблема - просто разговорная неформальность формулировок.. Даже в рамках литнормы.

Offline novikovag

  • Posts: 59
« Reply #3on: November 7, 2017, 19:26 »
Если писать так, как Вы, ни один переводчик в принципе не справится, так как воспримет «на сколько» в контексте сравнения ("на сколько A больше, чем B", например), а «как то» либо тоже в контексте сравнения ("это кресло не такое мягкое, как то»), либо как вводное выражение перед перечислением.
та не, мне интересно именно текущее положение дел, как дела то? В чем проблемы с переводом?

Online Awwal12

  • Super Moderator
  • *
  • Posts: 49811
  • Gender: Male
« Reply #4on: November 7, 2017, 19:29 »
Мне показалось, что для переводчика также проблема - просто разговорная неформальность формулировок.. Даже в рамках литнормы.
Для переводчика первая проблема - неспособность к анализу семантики высказывания, из чего неизбежно вытекают ошибки. Простейший пример: как перевести "ключ" - key или spring? И как перевести spring - "родник", "весна" или вообще "пружина"?

Алсо, чёт взоржал с "простого английского"...
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

« Reply #5on: November 7, 2017, 19:33 »
В чем проблемы с переводом?
Основные - с анализом семантики (что пока вообще практически недостижимо), а также анализом и корректными преобразованиями синтаксической структуры. Машинный перевод между языками с сильно отличающимся синтаксисом, как правило, заметно хуже. Удовлетворительной теории общего синтаксиса, напомню, так и нет.
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

Offline novikovag

  • Posts: 59
« Reply #6on: November 7, 2017, 19:36 »
Quote
Алсо, чёт взоржал с "простого английского"...
Флекций нет, родов нет, произносится как сотонарешил. Что не так?

« Reply #7on: November 7, 2017, 19:41 »
Quote
Основные - с анализом семантики
Так так так, семантика дело десятое. Разложен ли например русский язык на правила, которые можно закодировать в программе?

Online Awwal12

  • Super Moderator
  • *
  • Posts: 49811
  • Gender: Male
« Reply #8on: November 7, 2017, 19:44 »
Флекций нет
Вообще-то флексии есть, пусть и две с половиной. Так ведь сложность языка, а тем паче сложность перевода, не определяется развитостью словоизменения в языке. Китайский по этому критерию так вообще должен быть проще пареной репы...
произносится как сотонарешил
Это признак простоты?..
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

« Reply #9on: November 7, 2017, 19:49 »
Quote
Основные - с анализом семантики
Так так так, семантика дело десятое. Разложен ли например русский язык на правила, которые можно закодировать в программе?
М. А вы считаете, что грамматика не зависит от семантики? Как, например, правильно закодировать тот же род местоимений, не зная их антецедентов?
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

Offline novikovag

  • Posts: 59
« Reply #10on: November 7, 2017, 19:55 »
Quote
Основные - с анализом семантики
Так так так, семантика дело десятое. Разложен ли например русский язык на правила, которые можно закодировать в программе?
М. А вы считаете, что грамматика не зависит от семантики? Как, например, правильно закодировать тот же род местоимений, не зная их антецедентов?
Я бы хотел определиться сначала с грамматикой. Аналогия Панини и Госвами в санскрите.

« Reply #11on: November 7, 2017, 19:57 »
Quote
Это признак простоты?..
где система?

Offline Pigra_kojoto

  • Posts: 315
« Reply #12on: November 7, 2017, 20:19 »
Самая большая проблема, это контекстонеанализируемость.

Offline Bhudh

  • Posts: 49432
  • Gender: Male
  • aka 蝎
    • Сайты по языкознанию
« Reply #13on: November 7, 2017, 21:55 »
Я бы хотел определиться сначала с грамматикой. Аналогия Панини и Госвами в санскрите.
Грамматика Панини — это абсолютно нормализованная и зарегулированная грамматика литературного языка.
Сделать что-то подобное для английского, боюсь, невозможно.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Offline novikovag

  • Posts: 59
« Reply #14on: November 8, 2017, 05:21 »
Quote
Сделать что-то подобное для английского, боюсь, невозможно.
Интересно, а есть ли подвижки в этом направлении? Типа вся грамматика %ЯЗЫКА% в таблицах для чайников :umnik:

« Reply #15on: November 8, 2017, 05:28 »
Самая большая проблема, это контекстонеанализируемость.
Да ладно. Тот же гугл синтаксически правильно перевод сделать не может, для начала.

Offline Волод

  • Вне лингвистики
  • Posts: 2100
« Reply #16on: November 8, 2017, 09:20 »
Самая большая проблема, это контекстонеанализируемость.
Да ладно. Тот же гугл синтаксически правильно перевод сделать не может, для начала.

 :green: Откуда Вы знаете, что не может? Может не хочет.

Online Awwal12

  • Super Moderator
  • *
  • Posts: 49811
  • Gender: Male
« Reply #17on: November 8, 2017, 10:01 »
Сделать что-то подобное для английского, боюсь, невозможно.
Да в принципе-то можно. Беда в том, что это все равно не решает вопроса перевода на другой язык.
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

Offline novikovag

  • Posts: 59
« Reply #18on: November 8, 2017, 12:47 »
Сделать что-то подобное для английского, боюсь, невозможно.
Да в принципе-то можно. Беда в том, что это все равно не решает вопроса перевода на другой язык.
Но делает решение на шаг ближе. Кстати, если перевод на родственный английскому, то в чем трудности?

Offline Bhudh

  • Posts: 49432
  • Gender: Male
  • aka 蝎
    • Сайты по языкознанию
« Reply #19on: November 8, 2017, 15:53 »
А при чём тут родственность? На синтаксис она редко положительно влияет. Больше всего на морфемику и лексику.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Offline novikovag

  • Posts: 59
« Reply #20on: November 8, 2017, 16:03 »
А при чём тут родственность? На синтаксис она редко положительно влияет. Больше всего на морфемику и лексику.
Ну я по глупости своей думал, английский<=>немецкий легче перевести, чем английский<=>русский, свободный порядок слов и все такое. Даже украинско/белоруcско<=>русский перевод будет не таким уж и сложным?

Online Валер

  • Posts: 16289
  • Gender: Male
« Reply #21on: November 8, 2017, 17:56 »
Сделать что-то подобное для английского, боюсь, невозможно.
Да в принципе-то можно. Беда в том, что это все равно не решает вопроса перевода на другой язык.
Но делает решение на шаг ближе. Кстати, если перевод на родственный английскому, то в чем трудности?
А делает ли? В отличие от того санскрита инглиш весь такой живенький..

Offline novikovag

  • Posts: 59
« Reply #22on: November 8, 2017, 18:28 »
Сделать что-то подобное для английского, боюсь, невозможно.
Да в принципе-то можно. Беда в том, что это все равно не решает вопроса перевода на другой язык.
Но делает решение на шаг ближе. Кстати, если перевод на родственный английскому, то в чем трудности?
А делает ли? В отличие от того санскрита инглиш весь такой живенький..
Санскрит в этом плане сложен, хотя и формально описан.
Живенький английский:
Fæder ure þu þe eart on heofonum;
Si þin nama gehalgod
to becume þin rice
gewurþe ðin willa
on eorðan swa swa on heofonum.
urne gedæghwamlican hlaf syle us todæg
and forgyf us ure gyltas
swa swa we forgyfað urum gyltendum
and ne gelæd þu us on costnunge
ac alys us of yfele soþlice


Online Валер

  • Posts: 16289
  • Gender: Male
« Reply #23on: November 8, 2017, 18:39 »
Не понял. Что я имел в виду: английский - активно использующийся язык, да ещё и во всей своей пестроте.

Online Awwal12

  • Super Moderator
  • *
  • Posts: 49811
  • Gender: Male
« Reply #24on: November 8, 2017, 19:07 »
Вообще развитый синтетизм скорее облегчает, чем затрудняет парсинг синтаксиса...
Quote
Это признак простоты?..
где система?
Так отсутствие системы - это сложно, а не просто.
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

 

With Quick-Reply you can write a post when viewing a topic without loading a new page. You can still use bulletin board code and smileys as you would in a normal post.

Note: this post will not display until it's been approved by a moderator.
Name: Email:
Verification:
Type the letters shown in the picture
Listen to the letters / Request another image
Type the letters shown in the picture:
√49 Напишите ответ строчными буквами:
«Сто одёжек, все без застёжек» — что это?: