Лингвофорум

Общий раздел => Наука и техника => Тема начата: novikovag от ноября 7, 2017, 03:57

Название: Машинный перевод
Отправлено: novikovag от ноября 7, 2017, 03:57
Аноны, кто в теме, как обстоят дела в сабже? На сколько я понимаю, если язык чуть сложнее чем английский, то адекватного переводчика в принципе не существует. Даже у китаез и индусов, как то все вяло.
Название: Машинный перевод
Отправлено: Bhudh от ноября 7, 2017, 17:33
Если писать так, как Вы, ни один переводчик в принципе не справится, так как воспримет «на сколько» в контексте сравнения ("на сколько A больше, чем B", например), а «как то» либо тоже в контексте сравнения ("это кресло не такое мягкое, как то»), либо как вводное выражение перед перечислением.
Название: Машинный перевод
Отправлено: Валер от ноября 7, 2017, 18:07
Мне показалось, что для переводчика также проблема - просто разговорная неформальность формулировок.. Даже в рамках литнормы.
Название: Машинный перевод
Отправлено: novikovag от ноября 7, 2017, 18:26
Цитата: Bhudh от ноября  7, 2017, 17:33
Если писать так, как Вы, ни один переводчик в принципе не справится, так как воспримет «на сколько» в контексте сравнения ("на сколько A больше, чем B", например), а «как то» либо тоже в контексте сравнения ("это кресло не такое мягкое, как то»), либо как вводное выражение перед перечислением.
та не, мне интересно именно текущее положение дел, как дела то? В чем проблемы с переводом?
Название: Машинный перевод
Отправлено: Awwal12 от ноября 7, 2017, 18:29
Цитата: Валер от ноября  7, 2017, 18:07
Мне показалось, что для переводчика также проблема - просто разговорная неформальность формулировок.. Даже в рамках литнормы.
Для переводчика первая проблема - неспособность к анализу семантики высказывания, из чего неизбежно вытекают ошибки. Простейший пример: как перевести "ключ" - key или spring? И как перевести spring - "родник", "весна" или вообще "пружина"?

Алсо, чёт взоржал с "простого английского"...
Название: Машинный перевод
Отправлено: Awwal12 от ноября 7, 2017, 18:33
Цитата: novikovag от ноября  7, 2017, 18:26
В чем проблемы с переводом?
Основные - с анализом семантики (что пока вообще практически недостижимо), а также анализом и корректными преобразованиями синтаксической структуры. Машинный перевод между языками с сильно отличающимся синтаксисом, как правило, заметно хуже. Удовлетворительной теории общего синтаксиса, напомню, так и нет.
Название: Машинный перевод
Отправлено: novikovag от ноября 7, 2017, 18:36
Цитировать
Алсо, чёт взоржал с "простого английского"...
Флекций нет, родов нет, произносится как сотонарешил. Что не так?
Название: Машинный перевод
Отправлено: novikovag от ноября 7, 2017, 18:41
Цитировать
Основные - с анализом семантики
Так так так, семантика дело десятое. Разложен ли например русский язык на правила, которые можно закодировать в программе?
Название: Машинный перевод
Отправлено: Awwal12 от ноября 7, 2017, 18:44
Цитата: novikovag от ноября  7, 2017, 18:36
Флекций нет
Вообще-то флексии есть, пусть и две с половиной. Так ведь сложность языка, а тем паче сложность перевода, не определяется развитостью словоизменения в языке. Китайский по этому критерию так вообще должен быть проще пареной репы...
Цитата: novikovag от ноября  7, 2017, 18:36
произносится как сотонарешил
Это признак простоты?..
Название: Машинный перевод
Отправлено: Awwal12 от ноября 7, 2017, 18:49
Цитата: novikovag от ноября  7, 2017, 18:41
ЦитироватьОсновные - с анализом семантики
Так так так, семантика дело десятое. Разложен ли например русский язык на правила, которые можно закодировать в программе?
М. А вы считаете, что грамматика не зависит от семантики? Как, например, правильно закодировать тот же род местоимений, не зная их антецедентов?
Название: Машинный перевод
Отправлено: novikovag от ноября 7, 2017, 18:55
Цитата: Awwal12 от ноября  7, 2017, 18:49
Цитата: novikovag от ноября  7, 2017, 18:41
ЦитироватьОсновные - с анализом семантики
Так так так, семантика дело десятое. Разложен ли например русский язык на правила, которые можно закодировать в программе?
М. А вы считаете, что грамматика не зависит от семантики? Как, например, правильно закодировать тот же род местоимений, не зная их антецедентов?
Я бы хотел определиться сначала с грамматикой. Аналогия Панини и Госвами в санскрите.
Название: Машинный перевод
Отправлено: novikovag от ноября 7, 2017, 18:57
Цитировать
Это признак простоты?..
где система?
Название: Машинный перевод
Отправлено: Pigra_kojoto от ноября 7, 2017, 19:19
Самая большая проблема, это контекстонеанализируемость.
Название: Машинный перевод
Отправлено: Bhudh от ноября 7, 2017, 20:55
Цитата: novikovag от ноября  7, 2017, 18:55Я бы хотел определиться сначала с грамматикой. Аналогия Панини и Госвами в санскрите.
Грамматика Панини — это абсолютно нормализованная и зарегулированная грамматика литературного языка.
Сделать что-то подобное для английского, боюсь, невозможно.
Название: Машинный перевод
Отправлено: novikovag от ноября 8, 2017, 04:21
Цитировать
Сделать что-то подобное для английского, боюсь, невозможно.
Интересно, а есть ли подвижки в этом направлении? Типа вся грамматика %ЯЗЫКА% в таблицах для чайников :umnik:
Название: Машинный перевод
Отправлено: novikovag от ноября 8, 2017, 04:28
Цитата: Pigra_kojoto от ноября  7, 2017, 19:19
Самая большая проблема, это контекстонеанализируемость.
Да ладно. Тот же гугл синтаксически правильно перевод сделать не может, для начала.
Название: Машинный перевод
Отправлено: Волод от ноября 8, 2017, 08:20
Цитата: novikovag от ноября  8, 2017, 04:28
Цитата: Pigra_kojoto от ноября  7, 2017, 19:19
Самая большая проблема, это контекстонеанализируемость.
Да ладно. Тот же гугл синтаксически правильно перевод сделать не может, для начала.

:green: Откуда Вы знаете, что не может? Может не хочет.
Название: Машинный перевод
Отправлено: Awwal12 от ноября 8, 2017, 09:01
Цитата: Bhudh от ноября  7, 2017, 20:55
Сделать что-то подобное для английского, боюсь, невозможно.
Да в принципе-то можно. Беда в том, что это все равно не решает вопроса перевода на другой язык.
Название: Машинный перевод
Отправлено: novikovag от ноября 8, 2017, 11:47
Цитата: Awwal12 от ноября  8, 2017, 09:01
Цитата: Bhudh от ноября  7, 2017, 20:55
Сделать что-то подобное для английского, боюсь, невозможно.
Да в принципе-то можно. Беда в том, что это все равно не решает вопроса перевода на другой язык.
Но делает решение на шаг ближе. Кстати, если перевод на родственный английскому, то в чем трудности?
Название: Машинный перевод
Отправлено: Bhudh от ноября 8, 2017, 14:53
А при чём тут родственность? На синтаксис она редко положительно влияет. Больше всего на морфемику и лексику.
Название: Машинный перевод
Отправлено: novikovag от ноября 8, 2017, 15:03
Цитата: Bhudh от ноября  8, 2017, 14:53
А при чём тут родственность? На синтаксис она редко положительно влияет. Больше всего на морфемику и лексику.
Ну я по глупости своей думал, английский<=>немецкий легче перевести, чем английский<=>русский, свободный порядок слов и все такое. Даже украинско/белоруcско<=>русский перевод будет не таким уж и сложным?
Название: Машинный перевод
Отправлено: Валер от ноября 8, 2017, 16:56
Цитата: novikovag от ноября  8, 2017, 11:47
Цитата: Awwal12 от ноября  8, 2017, 09:01
Цитата: Bhudh от ноября  7, 2017, 20:55
Сделать что-то подобное для английского, боюсь, невозможно.
Да в принципе-то можно. Беда в том, что это все равно не решает вопроса перевода на другой язык.
Но делает решение на шаг ближе. Кстати, если перевод на родственный английскому, то в чем трудности?
А делает ли? В отличие от того санскрита инглиш весь такой живенький..
Название: Машинный перевод
Отправлено: novikovag от ноября 8, 2017, 17:28
Цитата: Валер от ноября  8, 2017, 16:56
Цитата: novikovag от ноября  8, 2017, 11:47
Цитата: Awwal12 от ноября  8, 2017, 09:01
Цитата: Bhudh от ноября  7, 2017, 20:55
Сделать что-то подобное для английского, боюсь, невозможно.
Да в принципе-то можно. Беда в том, что это все равно не решает вопроса перевода на другой язык.
Но делает решение на шаг ближе. Кстати, если перевод на родственный английскому, то в чем трудности?
А делает ли? В отличие от того санскрита инглиш весь такой живенький..
Санскрит в этом плане сложен, хотя и формально описан.
Живенький английский:
Fæder ure þu þe eart on heofonum;
Si þin nama gehalgod
to becume þin rice
gewurþe ðin willa
on eorðan swa swa on heofonum.
urne gedæghwamlican hlaf syle us todæg
and forgyf us ure gyltas
swa swa we forgyfað urum gyltendum
and ne gelæd þu us on costnunge
ac alys us of yfele soþlice

Название: Машинный перевод
Отправлено: Валер от ноября 8, 2017, 17:39
Не понял. Что я имел в виду: английский - активно использующийся язык, да ещё и во всей своей пестроте.
Название: Машинный перевод
Отправлено: Awwal12 от ноября 8, 2017, 18:07
Вообще развитый синтетизм скорее облегчает, чем затрудняет парсинг синтаксиса...
Цитата: novikovag от ноября  7, 2017, 18:57
ЦитироватьЭто признак простоты?..
где система?
Так отсутствие системы - это сложно, а не просто.
Название: Машинный перевод
Отправлено: novikovag от ноября 9, 2017, 01:59
Цитата: Awwal12 от ноября  8, 2017, 18:07
Вообще развитый синтетизм скорее облегчает, чем затрудняет парсинг синтаксиса...
Цитата: novikovag от ноября  7, 2017, 18:57
ЦитироватьЭто признак простоты?..
где система?
Так отсутствие системы - это сложно, а не просто.
Отсутствие ситемы принимашь как должность и все, а вот если ситема, то нужно ей следовать.
Название: Машинный перевод
Отправлено: novikovag от ноября 9, 2017, 02:23
Вот кстати, нашел табличку лексической схожести (wiki/m) Lexical_similarity (https://en.m.wikipedia.org/wiki/Lexical_similarity)
но она какая то странная, особенно применительно к русскому.

И еще, я правильно понимаю, что это некая попытка классификации?
https://gist.github.com/nlothian/9240750
Название: Машинный перевод
Отправлено: Валер от ноября 9, 2017, 15:57
Цитата: novikovag от ноября  9, 2017, 01:59
Цитата: Awwal12 от ноября  8, 2017, 18:07
Вообще развитый синтетизм скорее облегчает, чем затрудняет парсинг синтаксиса...
Цитата: novikovag от ноября  7, 2017, 18:57
ЦитироватьЭто признак простоты?..
где система?
Так отсутствие системы - это сложно, а не просто.
Отсутствие ситемы принимашь как должность и все, а вот если ситема, то нужно ей следовать.
Тык чтобы что-то принять, надо это что-то представлять себе. Например, систему :)