господа! прошу покумекать мой вопросик:
допустим есть программа которая переводит тексты с любого на любой n языков
лексику ведь можно как-то систематизировать и ограничить размером словаря
но как быть с именами людей растений и тд, в которых может быть произвольный набор звуков, и число этих имен бесконечно
возможно ли создание такого алгоритма который автоматически переводит звучание в любой другой язык
конечно же речь не о полноценной стопроцентной транскрипции, понятно что звуки в языках разные
или уже есть такое
Это в первую очередь проблема распознавания речи. Над ней, в общем-то, работают, и даже определённые успехи есть. Например, "виндой" в пределах базовых команд можно через микрофон руководить.
Цитата: Artemon от сентября 7, 2012, 02:41
Это в первую очередь проблема распознавания речи.
Когда я в первый раз прочитал вопрос Гостя№2, мне показалось, что речь идёт о переводе текста в текст. А сейчас я даже не знаю, что имелось в виду.
Я вообще не понял, что имелось в виду. В заголовке — одно, в посте Артемона — другое, а в первой сообщении темы вообще непонятно, что подразумевал автор.
Перевод фонетика языка A → IPA → фонетика языка B.
Цитата: Bhudh от сентября 7, 2012, 07:33
Перевод фонетика языка A → IPA → фонетика языка B.
да, я об этом
есть некоторое имя на одном языке состоящее из набора звуков этого языка - задача автоматизировать процесс транскрипции этого звучания в звуки другого языка чтобы была максимально возможная похожесть
например имя владимир путин или кристина арбакайте перевести на китайский
во первых хотелось бы посоветоваться с вами возможно ли такое в принципе, с использованием например универсальной фонетики
или всё же лучше чтобы это делал носитель каждого языка
Цитата: Bhudh от сентября 7, 2012, 07:33
Перевод фонетика языка A → IPA → фонетика языка B.
А в каком виде представлены входные данные?
Я так понял, что имелось в виду нечто такое:
текст в орфографии языка А → IPA → текст в орфографии языка Б.
Нет?
Цитата: Тайльнемер от сентября 7, 2012, 08:56А в каком виде представлены входные данные?
Либо орфография, либо транслит, наверное.