Лингвофорум

Теоретический раздел => Прикладная лингвистика => Компьютерная лингвистика => Тема начата: Hellerick от сентября 29, 2010, 17:24

Название: Автоматический фонетайзер
Отправлено: Hellerick от сентября 29, 2010, 17:24
Тут в английской Википедии вопрос зашел об использовании знаков ударения в русских (кириллических) именах. Я и авторитетный в русском секторе английской Википедии пользователь Ezhiki придерживаемся той позиции, что знаки ударений из кириллических имен должны быть удалены (поскольку не являются элементом русской орфографии, и потому что на многих компьютерах они отображаются неправильно), а в качестве компенсации должны быть добавлены транскрипции в IPA.

Проблема в том, что набирать большое количество транскрипций муторно, да и не все могут делать это корректно (Ezhiki говорит, что недостаточно компетентен для этого).

И вот я подумал, а не может ли кто-нибудь сделать автоматический фонетайзер для русского языка, например в виде странички с JAVA-кодом? При условии, что во всех словах расставлены ударения, и с предупреждением, что слова должны вводиться с учетом норм орфоэпии (тэннис, што) — кажется, это вполне реально. Я бы и сам попробовал, но у меня нет опыта составления подобных JAVA-страниц, да и я не хочу брать на себя ответственность за определение того, какая система транскрипции русских слов является правильной.

Или, может быть, кто-нибудь знает похожие уже готовые программы?

Разумеется, программа должна прежде всего быть заточенной под передачу русских имен собственных.
Название: Автоматический фонетайзер
Отправлено: Esvan от сентября 29, 2010, 17:31
Offtop

Лучше протолкните правило об обязательном указании произношения в IPA всех имён собственных, а не только русских.
Название: Автоматический фонетайзер
Отправлено: Bhudh от сентября 29, 2010, 23:42
В en:wiki так, кажется, и сделано.