Лингвофорум

Теоретический раздел => Прикладная лингвистика => Компьютерная лингвистика => Topic started by: Hellerick on September 29, 2010, 18:24

Title: Автоматический фонетайзер
Post by: Hellerick on September 29, 2010, 18:24
Тут в английской Википедии вопрос зашел об использовании знаков ударения в русских (кириллических) именах. Я и авторитетный в русском секторе английской Википедии пользователь Ezhiki придерживаемся той позиции, что знаки ударений из кириллических имен должны быть удалены (поскольку не являются элементом русской орфографии, и потому что на многих компьютерах они отображаются неправильно), а в качестве компенсации должны быть добавлены транскрипции в IPA.

Проблема в том, что набирать большое количество транскрипций муторно, да и не все могут делать это корректно (Ezhiki говорит, что недостаточно компетентен для этого).

И вот я подумал, а не может ли кто-нибудь сделать автоматический фонетайзер для русского языка, например в виде странички с JAVA-кодом? При условии, что во всех словах расставлены ударения, и с предупреждением, что слова должны вводиться с учетом норм орфоэпии (тэннис, што) — кажется, это вполне реально. Я бы и сам попробовал, но у меня нет опыта составления подобных JAVA-страниц, да и я не хочу брать на себя ответственность за определение того, какая система транскрипции русских слов является правильной.

Или, может быть, кто-нибудь знает похожие уже готовые программы?

Разумеется, программа должна прежде всего быть заточенной под передачу русских имен собственных.
Title: Автоматический фонетайзер
Post by: Esvan on September 29, 2010, 18:31
Offtop
Лучше протолкните правило об обязательном указании произношения в IPA всех имён собственных, а не только русских.
Title: Автоматический фонетайзер
Post by: Bhudh on September 30, 2010, 00:42
В en:wiki так, кажется, и сделано.