Лингвофорум

Теоретический раздел => Алтайские языки => Тюркские языки => Тема начата: Neeraj от июня 28, 2020, 13:38

Название: "Талгат"
Отправлено: Neeraj от июня 28, 2020, 13:38
Ссылка (https://rsbsrt.ru/tatar-speech-synthesizer/)  Интересно, кто-то использует это  :???
Название: "Талгат"
Отправлено: Rachtyrgin от июня 28, 2020, 20:59
Спасибо за ссылку. Вполне прилично.
Название: "Талгат"
Отправлено: Medrawd от июня 29, 2020, 15:38
Мм... Подскажите, а как вообще можно написать синтезатор речи для конкретного языка? Можно ли ручками сделать перекодировщик из буковок языка в МФа, а потом "скормить" модулю-синтезатору речи? Какие языки программирования для этого лучше годятся? Какие вообще эти модули бывают, как их использовать? Может ли он быть кроссплатформенным? И чтобы голоса были красивые и приятные))
Название: "Талгат"
Отправлено: Awwal12 от июня 29, 2020, 16:11
Цитата: Medrawd от июня 29, 2020, 15:38
Мм... Подскажите, а как вообще можно написать синтезатор речи для конкретного языка?
Много-много сэмплов и алгоритм их сложения, по идее.
Цитата: Medrawd от июня 29, 2020, 15:38
Можно ли ручками сделать перекодировщик из буковок языка в МФа, а потом "скормить" модулю-синтезатору речи?
Символы МФА не имеют точного звукового соответствия. Даже если не трогать вопросы тонов, интонации и пр.
Название: "Талгат"
Отправлено: Rachtyrgin от июня 29, 2020, 19:55
Цитата: Medrawd от июня 29, 2020, 15:38
Мм... Подскажите, а как вообще можно написать синтезатор речи для конкретного языка? Можно ли ручками сделать перекодировщик из буковок языка в МФа, а потом "скормить" модулю-синтезатору речи? Какие языки программирования для этого лучше годятся? Какие вообще эти модули бывают, как их использовать? Может ли он быть кроссплатформенным? И чтобы голоса были красивые и приятные))

По настоящему сложная задача. Если бы мне приспичило, я бы взял готовый синтезатор, например, от Гугля или тот, в котором "живет" наш Талгат - RH Voice от Ольги Яковлевой. В нем, кстати, помимо татарского, еще 7 языков.
Название: "Талгат"
Отправлено: Medrawd от июня 29, 2020, 20:21
Цитата: Rachtyrgin от июня 29, 2020, 19:55
По настоящему сложная задача. Если бы мне приспичило, я бы взял готовый синтезатор, например, от Гугля или тот, в котором "живет" наш Талгат - RH Voice от Ольги Яковлевой. В нем, кстати, помимо татарского, еще 7 языков.

Я погуглил. Значит, бывают синтезаторы, а бывают языковые модули для них (для разных языков). Как написать свой модуль? Что они из себя представляют?
Название: "Талгат"
Отправлено: Rachtyrgin от июня 29, 2020, 21:35
У Ольги Яковлевой на странице загрузки имеется следующее объяснение: Voices are built from recordings of natural speech. They have small footprints, because only statistical models are stored on users' computers. And though the voices lack the naturalness of the synthesizers which generate speech by combining segments of the recordings themselves, they are still very intelligible and resemble the speakers who recorded the source material. Так что Авваль XII безусловно прав. Все-таки, речь идет о сэмплах. Какой алгоритм позволяет склеивать между собой крошечные сэмплы, я не знаю. Впрочем, если Вы действительно готовы углубиться в тему, то обратите внимание на то, что Яковлева ссылается на технологию HTS и основанную на ней математику. Вот ссылка: http://hts.sp.nitech.ac.jp/
Название: "Талгат"
Отправлено: Awwal12 от июня 30, 2020, 09:56
Цитата: Rachtyrgin от июня 29, 2020, 21:35
Так что Авваль XII безусловно прав. Все-таки, речь идет о сэмплах.
Так в любом случае речь о сэмплах. И это тоже сэмплирование:
Цитата: Rachtyrgin от июня 29, 2020, 21:35
the synthesizers which generate speech by combining segments of the recordings themselves
Вопрос только, о каких именно и как с ними работают.
Синтезатор в строгом смысле слова записями не пользуется вообще, а просто генерирует тот или иной звуковой спектр. Но сейчас так обычно не делают.
Название: "Талгат"
Отправлено: Rachtyrgin от июля 17, 2020, 14:10
Появилась отличная статья на Хабре, где раскрывается технология. Оказывается, Ольга Яковлева - слепая. Тем не менее, она в одиночку создала синтезатор речи: https://habr.com/ru/company/ruvds/blog/511236/