Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.
Ограничения: максимум вложений в сообщении — 3 (3 осталось), максимальный размер всех файлов — 300 КБ, максимальный размер одного файла — 100 КБ
Снимите пометку с вложений, которые необходимо удалить
Перетащите файлы сюда или используйте кнопку для добавления файлов
Вложения и другие параметры
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр

Сообщения в этой теме

Автор Rachtyrgin
 - июля 17, 2020, 14:10
Появилась отличная статья на Хабре, где раскрывается технология. Оказывается, Ольга Яковлева - слепая. Тем не менее, она в одиночку создала синтезатор речи: https://habr.com/ru/company/ruvds/blog/511236/
Автор Awwal12
 - июня 30, 2020, 09:56
Цитата: Rachtyrgin от июня 29, 2020, 21:35
Так что Авваль XII безусловно прав. Все-таки, речь идет о сэмплах.
Так в любом случае речь о сэмплах. И это тоже сэмплирование:
Цитата: Rachtyrgin от июня 29, 2020, 21:35
the synthesizers which generate speech by combining segments of the recordings themselves
Вопрос только, о каких именно и как с ними работают.
Синтезатор в строгом смысле слова записями не пользуется вообще, а просто генерирует тот или иной звуковой спектр. Но сейчас так обычно не делают.
Автор Rachtyrgin
 - июня 29, 2020, 21:35
У Ольги Яковлевой на странице загрузки имеется следующее объяснение: Voices are built from recordings of natural speech. They have small footprints, because only statistical models are stored on users' computers. And though the voices lack the naturalness of the synthesizers which generate speech by combining segments of the recordings themselves, they are still very intelligible and resemble the speakers who recorded the source material. Так что Авваль XII безусловно прав. Все-таки, речь идет о сэмплах. Какой алгоритм позволяет склеивать между собой крошечные сэмплы, я не знаю. Впрочем, если Вы действительно готовы углубиться в тему, то обратите внимание на то, что Яковлева ссылается на технологию HTS и основанную на ней математику. Вот ссылка: http://hts.sp.nitech.ac.jp/
Автор Medrawd
 - июня 29, 2020, 20:21
Цитата: Rachtyrgin от июня 29, 2020, 19:55
По настоящему сложная задача. Если бы мне приспичило, я бы взял готовый синтезатор, например, от Гугля или тот, в котором "живет" наш Талгат - RH Voice от Ольги Яковлевой. В нем, кстати, помимо татарского, еще 7 языков.

Я погуглил. Значит, бывают синтезаторы, а бывают языковые модули для них (для разных языков). Как написать свой модуль? Что они из себя представляют?
Автор Rachtyrgin
 - июня 29, 2020, 19:55
Цитата: Medrawd от июня 29, 2020, 15:38
Мм... Подскажите, а как вообще можно написать синтезатор речи для конкретного языка? Можно ли ручками сделать перекодировщик из буковок языка в МФа, а потом "скормить" модулю-синтезатору речи? Какие языки программирования для этого лучше годятся? Какие вообще эти модули бывают, как их использовать? Может ли он быть кроссплатформенным? И чтобы голоса были красивые и приятные))

По настоящему сложная задача. Если бы мне приспичило, я бы взял готовый синтезатор, например, от Гугля или тот, в котором "живет" наш Талгат - RH Voice от Ольги Яковлевой. В нем, кстати, помимо татарского, еще 7 языков.
Автор Awwal12
 - июня 29, 2020, 16:11
Цитата: Medrawd от июня 29, 2020, 15:38
Мм... Подскажите, а как вообще можно написать синтезатор речи для конкретного языка?
Много-много сэмплов и алгоритм их сложения, по идее.
Цитата: Medrawd от июня 29, 2020, 15:38
Можно ли ручками сделать перекодировщик из буковок языка в МФа, а потом "скормить" модулю-синтезатору речи?
Символы МФА не имеют точного звукового соответствия. Даже если не трогать вопросы тонов, интонации и пр.
Автор Medrawd
 - июня 29, 2020, 15:38
Мм... Подскажите, а как вообще можно написать синтезатор речи для конкретного языка? Можно ли ручками сделать перекодировщик из буковок языка в МФа, а потом "скормить" модулю-синтезатору речи? Какие языки программирования для этого лучше годятся? Какие вообще эти модули бывают, как их использовать? Может ли он быть кроссплатформенным? И чтобы голоса были красивые и приятные))
Автор Rachtyrgin
 - июня 28, 2020, 20:59
Спасибо за ссылку. Вполне прилично.
Автор Neeraj
 - июня 28, 2020, 13:38
Ссылка  Интересно, кто-то использует это  :???