В первом файле — оригинальный текст, во втором — выхлоп генератора речи (голос NeoSpeech Julie), в третьем — распознавание речи программой Dragon NaturallySpeaking 10.0.
Ну как Джулия? Неплохо, правда?
Пока русские гении докуривали Беломор и допивали Балтику 9, купленные на остатки распила средств на поддержку русского языка, тупые американцы сделали синтезатор речи, который уже можно слушать без рвотных позывов и желания мучительной смерти разработчикам.
Распознаватель речи тоже ничего. Думаю, после дополнительной тренировки результаты будут гораздо лучше. А мы тем временем продолжаем сосать... лапу.
чтой-то мне не очень; по ушам слегка бьет, от ощущения, словно отдельные слова не очень хорошо склеены.
Хотя общий ритм речи в принципе неплохо.
Цитата: Алалах от апреля 6, 2010, 19:50
чтой-то мне не очень; по ушам слегка бьет, от ощущения, словно отдельные слова не очень хорошо склеены.
:o Вы другие голоса вообще слышали? Того же дежурного Сэма, например.
естественно. Именно поэтому и сейчас прослушал. Недавно скачивал себе "голоса" по необходимости (только не пытайте какие и откуда, удалил уже все, не помню ссылки. На разных языках были: английский, польский, испанский, немецкий)
О "Сэме" и речи нет, это доисторическая эпоха.
Цитата: Алалах от апреля 6, 2010, 19:57
естественно. Именно поэтому и сейчас прослушал. Недавно скачивал себе "голоса" по необходимости (только не пытайте какие и откуда, удалил уже все, не помню ссылки)
Это лучший на данный момент голос. Если он не очень, то остальные вообще шлак.
Глянул, сколько этот движок весит и ужаснулся.
Цитата: Bhudh от апреля 6, 2010, 20:42
Глянул, сколько этот движок весит и ужаснулся.
500 мегов — фигня. :)
Цитата: Bhudh от апреля 6, 2010, 20:42
Глянул, сколько этот движок весит и ужаснулся.
Есть ещё Пол, он поскромнее.
Ага, в 2 раза. Почему они такого размера?
Там каждое слово в mp3 записано в 192 какстве?
Цитата: Bhudh от апреля 6, 2010, 23:04
Ага, в 2 раза. Почему они такого размера?
Там каждое слово в mp3 записано в 192 какстве?
Там сэмплы человеческого голоса, наверное. В каком формате, не знаю.
Цитата: Bhudh от апреля 6, 2010, 23:04
Ага, в 2 раза. Почему они такого размера?
Там каждое слово в mp3 записано в 192 какстве?
Есть ещё Дженни (http://thepiratebay.org/torrent/4999861/Jennifer_22_Voice_US_English_Nextup_Textaloud_Realspeak). Дистр всего 46 мегов. Попробуй её. :)
Микрософт Сэм - страх и ужас.
Игрался с голосовым поиском Гугла. Отлично работает; он ошибался, только когда я произносил действительно странные вещи, например, свой ник. Наверное, полезная вещь для обладателей смартфонов.
Жаль только, что он у меня на русский язык настроен. Никто не знает, как его на английский переключить?
К слову: голосовой поиск работает в Хроме на любом компе, а не только на смартфонах.