Т. е. графически отобразить речевое звучание в плане издаваемых частот и прочее.
Спасибо!
В SoundForge такая функция есть. В принципе и в Winamp'е можно, но там затруднительно будет сохранить её в файл.
В Audacity тоже можно
Просто откройте в Praat (http://www.fon.hum.uva.nl/praat/)-е, это лучший способ.
Я для этой цели юзаю Sonic Visualiser - программу, специализированную именно на этой задаче (плюс ещё там неплохое замедленное/ускоренное воспроизведение без ухода частот). Интерфейс довольно удобный, сохранение файла в картинку возможно. Правда, это программа изначально орнитоложская, а не фонетическая. Ну и для музыки там удобно, т.к. частоты нотами подписываются и по шкале ими же помечены.
Про Praat не знал вообще - но судя по описанию, которое сейчас мельком взглянул, это нечто гораздо более мощное и функциональное, чем Sonic Visualiser (но, предполагаю, и пропорционально более сложное в освоении).
Цитата: Upliner от апреля 25, 2015, 23:02
В Audacity тоже можно
Ой, там всё гораздо хуже видно, и для изменения всякого параметра нужно в двадцать раз больше телодвижений с хождениями по глобальным меню и всё такое. С точки зрения удобства пользования и вообще возможности что-то рассмотреть с Sonic Visualiser ни в какое сравнение.
Ещё я юзал для этой цели (ещё раньше - совсем давно) звуковой редактор CoolEdit2000, который позже был взят Adobe и стал называться Adobe Audition. У этого зверя (в адобовских версиях - в 2000, кажется, этого не было в таком виде) плюс в возможности вручную определять свои градиенты для раскраски (хотя реализовано это как-то очень через одно место, контрынтуитивно - нет чтоб обычный инструмент типа "кривые" всандалить). И более-менее можно менять настройки. Но опять же, если нужен не редактор, а именно только посмотреть, зато тщательно - тоже не очень удобно.
Цитата: Upliner от апреля 25, 2015, 21:48
В SoundForge такая функция есть. В принципе и в Winamp'е можно, но там затруднительно будет сохранить её в файл.
Проку-то с аудио редакции...
Теоретически можно отфильтровать диктофонную запись человеческой речи таким образом, что бы в
визуальном режиме без натуги идентифицировать
каждый звук в отдельности...
Задержка только за способом фильтрации...
Цитата: orklyn от апреля 26, 2015, 16:55
Проку-то с аудио редакции...
Теоретически можно отфильтровать диктофонную запись человеческой речи таким образом, что бы в визуальном режиме без натуги идентифицировать каждый звук в отдельности...
Задержка только за способом фильтрации...
Да вроде вопрос был про сонограммы. Там самая проблема в том, чтобы охватить хорошо читаемым градиентом цветов ровно тот диапазон интенсивностей, который нужен для того, чтобы видеть интересущие вещи. (Хотя да, частотный фильтр, грубо говоря, типа "из коричневого шума в белый" мог бы помочь уложить спектр в более узкую полосу интенсивностей). Для гласных и для щелевых согласных это спектр в области средних частот (единицы кГц), где живут форманты. Взрывные согласные без натуги идентифицировать по сонограмме - несколько сложнее будет, они короткие и слишком слабые на фоне другого. Такой звук как "р" вообще выглядит забавно - как почти в чистом виде провал в звуке. Да, глядя на сонограмму, вы поймёте, что никаких "звуков в отдельности" в реальности не существует.
Цитата: Toman от апреля 26, 2015, 23:30
Да вроде вопрос был про сонограммы.
В трудах по фонетике фигурируют осциллограммы, спектрограммы...
ЦитироватьТакой звук как "р" вообще выглядит забавно - как почти в чистом виде провал в звуке. Да, глядя на сонограмму, вы поймёте, что никаких "звуков в отдельности" в реальности не существует.
Черно-белая фотография радуги заставляет верить в то, что в мире не существует иных цветов кроме оттенков серого.
В плане визуальной фиксации звуков речи
пока имеем подобную картину.
Цитата: orklyn от апреля 27, 2015, 12:29
В трудах по фонетике фигурируют осциллограммы, спектрограммы...
Спектрограмма - то же самое, что сонограмма. Осциллограмма в чистом виде для осмысленного визуального разглядывания может иметь лишь ограниченное применение. Например, м.б., форма фронта взрывных, где могут иметь значение детали длиной порядка длины волны, которые в любом спектре или спектрограмме заведомо потерялись бы. Ещё можно смотреть форму атаки и затухания звука, но это уже не сама осциллограмма, а в лучшем случае её огибающая (или вообще кривая мощности, а не амплитуды), причём это можно рассмотреть и на спектрограмме при подобающем подборе параметров (или на горизонтальном сечении спектрограммы).
Да, реально интересный вариант - это аналог спектрограммы, но базирующийся не на Фурье-спектрах в тех или иных окнах (обычно симметричных относительно времени и теряющих информацию о фазе!), а на моделировании возбуждения сигналом ряда осцилляторов (что уже даёт несимметричность относительно времени: осциллятор ничего не знает и не может знать о сигнале даже в самом ближайшем будущем, зато хранит свои постепенно затухающие колебания на некоторый промежуток времени (без чёткой границы) из прошлого). А если осцилляторы будут ещё и в какой-то мере связанными между собой, это даёт возможность учитывать информацию о фазе между разными частотами.
НЯП при беглом просмотре оглавления описания Praat, наверное, что-то подобное они имеют в виду под "кохлеаграммой"? Хотя могу ошибаться - повторюсь, я об этой программе ничего не знаю, м.б. там и нет такого уж физического моделирования мембраны?