Печать страницы - Как диктофонную запись перевести в формат сонограммы?

Название: Как диктофонную запись перевести в формат сонограммы?
Отправлено: orklyn от апреля 25, 2015, 16:01

Т. е. графически отобразить речевое звучание в плане издаваемых частот и прочее.
Спасибо!

Название: Как диктофонную запись перевести в формат сонограммы?
Отправлено: Upliner от апреля 25, 2015, 21:48

В SoundForge такая функция есть. В принципе и в Winamp'е можно, но там затруднительно будет сохранить её в файл.

Название: Как диктофонную запись перевести в формат сонограммы?
Отправлено: Upliner от апреля 25, 2015, 23:02

В Audacity тоже можно

Название: Как диктофонную запись перевести в формат сонограммы?
Отправлено: engelseziekte от апреля 26, 2015, 01:23

Просто откройте в Praat (http://www.fon.hum.uva.nl/praat/)-е, это лучший способ.

Название: Как диктофонную запись перевести в формат сонограммы?
Отправлено: Toman от апреля 26, 2015, 02:10

Я для этой цели юзаю Sonic Visualiser - программу, специализированную именно на этой задаче (плюс ещё там неплохое замедленное/ускоренное воспроизведение без ухода частот). Интерфейс довольно удобный, сохранение файла в картинку возможно. Правда, это программа изначально орнитоложская, а не фонетическая. Ну и для музыки там удобно, т.к. частоты нотами подписываются и по шкале ими же помечены.

Про Praat не знал вообще - но судя по описанию, которое сейчас мельком взглянул, это нечто гораздо более мощное и функциональное, чем Sonic Visualiser (но, предполагаю, и пропорционально более сложное в освоении).

Цитата: Upliner от апреля 25, 2015, 23:02
В Audacity тоже можно

Ой, там всё гораздо хуже видно, и для изменения всякого параметра нужно в двадцать раз больше телодвижений с хождениями по глобальным меню и всё такое. С точки зрения удобства пользования и вообще возможности что-то рассмотреть с Sonic Visualiser ни в какое сравнение.

Ещё я юзал для этой цели (ещё раньше - совсем давно) звуковой редактор CoolEdit2000, который позже был взят Adobe и стал называться Adobe Audition. У этого зверя (в адобовских версиях - в 2000, кажется, этого не было в таком виде) плюс в возможности вручную определять свои градиенты для раскраски (хотя реализовано это как-то очень через одно место, контрынтуитивно - нет чтоб обычный инструмент типа "кривые" всандалить). И более-менее можно менять настройки. Но опять же, если нужен не редактор, а именно только посмотреть, зато тщательно - тоже не очень удобно.

Название: Как диктофонную запись перевести в формат сонограммы?
Отправлено: orklyn от апреля 26, 2015, 16:55

Цитата: Upliner от апреля 25, 2015, 21:48
В SoundForge такая функция есть. В принципе и в Winamp'е можно, но там затруднительно будет сохранить её в файл.

Проку-то с аудио редакции...
Теоретически можно отфильтровать диктофонную запись человеческой речи таким образом, что бы в визуальном режиме без натуги идентифицировать каждый звук в отдельности...
Задержка только за способом фильтрации...

Название: Как диктофонную запись перевести в формат сонограммы?
Отправлено: Toman от апреля 26, 2015, 23:30

Цитата: orklyn от апреля 26, 2015, 16:55
Проку-то с аудио редакции...
Теоретически можно отфильтровать диктофонную запись человеческой речи таким образом, что бы в визуальном режиме без натуги идентифицировать каждый звук в отдельности...
Задержка только за способом фильтрации...

Да вроде вопрос был про сонограммы. Там самая проблема в том, чтобы охватить хорошо читаемым градиентом цветов ровно тот диапазон интенсивностей, который нужен для того, чтобы видеть интересущие вещи. (Хотя да, частотный фильтр, грубо говоря, типа "из коричневого шума в белый" мог бы помочь уложить спектр в более узкую полосу интенсивностей). Для гласных и для щелевых согласных это спектр в области средних частот (единицы кГц), где живут форманты. Взрывные согласные без натуги идентифицировать по сонограмме - несколько сложнее будет, они короткие и слишком слабые на фоне другого. Такой звук как "р" вообще выглядит забавно - как почти в чистом виде провал в звуке. Да, глядя на сонограмму, вы поймёте, что никаких "звуков в отдельности" в реальности не существует.

Название: Как диктофонную запись перевести в формат сонограммы?
Отправлено: orklyn от апреля 27, 2015, 12:29

Цитата: Toman от апреля 26, 2015, 23:30
Да вроде вопрос был про сонограммы.

В трудах по фонетике фигурируют осциллограммы, спектрограммы...

ЦитироватьТакой звук как "р" вообще выглядит забавно - как почти в чистом виде провал в звуке. Да, глядя на сонограмму, вы поймёте, что никаких "звуков в отдельности" в реальности не существует.

Черно-белая фотография радуги заставляет верить в то, что в мире не существует иных цветов кроме оттенков серого.
В плане визуальной фиксации звуков речи пока имеем подобную картину.

Название: Как диктофонную запись перевести в формат сонограммы?
Отправлено: Toman от апреля 27, 2015, 16:08

Цитата: orklyn от апреля 27, 2015, 12:29
В трудах по фонетике фигурируют осциллограммы, спектрограммы...

Спектрограмма - то же самое, что сонограмма. Осциллограмма в чистом виде для осмысленного визуального разглядывания может иметь лишь ограниченное применение. Например, м.б., форма фронта взрывных, где могут иметь значение детали длиной порядка длины волны, которые в любом спектре или спектрограмме заведомо потерялись бы. Ещё можно смотреть форму атаки и затухания звука, но это уже не сама осциллограмма, а в лучшем случае её огибающая (или вообще кривая мощности, а не амплитуды), причём это можно рассмотреть и на спектрограмме при подобающем подборе параметров (или на горизонтальном сечении спектрограммы).

Да, реально интересный вариант - это аналог спектрограммы, но базирующийся не на Фурье-спектрах в тех или иных окнах (обычно симметричных относительно времени и теряющих информацию о фазе!), а на моделировании возбуждения сигналом ряда осцилляторов (что уже даёт несимметричность относительно времени: осциллятор ничего не знает и не может знать о сигнале даже в самом ближайшем будущем, зато хранит свои постепенно затухающие колебания на некоторый промежуток времени (без чёткой границы) из прошлого). А если осцилляторы будут ещё и в какой-то мере связанными между собой, это даёт возможность учитывать информацию о фазе между разными частотами.

НЯП при беглом просмотре оглавления описания Praat, наверное, что-то подобное они имеют в виду под "кохлеаграммой"? Хотя могу ошибаться - повторюсь, я об этой программе ничего не знаю, м.б. там и нет такого уж физического моделирования мембраны?

Лингвофорум

Общий раздел => Наука и техника => Техника => Тема начата: orklyn от апреля 25, 2015, 16:01