Печать страницы - Звуки и графики

Название: Звуки и графики
Отправлено: Artemon от августа 6, 2008, 15:02

Мне как математику было бы очень интересно узнать следующее.

Допустим, есть у нас какая-то характеристика звука. Ну, там, скажем, количества шума, которое участвует в формировании звука. По этой характеристике звуки можно расположить по некой шкале. Допустим, есть другая характеристика, и звуки, опять же, можно расположить и по этой шкале. И т.п.

Сведя все эти шкалы в один график, получаем n-мерное пространство, где каждому звуку соответствуют его точные координаты. Если кто-то понял, о чём я, то хотелось бы узнать, есть ли какие-нибудь исследования или наработки на эту тему.

Название: Звуки и графики
Отправлено: Conservator от августа 6, 2008, 15:36

По-моему, полученные в рез-те подобного исследования данные имели бы большую погрешность. Здесь очень много зависит от тембра голоса произносящего звуки человека.

Название: Звуки и графики
Отправлено: Тася от августа 13, 2008, 11:54

ЦитироватьСведя все эти шкалы в один график, получаем n-мерное пространство, где каждому звуку соответствуют его точные координаты

А как Вы думаете, как свести в одну все-все шкалы, если на сегодняшний день звук речи акустически возможно охарактеризовать более чем по 10 признакам? ::)

Название: Звуки и графики
Отправлено: Dana от августа 13, 2008, 12:36

Цитата: "Тася" от
А как Вы думаете, как свести в одну все-все шкалы, если на сегодняшний день звук речи акустически возможно охарактеризовать более чем по 10 признакам?

Значит, будем иметь координаты в многомерном пространстве с размерностью 10 8-)

Название: Звуки и графики
Отправлено: Тася от августа 13, 2008, 13:10

ЦитироватьЗначит, будем иметь координаты в многомерном пространстве с размерностью 10

Понятно. :) А в практических целях это удобно?

Название: Звуки и графики
Отправлено: Artemon от августа 28, 2008, 22:27

Как бы вам так объяснить практические цели, чтобы вы не сочли меня сумасшедшим...

Дело в том, что я разрабатываю конланг на базе латыни. Фонетика у меня немного не такая, как в латыни, а это значит, что иногда два латинских слова (например, одно - с долгим гласным, другое - с кратким) у меня будут сливаться в одно.

Имея такие вот координаты, можно будет в аналогичных ситуациях заменять некоторые звуки ближайшими к ним. Как узнать, какой звук ближе к данному? Для пространства 10 - суммируем десять разностей соответствующих координат и извлекаем корень десятой степени (вроде бы ничего не попутал).

Понимаю, что в большинстве слов можно и на глаз прикинуть, как его лучше изменить, но когда таких слов много, то лучше бы делать это программно. :)

Название: Звуки и графики
Отправлено: myst от августа 28, 2008, 23:20

А что, если взять таблицу гласных в IPA и сделать на её основе граф? Ближе звучание, короче путь на графе. Или рёбрам назначить веса.

Название: Звуки и графики
Отправлено: myst от августа 28, 2008, 23:37

Вот, взгляните:
(http://content.files.mail.ru/BDR7DH/d2e30338ce4cd5b61046ad3bca1c6653)
Чем не граф? :)

Название: Звуки и графики
Отправлено: Artemon от августа 29, 2008, 01:57

Куда взглянуть-то? :)
И с согласными тоже что-то выдумать бы.

Название: Звуки и графики
Отправлено: myst от августа 29, 2008, 16:32

Цитата: "Artemon" от
Куда взглянуть-то?

Это я не через то место картинку выложил. :)
Теперь должно быть видно:
(http://dc84.4shared.com/download/60925431/a6a7b2e1/vowels.PNG?tsid=20080829-083027-f6b07b5a&forceAttachmentDownload=true)

Название: Звуки и графики
Отправлено: Artemon от августа 29, 2008, 18:03

Эээ... всё равно ничего не вижу.
Картинка должна быть? Может, проще картинку где-то в другое место, а сюда ссылку?

:???

Эдит: ссылку можно увидеть через цитату. Забавно.

В итоге на этой картинке каждый звук характеризуется двумя параметрами. Можно теоретически условиться таким образом: установить условную шкалу для заднеязычности (0 для переднеязычных, 4 для заднеязычных) и открытости (0 для закрытых, 6 для открытых) гласных. Т.е., например, звук [е] будет иметь координаты (1; 2) - если я правильно разобрался в графике.

А нет ли аналогичных двумерных графиков для других характеристик? Выше ведь писали, что там их больше десяти. Если есть, то аналогичным образом можно представить и их, и, по сути, задача будет решена. ::)

Название: Звуки и графики
Отправлено: myst от августа 29, 2008, 19:50

Про упомянутые десять характеристик я ничего не знаю.
Просто, мне подумалось: чем моделировать сами звуки, можно взять за основу IPA. Это, наверное, более грубая модель, но может её достаточно?
В википедии есть статья (http://en.wikipedia.org/wiki/IPA) про IPA. Злосчастная таблица гласных, которую я пытался Вам показать, оттуда. Там же есть таблица согласных.

Название: Звуки и графики
Отправлено: Artemon от августа 29, 2008, 22:58

Ага, спасибо. Похоже, всё-таки удастся свести в систему.
Более того, эту систему можно будет использовать при транслитерации названий собственных из языков с другими звуками... Неплохо, неплохо...

Название: Звуки и графики
Отправлено: Artemon от августа 30, 2008, 00:33

Результаты предварительного колупания меня удивили. В приятную сторону.

Любой гласный, по сути, можно задать тремя координатами: назальный или не, степень открытости, расположение в ряду.
Любой согласный - тоже тремя: способ образования, место образования, положение глоттиса.

Для более изощрённых (и, пожалуй, редких) звуков количество координат будет расти согласно их патализированности, щёлканью и т.п. Из чего следует, что для если такая координата для того или иного звука не указана, то её значение равно нулю.

Всего три координаты - это очень приятно и означает, что такой граф запросто можно смоделировать на компьютере. На двумерной бумаге тоже можно, но тогда придётся переводить в дополнительную координату назальность для гласных и глоттис для согласных.

По сути, такие двумерные схемы - вот же они.
http://ru.wikipedia.org/wiki/%D0%93%D0%BB%D0%B0%D1%81%D0%BD%D1%8B%D0%B5 (http://ru.wikipedia.org/wiki/%D0%93%D0%BB%D0%B0%D1%81%D0%BD%D1%8B%D0%B5)
http://ru.wikipedia.org/wiki/%D0%A1%D0%BE%D0%B3%D0%BB%D0%B0%D1%81%D0%BD%D1%8B%D0%B5 (http://ru.wikipedia.org/wiki/%D0%A1%D0%BE%D0%B3%D0%BB%D0%B0%D1%81%D0%BD%D1%8B%D0%B5)

А то уж напугали выше более чем десятью. :)

Название: Звуки и графики
Отправлено: Тихомиров Ден от августа 31, 2008, 09:16

Связка тем: "нелинейное письмо" http://lingvoforum.net/index.php/topic,10757.msg172870.html#msg172870

Название: Звуки и графики
Отправлено: myst от августа 31, 2008, 14:51

Artemon, Вы планируете сделать что-то вроде компаратора транскрипций слов?
Несколько лет назад у меня была подобная затея. Основная трудность, с которой я столкнулся,— это вычисление транскрипции. Я делал для английского, а из-за его орфографии ничего лучше таблицы преобразования выдумать не смог. Слов в английском много, таблица обещала быть огромной, готовой таблицы я не нашёл, потрошить Lingvo было неохота — так и забросил.

Название: Звуки и графики
Отправлено: Artemon от сентября 1, 2008, 02:00

Ну, если получится впихнуть латинский словарь в соответствующую программу (см. выше), большинство слов она прогенерит без меня. Останусь в роли научного руководителя. :)

Название: Звуки и графики
Отправлено: myst от сентября 3, 2008, 19:57

Цитата: "Artemon" от
Ну, если получится впихнуть латинский словарь в соответствующую программу (см. выше), большинство слов она прогенерит без меня. Останусь в роли научного руководителя.

У Вас латинский словарь с транскрипциями или в латинском прозрачная орфография?

Название: Звуки и графики
Отправлено: Тихомиров Ден от сентября 3, 2008, 23:25

Я не в курсе. Простите что влезаю в латинские языки

По мне всякая графика являеться условным элементом - кодом, как и звучание. Разница тоже условна, поймать условность можно только через условное обобщение и примитивизацию самых простых (принятых за приметив) элементов кода. Мы же за смыслом гонимся.
Во всех произношениях их примерно одно количество плюс минус погрешности эмоциональных субьектов и ситуаций. Их можно учитывать в производных, - потери смысла не столь критически, особенно в системе требующей унификации. Степень комуникации зависит и от степени унификации кода.
С орфографией разобраться станет проще, она более производный элемент.

Название: Звуки и графики
Отправлено: Artemon от сентября 4, 2008, 00:28

Цитата: myst от сентября 3, 2008, 19:57
Цитата: "Artemon" от
Ну, если получится впихнуть латинский словарь в соответствующую программу (см. выше), большинство слов она прогенерит без меня. Останусь в роли научного руководителя.
У Вас латинский словарь с транскрипциями или в латинском прозрачная орфография?

Ну, правила чтения в латинском не самые сложные. Думаю, программа легко обучится и разберётся.
Надеюсь. :)

Название: Звуки и графики
Отправлено: Artemon от сентября 4, 2008, 00:31

Цитата: Тихомиров Ден от сентября 3, 2008, 23:25
По мне всякая графика являеться условным элементом - кодом, как и звучание. Разница тоже условна, поймать условность можно только через условное обобщение и примитивизацию самых простых (принятых за приметив) элементов кода. Мы же за смыслом гонимся.
Во всех произношениях их примерно одно количество плюс минус погрешности эмоциональных субьектов и ситуаций. Их можно учитывать в производных, - потери смысла не столь критически, особенно в системе требующей унификации. Степень комуникации зависит и от степени унификации кода.
С орфографией разобраться станет проще, она более производный элемент.

Правильно. Мы уже установили, что все согласные звуки можно свести к трём основным параметрам, а гласные - к двум. Из этого и стоит исходить, выдумывая под них знаки.

Название: Звуки и графики
Отправлено: Тихомиров Ден от сентября 4, 2008, 01:25

Сначало было слово из первого звука, и звук был ..... потом была половина первого дня (пора обедать)
расположим звуки по циферблату. Очень чувственно и индивидуально.
А латинский как хочю - так и читаю, всё равно пойму по своему.

Название: Звуки и графики
Отправлено: myst от сентября 4, 2008, 12:26

Цитата: "Artemon" от
Думаю, программа легко обучится и разберётся.

Ваша программа самообучаема? Это очень интересно.

Название: Звуки и графики
Отправлено: arseniiv от сентября 4, 2008, 17:53

Цитата: Artemon от августа 30, 2008, 00:33
Любой гласный, по сути, можно задать тремя координатами: назальный или не, степень открытости, расположение в ряду.

Извините, может зря пишу, но раз у гласных взято различение назальности, почему же забыли об огублении? В той же схеме в Википедии огубление гласных различено, а вот назальности имхо я не видел...

Название: Звуки и графики
Отправлено: Марбол от сентября 4, 2008, 18:14

Здравствуйте!

Артемон, если не касаться назальных звуков, то остаются два признака. Положение в ряду - это, может быть, некоторым образом определённое расстояние между фокусом артикуляции и плоскостью раствора губ? Тогда степень открытости - это, по сути, телесный угол, занимаемый сечением раствора губ относительно фокуса? или это пропорция сечений раствора и фокуса?

Название: Звуки и графики
Отправлено: Artemon от сентября 7, 2008, 22:51

Цитата: arseniiv от сентября 4, 2008, 17:53
Цитата: Artemon от августа 30, 2008, 00:33
Любой гласный, по сути, можно задать тремя координатами: назальный или не, степень открытости, расположение в ряду.
Извините, может зря пишу, но раз у гласных взято различение назальности, почему же забыли об огублении? В той же схеме в Википедии огубление гласных различено, а вот назальности имхо я не видел...

Точно. Упустил.
Тогда немного переформулирую.

Любой гласный, по сути, можно задать двумя основными (степень открытости, расположение в ряду) и – при надобности – рядом дополнительных координат (назальность, огубленность, эризация, тон...).
Любой согласный – двумя основными (способ образования, место образования) и – при надобности – также рядом дополнительных (положение глоттиса, палатализация, щёлканье...).

Пожалуй, удобнее всего при таком раскладе будет всё же по умолчанию пользоваться двумерными координатами, подключая третьи и последующие лишь при надобности. При этом звуки, имеющие различия исключительно по третьей и т.д. координатам, стоит записывать одинаковыми значками, но снабжать их звёздочками, апострофами, умляутами и прочими условными обозначениями дополнительных характеристик.

Название: Звуки и графики
Отправлено: Artemon от сентября 7, 2008, 22:53

Цитата: Марбол от сентября 4, 2008, 18:14
Здравствуйте!

Артемон, если не касаться назальных звуков, то остаются два признака. Положение в ряду - это, может быть, некоторым образом определённое расстояние между фокусом артикуляции и плоскостью раствора губ? Тогда степень открытости - это, по сути, телесный угол, занимаемый сечением раствора губ относительно фокуса? или это пропорция сечений раствора и фокуса?

Хм, хотите даже так выразить? Скажем, через синус данного угла?
Мысль весьма интересная. Весьма. К сожалению, не обладаю достаточным уровнем знаний, чтобы подтвердить правильность вашей теории.

Название: Звуки и графики
Отправлено: Artemon от октября 6, 2008, 02:47

Вот такое нашёл. По-моему, это даже интереснее, чем в Вики.
Простите, переводить и править банально нет сил, время позднее.

...американські вчені Роман Якобсон, Гуннар Фант, Морріс Халле розробили універсальну систему диференційних ознак, побудовану на бінарному принципі, внаслідок чого всі фонемні опозиції зводяться до привативних. За основу загальної класифікації фонем вони взяли не артикуляційні ознаки (на їхню думку, артикуляційні особливості звуків у мовах світу найрізноманітніші й дуже тонкі, через що незручні для типологічної класифікації звуків), а акустичні, які можуть бути визначені за допомогою спеціальної електроакустичної апаратури. Вони виділили 12 пар диференційних ознак, які утворюють двочленні протиставлення (9 ознак звучності і 3 ознаки тону): 1) вокальність — невокальність; 2) консонантність — неконсонантність; 3) компактність (наявність у спектрі центральної ділянки більшої концентрації енергії) — дифузність (менша концентрація енергії в центральній ділянці спектра і поширення звукової енергії на його периферію); 4) напруженість — ненапруженість; 5) дзвінкість — глухість; 6) назальність (носовий характер) — неназальність (ротовий характер); 7) перервність — неперервність; 8) різкість (висока інтенсифікація шумів) — нерізкість (невисока інтенсифікація шумів); 9) глоталізованість — неглоталізованість; 10) низька тональність — висока тональність; 11) бемольність (ослаблення верхніх частотних складників унаслідок участі при творенні звука губ) — небемольність; 12) дієзність (посилення верхніх частотних показників унаслідок підняття спинки язика до піднебіння; дієзні — це м'які приголосні) — недієзність. За допомогою цих диференційних ознак можна описати систему фонем будь-якої мови. Звичайно, мо¬ви використовують не всі ознаки (із наведених 12 пар ознак можна утворити 4096 різних фонем). Для опису фонем української мови достатньо 9 ознак: вокальність, консонантність, дифузність, низькість, бемольність, дієзність, перервність, різкість, дзвінкість (див. табл.).

     а   і   У   б   к   м'   к   Ч   ш.
вокальність     +   +   +               +   +
консонантність   —   —   —   +   +   +   +   +   +
дифузність     —   +   +   +   —   +   +   +   —
низькість      +   —   +   +   +   +   —   —   —
бемольність     —   —   +   —   —   —   —   —   —
дієзність     —   —   —   —   —   +   —   —   —
перервність     —   —   —   +   +   +   +   +   —
різкість                          +   —
дзвінкість     +   +   +   +   —   +   +   —   —

Название: Звуки и графики
Отправлено: Artemon от октября 6, 2008, 03:00

Эх, кривовато вышло, жаль. :(

P.S. Дэн, как вам, кстати, идея базировать графическое представление звука именно на этих 12-ти признаках? Самое банальное: сделать 12 ключей и в зависимости от наличия той или иной характеристики рисовать данный ключ или нет. Вот, например, 4 вертикальных, 4 горизонтальных и 4 диагональных ключа в пиктограммке символа, который теоретически имел бы все признаки (пример от балды, сразу говорю).

-- --
|\ / |
\ /
/ \
|/ \|
-- --

Ну или по-другому как-нибудь. Главное - что характеристик именно 12, и они бинарные.

Название: Звуки и графики
Отправлено: Тихомиров Ден от октября 6, 2008, 18:51

Спасибо. Обдумаю. Пока на вскидку:
Как можно использовать этот принцип для выбора общего углового значения звука? Среднее арифметическое из суммы углов признаков вроде не годиться, - будут дубли?
Степень выраженности признака не учтена, хотя можно длинной. Доминантный отличительный признак выбрать сложно без дублей.
Для передачи эмоциональной окраски, акцентов, особенностей произношения - подойдёт. Но усложнит распознание на более высоких уровнях, - потребует больше пикселей и площади, но 12 углов уменьшает колличество пикселей до 16. Это большой плюс.
С пикселями кстати в скором времени может и будет покончено. Есть векторные дисплеи.

Название: Звуки и графики
Отправлено: myst от октября 6, 2008, 19:14

Я в ветке про нелинейное письмо выкладывал сегментный индикатор на основе квадрата. В нём как раз реализовано три сегмента на каждую сторону, то есть 12 бит.

Название: Звуки и графики
Отправлено: Тихомиров Ден от октября 6, 2008, 19:38

Да, я общитался. 9 пикселей хватит.

Лингвофорум

Теоретический раздел => Общая лингвистика => Фонетика и фонология => Тема начата: Artemon от августа 6, 2008, 15:02