Мне как математику было бы очень интересно узнать следующее.
Допустим, есть у нас какая-то характеристика звука. Ну, там, скажем, количества шума, которое участвует в формировании звука. По этой характеристике звуки можно расположить по некой шкале. Допустим, есть другая характеристика, и звуки, опять же, можно расположить и по этой шкале. И т.п.
Сведя все эти шкалы в один график, получаем n-мерное пространство, где каждому звуку соответствуют его точные координаты. Если кто-то понял, о чём я, то хотелось бы узнать, есть ли какие-нибудь исследования или наработки на эту тему.
По-моему, полученные в рез-те подобного исследования данные имели бы большую погрешность. Здесь очень много зависит от тембра голоса произносящего звуки человека.
ЦитироватьСведя все эти шкалы в один график, получаем n-мерное пространство, где каждому звуку соответствуют его точные координаты
А как Вы думаете, как свести в одну все-все шкалы, если на сегодняшний день звук речи акустически возможно охарактеризовать более чем по 10 признакам? ::)
Цитата: "Тася" от
А как Вы думаете, как свести в одну все-все шкалы, если на сегодняшний день звук речи акустически возможно охарактеризовать более чем по 10 признакам?
Значит, будем иметь координаты в многомерном пространстве с размерностью 10 8-)
ЦитироватьЗначит, будем иметь координаты в многомерном пространстве с размерностью 10
Понятно. :) А в практических целях это удобно?
Как бы вам так объяснить практические цели, чтобы вы не сочли меня сумасшедшим...
Дело в том, что я разрабатываю конланг на базе латыни. Фонетика у меня немного не такая, как в латыни, а это значит, что иногда два латинских слова (например, одно - с долгим гласным, другое - с кратким) у меня будут сливаться в одно.
Имея такие вот координаты, можно будет в аналогичных ситуациях заменять некоторые звуки ближайшими к ним. Как узнать, какой звук ближе к данному? Для пространства 10 - суммируем десять разностей соответствующих координат и извлекаем корень десятой степени (вроде бы ничего не попутал).
Понимаю, что в большинстве слов можно и на глаз прикинуть, как его лучше изменить, но когда таких слов много, то лучше бы делать это программно. :)
А что, если взять таблицу гласных в IPA и сделать на её основе граф? Ближе звучание, короче путь на графе. Или рёбрам назначить веса.
Вот, взгляните:
(http://content.files.mail.ru/BDR7DH/d2e30338ce4cd5b61046ad3bca1c6653)
Чем не граф? :)
Куда взглянуть-то? :)
И с согласными тоже что-то выдумать бы.
Цитата: "Artemon" от
Куда взглянуть-то?
Это я не через то место картинку выложил. :)
Теперь должно быть видно:
(http://dc84.4shared.com/download/60925431/a6a7b2e1/vowels.PNG?tsid=20080829-083027-f6b07b5a&forceAttachmentDownload=true)
Эээ... всё равно ничего не вижу.
Картинка должна быть? Может, проще картинку где-то в другое место, а сюда ссылку?
:???
Эдит: ссылку можно увидеть через цитату. Забавно.
В итоге на этой картинке каждый звук характеризуется двумя параметрами. Можно теоретически условиться таким образом: установить условную шкалу для заднеязычности (0 для переднеязычных, 4 для заднеязычных) и открытости (0 для закрытых, 6 для открытых) гласных. Т.е., например, звук [е] будет иметь координаты (1; 2) - если я правильно разобрался в графике.
А нет ли аналогичных двумерных графиков для других характеристик? Выше ведь писали, что там их больше десяти. Если есть, то аналогичным образом можно представить и их, и, по сути, задача будет решена. ::)
Про упомянутые десять характеристик я ничего не знаю.
Просто, мне подумалось: чем моделировать сами звуки, можно взять за основу IPA. Это, наверное, более грубая модель, но может её достаточно?
В википедии есть статья (http://en.wikipedia.org/wiki/IPA) про IPA. Злосчастная таблица гласных, которую я пытался Вам показать, оттуда. Там же есть таблица согласных.
Ага, спасибо. Похоже, всё-таки удастся свести в систему.
Более того, эту систему можно будет использовать при транслитерации названий собственных из языков с другими звуками... Неплохо, неплохо...
Результаты предварительного колупания меня удивили. В приятную сторону.
Любой гласный, по сути, можно задать тремя координатами: назальный или не, степень открытости, расположение в ряду.
Любой согласный - тоже тремя: способ образования, место образования, положение глоттиса.
Для более изощрённых (и, пожалуй, редких) звуков количество координат будет расти согласно их патализированности, щёлканью и т.п. Из чего следует, что для если такая координата для того или иного звука не указана, то её значение равно нулю.
Всего три координаты - это очень приятно и означает, что такой граф запросто можно смоделировать на компьютере. На двумерной бумаге тоже можно, но тогда придётся переводить в дополнительную координату назальность для гласных и глоттис для согласных.
По сути, такие двумерные схемы - вот же они.
http://ru.wikipedia.org/wiki/%D0%93%D0%BB%D0%B0%D1%81%D0%BD%D1%8B%D0%B5 (http://ru.wikipedia.org/wiki/%D0%93%D0%BB%D0%B0%D1%81%D0%BD%D1%8B%D0%B5)
http://ru.wikipedia.org/wiki/%D0%A1%D0%BE%D0%B3%D0%BB%D0%B0%D1%81%D0%BD%D1%8B%D0%B5 (http://ru.wikipedia.org/wiki/%D0%A1%D0%BE%D0%B3%D0%BB%D0%B0%D1%81%D0%BD%D1%8B%D0%B5)
А то уж напугали выше более чем десятью. :)
Связка тем: "нелинейное письмо" http://lingvoforum.net/index.php/topic,10757.msg172870.html#msg172870
Artemon, Вы планируете сделать что-то вроде компаратора транскрипций слов?
Несколько лет назад у меня была подобная затея. Основная трудность, с которой я столкнулся,— это вычисление транскрипции. Я делал для английского, а из-за его орфографии ничего лучше таблицы преобразования выдумать не смог. Слов в английском много, таблица обещала быть огромной, готовой таблицы я не нашёл, потрошить Lingvo было неохота — так и забросил.
Ну, если получится впихнуть латинский словарь в соответствующую программу (см. выше), большинство слов она прогенерит без меня. Останусь в роли научного руководителя. :)
Цитата: "Artemon" от
Ну, если получится впихнуть латинский словарь в соответствующую программу (см. выше), большинство слов она прогенерит без меня. Останусь в роли научного руководителя.
У Вас латинский словарь с транскрипциями или в латинском прозрачная орфография?
Я не в курсе. Простите что влезаю в латинские языки
По мне всякая графика являеться условным элементом - кодом, как и звучание. Разница тоже условна, поймать условность можно только через условное обобщение и примитивизацию самых простых (принятых за приметив) элементов кода. Мы же за смыслом гонимся.
Во всех произношениях их примерно одно количество плюс минус погрешности эмоциональных субьектов и ситуаций. Их можно учитывать в производных, - потери смысла не столь критически, особенно в системе требующей унификации. Степень комуникации зависит и от степени унификации кода.
С орфографией разобраться станет проще, она более производный элемент.
Цитата: myst от сентября 3, 2008, 19:57
Цитата: "Artemon" от
Ну, если получится впихнуть латинский словарь в соответствующую программу (см. выше), большинство слов она прогенерит без меня. Останусь в роли научного руководителя.
У Вас латинский словарь с транскрипциями или в латинском прозрачная орфография?
Ну, правила чтения в латинском не самые сложные. Думаю, программа легко обучится и разберётся.
Надеюсь. :)
Цитата: Тихомиров Ден от сентября 3, 2008, 23:25
По мне всякая графика являеться условным элементом - кодом, как и звучание. Разница тоже условна, поймать условность можно только через условное обобщение и примитивизацию самых простых (принятых за приметив) элементов кода. Мы же за смыслом гонимся.
Во всех произношениях их примерно одно количество плюс минус погрешности эмоциональных субьектов и ситуаций. Их можно учитывать в производных, - потери смысла не столь критически, особенно в системе требующей унификации. Степень комуникации зависит и от степени унификации кода.
С орфографией разобраться станет проще, она более производный элемент.
Правильно. Мы уже установили, что все согласные звуки можно свести к трём основным параметрам, а гласные - к двум. Из этого и стоит исходить, выдумывая под них знаки.
Сначало было слово из первого звука, и звук был ..... потом была половина первого дня (пора обедать)
расположим звуки по циферблату. Очень чувственно и индивидуально.
А латинский как хочю - так и читаю, всё равно пойму по своему.
Цитата: "Artemon" от
Думаю, программа легко обучится и разберётся.
Ваша программа самообучаема? Это очень интересно.
Цитата: Artemon от августа 30, 2008, 00:33
Любой гласный, по сути, можно задать тремя координатами: назальный или не, степень открытости, расположение в ряду.
Извините, может зря пишу, но раз у гласных взято различение назальности, почему же забыли об огублении? В той же схеме в Википедии огубление гласных различено, а вот назальности имхо я не видел...
Здравствуйте!
Артемон, если не касаться назальных звуков, то остаются два признака. Положение в ряду - это, может быть, некоторым образом определённое расстояние между фокусом артикуляции и плоскостью раствора губ? Тогда степень открытости - это, по сути, телесный угол, занимаемый сечением раствора губ относительно фокуса? или это пропорция сечений раствора и фокуса?
Цитата: arseniiv от сентября 4, 2008, 17:53
Цитата: Artemon от августа 30, 2008, 00:33
Любой гласный, по сути, можно задать тремя координатами: назальный или не, степень открытости, расположение в ряду.
Извините, может зря пишу, но раз у гласных взято различение назальности, почему же забыли об огублении? В той же схеме в Википедии огубление гласных различено, а вот назальности имхо я не видел...
Точно. Упустил.
Тогда немного переформулирую.
Любой гласный, по сути, можно задать двумя основными (степень открытости, расположение в ряду) и – при надобности – рядом дополнительных координат (назальность, огубленность, эризация, тон...).
Любой согласный – двумя основными (способ образования, место образования) и – при надобности – также рядом дополнительных (положение глоттиса, палатализация, щёлканье...).
Пожалуй, удобнее всего при таком раскладе будет всё же по умолчанию пользоваться двумерными координатами, подключая третьи и последующие лишь при надобности. При этом звуки, имеющие различия исключительно по третьей и т.д. координатам, стоит записывать одинаковыми значками, но снабжать их звёздочками, апострофами, умляутами и прочими условными обозначениями дополнительных характеристик.
Цитата: Марбол от сентября 4, 2008, 18:14
Здравствуйте!
Артемон, если не касаться назальных звуков, то остаются два признака. Положение в ряду - это, может быть, некоторым образом определённое расстояние между фокусом артикуляции и плоскостью раствора губ? Тогда степень открытости - это, по сути, телесный угол, занимаемый сечением раствора губ относительно фокуса? или это пропорция сечений раствора и фокуса?
Хм, хотите даже так выразить? Скажем, через синус данного угла?
Мысль весьма интересная. Весьма. К сожалению, не обладаю достаточным уровнем знаний, чтобы подтвердить правильность вашей теории.
Вот такое нашёл. По-моему, это даже интереснее, чем в Вики.
Простите, переводить и править банально нет сил, время позднее.
...американські вчені Роман Якобсон, Гуннар Фант, Морріс Халле розробили універсальну систему диференційних ознак, побудовану на бінарному принципі, внаслідок чого всі фонемні опозиції зводяться до привативних. За основу загальної класифікації фонем вони взяли не артикуляційні ознаки (на їхню думку, артикуляційні особливості звуків у мовах світу найрізноманітніші й дуже тонкі, через що незручні для типологічної класифікації звуків), а акустичні, які можуть бути визначені за допомогою спеціальної електроакустичної апаратури. Вони виділили 12 пар диференційних ознак, які утворюють двочленні протиставлення (9 ознак звучності і 3 ознаки тону): 1) вокальність — невокальність; 2) консонантність — неконсонантність; 3) компактність (наявність у спектрі центральної ділянки більшої концентрації енергії) — дифузність (менша концентрація енергії в центральній ділянці спектра і поширення звукової енергії на його периферію); 4) напруженість — ненапруженість; 5) дзвінкість — глухість; 6) назальність (носовий характер) — неназальність (ротовий характер); 7) перервність — неперервність; 8) різкість (висока інтенсифікація шумів) — нерізкість (невисока інтенсифікація шумів); 9) глоталізованість — неглоталізованість; 10) низька тональність — висока тональність; 11) бемольність (ослаблення верхніх частотних складників унаслідок участі при творенні звука губ) — небемольність; 12) дієзність (посилення верхніх частотних показників унаслідок підняття спинки язика до піднебіння; дієзні — це м'які приголосні) — недієзність. За допомогою цих диференційних ознак можна описати систему фонем будь-якої мови. Звичайно, мо¬ви використовують не всі ознаки (із наведених 12 пар ознак можна утворити 4096 різних фонем). Для опису фонем української мови достатньо 9 ознак: вокальність, консонантність, дифузність, низькість, бемольність, дієзність, перервність, різкість, дзвінкість (див. табл.).
а і У б к м' к Ч ш.
вокальність + + + + +
консонантність — — — + + + + + +
дифузність — + + + — + + + —
низькість + — + + + + — — —
бемольність — — + — — — — — —
дієзність — — — — — + — — —
перервність — — — + + + + + —
різкість + —
дзвінкість + + + + — + + — —
Эх, кривовато вышло, жаль. :(
P.S. Дэн, как вам, кстати, идея базировать графическое представление звука именно на этих 12-ти признаках? Самое банальное: сделать 12 ключей и в зависимости от наличия той или иной характеристики рисовать данный ключ или нет. Вот, например, 4 вертикальных, 4 горизонтальных и 4 диагональных ключа в пиктограммке символа, который теоретически имел бы все признаки (пример от балды, сразу говорю).
-- --
|\ / |
\ /
/ \
|/ \|
-- --
Ну или по-другому как-нибудь. Главное - что характеристик именно 12, и они бинарные.
Спасибо. Обдумаю. Пока на вскидку:
Как можно использовать этот принцип для выбора общего углового значения звука? Среднее арифметическое из суммы углов признаков вроде не годиться, - будут дубли?
Степень выраженности признака не учтена, хотя можно длинной. Доминантный отличительный признак выбрать сложно без дублей.
Для передачи эмоциональной окраски, акцентов, особенностей произношения - подойдёт. Но усложнит распознание на более высоких уровнях, - потребует больше пикселей и площади, но 12 углов уменьшает колличество пикселей до 16. Это большой плюс.
С пикселями кстати в скором времени может и будет покончено. Есть векторные дисплеи.
Я в ветке про нелинейное письмо выкладывал сегментный индикатор на основе квадрата. В нём как раз реализовано три сегмента на каждую сторону, то есть 12 бит.
Да, я общитался. 9 пикселей хватит.