Математические методы при определении близости (?) лингвистических явлений?

Автор Lassie, июля 26, 2011, 21:49

0 Пользователи и 1 гость просматривают эту тему.

Марбол

Например, а и б - два признака примерно равной информативности; В и Г - два слова, у В есть только признак а, у Г - только б. Предположим, вообще признак а охватывает в N раз больше слов, чем б. Тогда, чтобы по набору (а, б) между этими словами расстояние было равно 0, нужно, чтобы коэффициент достоверности по а для В был тоже в N раз больше, чем коэффициент достоверности по б для Г. То есть, признак а должен быть важнее для В в N раз, чем б для Г. Например, б - вообще периферийный для Г, так что доля употреблений Г с б сравнительно ничтожна, по отношению ко всем остальным употреблениям Г. Напротив, а для В - доминирующий признак, а число остальных употреблений В ничтожно мало. Значит, чтобы между В и Г было нулевое расстояние, нужно, чтобы всех слов с признаком б должно быть ничтожно мало, по сравнению со словами с признаком а. - При том, что количество информации у признаков равное. По крайней мере качественно, эта картина не подтверждается логарифмической формулой для количества информации признака: у а информативность оказывается порядочно выше, чем у б, поскольку J(б) = log(μ(Γа+б)!)-log{(μ(Γа+б)-μ(Γб))!k(б)} ~ log(μ(Γа+б)!)-log(μ(Γа+б)!) ~ 0

Марбол

Моя предыдущая выкладка показывает только, что в рамках статьи, при указанных условиях, два признака не могут нести одинаковое количество информации.

Надеюсь, Lassie как-нибудь выскажется по моим вопросам.
Между прочим, Lassie, чья это статья?

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр