Математические методы при определении близости (?) лингвистических явлений?

Марбол · июля 30, 2011, 21:24

Например, а и б - два признака примерно равной информативности; В и Г - два слова, у В есть только признак а, у Г - только б. Предположим, вообще признак а охватывает в N раз больше слов, чем б. Тогда, чтобы по набору (а, б) между этими словами расстояние было равно 0, нужно, чтобы коэффициент достоверности по а для В был тоже в N раз больше, чем коэффициент достоверности по б для Г. То есть, признак а должен быть важнее для В в N раз, чем б для Г. Например, б - вообще периферийный для Г, так что доля употреблений Г с б сравнительно ничтожна, по отношению ко всем остальным употреблениям Г. Напротив, а для В - доминирующий признак, а число остальных употреблений В ничтожно мало. Значит, чтобы между В и Г было нулевое расстояние, нужно, чтобы всех слов с признаком б должно быть ничтожно мало, по сравнению со словами с признаком а. - При том, что количество информации у признаков равное. По крайней мере качественно, эта картина не подтверждается логарифмической формулой для количества информации признака: у а информативность оказывается порядочно выше, чем у б, поскольку J(б) = log(μ(Γ_а+б)!)-log{(μ(Γ_а+б)-μ(Γ_б))!k(б)} ~ log(μ(Γ_а+б)!)-log(μ(Γ_а+б)!) ~ 0

Марбол · июля 31, 2011, 23:26

Моя предыдущая выкладка показывает только, что в рамках статьи, при указанных условиях, два признака не могут нести одинаковое количество информации.

Надеюсь, Lassie как-нибудь выскажется по моим вопросам.
Между прочим, Lassie, чья это статья?

Лингвофорум

Математические методы при определении близости (?) лингвистических явлений?

Марбол

Марбол

Быстрый ответ