Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.
Ограничения: максимум вложений в сообщении — 3 (3 осталось), максимальный размер всех файлов — 300 КБ, максимальный размер одного файла — 100 КБ
Снимите пометку с вложений, которые необходимо удалить
Перетащите файлы сюда или используйте кнопку для добавления файлов
Вложения и другие параметры
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр

Сообщения в этой теме

Автор winter cat
 - сентября 16, 2012, 22:41
Цитата: Darkstar от апреля  9, 2012, 12:33
Венгерский -- это "креол", я давно говорил...
Но у ASJP он нормально позиционирован в угорские.
Аргументируйте, пожалуйста...
Креол из чего?
Автор GaLL
 - сентября 16, 2012, 01:08
Просматривая статьи по глоттохронологии в сборнике "Новое в лингвистике" №1, среди которых и статья М. Сводеша, на которую часто ссылаются, я не нашёл применение методов мат. статистики, т. е. , например, нахождения доверительного интервала оценки времени распада для определённой надёжности. Формула радиоактивного распада берётся для лексики без учёта (во всяком случае, такое складывается впечатление) того, что рассматриваемое радиоактивное вещество обычно содержит на порядки больше атомов, чем списки лексики - слов, и точность формулы в первом случае - следствие ЗБЧ (закона больших чисел). Неужели такой подход типичен для лексикостатистики?
Автор GaLL
 - апреля 9, 2012, 18:29
Цитата: Devorator linguarum от апреля  9, 2012, 16:15
Про неодинаковую вероятность выпадения разных слов из списка у самого Старостина несколько статей есть, где даже на материале большого количества языковых семей эмпирически подсчитывается, для какого слова какая вероятность.
Одну статью об этом я видел ("Определение устойчивости базисной лексики"). Но там не говорится применении этих индексов стабильности, и не обосновывается, почему они должны высчитываться именно таким способом.
Автор Darkstar
 - апреля 9, 2012, 16:31
Кстати, в статье по генезу семитских Andrew Kitchen, Christopher Ehret at al (04/2009) погрешности учитываются и для всех глоттохр значений дана дельта. Только толку от них. Дерево оно же либо кривое, либо некривое...
Автор Devorator linguarum
 - апреля 9, 2012, 16:15
Цитата: GaLL от апреля  8, 2012, 23:50
К тому же такой подход оперирует со словами базового списка как с одинаково распределёнными случайными величинами, хотя на самом деле из стабильность различна: например, в ИЕ языках местоимение "я" обнаруживает куда большую стабильность, нежели "хвост", "вошь", "луна" и т. п. Кроме того, фонетический облик слова и характер перестроек при изменении языка также влияет на стабильность: если данное слово совпадёт с другим из-за омонимии, велика вероятность его замены другим.
В общем, лексикостатистика в том виде, в котором она существует, оперирует словами как сферическими конями в вакууме.
Таки вы серьезно отстали от жизни, GaLL. Отмеченные погрешности глоттохронологи пркрасно осознают (и осознали едва ли не сразу же, как только Сводеш предложил свой метод... не без помощи "доброжелательных" критиков, разумеется :green:). Про неодинаковую вероятность выпадения разных слов из списка у самого Старостина несколько статей есть, где даже на материале большого количества языковых семей эмпирически подсчитывается, для какого слова какая вероятность.
Автор snn
 - апреля 9, 2012, 13:08
Цитата: Nevik Xukxo от апреля  9, 2012, 13:00
Погрешности вообще нарастают со временем или нет системы?
Боюсь, что системы тут нет.
Автор Nevik Xukxo
 - апреля 9, 2012, 13:00
Погрешности вообще нарастают со временем или нет системы?
Автор Darkstar
 - апреля 9, 2012, 12:25
Gall,
Ваши замечания касательно погрешностей абсолютно правильны! Я и сам не считаю погрешности, чтобы не отягащать мат. аппаратом, просто держу их в уме (т.е. отбрасываю сомнительные места "на глазок".)

Все остальное -- это банальности.

С точки зрения математики меня больше интересуют то, что называют Bayesian approach (как обычно в математике название не имеет ни какого отношения к содержанию), где речь идет о построении филогений с элементами статистики. В принципе, сейчас это загнано уже в программные алгоритмы, и вероятно, люди которые этим пользуются сами не понимают, как это работает. (Еще у Старостина деревья строились автоматически, на каком алгоритме тоже не очень ясно. ) Для австронезийских в частности сейчас это активно развивают...
Автор snn
 - апреля 9, 2012, 10:42
Цитата: autolyk от апреля  9, 2012, 07:20

По ссылке не хватает самого важного:
ЦитироватьFirst, we develop a general method for visualizing the distances among categories (such as languages) on the basis of any set of features (such as structural traits) they could share. Second, we apply this method to an existing set of features of northern Eurasian languages, collected by P. Klesment, A. Kunnap, S.-E. Soosaar, R. Taagepera (2003).

A general method for visualizing inter-category distances (Section omitted)

These 46 features are listed below, indicating their occurrence in the subgroups of U, A, and PS, as well as in Germanic [GER], Slavic [SLA], Baltic [BAL].  (Section omitted)


Сложилось впечатление, что авторы взяли некий набор фонетических, морфологических и грамматических особенностей и посчитали коэффициенты по ф-ле:
[d.sub.ij] = 1 - [a.sub.ij]/([a.sub.i][a.sub.j])0.5, где [a.sub.ij] кол-во общих особенностей (из списка) между подгруппами, а [a.sub.i] кол-во особенностей в подгруппе.
Не имея возможности ознакомится с методом отбора характерных признаков, служивших для расчёта коэффициентов, сказать что-либо по существу затруднительно. Но результаты, мягко говоря, настораживают.
Вот тут подробнее:
http://www.thefreelibrary.com/Distances among Uralic and other Northern Eurasian languages/[TEXT...-a0200671842
ЦитироватьСложилось впечатление
У меня сложилось впечатление, что авторы попробовали сделать нечто подобное тому, как генетики в разных компонентах вычисляют близость между разными популяциями. Результаты подчас тоже бывают неожиданными. :)
Цитировать[d.sub.ij] = 1 - [a.sub.ij]/([a.sub.i][a.sub.j])0.5, где [a.sub.ij]
Да, именно так. :)
Автор GaLL
 - апреля 9, 2012, 10:10
Не понял вопроса. Где-то есть основание говорить о бинарном расветвлении, где-то нет.
И вообще, я хотел напомнить, что этот метод получает лишь статистически наиболее вероятное дерево, и близкие ему деревья будут почти такими же вероятными (если конечно метод верен). Причём метод опирается лишь на список Сводеша, превращая слова в сферических коней, используя некоторые представления о том, каких слова в данных языках родственны (которые могут быть ещё сто раз пересмотрены, не говоря уж о том, что родство этих семей требует доказательства). Кроме того, равномерность процесса изменения базовой лексики не доказана.