Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Заметки о глоттохронологии

Автор yurifromspb, февраля 16, 2016, 00:35

0 Пользователи и 1 гость просматривают эту тему.

yurifromspb

Cюда буду бросать всякое по теме.


Несколько вариантов переменной скорости.







вариантскоростьзакон замен
Сводеш[tex]\lambda[/tex][tex]x_0 e^{-\lambda t}[/tex]
2[tex]\lambda t[/tex][tex]x_0 e^{- \frac{\lambda t^2}{2} }[/tex]
3[tex]\lambda x t[/tex][tex]\frac{x_0}{1+\frac {1} {2} \lambda x_0 t^2}[/tex]
4[tex]\lambda {t/\tau \over {1+t/\tau}}[/tex][tex]x_0e^{-\lambda t}(1+t/\tau)^{\lambda \tau}[/tex]
Старостин[tex]\frac {2 \lambda x t}{1+\lambda x t}^*[/tex][tex]x(t)=x_0 e^{- \lambda t^2 x(t)[/tex]
6[tex]\lambda x\frac {t/\tau} {1+t/\tau}[/tex][tex]\frac{x_0}{1+\lambda x_0(t-\tau\ln(1+t/\tau))}[/tex]
*В источниках не зафиксировано, но, если найти производную числа замен по времени, получится так.

Комментарии на http://starling.rinet.ru/Texts/vasilyev.pdf
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Alone Coder

Постулат Сводеша о том, что все слова меняются с одной скоростью, неверен. Грубой коррекцией был список Яхонтова ("более стабильные слова"), но никаких числовых данных он дать не может. Слишком много неизвестных.
Кроме того, глоттохронология датирует событие, которое мы не можем датировать даже непосредственным наблюдением - момент расхождения языков. Что это за момент, как его строго определить?

Bhudh

Цитата: Alone Coder от февраля 16, 2016, 09:57Постулат Сводеша о том, что все слова меняются с одной скоростью, неверен.
Можно включить частотность множителем.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

yurifromspb

Цитата: Alone Coder от февраля 16, 2016, 09:57
Постулат Сводеша о том, что все слова меняются с одной скоростью, неверен. Грубой коррекцией был список Яхонтова ("более стабильные слова"), но никаких числовых данных он дать не может. Слишком много неизвестных.
Кроме того, глоттохронология датирует событие, которое мы не можем датировать даже непосредственным наблюдением - момент расхождения языков. Что это за момент, как его строго определить?
Этот вопрос, как я понимаю, рассматривается. В частности, в другой теме дали ссылку на статью по теме, надо будет посмотреть. Собственно, сама формула Старостина пытается это учитывать (как - другой вопрос), но, в целом, если честно, мне уже становится немного не по себе от мысли, что эти датировки многие воспринимают чересчур серьёзно.
Кстати, насчёт второго вопроса, я тут увидел работу Васильева http://starling.rinet.ru/Texts/vasilyev.pdf, так вот, я её ещё не изучал, но меня позабавил набор данных для калибровки модели. Посмотрите, я прикрепил к сообщению график с этими данными, в статье это таблица 3. И это дело автор фитирует 3я экспонентами. Тремя экспонентами. Мне кажется, вы оцените.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

злой

Entre los individuos, como entre las naciones, el respeto al derecho ajeno es la paz.   - Benito Juárez

yurifromspb

Цитата: злой от февраля 17, 2016, 05:14
Offtop

А релятивистские поправки?
Offtop
Кхм... Это ж вариант 4, там скорость меняется от нуля до некоторого предельного значения.
Вообще, Старостин, очевидно, думал, что у него скорость λxt.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

wandrien

Offtop
Если по Сводешу лексика распадается с равной скоростью, то каковы среднее время жизни слова и период полураспада словаря?

yurifromspb

Offtop
Цитата: wandrien от февраля 17, 2016, 05:31
Offtop
Если по Сводешу лексика распадается с равной скоростью, то каковы среднее время жизни слова и период полураспада словаря?
[tex]e^{-\lambda t}=1/2;<br />-\lambda t = \ln 1/2;<br />t = \frac {\ln 2} {\lambda}[/tex]
[tex]\left \langle t \right \rangle = 1/\lambda[/tex]
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Nevik Xukxo

Скока надо тыщ лет, чтоб ни одного когната не осталось? :what:

yurifromspb

Цитата: Nevik Xukxo от февраля 17, 2016, 08:13
Скока надо тыщ лет, чтоб ни одного когната не осталось? :what:
Как на самом деле - не знаю. И, к тому же это вероятностная величина, но если тупо по формуле, то так:




ВариантВремя, т.л.
Сводеш λ=0.1416.4
Старостин λ=0.0521.5
Это время, на котором средняя доля совпадений между двумя языками равна 0.01
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

yurifromspb

Цитата: Alone Coder от февраля 16, 2016, 09:57
Кроме того, глоттохронология датирует событие, которое мы не можем датировать даже непосредственным наблюдением - момент расхождения языков. Что это за момент, как его строго определить?
Я вам дал ссылку на статью с калибровкой по литературным языкам, но вы спрашивали несколько не о том. Извиняюсь, не очень внимательно прочитал.
Да, вы правы. История стословных списков это не то же, что история языков. Более того, язык вообще не является отдельной сущностью, атомом. Язык это множество идиолектов, каждый из которых конструируется по образцу окружающей речи. История языка это невообразимое множество взаимовлияющих  историй, и чему соответствует в реальности оценка времени дивергенции даже для достоверно родственных языков - нетривиальный вопрос.  Это, кстати, важная мысль. Но, может лингвистика на этот вопрос уже обращала внимание, кто знает?
Из более менее очевидного приходит в голову, что событие разделения, при любом разумном определении, ограничено снизу появлением диалектной особенности, а сверху - полным прекращением контактов Глоттохронологическая оценка, кажется, должна тяготеть к нижней границе.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Alone Coder

Есть и ещё одна проблема.
Как только языки получают письменность, они развиваются уже не так, как в естественной среде обитания. А именно, появляется тенденция к замораживанию, внедрению пласта абстрактных терминов, пуризму в других областях (тоже взаимовлияние языков, но с обратным знаком), исчезновению диалектного разнообразия, ломке структуры из-за смешения в одной "норме" диалектного материала из разных "классиков".
Но языки, не имеющие письменности, мы не можем исследовать в историческом разрезе. Максимум мы можем найти заимствования в других языках, которые всегда ненадёжны - и даже когда надёжны, то фонетически искажены.
Выходит, нет вообще никаких шансов правильно калибровать глоттохронологию, какой бы метод расчётов мы ни выбрали.

Какие задачи решает глоттохронология? Она не годится для доказательства родства языков. Она нужна только для исследования похождений племён, с привязкой к культурам и генам. Но известно, что и языки, и культурные элементы легко заимствуются. Ни горшки, ни гены не "разговаривают". Можно сконструировать красивую гипотезу, но она в любом случае будет бездоказательной.

А ведь есть альтернатива - мы можем построить математическую модель развития языка, исходя из физиологии, и подставить в неё целые словари. Так мы сможем определить вероятность того или иного родства, порядок наложения языковых пластов и даже, возможно, топологию связей с соседями (если вместо словаря языка подставить размеченный массив диалектных данных). Это решило бы те же исторические задачи, но более надёжно. Проблема в том, что такую математическую модель никто не строит и не построит, покуда уровень используемой лингвистами математики остаётся на уровне начальной школы. Тут и обычной институтской программы недостаточно. Кроме того, поскольку это будет динамит под систему авторитетов в лингвистике, лингвистическое сообщество не примет эти результаты.

По другой теме - интересно было бы довести методику Старостина до абсурда: случайным образом переставить семантику слов в базе данных и запустить автоматическое сравнение. Понятно, что Старостин делал публикации только о парах языков, где набралось побольше совпадений. Поэтому случайная перестановка в этих парах не даст результата. Но для других пар языков после такого эксперимента может найтись совпадений не меньше, чем в старостинских парах.

Bhudh

Цитата: Alone Coder от февраля 17, 2016, 15:42мы можем построить математическую модель развития языка, исходя из физиологии, и подставить в неё целые словари
Для этого необходима точная фонологическая запись всех слов. А для языков, данные по которым старше 50 лет, это, м-м-м, маловероятно...
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

yurifromspb

Литературный язык может и без письменности существовать. Письменность сохраняет прошлое, конечно.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

yurifromspb

Прочитал http://starling.rinet.ru/Texts/vasilyev.pdf
При изложении результатов Старостина, авторы никак не вскрывают непонимания им дифференциальной природы предположений типа λ=λt. То ли сами не понимают, то ли не хотят унижать авторитет. В принципе, если бы дело шло об учителе, можно было бы просто представить его формулы как результат чисто эмпирического подбора, и не было бы вопросов. Но это, в общем, не так важно. Важнее, что авторы делают очень смешные аппроксимации по шести точкам. Там слона можно вписать, если захотеть. Всё это очень слабо обосновано. А если убрать реконструкции типа даты распада индоевропейского, то там вообще лучшая аппроксимация - банальная прямая. Но, в принципе, по сравнению со Старостиным это шаг вперёд.
Интересна попытка получить эффект "старения слов" исходя из вида дифура. В общем, это удалось.
Модель там такая: вместо одностадийного распада вводят двустадийный. Сначала слово заменяется одинаково в языках-потомках, потом - независимо. Интересно, что при равенстве констант скорости этих двух стадий, эта модель идентична моей модели 4 при τ=1/λ.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

yurifromspb

График по калибровочным данным данным Старостина и Васильева.

Красная линия - формула Старостина с λ=0.0623 residual sum-of-squares: 2.569
Зеленая - формула Васильева без неизменной части (= моя 4) с λ=0.3687 residual sum-of-squares: 0.03217
Синяя - полная формула Васильева [tex]c + (1-c)e^{-\lambda t}(1+\lambda t)[/tex]
c=0.5369 λ=0.6729 residual sum-of-squares: 0.02648
Видно, что формула Васильева гораздо лучше приближает данные.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

yurifromspb

Я лопух. Не заметил, что обоснование у Васильева построено так, как будто речь идёт о сравнении двух синхронных языков, а калибровка на данных по изменениям отдельных языков (внутри одного языка связанная и независимая части словаря неотличимы, замедление по времени при парном сравнении - следствие потери памяти о прошлом, но не отсутствия симметрии по времени). Я дважды лопух, у Васильева разные данные для калибровки, но данные по совр. языкам я не заметил (там табличка была на боку, я её пропустил).
Но замедление на малых временах, вроде как налицо. Ничего не понимаю. Нет симметрии по времени? Глоттохронология отменяется?
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

yurifromspb

На подумать: чем больше система, тем медленнее в ней идут процессы.  :scl:
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Mihailov

Цитата: Alone Coder от февраля 16, 2016, 09:57
Кроме того, глоттохронология датирует событие, которое мы не можем датировать даже непосредственным наблюдением - момент расхождения языков. Что это за момент, как его строго определить?
Формально проблемы нет. Можно определить как средний момент между последней синхронной заменой в стословнике и первой асинхронной.

Alone Coder

Так нельзя. В одном языке есть диалекты, которые не совпадают по стословнику.

Tibaren

Цитата: Alone Coder от февраля 23, 2016, 13:20
Так нельзя. В одном языке есть диалекты, которые не совпадают по стословнику.
Offtop
Кодер, если не трудно, продолжите вашу идею. Не совсем понятно, что вы имели в виду.
Zikiro beltza ona dut bañan obea buztan zuria

Alone Coder

Стословник фиксирует немаркированные слова, выражающие данные понятия. Маркированность в каждом диалекте своя. Например, для русского живот/пузо, кожа/шкура.

Tibaren

Цитата: Alone Coder от февраля 23, 2016, 19:49
Стословник фиксирует немаркированные слова, выражающие данные понятия. Маркированность в каждом диалекте своя. Например, для русского живот/пузо, кожа/шкура.
Да это понятно, имеется в виду ваше
ЦитироватьТак нельзя
Zikiro beltza ona dut bañan obea buztan zuria

Alone Coder

В языке мы не можем определить момент, когда произошла замена. Если же взять не язык, а конкретный диалект, то может получиться ситуация, когда уже заменённое слово возвращается назад, причём в синхронно регулярном виде.

yurifromspb

А что читатели темы думают о калибровочных данных по литературным языкам? Ведь должна же быть экспонента? Аргументация Васильева за "старение слов", как мы увидели, содержит грубую ошибку (верна для пары языков, но не для одного), а у Старостина аргументации, считай, что и нет. Ни у кого нет мыслей, почему так? Может быть дело в росте населения? Или в росте грамотности? Или причина в "глобализации"? По любому, здесь есть какой-то фактор, монотонно меняющийся во времени, и убивающий саму идею глоттохронологии. Или есть другие варианты?
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр