Автор Тема: Заметки о глоттохронологии  (Прочитано 10740 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн yurifromspb

  • Blogger
  • *
  • Сообщений: 2062
Cюда буду бросать всякое по теме.


Несколько вариантов переменной скорости.
вариантскоростьзакон замен
Сводеш[tex]\lambda[/tex][tex]x_0 e^{-\lambda t}[/tex]
2[tex]\lambda t[/tex][tex]x_0 e^{- \frac{\lambda t^2}{2} }[/tex]
3[tex]\lambda x t[/tex][tex]\frac{x_0}{1+\frac {1} {2} \lambda x_0 t^2}[/tex]
4[tex]\lambda {t/\tau \over {1+t/\tau}}[/tex][tex]x_0e^{-\lambda t}(1+t/\tau)^{\lambda \tau}[/tex]
Старостин[tex]\frac {2 \lambda x t}{1+\lambda x t}^*[/tex][tex]x(t)=x_0 e^{- \lambda t^2 x(t)[/tex]
6[tex]\lambda x\frac {t/\tau} {1+t/\tau}[/tex][tex]\frac{x_0}{1+\lambda x_0(t-\tau\ln(1+t/\tau))}[/tex]
*В источниках не зафиксировано, но, если найти производную числа замен по времени, получится так.

Комментарии на http://starling.rinet.ru/Texts/vasilyev.pdf
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Оффлайн Alone Coder

  • Вне лингвистики
  • Сообщений: 23159
  • Пол: Мужской
    • Орфовики
Постулат Сводеша о том, что все слова меняются с одной скоростью, неверен. Грубой коррекцией был список Яхонтова ("более стабильные слова"), но никаких числовых данных он дать не может. Слишком много неизвестных.
Кроме того, глоттохронология датирует событие, которое мы не можем датировать даже непосредственным наблюдением - момент расхождения языков. Что это за момент, как его строго определить?

Оффлайн Bhudh

  • Сообщений: 64361
  • Пол: Мужской
  • aka 蝎
    • Сайты по языкознанию
Постулат Сводеша о том, что все слова меняются с одной скоростью, неверен.
Можно включить частотность множителем.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Оффлайн yurifromspb

  • Blogger
  • *
  • Сообщений: 2062
Постулат Сводеша о том, что все слова меняются с одной скоростью, неверен. Грубой коррекцией был список Яхонтова ("более стабильные слова"), но никаких числовых данных он дать не может. Слишком много неизвестных.
Кроме того, глоттохронология датирует событие, которое мы не можем датировать даже непосредственным наблюдением - момент расхождения языков. Что это за момент, как его строго определить?
Этот вопрос, как я понимаю, рассматривается. В частности, в другой теме дали ссылку на статью по теме, надо будет посмотреть. Собственно, сама формула Старостина пытается это учитывать (как - другой вопрос), но, в целом, если честно, мне уже становится немного не по себе от мысли, что эти датировки многие воспринимают чересчур серьёзно.
Кстати, насчёт второго вопроса, я тут увидел работу Васильева http://starling.rinet.ru/Texts/vasilyev.pdf, так вот, я её ещё не изучал, но меня позабавил набор данных для калибровки модели. Посмотрите, я прикрепил к сообщению график с этими данными, в статье это таблица 3. И это дело автор фитирует 3я экспонентами. Тремя экспонентами. Мне кажется, вы оцените.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Оффлайн злой

  • Сообщений: 15784
  • Пол: Мужской
  • це якась маячня
Offtop
Старостин[tex]\frac {2 \lambda x t}{1+\lambda x t}^*[/tex][tex]x(t)=x_0 e^{- \lambda t^2 x(t)[/tex]

А релятивистские поправки?
Молчу, молчу

Оффлайн yurifromspb

  • Blogger
  • *
  • Сообщений: 2062
Offtop
А релятивистские поправки?
Offtop
Кхм... Это ж вариант 4, там скорость меняется от нуля до некоторого предельного значения.
Вообще, Старостин, очевидно, думал, что у него скорость λxt.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Оффлайн wandrien

  • Сообщений: 12853
  • Ты должен быть сильным, иначе зачем тебе быть.
Offtop
Если по Сводешу лексика распадается с равной скоростью, то каковы среднее время жизни слова и период полураспада словаря?

Оффлайн yurifromspb

  • Blogger
  • *
  • Сообщений: 2062
Offtop
Offtop
Если по Сводешу лексика распадается с равной скоростью, то каковы среднее время жизни слова и период полураспада словаря?
[tex]e^{-\lambda t}=1/2; -\lambda t = \ln 1/2; t = \frac {\ln 2} {\lambda}[/tex]
[tex]\left \langle t \right \rangle = 1/\lambda[/tex]
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Оффлайн Nevik Xukxo

  • Сообщений: 50395
  • Пол: Мужской
Скока надо тыщ лет, чтоб ни одного когната не осталось? :what:

Оффлайн yurifromspb

  • Blogger
  • *
  • Сообщений: 2062
Скока надо тыщ лет, чтоб ни одного когната не осталось? :what:
Как на самом деле - не знаю. И, к тому же это вероятностная величина, но если тупо по формуле, то так:
ВариантВремя, т.л.
Сводеш λ=0.1416.4
Старостин λ=0.0521.5
Это время, на котором средняя доля совпадений между двумя языками равна 0.01
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Кроме того, глоттохронология датирует событие, которое мы не можем датировать даже непосредственным наблюдением - момент расхождения языков. Что это за момент, как его строго определить?
Я вам дал ссылку на статью с калибровкой по литературным языкам, но вы спрашивали несколько не о том. Извиняюсь, не очень внимательно прочитал.
Да, вы правы. История стословных списков это не то же, что история языков. Более того, язык вообще не является отдельной сущностью, атомом. Язык это множество идиолектов, каждый из которых конструируется по образцу окружающей речи. История языка это невообразимое множество взаимовлияющих  историй, и чему соответствует в реальности оценка времени дивергенции даже для достоверно родственных языков - нетривиальный вопрос.  Это, кстати, важная мысль. Но, может лингвистика на этот вопрос уже обращала внимание, кто знает?
Из более менее очевидного приходит в голову, что событие разделения, при любом разумном определении, ограничено снизу появлением диалектной особенности, а сверху - полным прекращением контактов Глоттохронологическая оценка, кажется, должна тяготеть к нижней границе.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Оффлайн Alone Coder

  • Вне лингвистики
  • Сообщений: 23159
  • Пол: Мужской
    • Орфовики
Есть и ещё одна проблема.
Как только языки получают письменность, они развиваются уже не так, как в естественной среде обитания. А именно, появляется тенденция к замораживанию, внедрению пласта абстрактных терминов, пуризму в других областях (тоже взаимовлияние языков, но с обратным знаком), исчезновению диалектного разнообразия, ломке структуры из-за смешения в одной "норме" диалектного материала из разных "классиков".
Но языки, не имеющие письменности, мы не можем исследовать в историческом разрезе. Максимум мы можем найти заимствования в других языках, которые всегда ненадёжны - и даже когда надёжны, то фонетически искажены.
Выходит, нет вообще никаких шансов правильно калибровать глоттохронологию, какой бы метод расчётов мы ни выбрали.

Какие задачи решает глоттохронология? Она не годится для доказательства родства языков. Она нужна только для исследования похождений племён, с привязкой к культурам и генам. Но известно, что и языки, и культурные элементы легко заимствуются. Ни горшки, ни гены не "разговаривают". Можно сконструировать красивую гипотезу, но она в любом случае будет бездоказательной.

А ведь есть альтернатива - мы можем построить математическую модель развития языка, исходя из физиологии, и подставить в неё целые словари. Так мы сможем определить вероятность того или иного родства, порядок наложения языковых пластов и даже, возможно, топологию связей с соседями (если вместо словаря языка подставить размеченный массив диалектных данных). Это решило бы те же исторические задачи, но более надёжно. Проблема в том, что такую математическую модель никто не строит и не построит, покуда уровень используемой лингвистами математики остаётся на уровне начальной школы. Тут и обычной институтской программы недостаточно. Кроме того, поскольку это будет динамит под систему авторитетов в лингвистике, лингвистическое сообщество не примет эти результаты.

По другой теме - интересно было бы довести методику Старостина до абсурда: случайным образом переставить семантику слов в базе данных и запустить автоматическое сравнение. Понятно, что Старостин делал публикации только о парах языков, где набралось побольше совпадений. Поэтому случайная перестановка в этих парах не даст результата. Но для других пар языков после такого эксперимента может найтись совпадений не меньше, чем в старостинских парах.

Оффлайн Bhudh

  • Сообщений: 64361
  • Пол: Мужской
  • aka 蝎
    • Сайты по языкознанию
мы можем построить математическую модель развития языка, исходя из физиологии, и подставить в неё целые словари
Для этого необходима точная фонологическая запись всех слов. А для языков, данные по которым старше 50 лет, это, м-м-м, маловероятно…
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Оффлайн yurifromspb

  • Blogger
  • *
  • Сообщений: 2062
Литературный язык может и без письменности существовать. Письменность сохраняет прошлое, конечно.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Прочитал http://starling.rinet.ru/Texts/vasilyev.pdf
При изложении результатов Старостина, авторы никак не вскрывают непонимания им дифференциальной природы предположений типа λ=λt. То ли сами не понимают, то ли не хотят унижать авторитет. В принципе, если бы дело шло об учителе, можно было бы просто представить его формулы как результат чисто эмпирического подбора, и не было бы вопросов. Но это, в общем, не так важно. Важнее, что авторы делают очень смешные аппроксимации по шести точкам. Там слона можно вписать, если захотеть. Всё это очень слабо обосновано. А если убрать реконструкции типа даты распада индоевропейского, то там вообще лучшая аппроксимация - банальная прямая. Но, в принципе, по сравнению со Старостиным это шаг вперёд.
Интересна попытка получить эффект "старения слов" исходя из вида дифура. В общем, это удалось.
Модель там такая: вместо одностадийного распада вводят двустадийный. Сначала слово заменяется одинаково в языках-потомках, потом - независимо. Интересно, что при равенстве констант скорости этих двух стадий, эта модель идентична моей модели 4 при τ=1/λ.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

График по калибровочным данным данным Старостина и Васильева.

Красная линия - формула Старостина с λ=0.0623 residual sum-of-squares: 2.569
Зеленая - формула Васильева без неизменной части (= моя 4) с λ=0.3687 residual sum-of-squares: 0.03217
Синяя - полная формула Васильева [tex]c + (1-c)e^{-\lambda t}(1+\lambda t)[/tex]
c=0.5369 λ=0.6729 residual sum-of-squares: 0.02648
Видно, что формула Васильева гораздо лучше приближает данные.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Я лопух. Не заметил, что обоснование у Васильева построено так, как будто речь идёт о сравнении двух синхронных языков, а калибровка на данных по изменениям отдельных языков (внутри одного языка связанная и независимая части словаря неотличимы, замедление по времени при парном сравнении - следствие потери памяти о прошлом, но не отсутствия симметрии по времени). Я дважды лопух, у Васильева разные данные для калибровки, но данные по совр. языкам я не заметил (там табличка была на боку, я её пропустил).
Но замедление на малых временах, вроде как налицо. Ничего не понимаю. Нет симметрии по времени? Глоттохронология отменяется?
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

На подумать: чем больше система, тем медленнее в ней идут процессы.  :scl:
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Оффлайн Mihailov

  • Сообщений: 174
Кроме того, глоттохронология датирует событие, которое мы не можем датировать даже непосредственным наблюдением - момент расхождения языков. Что это за момент, как его строго определить?
Формально проблемы нет. Можно определить как средний момент между последней синхронной заменой в стословнике и первой асинхронной.

Оффлайн Alone Coder

  • Вне лингвистики
  • Сообщений: 23159
  • Пол: Мужской
    • Орфовики
Так нельзя. В одном языке есть диалекты, которые не совпадают по стословнику.

Оффлайн Tibaren

  • Global Moderator
  • *
  • Сообщений: 10139
  • Пол: Мужской
Так нельзя. В одном языке есть диалекты, которые не совпадают по стословнику.
Offtop
Кодер, если не трудно, продолжите вашу идею. Не совсем понятно, что вы имели в виду.
Zikiro beltza ona dut bañan obea buztan zuria

Оффлайн Alone Coder

  • Вне лингвистики
  • Сообщений: 23159
  • Пол: Мужской
    • Орфовики
Стословник фиксирует немаркированные слова, выражающие данные понятия. Маркированность в каждом диалекте своя. Например, для русского живот/пузо, кожа/шкура.

Оффлайн Tibaren

  • Global Moderator
  • *
  • Сообщений: 10139
  • Пол: Мужской
Стословник фиксирует немаркированные слова, выражающие данные понятия. Маркированность в каждом диалекте своя. Например, для русского живот/пузо, кожа/шкура.
Да это понятно, имеется в виду ваше
Цитировать
Так нельзя
Zikiro beltza ona dut bañan obea buztan zuria

Оффлайн Alone Coder

  • Вне лингвистики
  • Сообщений: 23159
  • Пол: Мужской
    • Орфовики
В языке мы не можем определить момент, когда произошла замена. Если же взять не язык, а конкретный диалект, то может получиться ситуация, когда уже заменённое слово возвращается назад, причём в синхронно регулярном виде.

Оффлайн yurifromspb

  • Blogger
  • *
  • Сообщений: 2062
А что читатели темы думают о калибровочных данных по литературным языкам? Ведь должна же быть экспонента? Аргументация Васильева за "старение слов", как мы увидели, содержит грубую ошибку (верна для пары языков, но не для одного), а у Старостина аргументации, считай, что и нет. Ни у кого нет мыслей, почему так? Может быть дело в росте населения? Или в росте грамотности? Или причина в "глобализации"? По любому, здесь есть какой-то фактор, монотонно меняющийся во времени, и убивающий саму идею глоттохронологии. Или есть другие варианты?
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

 

В быстром ответе можно использовать BB-теги и смайлы.

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.
Имя: E-mail:
Визуальная проверка:
√49 Напишите ответ строчными буквами:
«Сто одёжек, все без застёжек» — что это?: