Лингвофорум

Теоретический раздел => Общая лингвистика => Компаративистика => Тема начата: Нефритовый Заяц от сентября 2, 2019, 09:56

Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Нефритовый Заяц от сентября 2, 2019, 09:56
Не могу никак в формулу Сводеша и Старостина вникнуть. Помогите, пожалуйста.
Подсчитываю расхождение чукотско-камчатских.

PS.Прошу от глумёжки воздержаться по возможности.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Leo от сентября 2, 2019, 10:05
подпишусь
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Mihailov от сентября 2, 2019, 10:39
Цитата: Нефритовый Заяц от сентября  2, 2019, 09:56
Не могу никак в формулу Сводеша и Старостина вникнуть. Помогите, пожалуйста.
Подсчитываю расхождение чукотско-камчатских.

PS.Прошу от глумёжки воздержаться по возможности.
Приведите исходные цифры. Мы покажем, как их обсчитывать.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 2, 2019, 11:39
Формула Сводеша идейно проста.

Если считать, что замена слова в любой одинаковый интервал времени равновероятна, если замены происходят равномернои днородно во времени, то имеется пуассонов процесс со всеми его свойствами.
Т.е., зная среднее число замен на интервал времени (например, [tex]\nu[/tex]), можно получить формулу вероятности выпадения определенного числа замен за этот интервал. Так, замен не случится вовсе с вероятностью [tex]e^{-\nu}[/tex]. Поскольку число замен [tex]\nu[/tex] в интервале пропорционально интервалу и частоте замен, т.е. равно [tex]\lambda t[/tex], можно переписать [tex]P(0)=e^{-\lambda t}[/tex]. А из этого следует, что для [tex]N_0[/tex] слов число [tex]N[/tex] незаменившихся слов в среднем будет равно [tex]N_0 e^{-\lambda t}[/tex], отсюда можно получить время расхождения, зная частоту замен и долю общих слов: [tex]t = {1 \over 2} {- 1 \over \lambda} \log {N \over N_0}[/tex] (время расхождения в два раза меньше, т.к. оба язвка прошли свою половину независимо и одновременно)
Вывод формул распределения Пуассона: https://www.youtube.com/watch?v=tA0piaEZOpE

Формула Старостина не имеет физического смысла, её следует воспринимать, как специально подобранную зависимость, дающую времена расхождения, удовлетворяющие ожиданиям автора.

Рекомендую поискать работы Васильева и Саенко по глоттохронологии.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Leo от сентября 2, 2019, 12:16
А лямбда это что ?
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Rusiok от сентября 2, 2019, 12:17
Offtop
Цитата: yurifromspb от сентября  2, 2019, 11:39
время расхождения в два раза меньше, т.к. оба языка прошли свою половину независимо и одновременно
1) Образно говоря, без "½" в формуле получаем всю длину шнурка, подвешенного за середину, два конца которого имеют равную длину. Такая общая длительность независимого развития пригодится, например, при определении времени написания древнеиндийских Вед?
2) Получается, что если фактически два идиома на протяжении лет, прошедших после разделения, обменивались базовой лексикой, то формула даст заниженный результат?
3) Тоже самое занижение результата формула даст, если естественная смена базовой лексики искусственно тормозилась (исландский, иврит, вообще литературные языки)?
4) И наоборот, если в истории языка произошло революционное обновление базовой лексики, то формула даст завышенный результат?
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 2, 2019, 12:18
Цитата: Leo от сентября  2, 2019, 12:16
А лямбда это что ?
Частота замен. За время [tex]t[/tex] слово в среднем заменяется [tex]\lambda t[/tex] раз.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 2, 2019, 12:33
Цитата: Rusiok от сентября  2, 2019, 12:17
...
2) Получается, что если фактически два идиома на протяжении лет, прошедших после разделения, обменивались базовой лексикой, то формула даст заниженный результат?
...
Проще сказать, что если процесс замен пуассонов, то всё хорошо, а чи ни, то ни.  :)
Вообще, это не оффтоп. Если человек хочет попробовать глоттохронологию, ему лучше всё это понимать.

По поводу (2).
В модели Васильева вероятность синхронной замены на одно и то же слово сразу после разделения равна единице, а потом постепенно спадает. Это моделирует такое "постепенное расхождение" и в тоже время позволяет вывести относительно простую формулу числа замен.
Можно посмотреть на примере романских:
М. Е. Васильев, М. Н. Саенко // К вопросу о точности глоттохронологии: датирование языковой дивергенции по данным романских языков. (https://cyberleninka.ru/article/n/k-voprosu-o-tochnosti-glottohronologii-datirovanie-yazykovoy-divergentsii-po-dannym-romanskih-yazykov)
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 2, 2019, 12:38
Кстати, субъективно кажется, при просмотре фитов данных по реальным языкам, что реальные шумы меньше того, что ожидается по модели. Для ста слов-то число замен на самом деле плюс-минус лапоть, а графики ровненькие относительно.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 2, 2019, 12:54
Цитата: Rusiok от сентября  2, 2019, 12:17
1) Образно говоря, без "½" в формуле получаем всю длину шнурка, подвешенного за середину, два конца которого имеют равную длину. Такая общая длительность независимого развития пригодится, например, при определении времени написания древнеиндийских Вед?
Со сводешом то хорошо, что при складывании шнурка в любой точке его длина не меняется. С более сложными моделями это уже не так.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Bhudh от сентября 2, 2019, 14:17
Цитата: yurifromspb от сентября  2, 2019, 12:18За время [tex]t[/tex] слово в среднем заменяется [tex]\lambda t[/tex] раз.
Как насчёт вероятности вместо замены x слов по одному разу поиметь замену одного слова x раз?
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Rusiok от сентября 2, 2019, 16:34
Цитата: Bhudh от сентября  2, 2019, 14:17
Цитата: yurifromspb от сентября  2, 2019, 12:18За время [tex]t[/tex] слово в среднем заменяется [tex]\lambda t[/tex] раз.
Как насчёт вероятности вместо замены x слов по одному разу поиметь замену одного слова x раз?
Думаю, это уже учтено в величине лямбда.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 2, 2019, 16:53
Цитата: Bhudh от сентября  2, 2019, 14:17
Цитата: yurifromspb от сентября  2, 2019, 12:18За время [tex]t[/tex] слово в среднем заменяется [tex]\lambda t[/tex] раз.
Как насчёт вероятности вместо замены x слов по одному разу поиметь замену одного слова x раз?
Всё согласно распределению Пуассона. Вероятность незамены одного слова равна в точности [tex]P(0)=e^{-\lambda t}[/tex]. Среднее число незамененных слов при условии независимости и равновероятности их замен равно [tex]N_0 e^{-\lambda t}[/tex].
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Rōmānus от сентября 2, 2019, 17:00
вы когда считать начнёте? я уже заждался  :'(
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Leo от сентября 2, 2019, 17:05
А есть ссылки на конкретный пример расчёта ?
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Mihailov от сентября 2, 2019, 17:52
Цитата: Rusiok от сентября  2, 2019, 12:173) Тоже самое занижение результата формула даст, если естественная смена базовой лексики искусственно тормозилась (исландский, иврит, вообще литературные языки)?
4) И наоборот, если в истории языка произошло революционное обновление базовой лексики, то формула даст завышенный результат?
Теоретически так. Но практически такие случаи бывают редко. Я не встречал упоминаний о других примерах, кроме тех, которые привели еще Бергсланд и Фогт (1962).
По революционному обновлению базовой лексики у них были два примера — эскимосский и риксмол. Пример с риксмолом — сразу в мусор: они его сравнивали с древненорвежским, тогда как он преемник старого датского. По эскимосскому они вроде некорректно подсчитали, Сводеш их подсчеты раскритиковал.
Примеров повышенной устойчивости у них было три — исландский, грузинский и армянский. Пример с армянским оказался некорректным. Во-первых, древние тексты оказались моложе, чем они думали. Во-вторых, за эталон современного языка они приняли язык писателей-пуристов, которые решили очистить язык от заимствований и вернуть его к первозданным истокам.
Остается в сухом остатке только повышенная сохранность исландского и грузинского: 4-5 замен в стословнике за тысячелетие. Может быть, это результат национального духа, как считали Бергсланд и Фогт. А может быть, это не национальный дух, а допустимая вариация: такие случаи по статистике должны встречаться с частотой один на несколько сотен.
Вы еще упомянули иврит. Но иврит долгое время был мертвым языком и потому не эволюционировал.
Что касается вообще литературных языков — часто говорят, что при наличии культивируемой письменной нормы базовая лексика обновляется медленнее, чем по Сводешу. Это распространенный предрассудок. Сводеш свой средний процент как раз по литературным языкам и вывел. Бывает, конечно, что обновление языка искусственно тормозится, но это всегда приводит к отрыву разговорного языка от литературного, как сейчас в Греции и в арабских странах. Или как это было в первые века развития романских языков: говорили на своих языках, а писали по-латыни, и смотрели на латынь не как на другой язык, а как на способ письма.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Leo от сентября 2, 2019, 17:57
наверно грузинский только в базовой лексике пуристичен, ибо вообще он пронизан русизмами грецизмами тюркизмами персизмами и арабизмами
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Tibaren от сентября 2, 2019, 18:08
Цитата: Mihailov от сентября  2, 2019, 17:52
грузинского: 4-5 замен в стословнике за тысячелетие.
Больше (https://ru.wiktionary.org/wiki/%D0%9F%D1%80%D0%B8%D0%BB%D0%BE%D0%B6%D0%B5%D0%BD%D0%B8%D0%B5:%D0%A1%D0%BF%D0%B8%D1%81%D0%BA%D0%B8_%D0%A1%D0%B2%D0%BE%D0%B4%D0%B5%D1%88%D0%B0_%D0%B4%D0%BB%D1%8F_%D0%BA%D0%B0%D1%80%D1%82%D0%B2%D0%B5%D0%BB%D1%8C%D1%81%D0%BA%D0%B8%D1%85_%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2).
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 2, 2019, 20:26
Цитата: Нефритовый Заяц от сентября  2, 2019, 09:56
Цитата: yurifromspb от сентября  2, 2019, 11:39
Формула Старостина не имеет физического смысла, её следует воспринимать, как специально подобранную зависимость, дающую времена расхождения, удовлетворяющие ожиданиям автора.
Всё-таки я к нему предвзят. Не то что бы она совсем не имеет физического смысла. Просто она выведена не вполне корректно, но от этого она не перестаёт отражать определенные воззрения на закон замен.
А лучшее в плане обоснованности и соответствия реальности это, наверное, формула Васильева: http://starling.rinet.ru/Texts/vasilyev.pdf Если хотите отойти от формулы Сводеша к чему-то более адекватному,  используйте его метод, а не Старостина.
(я уже давал ссылку на применение его метода на материале романских). Впрочем я специально этим не занимаюсь, может быть кто-то ещё внес что-то новое.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Нефритовый Заяц от сентября 2, 2019, 20:48
Прачукотско-камчатский (https://lingvoforum.net/index.php?topic=38879.75)

Сравниваем чукотский, корякский и ительменский. Алюторский, паланский - не исследованы.

По 35-словнику Яхонтова:

чукотско-корякских соответствий 30;
чукотско-ительменских 19;
корякско-ительменских 21;
чукотско-корякско-ительменских 19.

По 100-словнику Яхонтова:

чукотско-корякских соответствий 50;
чукотско-ительменских 33;
корякско-ительменских 33;
чукотско-корякско-ительменских 29.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 2, 2019, 21:31
Яхонтова на Сводеша, скорее всего нельзя просто так менять. Там скорости замен могут сильно отличаться. Но вообще, это тысячи лет. 3-4-5.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Нефритовый Заяц от сентября 2, 2019, 21:33
Цитата: Нефритовый Заяц от сентября  2, 2019, 20:48
Прачукотско-камчатский (https://lingvoforum.net/index.php?topic=38879.75)


По 100-словнику Яхонтова:

чукотско-корякских соответствий 50;
чукотско-ительменских 33;
корякско-ительменских 33;
чукотско-корякско-ительменских 29.

Поправка.

По 100-словнику Яхонтова:

чукотско-корякских соответствий 80;
чукотско-ительменских 52;
корякско-ительменских 54;
чукотско-корякско-ительменских 48.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 2, 2019, 21:48
Это по классическому Сводешу чукотско-корякские 0.8 т.л. и чукотско-корякско-ительменские 2.4 т.л.
По Васильеву, что-то типа 2 и 4 т.л.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 2, 2019, 21:48
Но вообще, надо понимать, что переносимость калибровки с одних языков на другие это только предположение.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Нефритовый Заяц от сентября 2, 2019, 21:49
Расчёты покажите, как это делается, пожалуйста.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Нефритовый Заяц от сентября 2, 2019, 21:55
По 100-словнику Сводеша:

чукотско-корякских совпадений 83;
чукотско-ительменских 54;
чукотско-корякских 55;
чукотско-корякско-ительменских 50.

Подскок заметили ительменского с корякским?
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 2, 2019, 21:57
Со Сводешом всё понятно, [tex]t= - { 1 \over 2 \lambda} \ln {N \over N_0 } [/tex]
[tex] - {1 \over 2*0.14} \ln 0.8 = 0.7969413 [/tex]
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 2, 2019, 21:58
С Васильевым, у меня со старых времен код на языке R завалялся, там решение нелинейного уравнения.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Leo от сентября 2, 2019, 22:00
Цитата: Нефритовый Заяц от сентября  2, 2019, 21:49
Расчёты покажите, как это делается, пожалуйста.
присоединяюсь к просьбе
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 2, 2019, 22:02
Цитата: Нефритовый Заяц от сентября  2, 2019, 21:55
Подскок заметили ительменского с корякским?
Эти формулы дают времена попарных расхождений. Какие-то более тонкие суждения (например, что были сепаратные заимствования или ещё что) надо отдельно обосновывать.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Нефритовый Заяц от сентября 2, 2019, 22:03
Цитата: yurifromspb от сентября  2, 2019, 21:57
Со Сводешом всё понятно, [tex]t= - { 1 \over 2 \lambda} \ln {N \over N_0 } [/tex]
[tex] - {1 \over 2*0.14} \ln 0.8 = 0.7969413 [/tex]
Это для чукотско-корякской пары?
Тройки возможно рассчитывать?
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 2, 2019, 22:06
Ну, вот, допустим есть некая зависимость процента когнатов от времени, взятая из статьи (это всё давние вещи, не мешало бы и проверить).
Я её записываю на R.
vasilev.orig <- function(t){
  0.08+0.92*exp(-0.45*t)*(1+0.45*t)
}

Хочу узнать обратную функцию, время от доли когнатов. Пожалуйста:
vasilev.orig.t <- function(x){
  uniroot(function(t){vasilev.orig(t)-x},c(0,15))$root
}
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 2, 2019, 22:07
Цитата: Нефритовый Заяц от сентября  2, 2019, 22:03
Тройки возможно рассчитывать?
Под логарифмом - доля когнатов.
По определению попарные расхождения.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Mihailov от сентября 3, 2019, 10:32
Цитата: yurifromspb от сентября  2, 2019, 21:57
[tex]t= - { 1 \over 2 \lambda} \log {N \over N_0 } [/tex]
[tex] - {1 \over 2*0.14} \log 0.8 = 0.7969413 [/tex]
Лучше писать ln, а не log. А то подумает человек, что логарифм тут десятичный, и будет удивляться, почему у него не получается.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Leo от сентября 3, 2019, 10:34
десятичный lg , log это логарифм с неуказанным основанием
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 3, 2019, 10:36
А, ну да, конечно. Может, модератор поменяет?
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 3, 2019, 11:00
Цитата: yurifromspb от сентября  2, 2019, 12:33
Цитата: Rusiok от сентября  2, 2019, 12:17
...
2) Получается, что если фактически два идиома на протяжении лет, прошедших после разделения, обменивались базовой лексикой, то формула даст заниженный результат?
...
В модели Васильева вероятность синхронной замены на одно и то же слово сразу после разделения равна единице, а потом постепенно спадает. Это моделирует такое "постепенное расхождение" и в тоже время позволяет вывести относительно простую формулу числа замен.
Но, должен уточнить, что "идейно" формула Васильева отражает представление не об "обмене", а об "общем состоянии". Васильев представляет дело так, что если разделить некую языковую общность, то в первое время у половинок будут происходить одинаковые замены даже без общения.
Вот здесь в главе 2 (стр. 15 в файле и 523 в нумерации издания): http://starling.rinet.ru/Texts/vasilyev.pdf

Впрочем, на практике, причина связанности изменений может быть разной, а налюдаемый эффект один.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Mihailov от сентября 3, 2019, 17:29
Цитата: Tibaren от сентября  2, 2019, 18:08
Цитата: Mihailov от сентября  2, 2019, 17:52
грузинского: 4-5 замен в стословнике за тысячелетие.
Больше (https://ru.wiktionary.org/wiki/%D0%9F%D1%80%D0%B8%D0%BB%D0%BE%D0%B6%D0%B5%D0%BD%D0%B8%D0%B5:%D0%A1%D0%BF%D0%B8%D1%81%D0%BA%D0%B8_%D0%A1%D0%B2%D0%BE%D0%B4%D0%B5%D1%88%D0%B0_%D0%B4%D0%BB%D1%8F_%D0%BA%D0%B0%D1%80%D1%82%D0%B2%D0%B5%D0%BB%D1%8C%D1%81%D0%BA%D0%B8%D1%85_%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2).
Я попробовал подсчитать. Больше или нет - не могу судить, так как не специалист. Там 207 слов, приходится все время справляться, какое из них входит в стословник, какое нет. В древнегрузинском стословнике 6 пробелов, остаются 94 позиции для сравнения. Нашел 3 явных несовпадения - "женщина", "птица", "шея". Еще 6 неясных случаев - "дерево", "лист", "лежать", "давать", земля", "хороший". На вид непохоже, но может быть, были там какие-то фонетические переходы, мало ли что. Еще 4 случая, которые можно толковать и так, и так, смотря какой выбрать синоним - "маленький", "кожа", "нога(ступня)", "песок". Здесь люди, знающие язык, должны выбрать подходящую форму по этой методичке (http://www.jolr.ru/files/(50)jlr2010-4(46-89).pdf%5B/url). А я могу только сказать, что замен было от 3 до 13 на 94 позиции.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Mihailov от сентября 3, 2019, 17:48
Цитата: Mihailov от сентября  3, 2019, 17:29
по этой методичке
ссылка не открывается, даю еще раз http://www.jolr.ru/files/(50)jlr2010-4(46-89).pdf (http://www.jolr.ru/files/(50)jlr2010-4(46-89).pdf)
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Medrawd от сентября 3, 2019, 20:38
А можете на Си или Паскале функцию написать? А то я тупой в математике...
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Medrawd от сентября 3, 2019, 20:43
Чему равна лямбда? (это число замен во сколько лет? Из скольки-словного списка?) Что такое N и N0? Какое основание у логарифма?
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 3, 2019, 20:55
Лямбду, вообще говоря, надо калибровать, но можно взять 0.14 Это математическое ожидание числа замен одного слова за 1000 лет (соответсвенно, результат будет в тысячах лет, можно взять другие единицы измерения, тогда лямбду надо пересчитать).
N0 - слов в списке, N - число незамененных слов на время t. Логарифм натуральный.


float t_of_divergence(float fraction_of_cognates, float lambda){
    return - 0.5 / lambda * log(fraction_of_cognates)
}

Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Medrawd от сентября 3, 2019, 21:17
Цитата: yurifromspb от сентября  3, 2019, 20:55
Лямбду, вообще говоря, надо калибровать, но можно взять 0.14 Это математическое ожидание числа замен одного слова за 1000 лет.
N0 - слов в списке, N - число незамененных слов на время t. Логарифм десятичный.


float t_of_divergence(float fraction_of_cognates, float lambda){
    return - 0.5 / lambda * log(fraction_of_cognates)
}


Спасибо! А если мне известно время расхождения, а я хочу вычислить лямбду? Блин, я забыл элементарную алгебру, не могу перетасовать слагаемые, чтобы получилось нужное(((
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 3, 2019, 21:22
Тогда вместо лямбды поставьте время. Но вообще настоящая калибровка требует нескольких пар (время, процент когнатов) и производится методом наименьших квадратов.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Medrawd от сентября 3, 2019, 21:50
Цитата: yurifromspb от сентября  3, 2019, 21:22
Тогда вместо лямбды поставьте время. Но вообще настоящая калибровка требует нескольких пар (время, процент когнатов) и производится методом наименьших квадратов.

Спасибо))
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Tibaren от сентября 3, 2019, 22:25
Цитата: yurifromspb от сентября  3, 2019, 10:36
А, ну да, конечно. Может, модератор поменяет?
Исправил.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Tibaren от сентября 3, 2019, 22:35
Цитата: Leo от сентября  2, 2019, 22:00
Цитата: Нефритовый Заяц от сентября  2, 2019, 21:49
Расчёты покажите, как это делается, пожалуйста.
присоединяюсь к просьбе
Что касается расчетов по Васильеву-Милитареву, удобно пользоваться их таблицей с опорными точками (она была в более ранней версии той статьи, которая выложена на старлинге). Nотн(t) - доля сохран. слов в 100-словнике; t - время разделения сравниваемых языков.

Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Medrawd от сентября 3, 2019, 23:07
Цитата: yurifromspb от сентября  3, 2019, 20:55
Лямбду, вообще говоря, надо калибровать, но можно взять 0.14 Это математическое ожидание числа замен одного слова за 1000 лет

Из какого списка Сводеша? 100-словного или 200-словного?


float t_of_divergence(float fraction_of_cognates, float lambda){
    return - 0.5 / lambda * log(fraction_of_cognates)
}

[/quote]

fraction_of_cognates - это что такое, в чем измеряется и как рассчитывается? Число общих слов/числе слов списка?
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 3, 2019, 23:27
Цитата: Tibaren от сентября  3, 2019, 22:25
Цитата: yurifromspb от сентября  3, 2019, 10:36
А, ну да, конечно. Может, модератор поменяет?
Исправил.
Спасибо!
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 3, 2019, 23:30
Цитата: Medrawd от сентября  3, 2019, 23:07
Цитата: yurifromspb от сентября  3, 2019, 20:55
Лямбду, вообще говоря, надо калибровать, но можно взять 0.14 Это математическое ожидание числа замен одного слова за 1000 лет

Из какого списка Сводеша? 100-словного или 200-словного?
С одной стороны, какая разница, если fraction_of_cognates это число когнатов делить на число слов в списке, а с другой 0.14 найдено для стословника и это важно, потому что на самом деле скорость замен у второй половины 200словника выше, чем у первой. Да и вообще, там в этих списках собраны слова с существенно различной устойчивостью.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Tibaren от сентября 3, 2019, 23:30
Цитата: Mihailov от сентября  3, 2019, 17:29
Цитата: Tibaren от сентября  2, 2019, 18:08
Цитата: Mihailov от сентября  2, 2019, 17:52
грузинского: 4-5 замен в стословнике за тысячелетие.
Больше (https://ru.wiktionary.org/wiki/%D0%9F%D1%80%D0%B8%D0%BB%D0%BE%D0%B6%D0%B5%D0%BD%D0%B8%D0%B5:%D0%A1%D0%BF%D0%B8%D1%81%D0%BA%D0%B8_%D0%A1%D0%B2%D0%BE%D0%B4%D0%B5%D1%88%D0%B0_%D0%B4%D0%BB%D1%8F_%D0%BA%D0%B0%D1%80%D1%82%D0%B2%D0%B5%D0%BB%D1%8C%D1%81%D0%BA%D0%B8%D1%85_%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2).
Я попробовал подсчитать. Больше или нет - не могу судить, так как не специалист. Там 207 слов, приходится все время справляться, какое из них входит в стословник, какое нет. В древнегрузинском стословнике 6 пробелов, остаются 94 позиции для сравнения. Нашел 3 явных несовпадения - "женщина", "птица", "шея". Еще 6 неясных случаев - "дерево", "лист", "лежать", "давать", земля", "хороший". На вид непохоже, но может быть, были там какие-то фонетические переходы, мало ли что. Еще 4 случая, которые можно толковать и так, и так, смотря какой выбрать синоним - "маленький", "кожа", "нога(ступня)", "песок". Здесь люди, знающие язык, должны выбрать подходящую форму по этой методичке (http://www.jolr.ru/files/(50)jlr2010-4(46-89).pdf%5B/url). А я могу только сказать, что замен было от 3 до 13 на 94 позиции.
Всего 10: женщина, птица, шея (иранизм в груз.), дерево (груз. < нахск.), лист, лежать, земля, хороший (груз. < арм.), черный (груз. < иран.), соль (груз. < н.-греч.).
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Medrawd от сентября 3, 2019, 23:45
Написал программу... Кто подскажет, сколько общих слов у романских языков? А у славянских? Просто чтобы протестировать. Например, у французского/итальянского, русского/украинского, русского/другого славянского. Только укажите, это 100- или 200-словный список Сводеша.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Bhudh от сентября 3, 2019, 23:55
(wikt/ru) Приложение:Списки Сводеша (https://ru.wiktionary.org/wiki/%D0%9F%D1%80%D0%B8%D0%BB%D0%BE%D0%B6%D0%B5%D0%BD%D0%B8%D0%B5:%D0%A1%D0%BF%D0%B8%D1%81%D0%BA%D0%B8_%D0%A1%D0%B2%D0%BE%D0%B4%D0%B5%D1%88%D0%B0)
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Нефритовый Заяц от сентября 4, 2019, 09:44
В чукотско-камчатских отсутствует "зерно, семя" и практически не представлена "змея". Нужно вычёркивать?
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: yurifromspb от сентября 4, 2019, 14:30
Да, самое простое, просто укоротить список, выкинув отсутствующие понятия.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Mihailov от сентября 4, 2019, 18:32
Цитата: Tibaren от сентября  3, 2019, 23:30Всего 10: женщина, птица, шея (иранизм в груз.), дерево (груз. < нахск.), лист, лежать, земля, хороший (груз. < арм.), черный (груз. < иран.), соль (груз. < н.-греч.).
Спасибо вам большое. Я вижу, в пяти пунктах Бергсланд и Фогт расходятся с вами и с википедией и отметили совпадения. Привожу таблицу.

                          Бергсланд-Фогт                          Википедия
                   древ.                  совр.                 древ.         совр.
птица          mprinveli            prinveli              prinveli       čit'i
дерево         xe                      xe                     Ʒeli             xe
лежать        c'ola                    c'ola                  [c-]            dac'ola
земля          mic'a, kueq'ana   mic'a                 tiqaj           niadagi
черный       Ĭavi                     šavi                    -               šavi

Не могли бы вы эти расхождения прокомментировать?
Бергсланд и Фогт пишут следующее:
"Данные по индексу сохранения  от древнего грузинского к современному и доля общего словаря в современных грузинском и мингрельском,  доложенные Бергсландом в Копенгагене (1956), были обсчитаны Фогтом. Чтобы обеспечить независимую проверку полученных результатов, которые значительно превышают проценты, постулируемые глоттохронологистами, мы послали список Сводеша нашим коллегам в Тбилиси, которые, не будучи информированы о целях, любезно составили представленную ниже сводку... Грузинский и армянский списки заполнил Илья Абуладзе... Мингрельский список заполнил один из его ассистентов, А. Кизирия, урожденный мингрел."
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Tibaren от сентября 4, 2019, 22:46
Цитата: Mihailov от сентября  4, 2019, 18:32
в пяти пунктах Бергсланд и Фогт расходятся с вами и с википедией и отметили совпадения. Привожу таблицу.
                          Бергсланд-Фогт                          Википедия
                   древ.                  совр.                 древ.         совр.
птица          mprinveli            prinveli              prinveli       čit'i
дерево         xe                      xe                     Ʒeli             xe
лежать        c'ola                    c'ola                  [c-]            dac'ola
земля          mic'a, kueq'ana   mic'a                 tiqaj           niadagi
черный       Ĭavi                     šavi                    -               šavi
Не могли бы вы эти расхождения прокомментировать?
Список для др.-грузинского на wiktionary я сверял у картвелистов из ТГУ. В отличие от Бергсланда-Фогта, эти данные скомпилированы из большего числа источников за более длительный период (см. список литературы) и, по всей видимости, достаточно достоверны.
Из представленных 5 позиций 3 не соответствуют семантическим критериям составления списков (выше давалась ссылка), а два заимствования не могут быть спроецированы в эпоху раннего средневековья.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Rusiok от сентября 5, 2019, 01:27
Цитата: Tibaren от сентября  4, 2019, 22:46
совр. птица čit'i
Чито гврито чито маргалито
да?
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Tibaren от сентября 5, 2019, 07:30
Цитата: Rusiok от сентября  5, 2019, 01:27
да?
Точно. В звательном падеже.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Mihailov от сентября 5, 2019, 13:11
Цитата: Tibaren от сентября  4, 2019, 22:46Список для др.-грузинского на wiktionary я сверял у картвелистов из ТГУ. В отличие от Бергсланда-Фогта, эти данные скомпилированы из большего числа источников за более длительный период (см. список литературы) и, по всей видимости, достаточно достоверны.
Благодарю вас. Еще вопрос. Бергсланд-Фогт датируют древнегрузинский список 5-м веком н.э. Эта датировка и сейчас остается в силе?
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Tibaren от сентября 5, 2019, 21:30
Цитата: Mihailov от сентября  5, 2019, 13:11
Бергсланд-Фогт датируют древнегрузинский список 5-м веком н.э. Эта датировка и сейчас остается в силе?
Не совсем так. Письменная фиксация лексем из списка несколько "размыта" по периоду раннего средневековья.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Mihailov от сентября 6, 2019, 18:12
Цитата: Tibaren от сентября  5, 2019, 21:30Не совсем так. Письменная фиксация лексем из списка несколько "размыта" по периоду раннего средневековья.
Можно, наверно, за среднее принять ориентировочно 700 г. Тогда получаем частоту замен 9/95=0,095 за 1300 лет (слово "соль" не входит в 100-словник Сводеша, хотя входит в 110-словник Старостина; учитываем также 5 пробелов в древнем списке). В пересчете на 1000 лет получаем 0,073, что вдвое ниже ожидаемого по Сводешу. Ожидаемое число замен на 95 слов за 1300 лет составляет 17, реально случилось 9. По статистике такие отклонения должны наблюдаться с частотой 1 на 45 языков.
Получается, что грузинский стословник действительно проявил повышенную устойчивость, хотя и не в такой мере, как это считали Бергсланд и Фогт.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Tibaren от сентября 6, 2019, 19:54
Цитата: Mihailov от сентября  6, 2019, 18:12
Можно, наверно, за среднее принять ориентировочно 700 г. Тогда получаем частоту замен 9/95=0,095 за 1300 лет
Не уверен. Здесь скорее нужно отслеживать фиксацию каждой позиции в списке и брать что-то вроде средневзвешенного значения.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Mihailov от сентября 9, 2019, 10:39
Цитата: Tibaren от сентября  6, 2019, 19:54Не уверен. Здесь скорее нужно отслеживать фиксацию каждой позиции в списке и брать что-то вроде средневзвешенного значения.
Согласен. Если строго считать, а не навскидку, так и надо делать.
А сейчас меня заинтересовало отношение между словами "чити" и "принвели". Употребляется ли сейчас слово "принвели", и если да, то в каких случаях"? И, как по-вашему, почему Абуладзе мог решить, что самый подходящий эквивалент английскому bird - "принвели", а не "чити"? Может быть, в 50-х годах слово "принвели" было более употребительным?
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Tibaren от сентября 9, 2019, 20:33
Цитата: Mihailov от сентября  9, 2019, 10:39
Употребляется ли сейчас слово "принвели", и если да, то в каких случаях"?
Употребляется, но уже больше в литературной речи и переходит в разряд архаизмов.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Bhudh от сентября 10, 2019, 23:00
Типа русского "птаха"?
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Tibaren от сентября 11, 2019, 07:32
В русском хотя бы однокоренные.
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: emons от сентября 11, 2019, 11:44
Цитата: Bhudh от сентября 10, 2019, 23:00
Типа русского "птаха"?
Типа укр. літак
для срав. самолет - tvitmprinavi
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: Nevik Xukxo от сентября 21, 2020, 19:02
Деривационный дрейф - это когнаты или не когнаты? А то я так понимаю, например, у Касьяна и др. в их дереве ИЕ повыкидывали из когнатов всякие wind-ветер, agni-ignis. :???
Название: помогите, пожалуйста, с глоттохронологическими подсчётами!
Отправлено: pomogosha от февраля 8, 2022, 18:10
Цитата: Nevik Xukxo от сентября 21, 2020, 19:02
Деривационный дрейф - это когнаты или не когнаты? А то я так понимаю, например, у Касьяна и др. в их дереве ИЕ повыкидывали из когнатов всякие wind-ветер, agni-ignis. :???
Традиционно — когнаты, но Касьян и др. решили, что нет, не когнаты.
Новый подход к индоевропейской классификации... (http://file:///C:/Users/User/AppData/Local/Microsoft/Windows/Temporary%20Internet%20Files/Content.IE5/O5YHF8ZF/061902.pdf)
Цитата: Касьян А.С. и др. от Вторая особенность нашей процедуры (одно из нововведений настоящего
исследования) заключается в том, что мы не помечаем как родственные формы с так
называемым деривационным дрейфом. Согласно традиционному и почти повсеместно
принятому подходу в качестве лексикостатистических совпадений рассматриваются такие
формы, у которых основные полнозначные морфемы (а именно, корни) являются
родственными друг другу, т. е. считаются восходящими к одному пракорню. Тем не менее,
очевидна мысль, что по морфологическим основаниям истинные исторические когнаты
могут быть замещены параллельными новыми образованиями, имеющими тот же корень,
см. хорошее обсуждение в [14: 202-203], где феномен параллельной морфологической
деривации называется «деривационным дрейфом».