Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

помогите, пожалуйста, с глоттохронологическими подсчётами!

Автор Нефритовый Заяц, сентября 2, 2019, 09:56

0 Пользователи и 2 гостей просматривают эту тему.

Нефритовый Заяц

Не могу никак в формулу Сводеша и Старостина вникнуть. Помогите, пожалуйста.
Подсчитываю расхождение чукотско-камчатских.

PS.Прошу от глумёжки воздержаться по возможности.


Mihailov

Цитата: Нефритовый Заяц от сентября  2, 2019, 09:56
Не могу никак в формулу Сводеша и Старостина вникнуть. Помогите, пожалуйста.
Подсчитываю расхождение чукотско-камчатских.

PS.Прошу от глумёжки воздержаться по возможности.
Приведите исходные цифры. Мы покажем, как их обсчитывать.

yurifromspb

Формула Сводеша идейно проста.

Если считать, что замена слова в любой одинаковый интервал времени равновероятна, если замены происходят равномернои днородно во времени, то имеется пуассонов процесс со всеми его свойствами.
Т.е., зная среднее число замен на интервал времени (например, [tex]\nu[/tex]), можно получить формулу вероятности выпадения определенного числа замен за этот интервал. Так, замен не случится вовсе с вероятностью [tex]e^{-\nu}[/tex]. Поскольку число замен [tex]\nu[/tex] в интервале пропорционально интервалу и частоте замен, т.е. равно [tex]\lambda t[/tex], можно переписать [tex]P(0)=e^{-\lambda t}[/tex]. А из этого следует, что для [tex]N_0[/tex] слов число [tex]N[/tex] незаменившихся слов в среднем будет равно [tex]N_0 e^{-\lambda t}[/tex], отсюда можно получить время расхождения, зная частоту замен и долю общих слов: [tex]t = {1 \over 2} {- 1 \over \lambda} \log {N \over N_0}[/tex] (время расхождения в два раза меньше, т.к. оба язвка прошли свою половину независимо и одновременно)
Вывод формул распределения Пуассона: https://www.youtube.com/watch?v=tA0piaEZOpE

Формула Старостина не имеет физического смысла, её следует воспринимать, как специально подобранную зависимость, дающую времена расхождения, удовлетворяющие ожиданиям автора.

Рекомендую поискать работы Васильева и Саенко по глоттохронологии.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".


Rusiok

Offtop
Цитата: yurifromspb от сентября  2, 2019, 11:39
время расхождения в два раза меньше, т.к. оба языка прошли свою половину независимо и одновременно
1) Образно говоря, без "½" в формуле получаем всю длину шнурка, подвешенного за середину, два конца которого имеют равную длину. Такая общая длительность независимого развития пригодится, например, при определении времени написания древнеиндийских Вед?
2) Получается, что если фактически два идиома на протяжении лет, прошедших после разделения, обменивались базовой лексикой, то формула даст заниженный результат?
3) Тоже самое занижение результата формула даст, если естественная смена базовой лексики искусственно тормозилась (исландский, иврит, вообще литературные языки)?
4) И наоборот, если в истории языка произошло революционное обновление базовой лексики, то формула даст завышенный результат?
"проект предлагал сократить разговорную речь путем сведения многосложных слов к односложным и упразднения глаголов" - Джонатан Свифт. Путешествие в Бальнибарби

yurifromspb

Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

yurifromspb

Цитата: Rusiok от сентября  2, 2019, 12:17
...
2) Получается, что если фактически два идиома на протяжении лет, прошедших после разделения, обменивались базовой лексикой, то формула даст заниженный результат?
...
Проще сказать, что если процесс замен пуассонов, то всё хорошо, а чи ни, то ни.  :)
Вообще, это не оффтоп. Если человек хочет попробовать глоттохронологию, ему лучше всё это понимать.

По поводу (2).
В модели Васильева вероятность синхронной замены на одно и то же слово сразу после разделения равна единице, а потом постепенно спадает. Это моделирует такое "постепенное расхождение" и в тоже время позволяет вывести относительно простую формулу числа замен.
Можно посмотреть на примере романских:
М. Е. Васильев, М. Н. Саенко // К вопросу о точности глоттохронологии: датирование языковой дивергенции по данным романских языков.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

yurifromspb

Кстати, субъективно кажется, при просмотре фитов данных по реальным языкам, что реальные шумы меньше того, что ожидается по модели. Для ста слов-то число замен на самом деле плюс-минус лапоть, а графики ровненькие относительно.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

yurifromspb

Цитата: Rusiok от сентября  2, 2019, 12:17
1) Образно говоря, без "½" в формуле получаем всю длину шнурка, подвешенного за середину, два конца которого имеют равную длину. Такая общая длительность независимого развития пригодится, например, при определении времени написания древнеиндийских Вед?
Со сводешом то хорошо, что при складывании шнурка в любой точке его длина не меняется. С более сложными моделями это уже не так.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Bhudh

Цитата: yurifromspb от сентября  2, 2019, 12:18За время [tex]t[/tex] слово в среднем заменяется [tex]\lambda t[/tex] раз.
Как насчёт вероятности вместо замены x слов по одному разу поиметь замену одного слова x раз?
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Rusiok

Цитата: Bhudh от сентября  2, 2019, 14:17
Цитата: yurifromspb от сентября  2, 2019, 12:18За время [tex]t[/tex] слово в среднем заменяется [tex]\lambda t[/tex] раз.
Как насчёт вероятности вместо замены x слов по одному разу поиметь замену одного слова x раз?
Думаю, это уже учтено в величине лямбда.
"проект предлагал сократить разговорную речь путем сведения многосложных слов к односложным и упразднения глаголов" - Джонатан Свифт. Путешествие в Бальнибарби

yurifromspb

Цитата: Bhudh от сентября  2, 2019, 14:17
Цитата: yurifromspb от сентября  2, 2019, 12:18За время [tex]t[/tex] слово в среднем заменяется [tex]\lambda t[/tex] раз.
Как насчёт вероятности вместо замены x слов по одному разу поиметь замену одного слова x раз?
Всё согласно распределению Пуассона. Вероятность незамены одного слова равна в точности [tex]P(0)=e^{-\lambda t}[/tex]. Среднее число незамененных слов при условии независимости и равновероятности их замен равно [tex]N_0 e^{-\lambda t}[/tex].
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Rōmānus

Надежда - мать дураков (с) Литовская пословица


Mihailov

Цитата: Rusiok от сентября  2, 2019, 12:173) Тоже самое занижение результата формула даст, если естественная смена базовой лексики искусственно тормозилась (исландский, иврит, вообще литературные языки)?
4) И наоборот, если в истории языка произошло революционное обновление базовой лексики, то формула даст завышенный результат?
Теоретически так. Но практически такие случаи бывают редко. Я не встречал упоминаний о других примерах, кроме тех, которые привели еще Бергсланд и Фогт (1962).
По революционному обновлению базовой лексики у них были два примера — эскимосский и риксмол. Пример с риксмолом — сразу в мусор: они его сравнивали с древненорвежским, тогда как он преемник старого датского. По эскимосскому они вроде некорректно подсчитали, Сводеш их подсчеты раскритиковал.
Примеров повышенной устойчивости у них было три — исландский, грузинский и армянский. Пример с армянским оказался некорректным. Во-первых, древние тексты оказались моложе, чем они думали. Во-вторых, за эталон современного языка они приняли язык писателей-пуристов, которые решили очистить язык от заимствований и вернуть его к первозданным истокам.
Остается в сухом остатке только повышенная сохранность исландского и грузинского: 4-5 замен в стословнике за тысячелетие. Может быть, это результат национального духа, как считали Бергсланд и Фогт. А может быть, это не национальный дух, а допустимая вариация: такие случаи по статистике должны встречаться с частотой один на несколько сотен.
Вы еще упомянули иврит. Но иврит долгое время был мертвым языком и потому не эволюционировал.
Что касается вообще литературных языков — часто говорят, что при наличии культивируемой письменной нормы базовая лексика обновляется медленнее, чем по Сводешу. Это распространенный предрассудок. Сводеш свой средний процент как раз по литературным языкам и вывел. Бывает, конечно, что обновление языка искусственно тормозится, но это всегда приводит к отрыву разговорного языка от литературного, как сейчас в Греции и в арабских странах. Или как это было в первые века развития романских языков: говорили на своих языках, а писали по-латыни, и смотрели на латынь не как на другой язык, а как на способ письма.

Leo

наверно грузинский только в базовой лексике пуристичен, ибо вообще он пронизан русизмами грецизмами тюркизмами персизмами и арабизмами

Tibaren

Zikiro beltza ona dut bañan obea buztan zuria

yurifromspb

Цитата: Нефритовый Заяц от сентября  2, 2019, 09:56
Цитата: yurifromspb от сентября  2, 2019, 11:39
Формула Старостина не имеет физического смысла, её следует воспринимать, как специально подобранную зависимость, дающую времена расхождения, удовлетворяющие ожиданиям автора.
Всё-таки я к нему предвзят. Не то что бы она совсем не имеет физического смысла. Просто она выведена не вполне корректно, но от этого она не перестаёт отражать определенные воззрения на закон замен.
А лучшее в плане обоснованности и соответствия реальности это, наверное, формула Васильева: http://starling.rinet.ru/Texts/vasilyev.pdf Если хотите отойти от формулы Сводеша к чему-то более адекватному,  используйте его метод, а не Старостина.
(я уже давал ссылку на применение его метода на материале романских). Впрочем я специально этим не занимаюсь, может быть кто-то ещё внес что-то новое.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Нефритовый Заяц

Прачукотско-камчатский

Сравниваем чукотский, корякский и ительменский. Алюторский, паланский - не исследованы.

По 35-словнику Яхонтова:

чукотско-корякских соответствий 30;
чукотско-ительменских 19;
корякско-ительменских 21;
чукотско-корякско-ительменских 19.

По 100-словнику Яхонтова:

чукотско-корякских соответствий 50;
чукотско-ительменских 33;
корякско-ительменских 33;
чукотско-корякско-ительменских 29.

yurifromspb

Яхонтова на Сводеша, скорее всего нельзя просто так менять. Там скорости замен могут сильно отличаться. Но вообще, это тысячи лет. 3-4-5.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Нефритовый Заяц

Цитата: Нефритовый Заяц от сентября  2, 2019, 20:48
Прачукотско-камчатский


По 100-словнику Яхонтова:

чукотско-корякских соответствий 50;
чукотско-ительменских 33;
корякско-ительменских 33;
чукотско-корякско-ительменских 29.

Поправка.

По 100-словнику Яхонтова:

чукотско-корякских соответствий 80;
чукотско-ительменских 52;
корякско-ительменских 54;
чукотско-корякско-ительменских 48.

yurifromspb

Это по классическому Сводешу чукотско-корякские 0.8 т.л. и чукотско-корякско-ительменские 2.4 т.л.
По Васильеву, что-то типа 2 и 4 т.л.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

yurifromspb

Но вообще, надо понимать, что переносимость калибровки с одних языков на другие это только предположение.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".


Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр