Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Древо распада индоевропейского языка

Автор Agnius, января 7, 2017, 17:44

0 Пользователи и 1 гость просматривают эту тему.

Валер

 Так до сих пор не понял почему их за сектантов каких-то держат.
Несолидарный. С войной, чем-либо, кем-либо.

Убить непросто. Убивать за свою страну намного легче.

Виктор Меркатор

Тема заброшена, надеюсь реанимировать.
Относительно генеалогического древа ИЕ языков.

Предлагаю на обсуждение репринт статьи
Двухмерная дендрограмма 84 индоевропейских языков

https://www.researchgate.net/publication/381608086_Dvuhmernaa_dendrogramma_84_indoevropejskih_azykov_2D_dendrogram_of_84_Indo-European_languages

Наиболее удивительным является наличие в череде лингвистических событий по разделению языков 2 отметок во времени с концентрацией на них 5 и 4 событий.
Первое 4400 лет назад - одновременное отделение от праиндоевропйского языка кельтских, греческих, иранских, индоарийских и германских языков. По времени появление бронзового оружия?
Второе около 400-500 года НЭ. Великое переселение народов, с последующим ускорением образования новых языков (точка перелома на графике).

Виктор Меркатор

Статья обсуждается на
https://novalingua.net/index.php?topic=5228.new#quickreply_anchor
Предлагаю обсудить здесь, принимаются любые возражения, все в интересах дела.

Bhudh

Первое возражение: это как раз использование в качестве материала данных только живых языков.
Давно известно, что даже по полным данным современных романских языков классическую латынь ну никак не восстановить. А латынь — это полноценный язык, о котором известно куда больше, чем, к примеру, о каком-нибудь горном иранском или джунглевом индоарийском диалекте.
Поэтому отсутствие в списках данных латыни, древнегреческого, древнеанглийского, готского, древнеирландского, старославянского, авестийского, пали, санскрита (!), хеттского () если и не обесценивает вычисления по группам, куда эти языки должны входить, то в немалой степени их искажает.
Тот же самый "коренной" македонский, который является ближайшим географически потомком солунского южнославянского диалекта, литературную форму которого мы сейчас называем «старославянский язык», мог быть в результате этим языком и заменён.
Другая проблема списков Сводеша: это при учитывании замены слова в списке проводить простую бинарную опирацию выкидывания слова. То бишь «нет слова в базовой лексике — нет его для наших целей и в языке!». В то время как в исторической лингвистике дело обстоит ровно наоборот: наличие вытеснённого из базовой лексики слова в разговорном языке или на периферии языка признаётся дополнительным подтверждением родства и этимологи охотятся за такими словами во всех возможных местах от Гесихия до Даля. Поэтому нормальный исторический Сводеш должен быть списком списков: если при вытесненном слове остаётся существовать прошлое, оно должно включаться на второе место в список этого значения и учитываться (хотя бы как бинарное «есть/нет») при расчёте близости языков.
Русским при наличии и активном использовании слова глаз ничего не мешает по пьяни распевать «Очи чёрные».

Списки Сводеша для отсутствующих языков можно взять в Викисловаре: https://en.wiktionary.org/wiki/Appendix:Swadesh_lists.
Да и вообще никто не мешает вместо данных Дайен-Краскала-Блэка аж 1990 года взять вики-списки, провести тот же анализ и сравнить, не изменилось ли чего?
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Виктор Меркатор

Цитата: Bhudh от июля  4, 2024, 08:41Первое возражение: это как раз использование в качестве материала данных только живых языков.
Давно известно, что даже по полным данным современных романских языков классическую латынь ну никак не восстановить. А латынь — это полноценный язык, о котором известно куда больше, чем, к примеру, о каком-нибудь горном иранском или джунглевом индоарийском диалекте.
Поэтому отсутствие в списках данных латыни, древнегреческого, древнеанглийского, готского, древнеирландского, старославянского, авестийского, пали, санскрита (!), хеттского () если и не обесценивает вычисления по группам, куда эти языки должны входить, то в немалой степени их искажает.
Тот же самый "коренной" македонский, который является ближайшим географически потомком солунского южнославянского диалекта, литературную форму которого мы сейчас называем «старославянский язык», мог быть в результате этим языком и заменён.
Другая проблема списков Сводеша: это при учитывании замены слова в списке проводить простую бинарную опирацию выкидывания слова. То бишь «нет слова в базовой лексике — нет его для наших целей и в языке!». В то время как в исторической лингвистике дело обстоит ровно наоборот: наличие вытеснённого из базовой лексики слова в разговорном языке или на периферии языка признаётся дополнительным подтверждением родства и этимологи охотятся за такими словами во всех возможных местах от Гесихия до Даля. Поэтому нормальный исторический Сводеш должен быть списком списков: если при вытесненном слове остаётся существовать прошлое, оно должно включаться на второе место в список этого значения и учитываться (хотя бы как бинарное «есть/нет») при расчёте близости языков.
Русским при наличии и активном использовании слова глаз ничего не мешает по пьяни распевать «Очи чёрные».

Списки Сводеша для отсутствующих языков можно взять в Викисловаре: https://en.wiktionary.org/wiki/Appendix:Swadesh_lists.
Да и вообще никто не мешает вместо данных Дайен-Краскала-Блэка аж 1990 года взять вики-списки, провести тот же анализ и сравнить, не изменилось ли чего?
Самое показательное то, что современные языки сохранили в себе память о прошлом. При всей искусственности македонского откуда известный раздрай что древнемакедонский это греческий а не славянский, это кодифицированный язык и возможно оттого и ближе к праязыку не только славян, но и ИЕ. Так а родина где? Что с того, что македонский если и составлен то из близких территориально славянских языков на которых разговаривали македонцы. Может, они тогда и не знали, что они македонцы, так и азербайджанцы тоже не существовали в прежние времена. Есть территория - есть народ, есть язык. Как с норвежским произошло.

Усложнять списки Сводеша до 10000 с приписыванием словам весов идея благодарная, если и реализуется то на базе ИИ, который даже не сочтет нужным объяснять свой вывод. Разные веса будут у пса и собаки. глаза и очей и пр. А сейчас что есть то есть. Реабилитирован Сводеш - скорость распада лексики постоянна, данные по скорости распада Лиза также верны, прав оказался Сводеш что заимствования следует отбраковывать (это идея Сводеша из самых первых его работ), вся разница что отбраковывание не субъективное а формальное по модели. Точность которой повышена в 9 раз поскольку оценка идет не по паре языков а по всем 84 языкам, увеличение выборки в N раз приводит к повышению точности в корень из N раз.
А что до прочих списков, у списков Дайен огромное преимущество - они не составлялись под готовую дендрограмму и известное наперед знание.
Вероятность того, что независимые данные дали обнаруженную впервые из множества дендрограмм (Грей/Аткинсон, Старости и др.) одновременность 5 событий из 18, составляет 1/17. Не ноль конечно, но история человечества одна, а не 17 альтернативных.

Я не маньяк всю жизнь целенаправленно и фанатично доказывать валидность модели которой кста 21 год и валидность которой была проверена еще на данных Сводеша по сэлишским языкам.

Опять невероятное совпадение - одинаковость конфигурации дендрограммы 2 языков по совершенно независимым 2 исследованиям Сводеша. Не мог Сводеш подгонять 70 лет назад данные под неизвестно что, он просто добросовестно делал свою работу. Если коротко, то измеренное Сводешем расстояние между 2 языками (которое понятно всегда одно) в 2 независимых исследованиях распалось на совершенно равные дивергенцию и конвергенцию. 73 Св распались на 19+35+19. При этом эта конфигурация повторилась при совершенно отличном наборе данных по прочим языкам, разным в 2 исследованиях. Вероятность подобного мала, принимается всегда наиболее вероятная гипотеза. Т.б. если она еще и наиболее простая - не требует колдовства с выявлением заимствований (есть соблазн в сомнительных случаях подогнать под результат) и полагает скорость распада языков постоянной. Что скорей всего заложено в необходимости сохранения связей между поколениями.
     

Agnius

 А чем это статья лучше статьи Касьяна? Там вроде наиболее достоверное дерево, использованы инновации по обработке Сводеша, байесовские деревья и т.д.  :pop:

Виктор Меркатор

Цитата: Agnius от июля  4, 2024, 14:45А чем это статья лучше статьи Касьяна? Там вроде наиболее достоверное дерево, использованы инновации по обработке Сводеша, байесовские деревья и т.д.  :pop:
Впервые узнал о существовании этой статьи (2019 год?), за 5 минут прочел, дендрограмму изучил. Я же метод в 2003 году вбросил и на 2 десятка лет о нем забыл.
Там языки древние, чего нет здесь. Приятно что датировку единую сочли на отделение греков кельтов иранцев и индоариев германцев. Но зачем-то армяне обижены, не признается древность их праязыка. Их попусту объединили с греками, что многими или не всеми признается. Армяне наряду с македонцами в основе ИЕ языков, и оттого ни одни ни другие не датируются, нужен выход за пределы системы. Про то и Касьян помянул, включил язык за пределами ИЕ. Это было в статье 2003 года по сэлишским языкам, где пунктиром обозначено звено, не определяемое в пределах языков сэлиш.   
Выделены индоиранцы чего здесь не фиксируется.
Восточные славяне (в плане языка) фикция.

Ну и сама постановка вопроса интересна - чем одна статья лучше другой. Да ничем - обе статьи хороши если там нет подлога натяжек или ошибок. Все это со временем загрузится в ИИ, он и скажет свое мнение о языках. 
И все смывает серый цвет границ датировок, что не фиксирует ни точных дат ни даже порядка событий.
Много было колдовства со списками, работы со словами, что есть голимый субъективизм. И 3 различных метода которые зачем-то объединяются в одну дендрограмму.
Байесовскийц метод использовали одними из первых Грей/Аткинсон, там дендрограмма никакая. 

Виктор Меркатор

Заинтересовали Касьяном, нашел статью - он оказывается со Старостиным работает, Георгием
https://elementy.ru/nauchno-populyarnaya_biblioteka/436886/V_poiskakh_prarodiny_indoevropeyskikh_yazykov
Симбиоз, понятно, математик с лингвистом.

Метод Касьяна заумь, вопрос поможет ли сложнейшая математика, которая иллюстрируется размытыми графическими построениями (размытыми оттого что водятся вероятностные модели) разрулить субъективные данные лингвистических матриц, которые бесконечно составляются и ревизуются.

Обсуждаемая модель примитивна до безобразия, построить дерево по матрице сможет освоивший Эксель 6-классник. Причем без вариантов и лишних медитаций. У другого получится то же самое. И самое главное - никакого вероятия, полевые данные святы, сомнению не подвергаются и полученные на их основе результаты просчитываются до 3 знака после запятой. Понятно, лишь на этапе обработки, для представления публике все можно округлить до целых, это плюс/минус 35 лет.

Получаемая дендрограмма содержит погрешности, не объясняемые современным знанием и даже противоречащие ему, особенно в области разделения новых языков. Но это неизбежно, слишком сложно взаимодействие между языками после их отделения. Самые большой источник погрешности - конвергенция с близкородственными языками. В основу метода заложена конвергенция с языками за пределами ИЕ семьи. Но это потенциал модификации метода, введение 3-го измерения. Но само по себе введение второго измерения, в тех же единицах, что и первое (время) огромный прогресс в глоттохронологии. Оттого дендрограмма 84 языков не в состоянии уместиться ни на каком листе бумаги, требование сохранение единого масштаба по 2 осям не позволяет. Ничего странного - на настенной карте РФ нельзя требовать изобразить в масштабе ваш дачный поселок.

В статье все дендрограммы изображены на 10 листах, некоторые учетверенный лист А4.
Но самое главное - появление на дендрограммах редких особенностей - признак их валидности. Особенности случайным образом не возникают, случайности ведут к хаосу. И самая главная особенность - ранее не выявленная одновременность отделения кельтов, германцев, греков, индоариев и иранцев. Дело историков, археологов, эзотериков объяснить эту особенность катастрофой, социальной или природной. Вот Гумилев особо не стеснялся в поисках причин подобных катаклизмов - вспышка пассионарности и вуаля. 

Никакая случайная загрязненная матрица + невалидный метод не дадут этой особенности, слишком мала вероятность. Примерно как набивший оскомину пример, что подошедшая к пишмашинке (теперь клавиатура) мартышка случайно наберет даже не роман или стишок, а хотя бы осмысленное слово.

Современная глоттохронология загнала себя в угол, нечто схожее с теорией музыкальных интервалов, где еще в средние века край новое время следовало все поломать вернуться к истокам Пифагору и построить новую теорию. Но предпочли ставить заплаты на старое, и в итоге нынешнее состояние теории безобразно до умопомрачения, она не для человека с системным мышлением, а чисто для способного заучить механически массу правил, где на каждое правило есть исключающее его подправило, и так несколько уровней.   

Bhudh

Цитата: Виктор Меркатор от июля  4, 2024, 10:05Я не маньяк всю жизнь целенаправленно и фанатично доказывать валидность модели которой кста 21 год и валидность которой была проверена еще на данных Сводеша по сэлишским языкам.
Да, у Вас маниакальность по другому вопросу: Вы свято уверены в верности вычислений по Вашему методу и потому даже не желаете их перепроверять.
Это ошибка выжившего называется, знаете ли.

Цитата: Виктор Меркатор от июля  4, 2024, 15:43Впервые узнал о существовании этой статьи (2019 год?), за 5 минут прочел, дендрограмму изучил. Я же метод в 2003 году вбросил и на 2 десятка лет о нем забыл.
И Вы считаете, что это достоинство и преимущество? Ничего не знать о конкурирующих методах, о параллельных исследованиях, текущих достижениях... Это есть хорошо?

Цитата: Виктор Меркатор от июля  4, 2024, 15:43Там языки древние, чего нет здесь. Приятно что датировку единую сочли на отделение греков кельтов иранцев и индоариев германцев. Но зачем-то армяне обижены, не признается древность их праязыка.
У них другие результаты именно потому, что у них есть другие данные. В том числе у них есть древнегреческий и грабар, наличие которых и делает армянский не таким древним.
Но Вы почему-то уверены, что и без данных этих языков Ваши вычисления полностью верны. А это уже порочный круг в доказательстве: Вы принимаете за доказанные и подтверждённые результаты то, что следовало бы подтвердить и перепроверить.
Как и вот это:
Цитата: Виктор Меркатор от июля  4, 2024, 15:43Выделены индоиранцы чего здесь не фиксируется.
Восточные славяне (в плане языка) фикция.

Цитата: Виктор Меркатор от июля  4, 2024, 19:11Метод Касьяна заумь
Ваша первоначальная статья для неспециалиста заумь не меньшая (она, кстати, вышла где-нибудь в виде статьи на бумаге? или только как доклад в сборнике?). Адхоковое введение лингвистической единицы времени это такое себе.

Цитата: Виктор Меркатор от июля  4, 2024, 19:11вопрос поможет ли сложнейшая математика, которая иллюстрируется размытыми графическими построениями (размытыми оттого что водятся вероятностные модели) разрулить субъективные данные лингвистических матриц, которые бесконечно составляются и ревизуются.
А почему Вы уверены, что матрица Дайен-Краскала-Блэка абсолютно объективна? Она же для этих же целей создавалась.
Цитата: Литература9. Isidore Dyen, Joseph B. Kruskal, Paul Black. An Indoeuropean classification: a lexico statistical experiment.

Цитата: Виктор Меркатор от июля  4, 2024, 19:11И самое главное - никакого вероятия, полевые данные святы, сомнению не подвергаются и полученные на их основе результаты просчитываются до 3 знака после запятой.
В науке ничего святого нет. Если дополнительный эксперимент требует введения дополнительных данных — их вводят, а не огрызаются на критиков «Нам эти данные не нужны! У нас и без них всё работает!».
Вы же на предложение ввести данные древних языков, чтобы уточнить модель, именно огрызаетесь.

Цитата: Виктор Меркатор от июля  4, 2024, 19:11Получаемая дендрограмма содержит погрешности, не объясняемые современным знанием и даже противоречащие ему, особенно в области разделения новых языков.
Так может, это не достоинство дендрограммы, а её недостаток? К чему сразу объявлять старые данные, не согласующиеся с дендрограммой, непременно ложными, а получаемую дендрограмму — непременно истинной и на ней строить все дальнейшие выводы?

Цитата: Виктор Меркатор от июля  4, 2024, 19:11Самые большой источник погрешности - конвергенция с близкородственными языками. В основу метода заложена конвергенция с языками за пределами ИЕ семьи.
Вы меня, конечно, извините, но в Вашем первоначальном докладе я термина и понятия «конвергенция» не нашёл вообще. Там исключительно о дивергенции речь.
Вы не могли бы уточнить, в какой именно момент "заброшенности" проекта Вы ввели вычисление этого параметра?

Цитата: Виктор Меркатор от июля  4, 2024, 19:11Оттого дендрограмма 84 языков не в состоянии уместиться ни на каком листе бумаги, требование сохранение единого масштаба по 2 осям не позволяет.
Мне почему-то этот пассаж неуловимо и неумолимо напоминает рассказы новохронологов о Глобальной Хронологической Карте (ГХК).
И вообще-то сейчас XXI век и можно создавать масштабируемые карты и таблицы почти любого размера и даже размерности. Прямо в браузере.

Цитата: Виктор Меркатор от июля  4, 2024, 19:11некоторые учетверенный лист А4
Для общего развития: этот формат называется A2. А в 2 раза больший, чем A4 — A3.

Цитата: Виктор Меркатор от июля  4, 2024, 19:11Современная глоттохронология загнала себя в угол
Вы только что признались, что забросили проект на 21 год, современной глоттохронологией не интересовались и судите по ней только по статье Касьяна 2019 года, о которой до того ничего не знали.
Не рановато ли так высокопарно судить и считать единственно себя "современным глоттохронологом"?
Может, стоит изучить ещё чьи-то исследования за 20 лет, да и с 2019-го 5 лет прошло.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

злой

Offtop
Цитата: Bhudh от июля  4, 2024, 21:50рассказы новохронологов о Глобальной Хронологической Карте (ГХК).

Цитата: с сайта по ссылке от Полная ГХК занимает очень большой объем.  Общая площадь этой карты составляет несколько десятков квадратных метров.

:D
Entre los individuos, como entre las naciones, el respeto al derecho ajeno es la paz.   - Benito Juárez

Виктор Меркатор

Цитата: Bhudh от июля  4, 2024, 21:50Да, у Вас маниакальность по другому вопросу: Вы свято уверены в верности вычислений по Вашему методу и потому даже не желаете их перепроверять.
Это ошибка выжившего называется, знаете ли.

Сами вычисления перепроверены. Там и сейчасранее обнаружил рисунок прежней версии, нумерация событий с 0, а в тексте с 1, кому нужно поймет, на то и препринт чтобы версию можно было заменить. Ответов же не меняет. а ошибки я и в печатных статьях прошедших рец. и ред. такие находил, что мама не горюй - 5 лет в Ed.B. межд. журнала пахал. Се челоек.

И Вы считаете, что это достоинство и преимущество? Ничего не знать о конкурирующих методах, о параллельных исследованиях, текущих достижениях... Это есть хорошо?

Да ни с кем я не конкурирую. Ушел из цеха, какое мне дело что там оставшиеся тачают.

У них другие результаты именно потому, что у них есть другие данные. В том числе у них есть древнегреческий и грабар, наличие которых и делает армянский не таким древним.
Но Вы почему-то уверены, что и без данных этих языков Ваши вычисления полностью верны. А это уже порочный круг в доказательстве: Вы принимаете за доказанные и подтверждённые результаты то, что следовало бы подтвердить и перепроверить.

Сказано же: данная версия для матрицы выживших языков. Древние оттого и умерли, что не явились хранителями вечного. Какой-то изначально дефект в них был, ошибка природы. А современные составляют систему, завершенную в себе.

Узнав что русский не восточный а укр. белор. западные, внутренне удивился, потом нашел конгениальные мнения. Не только лингвистические, но и из генетики. Хотя генетика меня не интересует. Хотя откуда знать наперед.

Есть единицы ампер вольт отчего бы не быть сводешам. Брать на веру с потолка скорость изменения и начинать вычисление дендрограммы с годов дурной вкус. Потом и начинают натягивать сову на глобус - менять постоянную, признавать ее непостоянной, подгонять под историю. А я истории не знаю или забыл. Дендрограмма строится в условных единицах, затем выясняется ее линейность, а на последнем этапе можно и округлить и посчитать в годах. Самое смешное совпадения до десятка лет когда римляне ушли из Британии, а заимствования совпали с точностью до 1 штуки с тем что насчитали знатоки.

А почему Вы уверены, что матрица Дайен-Краскала-Блэка абсолютно объективна? Она же для этих же целей создавалась.

Люди работали. А выборка 84 единицы приводит к компенсации отдельных погрешностей и повышению точности.

Насчет святости полевых данных. Пока невязки можно объяснить как имеющие лингвистическое значение (конвергенцию), зачем их отвергать как якобы погрешности? Именно так и делались - у Старостина Георгия (понятно по папе) четко написано - разные расстояния до 2 языков - берем среднее. А здесь не среднее берем - разница и есть заимствования. Гениально, Ватсон. Я же писал - никакой зауми, примитивно до безобразия. Яже приводил пример с муз. грамотой которой детишек мучают на уроках сольфеджио. Есть кварта есть квинта и баста. Если появились черные клавиши доп. к белым, ломайте старую систему и изобретайте новую. Ан нет, наизобретали интервалы малые, большие, а к этому еще и увеличенные и уменьшенные.
Насчет древних языков все сказано. Умерла значит умерла. Никакой доп. точности 5 языков с непоеределенным началом и концом не придадут. Удревнят дендрограмму за счет самих себя, до 10 тыс. лет дотягивают, но начиная с италийских самых древних из современных (про армянский пока забудем) точности не придадут. 

Погрешность не объявлялась достоинством и не списывалась на авторов матрицы. Возникла 1 раз отрицательная конвергенция -0,07 Св физически невозможная. 1 раз, Карл, из 80 значений. Бредовый метод набросал бы случайно 50% отрицательных конвергенций. При том что как писал для публики результаты округляются до 1 сводеша. Что есть 1 слово или 71 год дивергенции. ну и поморщиться можно если какой диалект признан созданным вчера. Опять в пределах погрешности, если ему максимум 100 лет. Но в статье сознательно неичего н огрублялось - может и правда у кого хватит духу в экселе вручную проверить. Хотя программу автоматического расчета написать можно быстрее.


Работа 2003 года не единственная, да и доклад фактически статья, она же в archiv.org  есть, а потом еще 5-6 статей пошло, там про конвергенцию точно написано. Хотя в валидности метода именно статья 2003 года убеждает - совпадение по 2 языкам сэлиш вычисленной независимо конвергенции.

Вы не могли бы уточнить, в какой именно момент "заброшенности" проекта Вы ввели вычисление этого параметра?

Ясно писано вычислялось по сэлишам в 2003 году. А заброшено ушел из лингвистики (где в шпрингере печатался, не так все плохо, и редакторстовал) в теорию тестов, страна призвала сами знаете для чего. ЕГЭ уже не наша работа, это другие. Моя система обработки матриц тестирования с извлечением из нее латентной переменной знания обучаемого и коррекции угадывания имхо лучшая в мире а если мы одни во вселенной то сами понимаете.

Прямо в браузере.

В граф. редакторе и созданы. 10 листов граф. приложений с дендрограммами. По понятным причинам не в тексте. Согласитесь, что дендрограмм в 2 измерениях вы никогда ранее не видели. И даже в 2004 году о них не слышали. Неужно можно возразить проитв того, что вбок от линии языка нарисовать сколько в нем заимствований? Это можно было сделать и при ручном поиске заимствований. Здесь же они извлекаются из матрицы. А поскольку в одном масштабе 1 Св и 50 Св (максимально возможная конвергенция армянского, по факту наверняка меньшая), на листке из школьной тетрадки не нарисуешь. Да и у иранских 45 Св, это уже точно.

Я же писал, что и к 2003 никого не читал, кроме Сводеша, из которого взял данные по сэлишам. Неужто не впечатляет? Все что до того было сделано бесконечные споры чему равна скорость и насколько она постоянна. И десятки дендрограмм которые Шлейхер до того нарисовал безо всяких сводешей.

А данная статья упрощение метода под современные языки большого количества. До того рисовались дендрограммы групп языков. По другим данным, не Дайена. 


Виктор Меркатор

Цитата: злой от июля  4, 2024, 22:29
Offtop
Цитата: Bhudh от июля  4, 2024, 21:50рассказы новохронологов о Глобальной Хронологической Карте (ГХК).

Цитата: с сайта по ссылке от Полная ГХК занимает очень большой объем.  Общая площадь этой карты составляет несколько десятков квадратных метров.

:D

Да оно и без фоменков все зависит от разрешающей способности. Если после Куликовской битвы рассказывать о Бородино, хватит листа А4.

Апропо 2-мерных дендрограмм на 10 листах от А4 до А2. Поскольку на каждой дендрограмме есть стержень - язык 52 (македонский) вокруг которого вертится вся ИЕ семья, можно эти 9 листов языковых групп нанизать на этот стержень "своим" 52 языком, сделать листы прозрачными чтоб ветви были видны, и развернуть каждый лист относительно соседнего на 40 градусов. Тогда вся ИЕ-стика уместится на табуретке. Можно даже сварную объемную конструкцию из толстой проволоки сделать, тогда бумаги не надо. А на конце проволоки шарик - язык - красота. Жаль конечно что вся конструкция стоять будет на италийских и армянских языках, без хеттов и тохаров, мне их реально жалко что не дожили и языки не сохранили. Полюбому гены сохранились и языки в других растоврились.

Bhudh

Цитата: Виктор Меркатор от июля  4, 2024, 23:15Древние оттого и умерли, что не явились хранителями вечного. Какой-то изначально дефект в них был, ошибка природы. А современные составляют систему, завершенную в себе.
Лингвисты говорят, что языки изменяются континуально. Английский язык сейчас совсем не тот английский, что был 100 лет назад. Русский язык сейчас не совсем тот, что русский 30 лет назад. И даже 10 лет назад.
Никакой завершённой в себе системы современных языков не существует, они представляют собой развитие тех самых древних языков, в которых Вы видите какой-то дефект. И продолжают развиваться.
Языки вымирают только вместе с носителями, а если у них есть потомки, которые продолжают язык: он продолжается в языках-потомках.

Цитата: Виктор Меркатор от июля  4, 2024, 23:15Узнав что русский не восточный а укр. белор. западные
Без данных древнерусского и старославянского.
Учитывая, что заимствования в русском в основном из последнего, вычёркивать его из наблюдения и считать вместо него "стволом" македонский несколько неразумно.

Цитата: Виктор Меркатор от июля  4, 2024, 23:15Я же писал - никакой зауми, примитивно до безобразия.
Так, может, Вам выложить весь код на GitHub, чтобы каждый мог взять и проверить?

Цитата: Виктор Меркатор от июля  4, 2024, 23:15Насчет древних языков все сказано. Умерла значит умерла. Никакой доп. точности 5 языков с непоеределенным началом и концом не придадут. Удревнят дендрограмму за счет самих себя, до 10 тыс. лет дотягивают, но начиная с италийских самых древних из современных (про армянский пока забудем) точности не придадут.
Докажите.
Вот прямо введите их данные в модель и проверьте. Вы учёный или где? Разве может учёный и исследователь позволять себе голословные заявления? Особенно когда есть простой способ их проверить?

Цитата: Виктор Меркатор от июля  4, 2024, 23:15Возникла 1 раз отрицательная конвергенция -0,07 Св физически невозможная.
Вот тут бы хотелось подробностей. Обычно появление "физически невозможных значений" выявляет явные недостатки модели.
Насколько вижу, это произошло с языком «Греческий MD». Как это расшифровывается и откуда появилась такая проблема?

Цитата: Виктор Меркатор от июля  4, 2024, 23:15А данная статья упрощение метода под современные языки большого количества.
Тут в чём закавыка.
Делать выводы о расхождении разных языков друг от друга и их языковом расстоянии друг от друга на основании вычисления данных современных языков можно.
А вот делать исторические выводы на основании данных только современных языков без привлечения данных исторических языков: это уже немного другой коленкор.
Можно взять современных рыб, рептилий и млекопитающих и попытаться построить им таблицу расхождений.
Но нельзя взять современных рыб, рептилий и млекопитающих и попытаться построить их общее генеалогическое древо, не привлекая динозавров и археоптериксов. Тут даже латимерия с гаттерией и ехидна с утконосом не спасут.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Agnius

Цитата: Виктор Меркатор от июля  4, 2024, 15:43Там языки древние, чего нет здесь
Это как раз у вас недостаток :pop:
 
Цитата: Виктор Меркатор от июля  4, 2024, 15:43Но зачем-то армяне обижены, не признается древность их праязыка. Их попусту объединили с греками, что многими или не всеми признается
Как второе противоречит первому?  ;D
 
Цитата: Виктор Меркатор от июля  4, 2024, 15:43Ну и сама постановка вопроса интересна - чем одна статья лучше другой. Да ничем - обе статьи хороши если там нет подлога натяжек или ошибок
Статья Касьяна на порядок приличнее, и где у кого больше цитируемости  :pop:
Цитата: Виктор Меркатор от июля  4, 2024, 15:43Много было колдовства со списками, работы со словами, что есть голимый субъективизм.
Так можно что угодно обозвать
 
Цитата: Виктор Меркатор от июля  4, 2024, 19:11Симбиоз, понятно, математик с лингвистом.

Метод Касьяна заумь, вопрос поможет ли сложнейшая математика, которая иллюстрируется размытыми графическими построениями (размытыми оттого что водятся вероятностные модели) разрулить субъективные данные лингвистических матриц, которые бесконечно составляются и ревизуются.
Касьян кстати там проходится по математикам в лингвистике  ;D
 
Цитата: Bhudh от июля  4, 2024, 21:50Это ошибка выжившего называется, знаете ли.
А где она тут? Сама ошибка крайне манипулятивна (я на этом вероятностный парадокс построил в другом разделе)  :pop: 

Bhudh

Цитата: Agnius от июля  5, 2024, 00:53А где она тут?
"Это у меня сработало, это у меня сработало, а данные, которые "для меня" бы не сработали, я не вводил, поэтому у меня ничего ничему не противоречит."
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Agnius

Цитата: Bhudh от июля  5, 2024, 01:09Это у меня сработало, это у меня сработало, а данные, которые "для меня" бы не сработали, я не вводил, поэтому у меня ничего ничему не противоречит."
А что значит "сработало"? Где фальсифицируемость? :pop:

Bhudh

Так тут субъективщина. В данном случае совпало с сводешевским анализом (удивительно, конечно, если по данным из его же статьи и делалось!) и более-менее совпало по славянским, ну, тут, конечно, экстраполировать данные по близкородственным языкам на дальнородственные это особый вопрос.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Виктор Меркатор

Цитата: Bhudh от июля  5, 2024, 01:23Так тут субъективщина. В данном случае совпало с сводешевским анализом (удивительно, конечно, если по данным из его же статьи и делалось!) и более-менее совпало по славянским, ну, тут, конечно, экстраполировать данные по близкородственным языкам на дальнородственные это особый вопрос.
О каком сводешевском анализе речь? У Сводеша 6 языков сэлиш, поскольку он постулировал, что при 10-15% совпадений метод не работает, разбил на 2 группы, и привел коэф. совпадения, никаких расстояний и т.б. годов не приводил.
Это было сделано по методу 2 координат, и поскольку 2 языка общие по 2 исследованиям, и выяснилось, что по этим 2 языкам конфигурации совпали, 2 дендрограммы были объединены.
Сделан вывод: случайное совпадение конфигураций по совершенно независимым наборам данных маловероятно, след закономерность в том, что модель валидна а данные Сврдеша достоверны. Одновременные невалидность модели и недостоверность данных возможны, но маловероятны. Не мог Сводеш (кажется, его жена была спец. по языкам аборигенов Америки) подгонять данные за 70 лет под будущую модель. Изменение на неск. процентов в доле совпадения разрушило бы совпадение. Кста где-то встречал у лингвистов, что они ошибку в 2-3 слова считают обычной. Отсюда еще раз: конвергенция вычисляется не по паре языков, а по всем 84, что улучшает точность в 9 раз, а ср. квадр. ошибку в 1 слово превращает в 0,1 слова. Даже 3 сигмы а лингвисты всегда считают размахом 2 сигмы не выводит ошибку за пределы 0,3 Св.
А методы по Байесу это перебор на компе миллионов вариантов (скажем, русский выводится из латыни) и просчет вероятностей вариантов исходя из данных, принимается наиболее вероятностный. Тем самым изначально закладывается что использование данных как точных невозможно. А в 2-мерных дендрограммах возможно.
Это примерно как намерили углы в треугольнике и 180 градусов не получилось. В топографии невязку разбрасывают по определенным правилам, а можно считать что данные точные но искривлено пространство. 2 разных идеологии.

Виктор Меркатор

Цитата: Bhudh от июля  5, 2024, 00:18Лингвисты говорят, что языки изменяются континуально. Английский язык сейчас совсем не тот английский, что был 100 лет назад. Русский язык сейчас не совсем тот, что русский 30 лет назад. И даже 10 лет назад.
Никакой завершённой в себе системы современных языков не существует, они представляют собой развитие тех самых древних языков, в которых Вы видите какой-то дефект. И продолжают развиваться.
Языки вымирают только вместе с носителями, а если у них есть потомки, которые продолжают язык: он продолжается в языках-потомках.

Ни о чем. Носителей латыни никто не завоевал и не убил. А язык умер.


Учитывая, что заимствования в русском в основном из последнего, вычёркивать его из наблюдения и считать вместо него "стволом" македонский несколько неразумно.

Не моя проблема что македонский как и таджикский или бретонский оказались некоторым образом на отшибе цивилизации. Дендрограммы можно было подправить за счет живых диалектов, но не вымерших языков. И центральным стволом оказались бы еще более косные диалекты. Хотя какая разница, язык или диалект. Остается произнести пошлую фразу что язык это диалект со флотом и армией. Пример голландский.

Так, может, Вам выложить весь код на GitHub, чтобы каждый мог взять и проверить?

В статье все формулы и даже сканы экрана экселя в 2 случаях с живыми цифрами которые проверяемы на предмет правильности взятия логарифмов, привет Неперу и Брадису.


Цитата: Виктор Меркатор от июля  4, 2024, 23:15Насчет древних языков все сказано. Умерла значит умерла. Никакой доп. точности 5 языков с непоеределенным началом и концом не придадут. Удревнят дендрограмму за счет самих себя, до 10 тыс. лет дотягивают, но начиная с италийских самых древних из современных (про армянский пока забудем) точности не придадут.
Докажите.
Вот прямо введите их данные в модель и проверьте. Вы учёный или где? Разве может учёный и исследователь позволять себе голословные заявления? Особенно когда есть простой способ их проверить?

Метод для современных языков и включение в него мертвых с неопределенным временем жизни есть тот же субъективизм что и ручное удаление заимствований. Мало мне того что лингвисты выписали себе индульгенцию на 3 ошибки в списке Сводеша. Полюбому придется вымершие языки экстраполировать на современность и затем обсчитывать, разбрасывая ошибку экстраполяции на конечные результаты. Чего тут проверять? Вы сомневаетесь, Вы проверяйте. Для практики восстановите прусский язык но не на момент вымирания а как если бы он дожил до наших дней и на нем писались романы. 

Цитата: Виктор Меркатор от июля  4, 2024, 23:15Возникла 1 раз отрицательная конвергенция -0,07 Св физически невозможная.
Вот тут бы хотелось подробностей. Обычно появление "физически невозможных значений" выявляет явные недостатки модели.
Насколько вижу, это произошло с языком «Греческий MD». Как это расшифровывается и откуда появилась такая проблема?

Вы в себе? Один раз 7 копеек на фоне 80 капиталов по 50 рублей? Если Вы не поняли написанного ранее, что появление 1 раз ничтожной отрицательной конвергенции в пользу метода, а не против него?
Еще раз к топографии: измерения производятся в поле, затем в камеральных условиях просчитываются. Всегда возникают невязки. Если они выше критерия, геодезисты отправляются перемерять. Если в пределах разрешенных, разбрасываются по меню. Невалидный метод, в котором то, что названо или считается конвергенцией, появляется от балды, давал бы нормально распределенные относительно 0 значения, и отрицательных было бы 50%.

Тут в чём закавыка.
Делать выводы о расхождении разных языков друг от друга и их языковом расстоянии друг от друга на основании вычисления данных современных языков можно.
А вот делать исторические выводы на основании данных только современных языков без привлечения данных исторических языков: это уже немного другой коленкор.

Странно. Десятки исследователей накинулись на даныне Дайена и лихо строили по расстояниям дендрограммы. Не встречал чтобы их за то упрекали.

Виктор Меркатор

 
Цитата: Виктор Меркатор от июля  4, 2024, 15:43Но зачем-то армяне обижены, не признается древность их праязыка. Их попусту объединили с греками, что многими или не всеми признается
Как второе противоречит первому?  ;


Греки древнее армян, в виду язык имеется. Понятно что особое положение армянского как и македонского объясняется их далекими предками которые и назывались по другому. Но развитие же шло непрерывно. Когда подросток превратился в юношу а юноша в дядю.

 
Статья Касьяна на порядок приличнее, и где у кого больше цитируемости 

Снимаю шляпу. Мои самые читаемые работы по 30-40 прочтений каждую неделю RG ведет статистику не сборник шпрингера или приличные заруб. журналы, а дипломная работа по диетологии (одно из образований, модель по биохимии касающаяся основного обмена и практические выводы для похудения любезных моему сердцу толстушек). Покажите мне безумца, который сошлется на ВКР. Кстати, старые ГОСТы на библиографию предполагали цитируемость ВКР, были примеры, в новейшем эта блажь искоренена, все знают что ВКР это рерайт ВКР прежних лет с целью повышения уникальности, а в последнее время работа ИИ - по рерайте или написанию с 0. Притом рерайт делается не самим выпускником, а биржей по его заказу, с разбивкой на части для разных исполнителей для скорости работы. Любому члену ГАК достаточно заглянуть в начало середину и конец ВКР чтобы понять что писано разными людьми и нет единой редакции. Но кто будет под себя любимого рыть? Есть незыблемые неписаные правила.   


Цитата: Виктор Меркатор от июля  4, 2024, 15:43Много было колдовства со списками, работы со словами, что есть голимый субъективизм.
Так можно что угодно обозвать

Так сами авторы тот же Касьян (писал Стариков) подробно описывает процедуру работы со списками, как поступать в сомнительных случаях и пр. Отсюда и выписываемая себе индульгенция на 3 ошибки.

 Касьян кстати там проходится по математикам в лингвистике 

Это противу правил. Пускай пример берет с журналистов - никогда не оценивать коллег по цеху. И правильно делают - нароют друг на друга такого что выноси святых. Арапов некогда работал в лингвистике. Потом каялся, отступником оказался. Он кстати замечательный анекдот придумал. Продавец спрашивает покупателя: вам газировку с соком или без? Ответ - без сока. Вопрос: А без какого сока - яблочного или апельсинового? Это было сказано по поводу того, что лингвисты по наличным текстам писателя или словарю одного произведения пытаются вычислить его потенциальный словарь. Зря уважаемый глумился. Я этим тоже занимался - по 4 частям Анны Карениной восстанавливал словарь Толстого. Все сошлось. 


 
Цитата: Bhudh от июля  4, 2024, 21:50Это ошибка выжившего называется, знаете ли.
А где она тут? Сама ошибка крайне манипулятивна (я на этом вероятностный парадокс построил в другом разделе) 
[/quote]

Есть такое дело. Проводится исследование, в него вкрадывается ошибка с вероятностью 10% которая выводит на значительный результат, открытие. Если проводить десятки исследований. то несколько бредовых будут опубликованы.

Виктор Меркатор

Цитата: Bhudh от июля  5, 2024, 01:09
Цитата: Agnius от июля  5, 2024, 00:53А где она тут?
"Это у меня сработало, это у меня сработало, а данные, которые "для меня" бы не сработали, я не вводил, поэтому у меня ничего ничему не противоречит."
Я не умею воскрешать мертвых (языков), оттого и не вводил. И не возникало соблазна после проведения анализа выкинуть те языки, которые не вписывались. Хотя в литературе встречал утверждение, что данные Дайена содержат ошибки. Где и какого рода не уточнялось. И на конф. лингвистов в Магдебурге в тех же 0-х годах мне устно сказали что данные грязноватые. Что тут сказать? 3 лингвиста в 60-90-х годах работали хуже при ручной обработке списков чем современные исследователи? Да и нельзя в матрицу дайен ввести еще 1 или 2 языка. обработанных по разным принципам. К 84 языкам они позднее приписали еще 12, продублировав славянские. При попытке построить дерево славянских языков с привлечением 12 языков и славянских из 84, получается дендрограмма с разнесенными 2 русскими, 2 польскими и пр. Оно бы ничего если бы это были разные диалекты. но утверждается что это все литературные языки. Во всем должна быть система, даже в системе внесения ошибок. 

Виктор Меркатор

Цитата: Agnius от июля  5, 2024, 01:14
Цитата: Bhudh от июля  5, 2024, 01:09Это у меня сработало, это у меня сработало, а данные, которые "для меня" бы не сработали, я не вводил, поэтому у меня ничего ничему не противоречит."
А что значит "сработало"? Где фальсифицируемость? :pop:
Метод фальсифицируем по Попперу, пример приводился. Скажем, много (за пределами стат. ошибок) отрицательных конвергенций, или отрицательных дивергенций. Или сильная восприимчивость к слабой раскачке - сознательно меняем на 1 % данные по 1 языку, и происходит катастрофа - вся дендрограмма преобразуется до неузнаваемости.
Подобная проверка была сделана в работе 2003 года по языкам сэлиш. После того как в 2 матрицах была выявлена одна и та же конвергенция 35 ед для пары языков, в одну из матриц была внесена погрешность +/- 4%, и конвергенция изменилась с 35 до 45 и 28 ед, что не позволило бы объединить 2 дендрограммы с общим звеном в одну. Т.е. и метод оказался рабочим, и данные Сводеша высоконадежны и согласованы.
С другой стороны, произвольное изменение данных не разрушило дендрограмму, просто она оказалась другой. А если бы ее не с чем было сравнивать, "ошибка" в данных и не была бы выявлена.

Виктор Меркатор

Обнаружил описку в своем тексте, время редактирования ушло. Написал что греки древнее армян по языку. Понятно что в виду имелась древность предшественников,и армянский древнее. А попытки свести армянский и греческий в одну группы были всегда, как и противников такого сведения было предостаточно. Но это по традиционным еще до глоттохронологии методам споры велись. 

Bhudh

Цитата: Виктор Меркатор от июля  5, 2024, 02:46Носителей латыни никто не завоевал и не убил. А язык умер.
Гляжу в книгу, вижу фигу.
Латинский язык не умер. Он развивался много веков и в конце концов развился в язык, который сейчас мы называем итальянским. Вернее, в кучу итальянских диалектов, некоторые из которых считаются отдельными языками (а диалектами называются только потому, что у них отдельных армии и флота нет).
Тот латинский язык, который пришёл с римскими легионами в Галлию, Испанию, Дакию, тоже развивался много веков и в конце концов развился в языки, которые мы называем сейчас французским, испанским, румынским. И у них тоже куча диалектов. И ни одному из них никто, в принципе, не мешал сохранить название «латинский язык» до сегодняшнего дня, и был бы сейчас "живой латинский язык". А Святой Престол говорил бы на "церковно-латинском" или "церковно-романском".
Вы принимаете название языка за сам язык, это распространённая семантическая ошибка.

Цитата: Виктор Меркатор от июля  5, 2024, 02:46Метод для современных языков
Что на это указывает?
Какая разница, когда язык существовал, если это просто какой-то язык?
Язык: это просто какая-то локализованная в пространстве и времени стадия существования общечеловеческой коммуникативной системы.
Можно нарезать английский язык на временны́е слои размером 10 лет и каждый такой слой в рамках эксперимента назвать «язык». И сравнивать между собой «английский язык 2010-х»,  «английский язык 2000-х»,  «английский язык 1990-х»... Просто обычно нарезают на слои побольше и называют их «древнеанглийский язык», «среднеанглийский язык», «ранненовоанглийский язык», «средненовоанглийский язык», «поздненовоанглийский язык». А это всего лишь стадии существования английского языка. И каждая стадия обладает своми особенностями и может давать особенные данные для исследователей, независимо от хронологического расположения.

Цитата: Виктор Меркатор от июля  5, 2024, 02:46В статье все формулы и даже сканы экрана экселя в 2 случаях с живыми цифрами
А, то есть Вы предлагаете вместо того, чтобы скачать архив, открыть IDEшку и запустить код, кропотливо перебивать цифирьки с картиночки ручками и писать собственные функции для реализации Ваших формул? Ну очень научное поведение. Я-то думал, учёные приветствуют развитие своих методов и предоставляют для этого оптимальные возможности...

Цитата: Виктор Меркатор от июля  5, 2024, 02:46Вы сомневаетесь, Вы проверяйте.
Где-то я это слышал... Ах да!

Только нет, в науке работает обратный принцип: «Бремя доказательства лежит на утверждающем». Вы утверждаете, что данные древних языков бесполезны и не повлияют на результат: Вы это будьте добры и доказать.

Цитата: Виктор Меркатор от июля  5, 2024, 02:46Один раз 7 копеек на фоне 80 капиталов по 50 рублей? Если Вы не поняли написанного ранее, что появление 1 раз ничтожной отрицательной конвергенции в пользу метода, а не против него?
Попробуйте прийти в банк и сказать, что ничтожная ошибка в −0.07 % это в Вашу пользу и поэтому банк должен Вам выплатить миллион рублей.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Agabazar

Цитата: Bhudh от июля  5, 2024, 04:13
Цитата: Виктор Меркатор от июля  5, 2024, 02:46Носителей латыни никто не завоевал и не убил. А язык умер.
Гляжу в книгу, вижу фигу.
Латинский язык не умер. Он развивался много веков и в конце концов развился в язык, который сейчас мы называем итальянским. Вернее, в кучу итальянских диалектов, некоторые из которых считаются отдельными языками (а диалектами называются только потому, что у них отдельных армии и флота нет).
Тот латинский язык, который пришёл с римскими легионами в Галлию, Испанию, Дакию, тоже развивался много веков и в конце концов развился в языки, которые мы называем сейчас французским, испанским, румынским. И у них тоже куча диалектов. И ни одному из них никто, в принципе, не мешал сохранить название «латинский язык» до сегодняшнего дня, и был бы сейчас "живой латинский язык". А Святой Престол говорил бы на "церковно-латинском" или "церковно-романском".
Вы принимаете название языка за сам язык, это распространённая семантическая ошибка.

Можно привести пример  за пределами Индоевропейской семьи?  :)
Очень часто  заявляют, что булгарский язык вымер. А между тем он вполне себе существует до сих пор. Правда, под другим названием. Причём, совершенно не важно, какими путями,  какими перипетиями судьбы  древний и средневековый булгарский язык стал современным чувашским языком.

Кстати, понятие «румынский» то же самое, что и «романский» = «латинский».

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр