Author Topic: ИЕ-хронология  (Read 1999 times)

0 Members and 1 Guest are viewing this topic.

Online yurifromspb

  • Posts: 655
« Reply #25on: November 19, 2016, 00:08 »
Пардон, а исходные данные - это значения, введенные в слоты старлинга кем-то и когда-то?
Да,  я имел ввиду исходные данные (матрица процентов совпадений), которую использовали для построения дерева. Всё что вы написали про трудности получения этих данных безусловно верно, и, конечно, "реальные данные, которые могут иметь, как минимум, несколько доп. значений и, как максимум, быть неверно интерпретированы фонетически и морфологически" были бы очень интересны, но я о только построении дерева. Уж очень мне сомнителен старостинский алгоритм (хотя я его не знаю, ориентируюсь по результатам: взять ту же топологию из заглавного сообщения - там ровная гребенка весьма красноречива, или можно сравнить деревья для романских языков, старлинговское и нормальное, по старлинговской же матрице (слева, числа надо на два умножать, чтобы сравнивать со стар. деревом)).
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Offline лад

  • Posts: 2371
« Reply #26on: November 19, 2016, 00:13 »
можно сравнить деревья для романских языков, старлинговское и нормальное,
"Нормальных" не существует, они все "ненормальные".

Offline Bhudh

  • Posts: 48597
  • aka 蝎
    • Сайты по языкознанию
« Reply #27on: November 19, 2016, 00:25 »
на примере английского
В транскрипции написано [ ̀ɔ:fn], а произносят краткий :down:.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Online yurifromspb

  • Posts: 655
« Reply #28on: November 19, 2016, 00:26 »
можно сравнить деревья для романских языков, старлинговское и нормальное,
"Нормальных" не существует, они все "ненормальные".
Я с математической точки зрения. Задача: из матрицы времён попарного расхождения получить дерево. Это ведь можно делать по разному. UPGMA, NJ и т.д. В нашем случае, думаю, вполне естественно сказать, что "нормальное" дерево - дерево удовлетворяющее принципу минимальной эволюции (на моей картинке именно такое дерево).
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Offline лад

  • Posts: 2371
« Reply #29on: November 19, 2016, 00:31 »
на примере английского
В транскрипции написано [ ̀ɔ:fn], а произносят краткий :down:.
Это все относительно, сам общался с американцем нэйтивом, который произносил офт(е)н, когда его спросили почему он так говорит ведь нас-то учили произносить оф(э)н, он так улыбнулся и помахал рукой...

Offline Alone Coder

  • Posts: 22548
    • Орфовики
« Reply #30on: November 19, 2016, 00:49 »
Задача: из матрицы времён попарного расхождения получить дерево.
Где взять матрицу?

Online yurifromspb

  • Posts: 655
« Reply #31on: November 19, 2016, 00:57 »
Где взять матрицу?
С этим тоже проблемы  :tss: (статью Старостина мы уже здесь обсуждали).
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Offline Tibaren

  • Global Moderator
  • *
  • Posts: 8591
« Reply #32on: November 19, 2016, 01:26 »
на примере английского
В транскрипции написано [ ̀ɔ:fn], а произносят краткий :down:.
:donno: Дык чукча вродь спрашивал про слоговые сонанты...
Hizkuntza aldian hibaian zehar hibia da (c)

« Reply #33on: November 19, 2016, 01:33 »
сам общался с американцем нэйтивом, который произносил офт(е)н,
) Вы знаете, мне тоже доводилось слышать "акцент" нативных американцев, от на-дене до кечуа... Там может призноситься и как 'ыф'ын, и как йоптэн...
Hizkuntza aldian hibaian zehar hibia da (c)

« Reply #34on: November 19, 2016, 01:36 »
Где взять матрицу?
С этим тоже проблемы  :tss: (статью Старостина мы уже здесь обсуждали).
Напишите мне в личку.
Hizkuntza aldian hibaian zehar hibia da (c)

Online yurifromspb

  • Posts: 655
« Reply #35on: November 19, 2016, 01:56 »
Пардон, а исходные данные - это значения, введенные в слоты старлинга кем-то и когда-то? Или реальные данные, которые могут иметь, как минимум, несколько доп. значений и, как максимум, быть неверно интерпретированы фонетически и морфологически?

Зашёл из ностальгичиских соображений на старлинговскую страничку лексикостатистики, откуда я брал матрицу для романских языков, оттуда прошёл по сыллке в их фейсбучную группу, а там иллюстрация:
Quote from: Dmitry Leshchiner
А почему "two subdialectal varieties of one language and two very closely related dialects in another branch", если расчет (fixed rate -- при variable, еще больше) показывает 1250 лет расхождения между Makléw и Welbuti - и 2350 между Jélmèk и Jabsch?
Quote from: George Starostin
Хороший вопрос. Дело в том, что там почти везде не очень понятно, насколько аккуратно составлялись списки. Где-то это, вероятно, настоящие лексикостатистические расхождения, но в куче мест могут быть просто неверные слова (по крайней мере, так это комментирует Ашер, составлявший списки).
:E:
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Offline Nevik Xukxo

  • Posts: 43679
« Reply #36on: November 19, 2016, 09:53 »
Не берите в голову папуасщину. Там, наверное, зачастую только списками Сводеша и оперируют, без более широких этимологических словарей, которых обычно там и нет.
Думаю, там больше похоже на массовое сравнение, чем на нормальную лексикостатистику. :umnik:

Offline Rusiok

  • Posts: 2637
« Reply #37on: November 19, 2016, 10:29 »
Вот так получилось, так и нарисовал.
Недоумений, конечно, вызывает массу, но для первого приближения вполне приличное дерево, если действительно, использовалась только глоттохронология.
"проект предлагал сократить разговорную речь путем сведения многосложных слов к односложным и упразднения глаголов" - Джонатан Свифт. Путешествие в Бальнибири

Offline лад

  • Posts: 2371
« Reply #38on: November 19, 2016, 13:00 »
Вот так получилось, так и нарисовал.
Недоумений, конечно, вызывает массу, но для первого приближения вполне приличное дерево, если действительно, использовалась только глоттохронология.
Деревьев "второго приближения" в природе не существует ни по одному языку. Уж извините, это просто невозможно, нет никакой методики хоть как-то проверить валидность деревьев и критериев, что же надо улучшить. А в той работе, из которого выдрано это дерево, самих деревьев и.-е. языков множество, а это только одно из них построенное по глоттохронологии. Практически все они вызывают недоумений никак не меньше.

Offline Alone Coder

  • Posts: 22548
    • Орфовики
« Reply #39on: November 19, 2016, 23:49 »
Надо раздельные матрицы сравнения первобытной лексики (камень, вода, волк итп), лексики эпохи медного века и ранних государств (лошадь, пшеница, колесница итп), лексики железного века (меч, плуг, стремя итп). Хронология известна по археологии. Значит, можно будет видеть по этапам, как контактировали языки. Есть такие матрицы?

Online yurifromspb

  • Posts: 655
« Reply #40on: November 20, 2016, 02:59 »
Уж очень мне сомнителен старостинский алгоритм (хотя я его не знаю, ориентируюсь по результатам: взять ту же топологию из заглавного сообщения - там ровная гребенка весьма красноречива, или можно сравнить деревья для романских языков, старлинговское и нормальное, по старлинговской же матрице (слева, числа надо на два умножать, чтобы сравнивать со стар. деревом)).
Про ровность гребенки я несколько погорячился. Т.е., я уверен, что она "ровная", но на картинке из заглавного сообщения этого не видно, т.к. она обрезана справа. Я этого сначала не заметил. Ладно, я не хочу запутать читателей непонятными фразами, тут надо довольно много писать каким должно и каким не должно быть хорошее дерево, построенное по матрице расстояний. В общем, мне видится так, что Старостин перевёл какие-то свои личные представления об этом в программный код. И эти представления, по-видимому, мало связаны со всем, что математики выяснили о связи матрицы расстояний с деревом. Повторюсь, тут можно и нужно многое написать, но это большой труд.
Короче, ограничусь ещё одной иллюстрацией с небольшим комментарием. Это почти те же самые романские языки с того же самого сайта: http://starling.rinet.ru/cgi-bin/response.cgi?root=new100&morpho=0&basename=new100\ier\rom&limit=-1



Слева - дерево построенное алгоритмом с сайта, справа - дерево минимальной эволюции по матрице расстояний, согласно закону Сводеша с константой 0.14.
В сравнении с более ранней картинкой языков стало больше. Как и на предыдущей картинке можно заметить что старостинский алгоритм тасует пучок похожих языков довольно своеобразно. Например, можно посмотреть группу французского на старлинговском дереве и на дереве минимальной эволюции. Видно, что на дереве МЕ французский с близкими ему языками, включая старофранцузский расположены одной группой, а на старлинговском дереве эта группа разбита на две части и смешана с кусками какой-то другой группы. Здесь интересно послушать специалиста по романским языкам. Т.е., даже оценка времени дивергенции по Сводешу даёт более осмысленную топологию, если её использует математически корректный алгоритм. Формулу Старостина я применять не стал, т.к. не могу корректно применить её для разновременных языков, объяснять - долго (старлинговцы могут, ну и молодцы).
Ещё одна интересная деталь. В базе старлинга появилась классическая (Апулей) и архаическая (Плавт) латынь. Между ними 0.69 совпадений и 350 лет разницы. По Сводешу это даёт константу ~1. Один, Карл! 105 слов за тысячу лет. Это меня удивило, прямо скажем.
Тем не менее, на Старлинговском дереве арх. и класс. латыни спокойно прибиты гвоздиком там, где им место по хронологии. Это, конечно, похвальное использование известных возрастов, но вызывает вопросы и к методу и к данным. Стоило ли включать такие данные в базу?
Что такое с латынью произошло за три века, кто знает?
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

 

With Quick-Reply you can write a post when viewing a topic without loading a new page. You can still use bulletin board code and smileys as you would in a normal post.

Note: this post will not display until it's been approved by a moderator.
Name: Email:
Verification:
Type the letters shown in the picture
Listen to the letters / Request another image
Type the letters shown in the picture:
√49 Напишите ответ строчными буквами:
«Сто одёжек, все без застёжек» — что это?: