основы компаративистики: Verbal Grammar Correlation Index

Ettok Dirim · сентября 20, 2017, 01:04

Предварительные замечания (конспективно)

Почему компаративистика должна уделять основное внимание структурам, а не лексике и не фонетике

Сравнение языков на предмет установления родства должно обращаться прежде всего к грамматическим структурам сравниваемых языков. Сравнением лексики и установлением "регулярных фонетических соответствий" без корреляции грамматических структур доказать ничего нельзя. То есть, говорить о каких-то фонетических соответствиях можно только после установления корреляции структур. По большому счету же РФС вообще не являются необходимыми, потому что достаточно установить корреляцию чистых структур без рассмотрения материальных экспонент вообще. Сравнение языков путем сравнения случайным образом выбранных списков лексики и постулирования затем некоторых РФС на деле приводят к тому, что различные люди пользуясь этой "методой" умудряются классифицировать один и тот же язык совершенно разным образом, так, например: айнский язык пытались притянуть к алтайской семье (Patrie), к австронезийской (Мураяма), к аустроазиастской (Vovin), шумерский пытались тянуть к уральским языкам (Парпола), к аустроазиатским (Дьяконов), к сино-тибетским (Braun) - все эти товарищи ни в коем случае не считаются фриками, а наоборот, хотя сам факт того, что они пользуясь сходной методикой пришли к совершенно различным выводам скорее является достойным фактом не столько науки сколько сюжетом для водевиля. Пользуясь различными методами можно прийти к разным выводам относительно одного и того же материала, но когда люди пользуются одним и тем же методом, то ожидается, что их выводы будут сходными, однако же мы этого не наблюдаем, что вполне хорошо говорит о полнейшей негодности методики основанной на сравнении лексики и поиске регулярных фонетических соответствий. (Тут адепты лексического метода обычно возражают, что они также сравнивают и грамматические морфемы тоже, но все дело в том, что они их сравнивают точно также как лексику, забывая о том, что морфема состоит из трех компонент: значения, позицию и только в третью очередь материальной экспоненты. Таким образом эти возражения нельзя воспринимать всерьез.)
Следует иметь в виду, что РФС могут появиться в результате заимствований, и если не знать историю сравниваемых языков(а зачастую это просто невозможно), то вполне можно, например, сравнивать японский и кантонский, и обнаружить, что они родственны: если бы не существовало других синитичексих языков и других языков пуёсской группы, то непременно бы появились деятели пытающиеся доказать родство кантонского и японского.
Также следует отметить, что есть языки фонетика которых невосстановима в принципе, например: шумерский, и при сравнении этих языков с какими-либо другими языками любые попытки сравнивать материальные экспоненты должны быть совершенно оставлены, то есть, должны быть инструменты позволяющие сделать вывод о родстве языков путь сравнения чистых структур.

Подробнее о том почему для компаративистики структуры важнее других элементов языка см.: Alexander Akulov. 2015. Why conclusions about genetic affiliation of certain language should be based on comparison of grammar but not on comparison of lexis? Cultural Anthropology and Ethnosemiotics Vol. 1, № 3; pp.: 5 - 9

P.S.: доброжелательная критика приветствуется.

P.P.S.: "критика", то есть, бессодержательные замечания имеющие своей целью троллинг будут беспощадно выпиливаться

Ettok Dirim · сентября 20, 2017, 01:30

Почему возможно доказать неродство

В современной лингвистике и окололингвистических кругах почему-то распространено поветрие, что доказательство неродства невозможно. На самом деле такая точка зрения входит в противоречия с фундаментальными принципами логики бинарных отношений. Отношение "состоять в родстве"/"быть родственным" является отношением эквивалентности, потому что удовлетворяет трем основным требованиям предъявляемым к бинарному отношению, претендующему на то, чтобы быть эквивалентным:

a) рефлексивность: a ~ a;

b) симметричность: если a ~ b, то b ~ a;

c) транзитивность: если a ~ b и b ~ c, то a ~ c

Всякое отношение эквивалентности необходимо разбивает множество, на котором оно задано, на некоторое число непересекающихся классов эквивалентности, и после разбиения на классы всегда имеется возможность совершить следующую операцию: указать элемент не входящий в данный класс.
Таким образом, отношение родства по определению разбивает множество языков на определенные классы (языковые семьи).

Отношение неродства является иррефлексивным, но симметричным и транзитивным (если языки А и B родственны, но при этом А не родственен C, то C и B тоже неродственны).
Подробнее см.:

Alexander Akulov. 2015. Whether is it possible to prove genetic unrelatedness of certain languages? Cultural Anthropology and Ethnosemiotics Vol. 1, № 3; pp.: 2 - 4
https://www.academia.edu/16201516/Whether_is_it_possible_to_prove_genetic_unrelatedness_of_certain_languages

Brown Simon. 2015. A bioimformatic perspective on linguistic relatedness. Cultural Anthropology and Ethnosemiotics, Vol.1, N 4: 43 - 52.
https://culturalanthropologyandethnosemiotics.wordpress.com/2015/12/14/caes-vol-1-№-4/

Ettok Dirim · сентября 20, 2017, 02:11

Общие теоретичексие основы метода Verbal Grammar Correlation Index (далее VGCI)

Как было сказано выше, язык - это прежде всего грамматическа система. Грамматика - это упорядоченная пара следующего вида: < A; Ω >, где A - это множество грамматических значений, а Ω - это множество позиционных дистрибуций определенных на A.
Степерь близости грамматических систем можно определить, определяя степень близости множеств грамматических значений и множеств позиционных дистрибуций, а затем взять суперпозицию обоих индексов.
Представляется достаточно очевидным, что чем более близки языки, тем выше у них будет значение индекса корреляции: языки являющиеся более близкими родственниками имеют больше общих грамматичексих значений и эти значения имеют более сходные позиционные выражения; языки, которые являются более дальними родственниками имеют меньше общих значений и эти общие значения имеют менее сходные позиционные реализации.

Основная идея метода VGCI и ее значение для компаративистики

Было предроложено, что существуют определенное пороговые значения индекса корреляции, которые определяют границы семей, то есть, если некое значение индекса корреляции выше порогового значения, то сравниваемые языки являются родственными, если значение меньше, то сравниваемые языки не являются родственными.
Предполагалось, что сравнив дальнеродственные языки из надежно собранных семей, можно выявить эти пороговые значения индекса корреляции (то есть, пороговое значение - это то значение, которое будут демонтрировать дальние родственники), и потом это пороговое значение может быть приложено к языкам, внешние связи которых не установлены с чем, чтобы увидеть связаны ли они с теми или иными языками.
Пороговые значения были выделены при сравнении между собой дальнеродственных языков таких семей как австронезийская, индоевропейская, сино-тибетская (подробнее об этом ниже).

Следует специально отметить, что данный метод предполагает прямое сравнение языков существующих или существоваших в реальности, то есть, не предполагается проведение каких-либо реконструкций, которые зачастую являются конлангерством и основаны на принципе "художник так видит" и не могут быть как-либо проверены.

Также следует специально ометить, что метод не уделяет никакого внимания материальным экспонентам, то есть, метод предполагает сравнение только значений и позиционных реализаций. Это не следует воспринимать как ответ радикальным адептам лексикостатистического метода, которые злостно игнорируют структурыные вопросы, а просто как вопрос практического удобства, поскольку установление регулярных фонетических корреляций при работе с языками, которые предполагаются дальними родственниками, может быть достаточно затруднительно. То есть, метод нацелен на то, чтобы доказывать родство/неродство путем сравнения множеств значений и множеств позиционных реализаций *путем сравнения чистых структур).
Последний пункт особенно важен в случае работ с такими языками как, например, шумерский или хаттский, иначе говоря, с древними языками, чья фонетика далеко не всегда может быть реконструирована удовлетворительным образом и зачастую не может быть реконструирована вообще.
Пример шумерского есть как раз тот самый случай, где любое сравнение материальных экспонент должно быть совершенно оставлено, и где все выводы о возможном родстве должны делаться исключительно на основе анализа чистых структур.

Почему метод уделяет внимание исключительно глагольной грамматике

Потому что глагольная грамматика является гораздо более универсальной, чем грамматика существительного. Существует масса языков с очень бедной грамматикой существительного, в то время как не бывает языков без глагольной грамматики, то есть, существуют языки без падежей и грамматических родов/именных классов, но не бывает языков без видо-временных форм, наклонений, и модальностей (даже языки, которые являются очень близкими родственниками могут различаться достаточно серьезно в этом аспекте, например: в английский и немецкий: в немецком есть три рода и падежи, а в английском ничего такого нет). Вот поэтому именно глагольная грамматика, то есть, грамматические значения выражаемые в глаголе рассматриваются как становой хребет и основа сравнительного метода.

Ettok Dirim · сентября 20, 2017, 02:42

Схема расчета VGCI

Представим что у нас есть два модельных абстрактных языка: X и Y.

X описывается следущими множествами
A_X (множество грамматических значений X) выглядит следующим образом: {x₁, x₂, x₃, _x4, x₅, _x6};
Ω_X (множество позиционных дистрибуций грамматичексих значений X) выглядит следующим образом: {x₁→p₁; x₂→p₁,p₂; x₃→p₂; x₄ →p₂, p₃; x₅→p₄; x₆→p₅}

Y описывается следующими множествами:
A_Y (множество грамматичексих значений Y) выглядит следующим образом: {y1, y2, y3, y4, y5}
Ω_Y: (множество позиционных дистрибуций Y) выглядит следующим образом: {y1→p1; y2→p1,p2; y3→p2, y4 →p5, p3; y5→p4}

Можно измерить индекс корреляции X и Y следующим образом:
1) оценить индекс корреляции A_X и A_Y (чтобы проделать это следует найти пересечение множеств A_X и A_Y, затем найти отношение числа элементов перечения к числу элементов каждого из сравниваемых множеств, а затем взять арифметическое среднее обоих получившихся значений);
2) оценить индекс корреляции позиционных дистрибуций грамматических значений принадлежащих к пересечению A_X и A_Y;
3) взять суперпозицию двух индексов, потому что множества значений и множества дистрибуций должны быть скоррелированы одновременно.

Индекс корреляции A_X и A_Y выглядит следующим образом: пересечение A_X и A_Y: {y1, y2, y3, y4, y5}, положим, что все элементы A_Y скоррелированы с первыми пятью элементами A_X, таким образом пересечение состоит из 5 элементов и, таким образом, отношения пересечения к числу элементов в каждом из сравниваемых множеств составляют: 5/6 и 5/5, и затем среднее арифметическое: (5/6 + 5/5)/2 ≈ 0.9.

Индекс корреляции позиционных реализаций элементов, принадлежащих пересечению A_X и A_Y определяется следующим образом:

x₁: p₁ ↔ y₁: p₁ - позиционные дистрибуции идентичны, индекс корреляции 1;
x₂: p₁, p₂ ↔ y₂: p₁, p₂ - позиционные дистрибуции идентичны, индекс корреляции 1;
x₃: p₂, ↔ y₃: p₂ - позиционные дистрибуции идентичны, индекс корреляции 1;
x₄: p₂ ≠ y₄: p₅ - позиционные дистрибуции не сходны, индекс корреляции 0;
x₅: p₄ ↔ y₅: p₄ - позиционные дистрибуции идентичны, индекс корреляции 1;

Теперь, чтобы оценить индекс корреляции позиционных реализаций следует взять среднее арифметическое индексов корреляции полученных для каждого отдельного значения: (1+ 1+1+0+1)/5 = 0.8.

И, наконец, чтобы получить индекс корреляции X и Y следует взять суперпозицию индекса корреляции множества значений и индекса коррелцяии позиционных реализаций, потому как и значения и позиции должны быть скоррелированы одновременно: 0.9*0.8 = 0.72.

Резюмируя все вышесказанное можно представить схему расчета VGCI в виде следующей формулы

Ettok Dirim · сентября 20, 2017, 02:56

Пороговые значения VGCI

VGCI (English; Russian) ≈ 0.52;
VGCI (English; Lithuanian) ≈ 0.43;
VGCI (English; Latin) ≈ 0.41;
VGCI (English; Persian) ≈ 0.38;
VGCI (Khmer; Vietnamese) ≈ 0.53;
VGCI (Hawaiian; Lha'alua) ≈ 0.39;
VGCI (Chinese; Tibetan) ≈ 0.39.

С другой стороны VGCI на материале неродственных языков дает следующие значения

VGCI (Chinese; English) ≈ 0.32;
VGCI (Chinese; Latin) ≈ 0.3;
VGCI (Khmer; Latin) ≈ 0.29;
VGCI (English; Tibetan) ≈ 0.13.

Таким образом, если значение VGCI около 0.4 иливыше 0.4 then, то языки родственны (то есть, принадлежат к одной семье),
если значени VGCI около 0.3 или ниже 0.3, то языки неродственны.
Погрешнотсь составляет около 2%.
То есть, такие значения как 0.39 или 0.38 являются вариантами 0.4; в то время как 0.31 или 0.32 вариантами 0.3.

Вероятность случайного совпадения двух языков составляет примерно 10^-19

подробнее о пороговых значениях, об оценке погрешности, оценки вероятности случайного совпадения см. Alexander Akulov. 2015. Verbal Grammar Correlation Index (VGCI) method: a detailed description. Cultural Anthropology and Ethnosemiotics, Vol.1, № 4; pp.: 19 - 42 https://www.academia.edu/19645637/Verbal_Grammar_Correlation_Index_VGCI_method_a_detailed_description

Ettok Dirim · сентября 20, 2017, 03:04

по сути дела, в методологии VGCI языки представляются как матрицы, см. приложенную картинку, наглядно показывающую сравнение грамматики японского с корейским.
(лингвистика, сравнение языков - это не игра в бисер с лексикой, это анализ матриц/векторов)

подробнее о применении VGCI к корейскому и японскому см.: Alexander Akulov. 2016. Prefixation Ability Index and Verbal Grammar Correlation Index prove the reality of Buyeo group. Acta Linguistica Asiatica, Vol 6, No 1, pp.: 81 - 97 https://revije.ff.uni-lj.si/ala/article/view/5503

Ettok Dirim · сентября 20, 2017, 03:10

другие работы с применением VGCI:

Alexander Akulov. 2016. The idiom of Phaistos disc seems to be a relative of Hattic language. Cultural Anthropology and Ethnosemiotics, Vol 2, № 4; pp.: 28 - 39 https://www.academia.edu/30407242/The_idiom_of_Phaistos_disc_seems_to_be_a_relative_of_Hattic_language

Alexander Akulov. 2016. Whether Sumerian language is related to Munda? Cultural Anthropology and Ethnosemiotics, Vol. 2, № 3; pp.: 23 - 29 https://www.academia.edu/28687151/Whether_Sumerian_language_is_related_to_Munda

Alexander Akulov. 2016. Ainu is a relative of Sino-Tibetan stock (preliminary notes). Cultural Anthropology and Ethnosemiotics, Vol. 2, № 2; pp.: 31 - 38 https://www.academia.edu/25865947/Ainu_is_a_relative_of_Sino-Tibetan_stock_preliminary_notes_

Alexander Akulov. 2015. Ainu and Great Andamanese are relatives (proved by Prefixation Ability Index and Verbal Grammar Correlation Index). Cultural Anthropology and Ethnosemiotics, Special Issue, October 2015; pp.: 1 – 24 https://www.academia.edu/17234105/Ainu_and_Great_Andamanese_are_relatives_proved_by_Prefixation_Ability_Index_and_Verbal_Grammar_Correlation_Index_

Лингвофорум

основы компаративистики: Verbal Grammar Correlation Index

Ettok Dirim

Ettok Dirim

Ettok Dirim

Ettok Dirim

Ettok Dirim

Ettok Dirim

Ettok Dirim

Быстрый ответ