Математические методы при определении близости (?) лингвистических явлений?

Автор Lassie, июля 26, 2011, 21:49

0 Пользователи и 1 гость просматривают эту тему.

Lassie

Обнаружила следующую давным-давно вышедшую статью о методе  определения синонимической близости глаголов (см. вложение). Заинтересовалась: а можно ли так? В том числе, смущают некоторые чисто математические моменты (к примеру, мне кажется, что кол-во информации J находится через ||х||, а ||х|| - через кол-во информации J), ну и область применения вызывает недоумение.
Есть ли профит лингвистический или эта методика схожа с подходом "чтобы избавиться от мышей, загоните всех мышей под шкаф и подрубите ножки"?

Artemon

За разнообразие в мире языков: //vk.com/lingvomir
    [li]Чёрное и белое - лишь условные абстракции. Но жить, навешивая ярлыки, куда проще.[/li]
    [li]Green ideas и глокая куздра сообщают, что главное – принцип. Слова меняются, модели остаются.[/li]
    [li]Хорошо кишинёвскому сыну тайца и египтянки.[/li]
    [li]Ругая эсперанто, предлагайте альтернативы. Многие в вашей стране смотрят голливудские фильмы без перевода?[/li]
    [li]Живой язык = мёртвый конланг + армия и флот.[/li]
    [li]Центру нужны единое мнение, единый язык и смиренные налогоплательщики.[/li]

RawonaM

Цитата: Artemon от июля 27, 2011, 03:11
С лексикой работать математическими формулами? Смело. :)
Математическими формулами можно с чем угодно работать.

Sirko

Математика - это инструмент. В физике он нужен и полезен. В астрологии - нет. Пока лингвистика находится на этапе именно псевдонауки, математика ей не поможет. Но близится светлое время! Настанет и на лингвистической улице праздник! Как ни прячтесь, а прогресс доберется и до вас!  :D

RawonaM

Цитата: Sirko от июля 27, 2011, 09:15
Пока лингвистика находится на этапе именно псевдонауки, математика ей не поможет.
На этапе псевдонауки она уже двести лет как не находится.
Математика ей поможет, но лингвисты не знают математику.

Валер

Цитата: RawonaM от июля 27, 2011, 08:53
Цитата: Artemon от июля 27, 2011, 03:11
С лексикой работать математическими формулами? Смело. :)
Математическими формулами можно с чем угодно работать.
Не с чем угодно нужно
Несолидарный. С войной, чем-либо, кем-либо.

Убить непросто. Убивать за свою страну намного легче.

RawonaM

Цитата: Валер от июля 27, 2011, 09:39
Цитата: RawonaM от июля 27, 2011, 08:53
Цитата: Artemon от июля 27, 2011, 03:11С лексикой работать математическими формулами? Смело. :)
Математическими формулами можно с чем угодно работать.
Не с чем угодно нужно
Но в данном случае нужно.
Нужно правильно собирать статистику из корпуса и/или от информантов.
Многие лингвисты пытаются делать то же самое просто наугад, не зная никаких математических методов, т.е. от балды.

Валер

Цитата: RawonaM от июля 27, 2011, 09:55
Цитата: Валер от июля 27, 2011, 09:39
Цитата: RawonaM от июля 27, 2011, 08:53
Цитата: Artemon от июля 27, 2011, 03:11С лексикой работать математическими формулами? Смело. :)
Математическими формулами можно с чем угодно работать.
Не с чем угодно нужно
Но в данном случае нужно.
Нужно правильно собирать статистику из корпуса и/или от информантов.
Многие лингвисты пытаются делать то же самое просто наугад, не зная никаких математических методов, т.е. от балды.
В данном случае возможно, не спорю
Несолидарный. С войной, чем-либо, кем-либо.

Убить непросто. Убивать за свою страну намного легче.

Lassie

Цитата: Sirko от июля 27, 2011, 09:15
Математика - это инструмент. В физике он нужен и полезен. В астрологии - нет. Пока лингвистика находится на этапе именно псевдонауки, математика ей не поможет.
Ну, это уж вы преувеличиваете.  :no: Лингвистика - наука.

Цитата: RawonaM от июля 27, 2011, 09:18
Цитата: Sirko от июля 27, 2011, 09:15
Пока лингвистика находится на этапе именно псевдонауки, математика ей не поможет.
На этапе псевдонауки она уже двести лет как не находится.
Математика ей поможет, но лингвисты не знают математику.
Не всегда можно с первого раза отличить зёрна от плевел :donno:
Вот мне и интересно: приведённый пример с расчётом близости слов - опус лингвиста, не знающего математику, или полезный инновационный, но пропущенный лингвистической общественностью подход?
По идее, можно выделить несколько свойств q и рассчитать близость чего угодно и чего угодно (можно автоматически, но степень соответствия признакам q нужно будет проставить вручную), а потом построить симплекс - и всё.  Но что полезного мы узнали, узнав численное выражение пресловутой  близости? Такую информацию только солить.
Формализация ради самого процесса :'(

RawonaM

Цитата: Lassie от июля 27, 2011, 10:49
Но что полезного мы узнали, узнав численное выражение пресловутой  близости? Такую информацию только солить. Формализация ради самого процесса :'(
Нет. Мы узнали много чего. Представьте себе алгоритм перевода, который подбирает синонимы к слову, которое уже было раньше, но чтобы не повторяться хочется выбрать другое.

RawonaM

Более того, все численные выражения нужны и необходимы просто. Ибо от простого перечисления синонимов смысла действительно никакого. А вот если синонимы с указанием их близости — это уже другое дело (плюс еще частотность употребления) и т.п.
Это все предстоит еще разрабатывать, но сейчас есть для этого инструменты, которых не было раньше. Почитайте Плунгяна о корпусной лингвистике, он затрагивал этот вопрос.

I. G.

Цитата: RawonaM от июля 27, 2011, 11:59
Почитайте Плунгяна о корпусной лингвистике, он затрагивал этот вопрос.
Он странно как-то говорит по-русски, хотя пишут, что он родился и вырос в Москве.   :???
...И мимимишечных круглышек,
Что безусловно хороши,
Но очень вредны для души.

Alone Coder




Alone Coder


RawonaM

Не понял? Научность не в количестве вообще-то. Корпус постоянно пополняется, через пять лет будет больше.
Есть корпусы других языков, они полнее.

Alone Coder

Всем известный товарищ говорит, что мы, дескать, не будем изучать то, чего нет в корпусе. Мол, раз Пушкин и газета "Известия" не использовали чего-то, то этого нет в русском.

RawonaM

Цитата: Alone Coder от июля 27, 2011, 12:31
Всем известный товарищ говорит, что мы, дескать, не будем изучать то, чего нет в корпусе. Мол, раз Пушкин и газета "Известия" не использовали чего-то, то этого нет в русском.
Он не так не говорил, но да, по конкретно этому пункту у меня тоже возникли возражения. Я хотел написать свои мысли об этом и в частности поднять этот вопрос тоже, но еще руки не дошли.

RawonaM

Только вы все же не внимательно прочитали или прослушали. Копрус должен включать все. Не Пушкина и газету "Извеситя", а абсолютно все. Если такого всего достаточно, то это уже другой разговор.

I. G.

ЦитироватьВладимир Плунгян: Если не брать в расчет теоретиков старой школы, я особенно оппозиции и не вижу.
Мне кажется, что он лукавит. Нейро-, психо-, когнитивные и др. лингвисты врядл ли выбросят мозг на помойку.   :what:
...И мимимишечных круглышек,
Что безусловно хороши,
Но очень вредны для души.

RawonaM

́
Цитата: I. G. от июля 27, 2011, 14:00
ЦитироватьВладимир Плунгян: Если не брать в расчет теоретиков старой школы, я особенно оппозиции и не вижу.
Мне кажется, что он лукавит. Нейро-, психо-, когнитивные и др. лингвисты врядл ли выбросят мозг на помойку.   :what:
А никто не предлагает выбрасывать.

Konay

Вообще математика отвечает на вопрос "сколько?", когда перебором что-то невозможно посчитать. А что в лингвистике такого, что нужно было бы посчитать?

RawonaM

Цитата: Konay от июля 27, 2011, 14:43
Вообще математика отвечает на вопрос "сколько?", когда перебором что-то невозможно посчитать. А что в лингвистике такого, что нужно было бы посчитать?
Все.

Ngati

Цитата: RawonaM от июля 27, 2011, 08:53
Цитата: Artemon от июля 27, 2011, 03:11
С лексикой работать математическими формулами? Смело. :)
Математическими формулами можно с чем угодно работать.
:UU:

ЦитироватьОценка степени характерности дистрибуций путем метода линейки

метод линейки представляет собой следующее:

    пусть у нас имеется некий язык Х.
    базовой лексикой я предлагаю называть наиболее древнюю лексику определенного языка Х.
    базовая лексика во всяком языке всегда имеет  намного бОльшую степень полисемии по сравнению с более новой лексикой. это выражается в том, что объем словарных статей, посвященных базовым лексемам, намного больше, чем объем статей, посвященных лексемам более новым.
    таким образом, измеряя линейкой длину текста словарной статьи, можно достаточно надежно выявить базовые лексемы (естественно, подразумевается, что все измерения проводятся по одному и тому же словарю, и что учитывается не абсолютная длина статьи в некоторых единицах измерения длины, а отношение длины данной словарной статьи к длинам других словарных статей).)

из того факта, что язык и культура суть изоморфные структуры следует, что для оценки относительной древности или распространенности артефактов/мемов/ритуалов может быть применен метод, сходный с "методом линейки", который применяется для выявления в словаре базовой лексики
чем больше времени в некоторой культуре существует данный артефакт, концепт или ритуал - тем более разработанным будет соответствующее семантическое поле, и чем менее свойственным артефакт/ритуал будет для данной культуры - тем менее разработанным будет его семантическое поле.

метод линейки предполагает не просто умозрительные оценки "хорошо разработано" и "плохо разработано", а оценки количественные - то есть расчет коэффициентов. например, коэффициент синонимии ядерного элемента семантического поля, коэффициент взаимозаменяемости синонимов, кэффициент предикативности, коэффициент субстантивности и т.д.

объектом применения вышеописанного метода могут быть и сами элементы культуры (артефакты/мемы и ритуалы) семантическое поле тогда будет выстраиваться на основании анализа функционирования артефакта/мема/ритуала в тех или иных ситуациях, а линейка - расчет коэффициента частотности/встречаемости, сочетаемости и пр.
matnaw rera 'apa ca 'osma 'ura nis kanto ko-rikin

係数で始まれば科学なり、係数で終われば簿記なり。

все на расчет коэффициента развития префиксации!

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр