Лингвофорум

Теоретический раздел => Общая лингвистика => Структура языков => Тема начата: gasyoun от мая 21, 2014, 11:42

Название: Сколько морфем в разных языках мира?
Отправлено: gasyoun от мая 21, 2014, 11:42
В арабском языке 2967 трехбуквенных корней (по http://flaez.ch/arabwrz.html).
В санскрите от 580 до 3693 шт. корней.
При намеренно не сужаемом корпусе текстов количество корней варь-ирует от 580 до 3693 шт. (от числа 7 946 834 теоретически возможных, то есть почти восемь миллионов  корней). Сравнить с английским хотел бы (помню в приложении к Duden была статистика по немецкому в Fremdsprache словаре, не помню в каком только, 2004 г. кажется, но нет его под рукой), или любой другой 3й язык бы подобрать. Но не знаю, где брать истончики, гуглиться слабо.
Сколько глагольных корней в разных языках мира? Сколько всего глагольных всяких образований теоретически можно образовать от кажого глагола (грубо, округляя)?
По http://languages.garshin.ru/nostratic/indo-european/slavic/east-slavic/russian-words.html в "Словаре Академии Российской" (1789-1794) содержится несколько более 42 000 слов, в "Словаре церковнославянского и русского языка", изданного Академией наук в 1847 году, представлено уже около 115 000 слов, а в 17-томном "Словаре современного русского литературного языка" (1948-1965) - 120 480 слов [в английском - полмиллиарда, или даже 1 миллиард слов]. Всего в русском языке более 56 млн. языковых сочетаний.
На основе 21 словаря санскита в моем конордансе 260 000 слов.
Единственная ветка более менее на тему А сколько в русском языке морфем? (http://lingvoforum.net/index.php?topic=31363.0)
Название: Сколько морфем в разных языках мира?
Отправлено: Солохин от мая 21, 2014, 12:03
По моим наблюдениям, в языках порядка 5000 реально употребляемых морфем, из которых наиболее частотных и продуктивных - порядка 600-800.
Название: Сколько морфем в разных языках мира?
Отправлено: gasyoun от мая 21, 2014, 12:19
Да, есть такое, однако хочется получить более четкие цифры и по возможности даже библиографические ссылки или ссылки на спарсенные тексты, где нечто похожее можно посчитать на корпусе текстов любового (просто нужен 3й) языка.
Название: Сколько морфем в разных языках мира?
Отправлено: Rwseg от мая 21, 2014, 15:41
Цитата: gasyoun от мая 21, 2014, 11:42
[в английском - полмиллиарда, или даже 1 миллиард слов]
Хватит же журналистские сенсации тиражировать.
Название: Сколько морфем в разных языках мира?
Отправлено: gasyoun от мая 21, 2014, 15:45
У Вас есть точнее цифра - welcome. За что купил, за то продал - копипаст. Сколько слов в английском языке?
Название: Сколько морфем в разных языках мира?
Отправлено: Rwseg от мая 21, 2014, 16:23
Цитата: gasyoun от мая 21, 2014, 15:45
У Вас есть точнее цифра - welcome. За что купил, за то продал - копипаст. Сколько слов в английском языке?
Ну если вы сравниваете словари, то один из самых больших (http://public.oed.com/history-of-the-oed/dictionary-facts/) 291,5/231,1 тыс. И то потому что в английские словари пихают все абсолютно слова (архаизмы, диалектизмы, сленг, термины и т.д. как раз около 60 тыс.). А в русских или французских лишь самые основные. В итоге в самом большом французском Le Grand Robert 75-100 тыс.
Название: Сколько морфем в разных языках мира?
Отправлено: gasyoun от мая 21, 2014, 18:39
Сравниваю словари за отсутствием лучшего метода. Сравнивать санскритские тексты (нерасчлененные тем более) с другими языками - представляю с трудом. В моем санскритском сводном списке 269054 слов. Статистика Le Grand Robert по памяти, или прямо в книге пишут? Насчет "около 60 тыс." - без вычета определенных меток считали?
Название: Сколько морфем в разных языках мира?
Отправлено: Rwseg от мая 21, 2014, 18:55
Цитата: gasyoun от мая 21, 2014, 18:39
Сравниваю словари за отсутствием лучшего метода.
Словарей на полмиллиарда слов не существует. Даже полмиллиона — это реально гигантический словарь.

Цитата: gasyoun от мая 21, 2014, 18:39
В моем санскритском сводном списке 269054 слов.
Это леммы или просто любые словоформы?

Цитата: gasyoun от мая 21, 2014, 18:39
Статистика Le Grand Robert по памяти, или прямо в книге пишут?
Прямо пишут.

Цитата: gasyoun от мая 21, 2014, 18:39
Насчет "около 60 тыс." - без вычета определенных меток считали?
По ссылке выше.
Название: Сколько морфем в разных языках мира?
Отправлено: gasyoun от мая 21, 2014, 19:13
В моей список входит все слова из всех доступных словников санскрита. Я бы не сказал, что это прямо любые словоформы, но для отдельных частей речи момент повторов не исключен. А Оксфордский список заглавных слов доступен где-то для скачывания?
Название: Сколько морфем в разных языках мира?
Отправлено: Rwseg от мая 21, 2014, 22:49
Я не видел. Но можно выскрести список из словаря Лингво. Но для этого нужно программировать уметь.
Встречал только частотные списки до 100 тыс.
Название: Сколько морфем в разных языках мира?
Отправлено: gasyoun от мая 22, 2014, 01:12
131 257 слов в БАС из 2936 корней в русском языке.
269054 в сводном словнике из 3689 корней в санскрите.
273,000 в OED из ? корней в английском языке.
330,000 в DWB из ? корней в немецком языке.
500,000 в LKŽ из ? корней в литовском языке.