Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Сколько морфем в разных языках мира?

Автор gasyoun, мая 21, 2014, 11:42

0 Пользователи и 1 гость просматривают эту тему.

gasyoun

В арабском языке 2967 трехбуквенных корней (по http://flaez.ch/arabwrz.html).
В санскрите от 580 до 3693 шт. корней.
При намеренно не сужаемом корпусе текстов количество корней варь-ирует от 580 до 3693 шт. (от числа 7 946 834 теоретически возможных, то есть почти восемь миллионов  корней). Сравнить с английским хотел бы (помню в приложении к Duden была статистика по немецкому в Fremdsprache словаре, не помню в каком только, 2004 г. кажется, но нет его под рукой), или любой другой 3й язык бы подобрать. Но не знаю, где брать истончики, гуглиться слабо.
Сколько глагольных корней в разных языках мира? Сколько всего глагольных всяких образований теоретически можно образовать от кажого глагола (грубо, округляя)?
По http://languages.garshin.ru/nostratic/indo-european/slavic/east-slavic/russian-words.html в "Словаре Академии Российской" (1789-1794) содержится несколько более 42 000 слов, в "Словаре церковнославянского и русского языка", изданного Академией наук в 1847 году, представлено уже около 115 000 слов, а в 17-томном "Словаре современного русского литературного языка" (1948-1965) - 120 480 слов [в английском - полмиллиарда, или даже 1 миллиард слов]. Всего в русском языке более 56 млн. языковых сочетаний.
На основе 21 словаря санскита в моем конордансе 260 000 слов.
Единственная ветка более менее на тему А сколько в русском языке морфем?
http://groups.google.com/group/Nagari/ & http://nagari.southindia.ru
Словари санскрита, прописи дэванагари, материалы по авестийскому, хинди

Солохин

По моим наблюдениям, в языках порядка 5000 реально употребляемых морфем, из которых наиболее частотных и продуктивных - порядка 600-800.
Sinjoro Jesuo Kristo purigu min.


Вне форума.

gasyoun

Да, есть такое, однако хочется получить более четкие цифры и по возможности даже библиографические ссылки или ссылки на спарсенные тексты, где нечто похожее можно посчитать на корпусе текстов любового (просто нужен 3й) языка.
http://groups.google.com/group/Nagari/ & http://nagari.southindia.ru
Словари санскрита, прописи дэванагари, материалы по авестийскому, хинди

Rwseg

Цитата: gasyoun от мая 21, 2014, 11:42
[в английском - полмиллиарда, или даже 1 миллиард слов]
Хватит же журналистские сенсации тиражировать.

gasyoun

У Вас есть точнее цифра - welcome. За что купил, за то продал - копипаст. Сколько слов в английском языке?
http://groups.google.com/group/Nagari/ & http://nagari.southindia.ru
Словари санскрита, прописи дэванагари, материалы по авестийскому, хинди

Rwseg

Цитата: gasyoun от мая 21, 2014, 15:45
У Вас есть точнее цифра - welcome. За что купил, за то продал - копипаст. Сколько слов в английском языке?
Ну если вы сравниваете словари, то один из самых больших 291,5/231,1 тыс. И то потому что в английские словари пихают все абсолютно слова (архаизмы, диалектизмы, сленг, термины и т.д. как раз около 60 тыс.). А в русских или французских лишь самые основные. В итоге в самом большом французском Le Grand Robert 75-100 тыс.

gasyoun

Сравниваю словари за отсутствием лучшего метода. Сравнивать санскритские тексты (нерасчлененные тем более) с другими языками - представляю с трудом. В моем санскритском сводном списке 269054 слов. Статистика Le Grand Robert по памяти, или прямо в книге пишут? Насчет "около 60 тыс." - без вычета определенных меток считали?
http://groups.google.com/group/Nagari/ & http://nagari.southindia.ru
Словари санскрита, прописи дэванагари, материалы по авестийскому, хинди

Rwseg

Цитата: gasyoun от мая 21, 2014, 18:39
Сравниваю словари за отсутствием лучшего метода.
Словарей на полмиллиарда слов не существует. Даже полмиллиона — это реально гигантический словарь.

Цитата: gasyoun от мая 21, 2014, 18:39
В моем санскритском сводном списке 269054 слов.
Это леммы или просто любые словоформы?

Цитата: gasyoun от мая 21, 2014, 18:39
Статистика Le Grand Robert по памяти, или прямо в книге пишут?
Прямо пишут.

Цитата: gasyoun от мая 21, 2014, 18:39
Насчет "около 60 тыс." - без вычета определенных меток считали?
По ссылке выше.

gasyoun

В моей список входит все слова из всех доступных словников санскрита. Я бы не сказал, что это прямо любые словоформы, но для отдельных частей речи момент повторов не исключен. А Оксфордский список заглавных слов доступен где-то для скачывания?
http://groups.google.com/group/Nagari/ & http://nagari.southindia.ru
Словари санскрита, прописи дэванагари, материалы по авестийскому, хинди

Rwseg

Я не видел. Но можно выскрести список из словаря Лингво. Но для этого нужно программировать уметь.
Встречал только частотные списки до 100 тыс.

gasyoun

131 257 слов в БАС из 2936 корней в русском языке.
269054 в сводном словнике из 3689 корней в санскрите.
273,000 в OED из ? корней в английском языке.
330,000 в DWB из ? корней в немецком языке.
500,000 в LKŽ из ? корней в литовском языке.
http://groups.google.com/group/Nagari/ & http://nagari.southindia.ru
Словари санскрита, прописи дэванагари, материалы по авестийскому, хинди

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр