Лингвофорум

Теоретический раздел => Общая лингвистика => Принципы лингвистики => Topic started by: myst on October 5, 2009, 18:50

Title: Сравнение лексиконов
Post by: myst on October 5, 2009, 18:50
ЯзыкКоличество слов (≥ 2,06 ipm)
Иврит
42390
Русский
40447
Арабский
36373
Португальский
25004
Китайский
24240
Испанский
24195
Немецкий
23806
Французский
22279
Английский
21343
Японский
17153

Как видим, великий и могучий показал остальным своё величие и могучие. ;)

Источник данных: http://corpus.leeds.ac.uk/list.html
Title: Сравнение лексиконов
Post by: Alone Coder on October 5, 2009, 18:52
Это тех слов, которых больше 2 на миллион?
Да уж, тут плакать надо.
Title: Сравнение лексиконов
Post by: myst on October 5, 2009, 18:56
Это тех слов, которых больше 2 на миллион?
Да уж, тут плакать надо.
Угу. Это всё из-за португальского (список маленький). Выкинуть его, что ли?.. :???
Title: Сравнение лексиконов
Post by: myst on October 5, 2009, 18:57
Да, я забыл сказать, слова во всех формах.
Title: Сравнение лексиконов
Post by: do50 on October 5, 2009, 19:00
Как видим великий и могучий показал остальным своё величие и могучие. ;)
Offtop
великий => величие; могучий => могущество ;)
Title: Сравнение лексиконов
Post by: Alone Coder on October 5, 2009, 19:00
Тогда ещё жить можно.
Вообще идеальный лексикон должен обладать двумя свойствами:
1. Как минимум два слова на каждый корень (не считая ономатопеи).
2. Связь между однокоренными словами должна быть регулярной.
Но русскому до этого...
Title: Сравнение лексиконов
Post by: myst on October 5, 2009, 19:01
Как видим великий и могучий показал остальным своё величие и могучие. ;)
Offtop
великий => величие; могучий => могущество ;)
Offtop
Эта ж игра слов.;)
Title: Сравнение лексиконов
Post by: do50 on October 5, 2009, 19:04
Как видим великий и могучий показал остальным своё величие и могучие. ;)
Offtop
великий => величие; могучий => могущество ;)
Offtop
Эта ж игра слов.;)
Offtop
да я понял :green:
Title: Сравнение лексиконов
Post by: Алексей Гринь on October 5, 2009, 19:07
Китайский-то как богат
Title: Сравнение лексиконов
Post by: myst on October 5, 2009, 19:51
Добавил иврит (источник (http://homepages.inf.ed.ac.uk/v1amccau/)). Теперь таки он лидирует. :)
Что интересно, у него слов с частотой ≥1 ipm меньше, чем русском; а с ≥2,06 больше.
Title: Сравнение лексиконов
Post by: Hellerick on October 5, 2009, 20:02
Мне сложно интерпретировать эти статистические данные. Что они означают? Насколько часто языки прибегают у словообразованию?
Title: Сравнение лексиконов
Post by: Alone Coder on October 5, 2009, 20:08
Они характеризуют количество словоформ, которые надо выучить, чтобы понимать язык.
Title: Сравнение лексиконов
Post by: Alone Coder on October 5, 2009, 20:10
А как насчёт чешского, польского, украинского и эсперанто?
Title: Сравнение лексиконов
Post by: myst on October 5, 2009, 20:20
А как насчёт чешского, польского, украинского и эсперанто?
Я сел поработать, завтра поищу и для других языков.
Title: Сравнение лексиконов
Post by: myst on October 5, 2009, 20:21
Кто знает иврит, гляньте, там точно словоформы?
Title: Сравнение лексиконов
Post by: myst on October 5, 2009, 22:10
Нашёл для венгерского: http://mokk.bme.hu/resources/webcorpus
Но там не в ipm. Надо пересчитывать. :wall:
Title: Сравнение лексиконов
Post by: Валентин Н on May 21, 2011, 23:07
Ну вот, а если склонять глагольную часть отглаг сущ и прил, будет ещё больше :up:
Title: Сравнение лексиконов
Post by: Awwal12 on May 21, 2011, 23:43
Ну вот, а если склонять глагольную часть отглаг сущ и прил, будет ещё больше :up:
Ну да, а если ещё добавить личные показатели к деепричастиям, так ваапще.......
Title: Сравнение лексиконов
Post by: Валентин Н on May 22, 2011, 00:26
Ну да, а если ещё добавить личные показатели к деепричастиям, так ваапще.......
Пример! :=
Title: Сравнение лексиконов
Post by: Awwal12 on May 22, 2011, 00:28
Пример! :=
Ну как... "Проезжаюля мимо станции, с меня слетела шляпа..."
Title: Сравнение лексиконов
Post by: Валентин Н on May 22, 2011, 00:36
Ну как...
хреново
ю и ля как у вас сочетаются? Ю означает я - проеҗаЮ (я), а ля что значит?