Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Происхождение лексики РЯ

Автор Artiemij, декабря 29, 2016, 12:28

0 Пользователи и 1 гость просматривают эту тему.

Artiemij

Я тартар!

watchmaker

Вторая картинка для какого языка? Для английского?

Andrew

Прикольные картинки. Глядя на них, можно уверенно заявить, что венгерский - это славянско-угорский пиджин, на треть состоящий из инопланетных слов, а английский  наверняка относится к романским языкам.  :green:
Дякую тобі Боже що я москаль

Alone Coder

Процентовка будет различаться в зависимости от размера словаря. Надо брать процент слов по тексту, а не по словарю.

Валер

Цитата: Alone Coder от декабря 29, 2016, 18:52
Процентовка будет различаться в зависимости от размера словаря. Надо брать процент слов по тексту, а не по словарю.
А текстов - по тематике :)
Несолидарный. С войной, чем-либо, кем-либо.

Убить непросто. Убивать за свою страну намного легче.

bvs

Эти диаграммы имеют смысл для конкретного словаря, а не для языка в целом, так как нет точного определения слова в смысле лексической единицы, принадлежащей к языку. Для словаря Фасмера можно составить, но и там довольно много устаревшей и диалектной лексики.

Artiemij

В идеале, конечно, нужен не словарь слов, а словарь корней. И не всех, а только современных и общеупотребительных. Но для начала неплохо было бы получить хоть какие-нибудь данные: выбирать нам пока что не из чего.
Я тартар!

Валер

Цитата: Artiemij от декабря 29, 2016, 20:45
В идеале, конечно, нужен не словарь слов, а словарь корней. И не всех, а только современных и общеупотребительных. Но для начала неплохо было бы получить хоть какие-нибудь данные: выбирать нам пока что не из чего.
В чём смысл?
Несолидарный. С войной, чем-либо, кем-либо.

Убить непросто. Убивать за свою страну намного легче.

Artiemij

А зачем учитывать слова, которые почти никто не знает и не употребляет?
Я тартар!

Валер

Цитата: Artiemij от декабря 29, 2016, 20:51
А зачем учитывать слова, которые почти никто не знает и не употребляет?
Со своей колокольни смотрю. Более исконные слова говорят о природе языка. А иначе - просто статистика :)
Несолидарный. С войной, чем-либо, кем-либо.

Убить непросто. Убивать за свою страну намного легче.


Валер

Цитата: Artiemij от декабря 29, 2016, 21:00
:what:
Например, слова из разных сфер покажут разное происхождение в процентах. Тот же английский с самом бытовом аспекте - вполне себе германский. Где-нить ближе к научному дискурсу, да и не только вроде - полуроманский. Ну и что о чём говорит? Само название этой темы тоже можно понимать неоднозначно.
Несолидарный. С войной, чем-либо, кем-либо.

Убить непросто. Убивать за свою страну намного легче.

Artiemij

Цитата: Валер от декабря 29, 2016, 21:03Ну и что о чём говорит?
О том, что самая базовая бытовая лексика наиболее устойчива к иностранщине. Безусловно, интересно было бы получить данные как в целом, так и по отдельным слоям лексики, но опять же: выбирать пока что особо не из чего.
Я тартар!

watchmaker

ЦитироватьО том, что самая базовая бытовая лексика наиболее устойчива к иностранщине.
И несмотря на это в английском полно романской лексики даже среди самых обиходных слов.

Валер

Цитата: watchmaker от декабря 29, 2016, 21:18
ЦитироватьО том, что самая базовая бытовая лексика наиболее устойчива к иностранщине.
И несмотря на это в английском полно романской лексики даже среди самых обиходных слов.
Английский всё же язык достаточно нетипичный.
Несолидарный. С войной, чем-либо, кем-либо.

Убить непросто. Убивать за свою страну намного легче.

Awwal12

Цитата: Валер от декабря 29, 2016, 21:03
Тот же английский с самом бытовом аспекте - вполне себе германский.
Не очень-то. Невинная сказочка для детей, как где-то на форуме было уже показано, все равно состоит более чем наполовину из заимствованной лексики, львиная доля которой, конечно, старофранцузская.
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

Валер

Цитата: Awwal12 от декабря 29, 2016, 21:22
Цитата: Валер от декабря 29, 2016, 21:03
Тот же английский с самом бытовом аспекте - вполне себе германский.
Не очень-то. Невинная сказочка для детей, как где-то на форуме было уже показано, все равно состоит более чем наполовину из заимствованной лексики, львиная доля которой, конечно, старофранцузская.
Нужен словарь служебных слов ::)
Матерятся они хотя бы по своей маме или тоже без старофранцузской не обошлось :)
Несолидарный. С войной, чем-либо, кем-либо.

Убить непросто. Убивать за свою страну намного легче.

yurifromspb

Интересно, сколько там в секторе "Germanic languages" неанглосаксонского. Как пример: are от данов.
Дяденька, я ведь не настоящий лингвист, а этимологический словарь я в интернете нашёл.

Свобода у каждого своя, как и очевидность, посмотри, не тьма ли твой свет.

Bāb-lišānī lapit-ma, lū awīlāta! // from "Lamentations of Urišapibim".

Awwal12

Цитата: yurifromspb от декабря 29, 2016, 22:19
Интересно, сколько там в секторе "Germanic languages" неанглосаксонского.
В процентном отношении мало, но оно концентрируется в достаточно базовой лексике.
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

Rwseg

Не хочется никого обижать, возможно кто-то лучше знает, как обстоит дело в российской лингвистической науке, какие сейчас делаются исследования, но российская лексикология была всегда недоразвита. В то время как за XIX век были изданы десятки английских словарей, и в итоге стало нормой, чтобы в словарях была этимология, в России сподобились лишь на словарь Даля, который сделал почти что один человек. А позже из всех только немец один нашелся, который взялся делать этимологический словарь, 70 лет прошло — до сих пор цитируют (Преображенского и Черных как-то меньше знают, да первый уже и устарел). Ушаков, Ожегов, МАС и т.п. больше были нормирующими, и ориентировались на литературу, до этимологии им дела не было. Вывод из всего этого — вряд ли стоит ожидать наличия каких-то фундаментальных исследований по лексике, с процентовкой и т.п. До сих пор нет даже полноценного этимологического словаря, который бы охватывал всю лексику, а не небольшую часть (у Фасмера всего 18 тыс. статей-заголовков, половина какие-то редкие любопытные лично Фасмеру слова, которые ему захотелось этимологизировать, а не самые обыкновенные, которые ему были неинтересны). Разве что в будущем кто-нибудь сподобится. Плюс ко всему, если в английском хорошо отфильтровывают исконную англо-саксонскую лексику от прочих германизмов, то в русском есть нерешенная проблема славянизмов, прежде всего из болгарского и польского. Никто толком не знает, сколько их и как их определять. Или как, допустим, отличать чистые болгаризмы от натуральных  русизмов, просто сделанных из болгарских частей, или как определить в латинизмах и германизмах, сколько из них пришло через польский, и которые, можно сказать, полонизмы. Есть словари Филковой и Витковсого, но при ближайшем рассмотрении они не айс, какие-то сыроватые-недоделанные. С украинизмами-белорусизмам ещё сложнее.

Лично для себя я как-то скачал в текстовом виде словарь Крысина (16 тыс. слов) и сделал простой поиск по тегам (лат., гр., фр., нем. и т.п.). Точные результаты не помню, но получилось, что основная часть заимствований (где-то 60% минимум) из латыни и греческого. Можно сравнить с большими толковыми словарями и прикинуть сколько процент неславянских слов. Процентов 15, думаю, будет. С болгаризмами-полонизмами надо отдельно решать.

По тюркизмам есть словарь Шиповой, там она всего 2000 слов наскребла, половина какие-то редкие и исторические, то есть максимум 1000 тюркизмов в русском.

Awwal12

Цитата: Rwseg от декабря 29, 2016, 22:50
А позже из всех только немец один нашелся, который взялся делать этимологический словарь, 70 лет прошло — до сих пор цитируют (Преображенского и Черных как-то меньше знают, да первый уже и устарел).
Ну да. А Шанского и в природе никогда не было, стало быть, и Трубачев не сношался со словарем Фасмера, чтобы привести его к адекватному и современному на тот момент виду... :no:
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

bvs

Цитата: Awwal12 от декабря 29, 2016, 22:53
Трубачев не сношался со словарем Фасмера, чтобы привести его к адекватному и современному на тот момент виду...
Честно говоря, довольно часто Фасмер оказывается адекватнее комментариев Трубачева.

Awwal12

Цитата: bvs от декабря 29, 2016, 22:56
Цитата: Awwal12 от Трубачев не сношался со словарем Фасмера, чтобы привести его к адекватному и современному на тот момент виду...
Честно говоря, довольно часто Фасмер оказывается адекватнее комментариев Трубачева.
Иногда оказывается. Но комментарии в любом случае имеют ценность.
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

Rwseg

Кстати, я вчера на досуге словарь Филковой сопоставил со словарём-списком Лопатина (160 тыс. слов). Получилось в районе 5000 совпадений (т.е. 3%). Сколько там ошибок и сколько там в реальных текстах — неясно, надо вручную каждое слово сверять. Но в общем засилие болгаризмов явно преувеличено.

Rwseg

Цитата: Awwal12 от декабря 29, 2016, 22:53
Цитата: Rwseg от декабря 29, 2016, 22:50
А позже из всех только немец один нашелся, который взялся делать этимологический словарь, 70 лет прошло — до сих пор цитируют (Преображенского и Черных как-то меньше знают, да первый уже и устарел).
Ну да. А Шанского и в природе никогда не было, стало быть, и Трубачев не сношался со словарем Фасмера, чтобы привести его к адекватному и современному на тот момент виду... :no:
«Позже» — это непосредственно после Даля. Когда в конце XIX века были полноценные этимологические словари английского, для русского надо было ждать, когда немец сделает. Преображенский пытался, но недоделал. Не знаю даже, можно ли из Преображенского вытянуть что-то статистическое.

А Шанский.. ну нормальный словарь в своей категории и для своей целевой аудитории, вы вспомните, как он называется. У Крысина тоже хороший словарь, но это же не сравнится. По английскому могут статистику делать, потому что есть полноценная этимологическая информация по каждому слову, и уже лет сто как бы.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр