(https://alexsvitych.files.wordpress.com/2014/02/noname4.jpg)
(https://upload.wikimedia.org/wikipedia/commons/thumb/9/98/Origins_of_English_PieChart.svg/500px-Origins_of_English_PieChart.svg.png)
Есть ли что-нибудь подобное для русского языка?
Вторая картинка для какого языка? Для английского?
Прикольные картинки. Глядя на них, можно уверенно заявить, что венгерский - это славянско-угорский пиджин, на треть состоящий из инопланетных слов, а английский наверняка относится к романским языкам. :green:
Процентовка будет различаться в зависимости от размера словаря. Надо брать процент слов по тексту, а не по словарю.
Цитата: Alone Coder от декабря 29, 2016, 18:52
Процентовка будет различаться в зависимости от размера словаря. Надо брать процент слов по тексту, а не по словарю.
А текстов - по тематике :)
Эти диаграммы имеют смысл для конкретного словаря, а не для языка в целом, так как нет точного определения слова в смысле лексической единицы, принадлежащей к языку. Для словаря Фасмера можно составить, но и там довольно много устаревшей и диалектной лексики.
В идеале, конечно, нужен не словарь слов, а словарь корней. И не всех, а только современных и общеупотребительных. Но для начала неплохо было бы получить хоть какие-нибудь данные: выбирать нам пока что не из чего.
Цитата: Artiemij от декабря 29, 2016, 20:45
В идеале, конечно, нужен не словарь слов, а словарь корней. И не всех, а только современных и общеупотребительных. Но для начала неплохо было бы получить хоть какие-нибудь данные: выбирать нам пока что не из чего.
В чём смысл?
А зачем учитывать слова, которые почти никто не знает и не употребляет?
Цитата: Artiemij от декабря 29, 2016, 20:51
А зачем учитывать слова, которые почти никто не знает и не употребляет?
Со своей колокольни смотрю. Более исконные слова говорят о природе языка. А иначе - просто статистика :)
:what:
Цитата: Artiemij от декабря 29, 2016, 21:00
:what:
Например, слова из разных сфер покажут разное происхождение в процентах. Тот же английский с самом бытовом аспекте - вполне себе германский. Где-нить ближе к научному дискурсу, да и не только вроде - полуроманский. Ну и что о чём говорит? Само название этой темы тоже можно понимать неоднозначно.
Цитата: Валер от декабря 29, 2016, 21:03Ну и что о чём говорит?
О том, что самая базовая бытовая лексика наиболее устойчива к иностранщине. Безусловно, интересно было бы получить данные как в целом, так и по отдельным слоям лексики, но опять же: выбирать пока что особо не из чего.
ЦитироватьО том, что самая базовая бытовая лексика наиболее устойчива к иностранщине.
И несмотря на это в английском полно романской лексики даже среди самых обиходных слов.
Цитата: watchmaker от декабря 29, 2016, 21:18
ЦитироватьО том, что самая базовая бытовая лексика наиболее устойчива к иностранщине.
И несмотря на это в английском полно романской лексики даже среди самых обиходных слов.
Английский всё же язык достаточно нетипичный.
Цитата: Валер от декабря 29, 2016, 21:03
Тот же английский с самом бытовом аспекте - вполне себе германский.
Не очень-то. Невинная сказочка для детей, как где-то на форуме было уже показано, все равно состоит более чем наполовину из заимствованной лексики, львиная доля которой, конечно, старофранцузская.
Цитата: Awwal12 от декабря 29, 2016, 21:22
Цитата: Валер от декабря 29, 2016, 21:03
Тот же английский с самом бытовом аспекте - вполне себе германский.
Не очень-то. Невинная сказочка для детей, как где-то на форуме было уже показано, все равно состоит более чем наполовину из заимствованной лексики, львиная доля которой, конечно, старофранцузская.
Нужен словарь служебных слов ::)
Матерятся они хотя бы по своей маме или тоже без старофранцузской не обошлось :)
Интересно, сколько там в секторе "Germanic languages" неанглосаксонского. Как пример: are от данов.
Цитата: yurifromspb от декабря 29, 2016, 22:19
Интересно, сколько там в секторе "Germanic languages" неанглосаксонского.
В процентном отношении мало, но оно концентрируется в достаточно базовой лексике.
Не хочется никого обижать, возможно кто-то лучше знает, как обстоит дело в российской лингвистической науке, какие сейчас делаются исследования, но российская лексикология была всегда недоразвита. В то время как за XIX век были изданы десятки английских словарей, и в итоге стало нормой, чтобы в словарях была этимология, в России сподобились лишь на словарь Даля, который сделал почти что один человек. А позже из всех только немец один нашелся, который взялся делать этимологический словарь, 70 лет прошло — до сих пор цитируют (Преображенского и Черных как-то меньше знают, да первый уже и устарел). Ушаков, Ожегов, МАС и т.п. больше были нормирующими, и ориентировались на литературу, до этимологии им дела не было. Вывод из всего этого — вряд ли стоит ожидать наличия каких-то фундаментальных исследований по лексике, с процентовкой и т.п. До сих пор нет даже полноценного этимологического словаря, который бы охватывал всю лексику, а не небольшую часть (у Фасмера всего 18 тыс. статей-заголовков, половина какие-то редкие любопытные лично Фасмеру слова, которые ему захотелось этимологизировать, а не самые обыкновенные, которые ему были неинтересны). Разве что в будущем кто-нибудь сподобится. Плюс ко всему, если в английском хорошо отфильтровывают исконную англо-саксонскую лексику от прочих германизмов, то в русском есть нерешенная проблема славянизмов, прежде всего из болгарского и польского. Никто толком не знает, сколько их и как их определять. Или как, допустим, отличать чистые болгаризмы от натуральных русизмов, просто сделанных из болгарских частей, или как определить в латинизмах и германизмах, сколько из них пришло через польский, и которые, можно сказать, полонизмы. Есть словари Филковой и Витковсого, но при ближайшем рассмотрении они не айс, какие-то сыроватые-недоделанные. С украинизмами-белорусизмам ещё сложнее.
Лично для себя я как-то скачал в текстовом виде словарь Крысина (16 тыс. слов) и сделал простой поиск по тегам (лат., гр., фр., нем. и т.п.). Точные результаты не помню, но получилось, что основная часть заимствований (где-то 60% минимум) из латыни и греческого. Можно сравнить с большими толковыми словарями и прикинуть сколько процент неславянских слов. Процентов 15, думаю, будет. С болгаризмами-полонизмами надо отдельно решать.
По тюркизмам есть словарь Шиповой, там она всего 2000 слов наскребла, половина какие-то редкие и исторические, то есть максимум 1000 тюркизмов в русском.
Цитата: Rwseg от декабря 29, 2016, 22:50
А позже из всех только немец один нашелся, который взялся делать этимологический словарь, 70 лет прошло — до сих пор цитируют (Преображенского и Черных как-то меньше знают, да первый уже и устарел).
Ну да. А Шанского и в природе никогда не было, стало быть, и Трубачев не сношался со словарем Фасмера, чтобы привести его к адекватному и современному на тот момент виду... :no:
Цитата: Awwal12 от декабря 29, 2016, 22:53
Трубачев не сношался со словарем Фасмера, чтобы привести его к адекватному и современному на тот момент виду...
Честно говоря, довольно часто Фасмер оказывается адекватнее комментариев Трубачева.
Цитата: bvs от декабря 29, 2016, 22:56
Цитата: Awwal12 от Трубачев не сношался со словарем Фасмера, чтобы привести его к адекватному и современному на тот момент виду...
Честно говоря, довольно часто Фасмер оказывается адекватнее комментариев Трубачева.
Иногда оказывается. Но комментарии в любом случае имеют ценность.
Кстати, я вчера на досуге словарь Филковой сопоставил со словарём-списком Лопатина (160 тыс. слов). Получилось в районе 5000 совпадений (т.е. 3%). Сколько там ошибок и сколько там в реальных текстах — неясно, надо вручную каждое слово сверять. Но в общем засилие болгаризмов явно преувеличено.
Цитата: Awwal12 от декабря 29, 2016, 22:53
Цитата: Rwseg от декабря 29, 2016, 22:50
А позже из всех только немец один нашелся, который взялся делать этимологический словарь, 70 лет прошло — до сих пор цитируют (Преображенского и Черных как-то меньше знают, да первый уже и устарел).
Ну да. А Шанского и в природе никогда не было, стало быть, и Трубачев не сношался со словарем Фасмера, чтобы привести его к адекватному и современному на тот момент виду... :no:
«Позже» — это непосредственно после Даля. Когда в конце XIX века были полноценные этимологические словари английского, для русского надо было ждать, когда немец сделает. Преображенский пытался, но недоделал. Не знаю даже, можно ли из Преображенского вытянуть что-то статистическое.
А Шанский.. ну нормальный словарь в своей категории и для своей целевой аудитории, вы вспомните, как он называется. У Крысина тоже хороший словарь, но это же не сравнится. По английскому могут статистику делать, потому что есть полноценная этимологическая информация по каждому слову, и уже лет сто как бы.
Цитата: bvs от декабря 29, 2016, 22:56
Честно говоря, довольно часто Фасмер оказывается адекватнее комментариев Трубачева.
Процитируйте хотя бы один такой случай.
Насчет собаки, например:
ЦитироватьTrubachev's comments: [Ир. происхождение слова соба́ка маловероятно, скорее всего мы имеем здесь заимствование из тюрк. köbäk "собака"; см. подробно Трубачев, Слав. названия дом. животных, М., 1960, стр. 29 и сл., где и остальная литер. -- Т.]
Цитата: Rwseg от декабря 29, 2016, 22:50
Не хочется никого обижать...
Что-то вы не все словари упомянули.
Это во-первых. Во-вторых, вы написали ваше общее впечатление, которое, однако далеко от реальности. В эти хвалёные «десятки словарей» в большинстве яйца выеденного не стоят, у нас такого ширпотреба вышло тоже много. Ну и кроме того, вы заговорили о лексикологии. — Вот потому и мало значимых этимологических словарей (не только русского языка, «отнюдь»), что лексиколог не сможет вам написать полноценного или хотя бы просто сносного этимологического словаря. А те, кто может, в большинстве своём не интересуются сплошным перебором лексики — это рутинно и скучно.
Цитата: bvs от декабря 29, 2016, 23:16
Насчет собаки, например:
ЦитироватьTrubachev's comments: [Ир. происхождение слова соба́ка маловероятно, скорее всего мы имеем здесь заимствование из тюрк. köbäk "собака"; см. подробно Трубачев, Слав. названия дом. животных, М., 1960, стр. 29 и сл., где и остальная литер. -- Т.]
И чего тут? Можно это слово вообще исконным считать — морфологически оно вполне: *sob-aka, имя деятеля с комплексом -a-ko- от праслав. прилагательного *sobъ. По значению там тоже нет непреодолимых препятствий.
На переход k > s других примеров из позднепраславянского нет, если предполагать палатализацию, то было бы ц-.
Цитата: bvs от декабря 29, 2016, 23:45
На переход k > s других примеров из позднепраславянского нет
Трубачев же приводит тюркскую этимологию "карася" с таким же переходом.
Цитата: Rwseg от декабря 29, 2016, 23:09А Шанский.. ну нормальный словарь в своей категории и для своей целевой аудитории, вы вспомните, как он называется.
«Этимологический словарь русского языка (https://ru.wikipedia.org/wiki/%D0%A8%D0%B0%D0%BD%D1%81%D0%BA%D0%B8%D0%B9,_%D0%9D%D0%B8%D0%BA%D0%BE%D0%BB%D0%B0%D0%B9_%D0%9C%D0%B0%D0%BA%D1%81%D0%B8%D0%BC%D0%BE%D0%B2%D0%B8%D1%87#.D0.A1.D0.BB.D0.BE.D0.B2.D0.B0.D1.80.D0.B8)» он называется. А Вы какой имеете в виду?‥
Цитата: Wolliger Mensch от декабря 29, 2016, 23:24
В эти хвалёные «десятки словарей» в большинстве яйца выеденного не стоят, у нас такого ширпотреба вышло тоже много.
По ходу у вас как всегда, как дело касается в английского, вы не в теме, говорите какую-то ерунду... Как часто вы пользуетесь английскими словарями, чтобы вообще что-то говорить? Я ими пользуюсь ежедневно и периодически смотрю как раз в старые (кон. XIX — нач. XX вв.), ибо в них иногда больше полезной информации типа списка орфографических вариантов в среднеанглийском, чего в современных словарях нет. Да и даже если и были много широпотребов (и что в этом плохого, это говорит об заинтересованности публики в словарях), одновременно было много очень качественных очень знаковых словарей (для своего времени, конечно). На русском за два века из знаковых только словарь Академии и словарь Даля. Даже не в числе дело, а в качестве, достаточно просто открыть и сравнить, совсем другой был уровень, другой подход.
Но я не хотел даже сравнивать, я согласен, что русские словари самые слоновые в мире, суть в том, что:
Цитата: Wolliger Mensch от декабря 29, 2016, 23:24
А те, кто может, в большинстве своём не интересуются сплошным перебором лексики — это рутинно и скучно.
Как раз об этом я сказал, что русские будут исписывать по сто страниц и по десять диссертаций об этимологии слова «собака», но до этимологии простых слов им дела нет, «скучно». Ну раз скучно, так чего ожидать какой-то статистики. Англоязычным было нескучно, в итоге мы знаем статистический анализ английской лексики. А русские пусть ещё на десять диссертаций обмусоливают этимологию слова «собака».
Цитата: Bhudh от декабря 30, 2016, 13:29
Цитата: Rwseg от декабря 29, 2016, 23:09А Шанский.. ну нормальный словарь в своей категории и для своей целевой аудитории, вы вспомните, как он называется.
«Этимологический словарь русского языка (https://ru.wikipedia.org/wiki/%D0%A8%D0%B0%D0%BD%D1%81%D0%BA%D0%B8%D0%B9,_%D0%9D%D0%B8%D0%BA%D0%BE%D0%BB%D0%B0%D0%B9_%D0%9C%D0%B0%D0%BA%D1%81%D0%B8%D0%BC%D0%BE%D0%B2%D0%B8%D1%87#.D0.A1.D0.BB.D0.BE.D0.B2.D0.B0.D1.80.D0.B8)» он называется. А Вы какой имеете в виду?‥
Я как-то о его школьном словаре думал, а его другом то ли не знал, то ли забыл, ладно, признаю своё невежество, мне не стыдно признать свои ошибки. Русские словари самые слоновые. Но из них можно вывести какую-то статистику?
Цитата: Rwseg от декабря 30, 2016, 14:01
По ходу у вас как всегда, как дело касается в английского, вы не в теме, говорите какую-то ерунду... Как часто вы пользуетесь английскими словарями, чтобы вообще что-то говорить? Я ими пользуюсь ежедневно и периодически смотрю как раз в старые (кон. XIX — нач. XX вв.), ибо в них иногда больше полезной информации типа списка орфографических вариантов в среднеанглийском, чего в современных словарях нет. Да и даже если и были много широпотребов (и что в этом плохого, это говорит об заинтересованности публики в словарях), одновременно было много очень качественных очень знаковых словарей (для своего времени, конечно). На русском за два века из знаковых только словарь Академии и словарь Даля. Даже не в числе дело, а в качестве, достаточно просто открыть и сравнить, совсем другой был уровень, другой подход.
Извините, у вас всё в порядке с головой? Вы сами читаете, что пишете?
Цитата: Rwseg от декабря 29, 2016, 22:50
В то время как за XIX век были изданы десятки английских словарей, и в итоге стало нормой, чтобы в словарях была этимология...
Об этом речь, вы не забыли? На это и был ответ.
Цитата: Rwseg от декабря 29, 2016, 22:50До сих пор нет даже полноценного этимологического словаря, который бы охватывал всю лексику, а не небольшую часть (у Фасмера всего 18 тыс. статей-заголовков, половина какие-то редкие любопытные лично Фасмеру слова, которые ему захотелось этимологизировать, а не самые обыкновенные, которые ему были неинтересны).
Печально. А я-то уж губу раскатал, надеялся, кто-нибудь за четверть века уже успел данные по русской лексике в электронный вид перевести, а тут вот оно как...
(http://s8.hostingkartinok.com/uploads/images/2017/02/98e43ed502d754fa9ce0141fbbef3465.png)
Тут надо два словаря. Один со всей лексикой (миллион карточек где-то хранится до ближайшего пожара) с разбиением по морфемам. Второй с этимологией всех морфем. У Фасмера плохо проработаны приставки и особенно суффиксы.
Хоть бы ЭССЯ и СРНГ доделали, до буквы "Т" ни один словарь довести не могут. При этом никто с конца алфавита не издаёт.
Цитата: Alone Coder от февраля 7, 2017, 22:24
Тут надо два словаря. Один со всей лексикой (миллион карточек где-то хранится до ближайшего пожара) с разбиением по морфемам. Второй с этимологией всех морфем. У Фасмера плохо проработаны приставки и особенно суффиксы.
Каких именно приставок вам не хватает у Фасмера? И потом, у него словарь, а не историческая морфология. Скажите спасибо, что уделил какое-то внимание морфологическим вопросам.
Цитата: Alone Coder от февраля 7, 2017, 22:24
Хоть бы ЭССЯ и СРНГ доделали, до буквы "Т" ни один словарь довести не могут. При этом никто с конца алфавита не издаёт.
Зачем вам до буквы «Т»?