Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

О процентах лексики

Автор myst, января 9, 2011, 22:04

0 Пользователи и 1 гость просматривают эту тему.

RawonaM

Цитата: Karakurt от января  9, 2011, 22:47
Цитировать
ЦитироватьА если скандинавизмы посчитать? Ибо заимствования.
Так это же тоже германцы.
Все равно, не исконна же.
А исконность у вас с какого века считается? Все что в олдинглише уже исконное? Или только то, что проследить невозможно?

Bhudh

Цитата: μύστηςЧем слова считаешь?
Скорее «что словами считаешь?».
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

RawonaM

Цитата: myst от января  9, 2011, 22:50
Цитировать102 слова, 12 жабоизмы.
Чем слова считаешь?
wc. Она нормально считает?

myst

Цитата: RawonaM от января  9, 2011, 22:51
wc. Она нормально считает?
Я уже забыл, что она считает. У меня awk головного мозга. :)

myst

Надо не так сделать. Берём первую сотню самых частотных слов и смотрим. Потом вторую. Потом... впрочем, ну его нафик, хватит и двух сотен.

Nevik Xukxo

Цитата: RawonaM от января  9, 2011, 22:50
А исконность у вас с какого века считается?

Предлагаю считать исконно английской только ту лексику, что приплыла с Хенгистом и Хорсой, но никак не позже. :uzhos:

RawonaM

Цитата: Bhudh от января  9, 2011, 22:49
ЦитироватьЗаапдейтил с учетом комментариев.
bray не проапдейтил.
Пардон.

Ну в общем, на таком маленьком тесте статистику не делают в любом случае, но дело ясное, что процент не более 20 стопудово. Чем "взрослее" текст, тем процент будет увеличиваться.

myst


RawonaM

Цитата: myst от января  9, 2011, 22:53
Надо не так сделать. Берём первую сотню самых частотных слов и смотрим. Потом вторую. Потом... впрочем, ну его нафик.
С педии:
Source of the most frequent 7,476 English words
       1st 100    1st 1,000    2nd 1,000    then on
Germanic    97%    57%    39%    36%
Italic    3%    36%    51%    51%
Hellenic    0    4%    4%    7%
Others    0    3%    6%    6%

Bhudh

Offtop
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

RawonaM

Цитата: myst от января  9, 2011, 22:54
Списки у меня есть. Кто возьмётся? :)
А что там браться? В NLTK закинул, он всю статистику по-взрослому умеет. Да и закидывать не надо, у него все есть. Только не знаю, проставлены ли жабоизмы.

myst

Обожаю Интернет: в нём почти всё уже сделано до нас. (Веб-сервер задолбал уже рвать соединения! Только с пятого раза запостил. :wall:)

myst

Цитата: Bhudh от января  9, 2011, 22:56
Offtop
:??? Ты кэпом в ночь подрабатываешь?

Bhudh

А уже ночь⁈ А-а-а! И правда!

Offtop
А некоторые-то не знают...
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

mnashe

Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!


Хворост

Когда я сажала, ливала смородину,
Она превращала мой сад в огородину.
Она превращала, рубила дрова,
На них высекая попутно слова.
arseniiv

mnashe

Цитата: RawonaM от января  9, 2011, 22:55
С педии:
Чтоб читалось удобнее:
Source of the most frequent 7,476 English words

1st 1001st 1,0002nd 1,000then on
Germanic97%57%39%36%
Italic3%36%51%51%
Hellenic04%4%7%
Others03%6%6%
Адепт единственного числа и безродового склонения
שָׁלוֹם עֲלֵיכֶם!

autolyk

Цитата: Хворост от января 10, 2011, 11:53
А dish, cook, inch считаются?
Если принять предложение:
Цитата: Невский чукчо от января  9, 2011, 22:53
Предлагаю считать исконно английской только ту лексику, что приплыла с Хенгистом и Хорсой, но никак не позже.
то считаются германскими, кроме inch.
Атэц Әүүәл not welcome in this topic

Aleksey

таки срач глуповат.
берете данные корпуса английского языка и радуетесь, как не поглядишь все тут лексикостатисты. епт.

myst

Цитата: Aleksey от января 10, 2011, 13:28
таки срач глуповат.
Во-первых, здесь нет никакого срача.

Цитата: Aleksey от января 10, 2011, 13:28
берете данные корпуса английского языка и радуетесь, как не поглядишь все тут лексикостатисты. епт.
Во-вторых, если у Вас есть какие-то дополнительные сведения, приводите. Пустое балабольство здесь никому не интересно.

Aleksey

Цитата: myst от января 10, 2011, 13:45
Во-вторых, если у Вас есть какие-то дополнительные сведения, приводите. Пустое балабольство здесь никому не интересно.
был бы рад, но в основном данные корпуса небесплатные..

злой

Надо считать исконно английскими только те слова, которые предсказываются методом сравнительного языкознания. Все остальные - не считово.
Entre los individuos, como entre las naciones, el respeto al derecho ajeno es la paz.   - Benito Juárez

Nekto



Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр