Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Закон Ципфа и корпусная лингвистика

Автор ostap.rest, января 12, 2011, 09:53

0 Пользователи и 1 гость просматривают эту тему.

Artemon

Цитата: ostap.rest от января 12, 2011, 10:44
ЦитироватьГде тут закон Ципфа?
возьмите пару тысяч слов, постройте график (в логарифм. координатах) "ранг слова" vs "частота слова" и увидите практически прямую линии (с некоторым отклонением в области высоких частот - т.н. поправка Мандельброта)
Myst, ну вот же тут было объяснено, почему нет абсолютной точности. Математика - это абстракция, жизнь полнится аллошками. :)
За разнообразие в мире языков: //vk.com/lingvomir
    [li]Чёрное и белое - лишь условные абстракции. Но жить, навешивая ярлыки, куда проще.[/li]
    [li]Green ideas и глокая куздра сообщают, что главное – принцип. Слова меняются, модели остаются.[/li]
    [li]Хорошо кишинёвскому сыну тайца и египтянки.[/li]
    [li]Ругая эсперанто, предлагайте альтернативы. Многие в вашей стране смотрят голливудские фильмы без перевода?[/li]
    [li]Живой язык = мёртвый конланг + армия и флот.[/li]
    [li]Центру нужны единое мнение, единый язык и смиренные налогоплательщики.[/li]

Тайльнемер

Цитата: lemma.zip от
. . .
77 1345.29 чем misc
78 1329.93 глаз noun
79 1317.07 жизнь noun
80 1292.77 первый ord
81 1286.04 день noun
82 1262.47 тута adv
83 1236.40 во prep
84 1232.17 ничто pron
85 1216.99 потом adv
86 1214.24 очень adv
87 1195.33 со prep
. . .
:o

Chilly

Парни, а у кого есть программа, позволяющая считать ???? и как можно воспользоваться ею ????


Alchemist

Насколько я понял, посчитать нужно слова и поставить их в порядке убывания частоты... Желательно, конечно, тут же график  ;up: Было бы круто...

RawonaM

Сортировка и график элементарно в экселе делается.
Считать слова это уже сложнее. Незачем их считать, уже посчитано давно.

Chilly

Спасибо то: Alchemist и RawonaM за ответ
Согласен, что подсчитано, но встречаются специфические тексты со специфическим уклоном, скажем философско-художественное "произведение" или историко-публицистическое. Ну, вообщем, их достаточно. Специфика определяется использованием (простите за тафтологию) специфической терминологией и понятиями (сюжет мы опускаем). Вот и стоит задача посчитать эти самые, их соотношение ко всем остальным ...... и прочее. Тоже задача специфическая ;) Вот и хотелось бы разжиться программкой и конечно же чтобы отображение графиков и регулировка "отсечки".......и прочее
Посему и вопрос - какой программой (если она есть) можно  воспользоваться, или какой техникой подсчета и отображения

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр