Author Topic: Закон Ципфа и корпусная лингвистика  (Read 12305 times)

0 Members and 1 Guest are viewing this topic.

Offline Artemon

  • Posts: 6283
  • Gender: Male
Quote
Где тут закон Ципфа?
возьмите пару тысяч слов, постройте график (в логарифм. координатах) "ранг слова" vs "частота слова" и увидите практически прямую линии (с некоторым отклонением в области высоких частот - т.н. поправка Мандельброта)
Myst, ну вот же тут было объяснено, почему нет абсолютной точности. Математика - это абстракция, жизнь полнится аллошками. :)
За разнообразие в мире языков: vk.com/lingvomir
  • Чёрное и белое - лишь условные абстракции. Но жить, навешивая ярлыки, куда проще.
  • Green ideas и глокая куздра сообщают, что главное – принцип. Слова меняются, модели остаются.
  • Хорошо кишинёвскому сыну тайца и египтянки.
  • Ругая эсперанто, предлагайте альтернативы. Многие в вашей стране смотрят голливудские фильмы без перевода?
  • Живой язык = мёртвый конланг + армия и флот.
  • Центру нужны единое мнение, единый язык и смиренные налогоплательщики.

Offline Тайльнемер

  • Posts: 12736
  • Σοι υν βυρρο. Ix bin æn ézl
Quote from: lemma.zip
. . .
77 1345.29 чем misc
78 1329.93 глаз noun
79 1317.07 жизнь noun
80 1292.77 первый ord
81 1286.04 день noun
82 1262.47 тута adv
83 1236.40 во prep
84 1232.17 ничто pron
85 1216.99 потом adv
86 1214.24 очень adv
87 1195.33 со prep
 . . .
:o

Chilly

  • Guest
Парни, а у кого есть программа, позволяющая считать ???? и как можно воспользоваться ею ????

Offline RawonaM

  • Posts: 43388
Что нужно посчитать ????

Offline Alchemist

  • Posts: 393
  • Gender: Male
Насколько я понял, посчитать нужно слова и поставить их в порядке убывания частоты... Желательно, конечно, тут же график  ;up: Было бы круто...
Dum spiro, spero.

Offline RawonaM

  • Posts: 43388
Сортировка и график элементарно в экселе делается.
Считать слова это уже сложнее. Незачем их считать, уже посчитано давно.

Chilly

  • Guest
Спасибо то: Alchemist и RawonaM за ответ
Согласен, что подсчитано, но встречаются специфические тексты со специфическим уклоном, скажем философско-художественное "произведение" или историко-публицистическое. Ну, вообщем, их достаточно. Специфика определяется использованием (простите за тафтологию) специфической терминологией и понятиями (сюжет мы опускаем). Вот и стоит задача посчитать эти самые, их соотношение ко всем остальным ...... и прочее. Тоже задача специфическая ;) Вот и хотелось бы разжиться программкой и конечно же чтобы отображение графиков и регулировка "отсечки".......и прочее
Посему и вопрос - какой программой (если она есть) можно  воспользоваться, или какой техникой подсчета и отображения

 

With Quick-Reply you can write a post when viewing a topic without loading a new page. You can still use bulletin board code and smileys as you would in a normal post.

Note: this post will not display until it's been approved by a moderator.
Name: Email:
Verification:
Type the letters shown in the picture
Listen to the letters / Request another image
Type the letters shown in the picture:
√49 Напишите ответ строчными буквами:
«Сто одёжек, все без застёжек» — что это?: