Лингвофорум

Практический раздел: для изучающих языки, помощь студентам => Английский язык => Словари, учебники => Тема начата: arseniiv от августа 11, 2009, 16:39

Название: Частоты английских букв
Отправлено: arseniiv от августа 11, 2009, 16:39
Есть у кого-нибудь таблица примерных частот букв в английских текстах?
Название: Частоты английских букв
Отправлено: RawonaM от августа 11, 2009, 16:42
http://en.wikipedia.org/wiki/Letter_frequency
Название: Частоты английских букв
Отправлено: Hellerick от августа 11, 2009, 17:32
Я в школе развлекался, составил программу которая подсчитывает частоту символов, а потом генерировал случайные тексты. Вроде таких:

English
It bee, he morthur thur anat of Artire wit all thely fin ded bein So frould the mad baccid. Er.. He the houted (th it thed to mad a grearther, quille and Folver sme butery, al. The hically ch pealiently an pails pe ven a sky. He day pre dating wit ittir

Русский
Пову что дает?! Все-тать. Гориную я помне извоже кто все пользоврее режа. Очертулся... Я де раза всему что го дво начемы. Я паться, что отескорнеку прохоте кая, ее?

Deutsch
Zu nen ungest wurchenlangersinivert des wormsee ler Bucheinemiste dielmhow und man Mainde. Her sickeiniststentwich in. Auf ein "Hie nemit Weitadtenfli 15.-16. Der Umgegenkfund Wage die Kochander Beruhmten Statig genstaderheinebirgen gibelben Lin
Название: Частоты английских букв
Отправлено: arseniiv от августа 11, 2009, 17:32
Спасибо :)
Название: Частоты английских букв
Отправлено: arseniiv от августа 11, 2009, 17:37
Цитата: Hellerick от августа 11, 2009, 17:32
Я в школе развлекался, составил программу которая подсчитывает частоту символов, а потом генерировал случайные тексты. Вроде таких:
;D вот как раз собирался сделать себе генератор слов по частотам.
Название: Частоты английских букв
Отправлено: Hellerick от августа 11, 2009, 17:44
Моя программа учитывала не частоту букв, а частоту триграммов, т.е. сочетаний из трех символов.

Можешь почитать поучительный рассказ, составленный этой программой:

Название: Частоты английских букв
Отправлено: arseniiv от августа 11, 2009, 18:50
Вот, сгенерировал в Mathematica. Чем-то походит на Lorem Ipsum:
«jewc edaieha ihve ahrr shehata iuothm h lhca ncbosh fenyeg lnfpoe sfct oenr nor hfieha cos ri anudv pethv oeo nhriegos iner toar di e herarohe fiaom yiitdsh ayhepsod vee toseecsr se ouieon eltw cnorett nvsbtd mit pgsg ity hf ehoch ka dnheaa u hgrc attco nosa le euhotphn yhattgc»

Hellerick, хороший рассказик ;D
Триграммами конечно же намного "натуральнее" выходит
Название: Частоты английских букв
Отправлено: Hellerick от августа 11, 2009, 19:13
Можно сначала генерировать заведомо непроизносимый бред, а потом пропускать его через фильтры, которые сделают его "благозвучней". Т.е. куда надо добавят гласных, где надо разберут консонантные кластеры, где-нибудь введут гармонию гласных. Я примерно так делал словарь языка Keva (http://conlang.wikia.com/wiki/Keva/Dictionary) — по мере нахождения уродливых сочетаний звуков я вводил всё новые правила, чтобы от них избавляться.