Частоты английских букв

Автор arseniiv, августа 11, 2009, 16:39

0 Пользователи и 1 гость просматривают эту тему.

arseniiv

Есть у кого-нибудь таблица примерных частот букв в английских текстах?


Hellerick

Я в школе развлекался, составил программу которая подсчитывает частоту символов, а потом генерировал случайные тексты. Вроде таких:

English
It bee, he morthur thur anat of Artire wit all thely fin ded bein So frould the mad baccid. Er.. He the houted (th it thed to mad a grearther, quille and Folver sme butery, al. The hically ch pealiently an pails pe ven a sky. He day pre dating wit ittir

Русский
Пову что дает?! Все-тать. Гориную я помне извоже кто все пользоврее режа. Очертулся... Я де раза всему что го дво начемы. Я паться, что отескорнеку прохоте кая, ее?

Deutsch
Zu nen ungest wurchenlangersinivert des wormsee ler Bucheinemiste dielmhow und man Mainde. Her sickeiniststentwich in. Auf ein "Hie nemit Weitadtenfli 15.-16. Der Umgegenkfund Wage die Kochander Beruhmten Statig genstaderheinebirgen gibelben Lin


arseniiv

Цитата: Hellerick от августа 11, 2009, 17:32
Я в школе развлекался, составил программу которая подсчитывает частоту символов, а потом генерировал случайные тексты. Вроде таких:
;D вот как раз собирался сделать себе генератор слов по частотам.

Hellerick

Моя программа учитывала не частоту букв, а частоту триграммов, т.е. сочетаний из трех символов.

Можешь почитать поучительный рассказ, составленный этой программой:


arseniiv

Вот, сгенерировал в Mathematica. Чем-то походит на Lorem Ipsum:
«jewc edaieha ihve ahrr shehata iuothm h lhca ncbosh fenyeg lnfpoe sfct oenr nor hfieha cos ri anudv pethv oeo nhriegos iner toar di e herarohe fiaom yiitdsh ayhepsod vee toseecsr se ouieon eltw cnorett nvsbtd mit pgsg ity hf ehoch ka dnheaa u hgrc attco nosa le euhotphn yhattgc»

Hellerick, хороший рассказик ;D
Триграммами конечно же намного "натуральнее" выходит

Hellerick

Можно сначала генерировать заведомо непроизносимый бред, а потом пропускать его через фильтры, которые сделают его "благозвучней". Т.е. куда надо добавят гласных, где надо разберут консонантные кластеры, где-нибудь введут гармонию гласных. Я примерно так делал словарь языка Keva — по мере нахождения уродливых сочетаний звуков я вводил всё новые правила, чтобы от них избавляться.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр