Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Быстропечатание

Автор Alone Coder, октября 17, 2010, 13:03

0 Пользователи и 1 гость просматривают эту тему.

myst


myst

Кстати, один вариант аккордного ввода на базе программы Тайльнемера уже реализован.

Alone Coder

Какой?
Для р-, в- нет подходящих вторых клавиш с низкой переходной вероятностью. Получатся только аккорды с к,т,н,л,п,г. Для этого центр клавиатуры должен выглядеть, например, так:
ТД--ЯК
ЛЗ--БН
ГС--МП

ТД="то", ТЗ="та"
ЛЗ="ло", ЛС="ла"
ГС="го"
КЯ="ко", КБ="ка"
НБ="но", НМ="на"
ПМ="по"

В сумме на эти аккорды приходится 8% текста.

Alone Coder

Однако:

"I ran an experiment to try to discover an optimal keyboard layout using evolutionary algorithms that would produce mutated keyboard layouts and have them compete by simulating typing a giant corpus of English text and C. All the winners from this exercise in natural selection had the five vowels on the home row under the left hand and most of DHTNS on the home row under the right."
http://haacked.com/archive/2007/06/05/dvorak-keyboard-layout-of-champions.aspx

Интересно, врёт или нет?

myst

Цитата: Alone Coder от октября 17, 2010, 14:41
Какой?
Один чел его делает. К нему нужен правильный подход, а то он не раскроет тайну. :)

myst

Зубачёв в своё время выкладывал математику своей раскладки. Жаль, что эта информация сгинула. :(

myst

Цитата: Alone Coder от октября 17, 2010, 14:41
Для р-, в- нет подходящих вторых клавиш с низкой переходной вероятностью. Получатся только аккорды с к,т,н,л,п,г.
Зачем эта вероятность сдалась вообще?

Цитата: Alone Coder от октября 17, 2010, 14:41
В сумме на эти аккорды приходится 8% текста.
Это доля в общем количестве символов, что ли?


Alone Coder

Цитата: myst от октября 17, 2010, 15:02
Цитата: Alone Coder от Сегодня в 15:41
ЦитироватьВ сумме на эти аккорды приходится 8% текста.
Это доля в общем количестве символов, что ли?
В общем количестве символов - в два раза больше. Ведь здесь 2-символьные комбинации. 8% - это число вхождений, делённое на объём текста.

myst

Цитата: Alone Coder от октября 17, 2010, 15:05
8% - это число вхождений, делённое на объём текста.
Надо не так считать. Надо считать в какой доле слов употребляется сочетание.

Alone Coder

Зачем? Важно не в какой доле слов, а сколько раз вообще.

Alone Coder

А ведь модель того перца можно и на речь применить (записанную в форме артикуляций, естественно). Тоже мерять дистанции и давать пенальти за повторные артикуляции. И разработать оптимальный язык  :green:

myst

Цитата: Alone Coder от октября 17, 2010, 15:22
Зачем? Важно не в какой доле слов, а сколько раз вообще.
Затем, что так очевиднее ценность сочетания. Если сочетание требуется половине всех слов, оно нужно в раскладке. А если только в сотне, то нет. Например, вышеупомянутый набор двухбуквенных сочетаний охватывает 45% слов.

myst

Сейчас после очередного забега по частотному списку 17-буквенных слов снова вспомнил ещё об одной идее. Как бы оптимизировать набор длинных слов? Пальцы просто вопиют что-то сделать с этими тствова, ственн, ованн, вств и пр. Особенно обламывают скопления согласных. Кроме того, эти все частотные словари дают несколько искажённую картину. Несмотря на довольно низкую частоту длинных (>8 символов) слов, они весьма существенно влияют на скорость набора и встречаются в реальном тексте чаще. Некоторые трёхсимвольные сочетания, например ыва, весьма полезны, несмотря опять же на их казалось бы низкую частоту.

Alone Coder

Короче, вручную формировать раскладку - это шаманство. Нужно строить модель, кормить ей тексты и организовать естественный отбор среди этих моделей.

Alone Coder

Цитата: myst от октября 17, 2010, 15:40
Несмотря на довольно низкую частоту длинных (>8 символов) слов, они весьма существенно влияют на скорость набора и встречаются в реальном тексте чаще.
Всё это психологические ощущения, не имеющие отношения к реальной скорости печати. 1/3 русского текста составляют 50 слов, из которых два 6-символьные, два 5-символьные, пять 4-символьных, а остальные 1-3 символьные.

Alone Coder

Интересно, как бы выглядела оптимальная раскладка для ДЕСЯТИ клавиш (каждому пальцу - по клавише, вагон двойных нажатий)? Насколько она могла бы соревноваться с большой клавиатурой?

Alone Coder

Если бы у клавиш было усилие нажатия, и одновременно можно было держать хоть все клавиши, то можно было бы непосредственно привязать на эти 10 клавиш 10 артикуляций (разные усилия нажатия - разные реализации артикуляций).

myst

Цитата: Alone Coder от октября 17, 2010, 15:44
Всё это психологические ощущения, не имеющие отношения к реальной скорости печати.
Это Вы мне рассказываете, что ли? Я вообще-то скорость не ощущениями меряю.

Цитата: Alone Coder от октября 17, 2010, 15:44
1/3 русского текста составляют 50 слов, из которых два 6-символьные, два 5-символьные, пять 4-символьных, а остальные 1-3 символьные.
Это всё статистика. Возьмём, например, моё предыдущее сообщение:

2 оптимизировать 14
2 встречаются 11
4 искажённую 10
7 Некоторые 9
10 Несмотря 8
9 длинных 7
14 Пальцы 6
8 Кроме 5
8 вств 4
7 Как 3
12 17 2
5 8 1

Я по работе очень много набираю русского текста и своими пальцами чувствую цену этой статистики.

Alone Coder

"оптимизировать" - 2 раза на миллион слов? Это копейки. Вы за всю жизнь, может быть, не набрали миллион слов.

myst

Цитата: Alone Coder от октября 17, 2010, 16:06
"оптимизировать" - 2 раза на миллион слов? Это копейки. Вы за всю жизнь, может быть, не набрали миллион слов.
Я набираю за день где-то тысяч по 60 знаков в среднем, когда работаю. Но дело не в этом, а в том, что я слово оптимизировать набрал за всю жизнь отнюдь не два раза.

myst

Цитата: Alone Coder от октября 17, 2010, 16:06
"оптимизировать" - 2 раза на миллион слов?
В первом столбце не частота, а количество слов; средний столбец не имеет смысла; в последнем — длина слов. Слов длиной более 6 символов больше, не говоря уже о их доле в объёме текста.

Alone Coder

Зато вы не набрали за всю жизнь ни разу кучу других слов с такой же частотой. А другие люди не разу не набрали за то же время слово "оптимизировать", зато набирали много раз другие слова, которыми вы не пользуетесь.

Alone Coder

Цитата: myst от октября 17, 2010, 16:12
В первом столбце не частота, а количество слов
Количество каких слов где?

myst


Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр