Цитата: Гвость от марта 13, 2012, 10:03Возьмите какой-нибудь большой текст типа "Войны и мира", распарсите его на слова, и посмотрите распределение их длин. Выбросьте n% самых длинных и получите нужную квантиль.
каков размер границы длинны знаков описывающих сущность?
например знаю что в среднем в русском это число: 6 знаков
допустим максимум в русском 15
то есть остальные длинные слова исключаются как нечастотные
вопрос вот окуда - допустим необходимо очень экономить каждый байт
задается максимальнодопутимая длина кодирования
есть ли сравнения этих показателей для разных языков - кто знаыть?
Цитата: mnashe от марта 15, 2012, 12:02Ну ты понял, что я имел в виду.
Не получится. <...> Тем более.
Цитата: Вадимий от марта 15, 2012, 11:58В данном случае нет, поскольку ударный уже давно передаётся mater lectionis י.
Консонантная письменность не мешает ивриту для химической номенклатуры? а то всякие там сульфаты vs сульфиты и проч.
Цитата: Вадимий от марта 15, 2012, 11:55Не получится. Это конкретное вещество (ЦПВ-2, использовалось для проявления цветной фотобумаге в советском / восточногерманском процессе), а не класс веществ.
Этилоксиэтилпарафенилендиаминсульфатами (39 букв) считается?
Цитата: Вадимий от марта 15, 2012, 11:55Тем более.
Этилоксиэтилпарафенилендиаминсульфатствовать (44 буквы) считается?
Страница создана за 0.076 сек. Запросов: 23.