Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.
Ограничения: максимум вложений в сообщении — 3 (3 осталось), максимальный размер всех файлов — 300 КБ, максимальный размер одного файла — 100 КБ
Снимите пометку с вложений, которые необходимо удалить
Перетащите файлы сюда или используйте кнопку для добавления файлов
Вложения и другие параметры
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр

Сообщения в этой теме

Автор antbez
 - марта 18, 2012, 15:50
Наверно, нужно отделить термины от не-терминов. Термины часто являются композитами (если в языке допускается композиция).
Автор Sudarshana
 - марта 15, 2012, 22:16
прапра...∞...прабабушка же
Автор murator
 - марта 15, 2012, 21:55
Цитата: Гвость от марта 13, 2012, 10:03
каков размер границы длинны знаков описывающих сущность?

например знаю что в среднем в русском это число: 6 знаков

допустим максимум в русском 15
то есть остальные длинные слова исключаются как нечастотные


вопрос вот окуда - допустим необходимо очень экономить каждый байт
задается максимальнодопутимая длина кодирования



есть ли сравнения этих показателей для разных языков - кто знаыть?
Возьмите какой-нибудь большой текст типа "Войны и мира", распарсите его на слова, и посмотрите распределение их длин. Выбросьте n% самых длинных и получите нужную квантиль.
И так для каждого языка.
Автор Karakurt
 - марта 15, 2012, 21:41
И тут длиной меряются.
Автор Вадимий
 - марта 15, 2012, 12:08
Цитата: mnashe от марта 15, 2012, 12:02
Не получится. <...> Тем более.
Ну ты понял, что я имел в виду.
Автор Вадимий
 - марта 15, 2012, 12:07
В немецком можно таких слов понасоздавать — закачаешься. То же числительное. В вике было где-то, так что можно почитать (я всё равно могу где-нибудь наляпать).

В ложбане длина собственных слов теоретически неограниченная. Для примера:
jbojevysofkemsuzgugje'ake'eborkemfaipaltrusi'oke'ekemgubyseltru «Ложбанская Советская Федеративная Социалистическая Республика» (63 символа, из них 4 апострофа). А измерить среднюю длину слова в ложбане — это интересно! Вроде даже есть книги на ложбане (хотя бы одну я знаю), вот можно проанализировать.

В польском, подозреваю, будет довольно большая средняя длина из-за всяких там rz да szcz. А а найти одно из максимальных по длине слово в начальной форме — тоже, думаю, увлекательно.
Автор mnashe
 - марта 15, 2012, 12:04
Цитата: Вадимий от марта 15, 2012, 11:58
Консонантная письменность не мешает ивриту для химической номенклатуры? а то всякие там сульфаты vs сульфиты и проч.
В данном случае нет, поскольку ударный уже давно передаётся mater lectionis י.
Автор mnashe
 - марта 15, 2012, 12:02
Цитата: Вадимий от марта 15, 2012, 11:55
Этилоксиэтилпарафенилендиаминсульфатами (39 букв) считается?
Не получится. Это конкретное вещество (ЦПВ-2, использовалось для проявления цветной фотобумаге в советском / восточногерманском процессе), а не класс веществ.

Цитата: Вадимий от марта 15, 2012, 11:55
Этилоксиэтилпарафенилендиаминсульфатствовать (44 буквы) считается?
Тем более.

Можно обойтись тв.п. ед.ч. — 38.
Автор Вадимий
 - марта 15, 2012, 11:58
Offtop
Консонантная письменность не мешает ивриту для химической номенклатуры? а то всякие там сульфаты vs сульфиты и проч.