Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Длины Русского и Английского языка.

Автор d1st, мая 13, 2010, 13:57

0 Пользователи и 1 гость просматривают эту тему.

Валер

Ну вот видите, наконец мы почти сошлись цифрой. При этом гуманитарий ничего не считал :green:
Несолидарный. С войной, чем-либо, кем-либо.

Убить непросто. Убивать за свою страну намного легче.

Hellerick

ЦитироватьСредняя длина русского слова составляет 5.28 символа. Средняя длина предложения в русском языке составляет 10.38 слов

ЦитироватьThe average length of English words is 4.5 letters

ЦитироватьAverage English sentence length is 14.3 words

Перемножаем одно на другое и получаем 54.81 для русского и 64.35 для английского.

Что бы эти цифры не означали.

Валер

Чисто замечу. Вполне возможно что слова и тексты в случаях двух языков были разные. А именно - есть частотность слов и есть тематики текстов.
Аналогично тому как с 4,9/5,1 усомнюсь в том что при прочих равных (см. начало) английское предложение длиннее русского
Несолидарный. С войной, чем-либо, кем-либо.

Убить непросто. Убивать за свою страну намного легче.

autolyk

Цитата: Валер от марта 19, 2012, 15:10
Чисто замечу. Вполне возможно что слова и тексты в случаях двух языков были разные. А именно - есть частотность слов и есть тематики текстов.
Посмотрите:
//www.arxiv.org/pdf/cs/0103007
Атэц Әүүәл not welcome in this topic

Валер

Как-то сложно для мозга :(  :)
А я правильно понял - там сказано, в частности, что итальянский как-бы в 10 раз синтетичней английского и в 2,5 - немецкого? :)
Несолидарный. С войной, чем-либо, кем-либо.

Убить непросто. Убивать за свою страну намного легче.

autolyk

Цитата: Валер от марта 19, 2012, 15:39
Как-то сложно для мозга
Да я тоже не математик. :)
Цитата: Валер от марта 19, 2012, 15:39
А я правильно понял - там сказано, в частности, что итальянский как-бы в 10 раз синтетичней английского и в 2,5 - немецкого?
Так получается.
Атэц Әүүәл not welcome in this topic

Валер

Несолидарный. С войной, чем-либо, кем-либо.

Убить непросто. Убивать за свою страну намного легче.

RawonaM

Цитата: Hellerick от марта 18, 2012, 13:21
Вольфрам, который знает всё, говорит, что типичный русский перевод англйского текста содержит на 10% больше символов.

http://www.wolframalpha.com/input/?i=Russian typical translation length
Чёй-то бред какой-то.
Ввел (German|French|Italian|Polish|Swedish) typical translation length, все вышли 1,1.
Japanese и Hebrew сказал нет данных.
Как спросить его насчет длины английского перевода русских текстов?
Науке известно, что перевод заведомо получается длиннее (вероятно потому что переводчик пытается передать нюансы языка-оригинала).

Цитата: Маркоман от марта 18, 2012, 15:04
Все языки одинаковы. Один и тот же объем информации за одно и то же время передается.
:fp:

Маркоман

А что не так? Может быть, чтобы на одном языке люди бы вынуждены были говорить долго, а на другом мало, в целом?
Раб Кремляди и Первого канала

Валер

Цитата: Маркоман от марта 19, 2012, 16:03
А что не так? Может быть, чтобы на одном языке люди бы вынуждены были говорить долго, а на другом мало, в целом?
А Вы подумайте над своим первоначальным утверждением
Несолидарный. С войной, чем-либо, кем-либо.

Убить непросто. Убивать за свою страну намного легче.

Маркоман

Раб Кремляди и Первого канала

Валер

Несолидарный. С войной, чем-либо, кем-либо.

Убить непросто. Убивать за свою страну намного легче.

Hellerick

Цитата: RawonaM от марта 19, 2012, 15:54
Чёй-то бред какой-то.
Ввел (German|French|Italian|Polish|Swedish) typical translation length, все вышли 1,1.
Japanese и Hebrew сказал нет данных.
Как спросить его насчет длины английского перевода русских текстов?

http://www.wolframalpha.com/input/?i=1000 words in Russian



Врет, конечно.

Awwal12

Вообще с какого перепуга длину слов меряют в БУКВАХ?... Как-то логичнее это делать в фонемах... Длина слова и длина его записи - тащемта две большие разницы. Последняя к языку, строго говоря, вообще относится постольку поскольку.
Фашиствующий имперец, асексуал и многожёнец, татарофоб, заслуженный функционер РПЦ. Слушает радио "Радонеж" и терпеть не может счастливых людей.

"Да здравствуют ДОЯРКИ!! Потому что доярки - это раса сверхчеловеков. За ними будущее планеты. Они переживут даже атомную войну, потому что доярки вечны, ибо хтоничны. И дадут потомство, которое тоже будет доярами и доярками. Ура, товарищи!.." (c) Awwal12

Валер

Цитата: Awwal12 от марта 19, 2012, 16:13
Вообще с какого перепуга длину слов меряют в БУКВАХ?... Как-то логичнее это делать в фонемах... Длина слова и длина его записи - тащемта две большие разницы. Последняя к языку, строго говоря, вообще относится постольку поскольку.
Да мерять можно в чём угодно - в зависимости от того, зачем :) И в слогах например, об этом выше писали
Опять же - языки разные, в арабском например если я правильно понимаю, вообще особенная значимость фонем
Несолидарный. С войной, чем-либо, кем-либо.

Убить непросто. Убивать за свою страну намного легче.

Hellerick

Цитата: Awwal12 от марта 19, 2012, 16:13
Вообще с какого перепуга длину слов меряют в БУКВАХ?... Как-то логичнее это делать в фонемах...

Смотря для каких целей дэсу.

Очевидзе

ЦитироватьВообще с какого перепуга длину слов меряют в БУКВАХ?..
Потому что анализируют текст.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр