Печать страницы - Распределение слов по количеству слогов (в санскрите)

Название: Распределение слов по количеству слогов (в санскрите)
Отправлено: gasyoun от января 14, 2014, 17:44

Господа,

По образцу приложений Зализняка сделали подобные вычисления для санскрита. Интересно, или спросите - зачем?

М.Г.

Название: Распределение слов по количеству слогов (в санскрите)
Отправлено: unlight от января 14, 2014, 17:49

Мне почему-то только вспомнился анекдот про среднюю длину слова в русском языке...

Название: Распределение слов по количеству слогов (в санскрите)
Отправлено: gasyoun от января 14, 2014, 18:51

Что-нибудь еще?

Название: Распределение слов по количеству слогов (в санскрите)
Отправлено: Komar от января 14, 2014, 19:07

Посмотрел.
Вообще не понимаю, что это за циферки.

В первой строке -

слова, образующие хотя бы 1 слог - отсутствуют
односложные слова - 8 штук
слова, содержащие более одного слога - 3221 штука
...
всего слов, имеющих ударение - 12998 штук

Объяснение будет?

Название: Распределение слов по количеству слогов (в санскрите)
Отправлено: gasyoun от января 16, 2014, 10:06

Цитата: Komar от января 14, 2014, 19:07
Вообще не понимаю, что это за циферки.

http://yadi.sk/d/IR0eXv9HEV6iX 938 стр. Помогло?

Цитата: Komar от января 14, 2014, 19:07
В первой строке -

слова, образующие хотя бы 1 слог - отсутствуют
односложные слова - 8 штук
слова, содержащие более одного слога - 3221 штука
...
всего слов, имеющих ударение - 12998 штук

Перед нами анализ 20204 слов, все слова с ударениями из словаря Бётлинга. Из них 12998 - столько слов заканчиваются на "-а". Односложные слова - 8 штук, то есть слов из одного слова всего 8, что именно тут требует пояснений?
Ты слегка попутал столбики.
Слова, содержащие более 1 слога - 5594 шт. То есть это 2,3,4,5,6,7 сложные слова.
"слова, образующие хотя бы 1 слог" - такой формулировки у меня нет, не пойму, о чем ты.
"слова, содержащие более одного слога - 3221 штука" такого у меня нет, а есть "Слова, содержащие более 2 слогов - 3221 штука". Почувствуйте разницу. Чтобы понять о чем таблица, тебе нужны примери слов или что-то еще? Ты как-то сбоку на таблицу смотришь и берешь значения из разных колонок, однако этого не требуется для ее расшифровки :)

Название: Распределение слов по количеству слогов (в санскрите)
Отправлено: Komar от января 16, 2014, 17:02

Цитата: gasyoun от января 16, 2014, 10:06
"слова, образующие хотя бы 1 слог" - такой формулировки у меня нет, не пойму, о чем ты.

Это четвёртый столбик твоей таблицы.

Цитата: gasyoun от января 16, 2014, 10:06
http://yadi.sk/d/IR0eXv9HEV6iX 938 стр. Помогло?

Да, помогло. Только не все 938 страниц, а одна конкретная страница с аналогичной таблицей. У Зализняка таблица нормально подписана и всё понятно. А у тебя информативная часть из шапки выкинута. Потому и не понятно ничего. Умеешь ты сделать из любой полезной информации чепуху.

В принципе, такая статистическая информация иногда могла бы пригодиться.

Только в твоей таблице информация недостоверная. У тебя написано, что в санскрите нет ни одного слова на -а без ударения. Тогда как в санскрите и слова без ударения есть, и туча слов с необозначенным ударением. Верность других данных проверить не могу, но в свете вышесказанного всё выглядит очень сомнительным.

Название: Распределение слов по количеству слогов (в санскрите)
Отправлено: gasyoun от января 16, 2014, 20:38

Цитата: Komar от января 16, 2014, 17:02
Это четвёртый столбик твоей таблицы.

Нет, так, как ты написал, у меня не написано, вроде проверил, именно так - не написано.

Цитата: Komar от января 16, 2014, 17:02
Да, помогло. Только не все 938 страниц, а одна конкретная страница с аналогичной таблицей.

Так я тебе и дал ссылку на конкретную страницу. Не всю же книгу читать.

Цитата: Komar от января 16, 2014, 17:02
У Зализняка таблица нормально подписана и всё понятно.

Прикольно, но у меня 1 в 1. Но у него, разумеется, понятнее.

Цитата: Komar от января 16, 2014, 17:02
А у тебя информативная часть из шапки выкинута. Потому и не понятно ничего. Умеешь ты сделать из любой полезной информации чепуху.

Шапка идентичная. Сгенерировал заново, увеличив для слабозрячих.

Цитата: Komar от января 16, 2014, 17:02
В принципе, такая статистическая информация иногда могла бы пригодиться.

Только в твоей таблице информация недостоверная. У тебя написано, что в санскрите нет ни одного слова на -а без ударения. Тогда как в санскрите и слова без ударения есть, и туча слов с необозначенным ударением. Верность других данных проверить не могу, но в свете вышесказанного всё выглядит очень сомнительным.

Здесь я разбираю лишь слова с ударениями. Для слов без ударений есть отдельная статистика. Отдельная таблица. Ничего сомнительного. Распределение слов по месту ударения - тут именно речь про ударения. А "слова на -а без ударения" - отдельная таблица.
1   Sum   %
a   28024   10,986%
ā   6385   2,503%
i   1376   0,539%
ī   372   0,146%
u   7300   2,862%
ū   536   0,210%
ṛ   750   0,294%
ṝ   2   0,001%
e   1286   0,504%
ai   319   0,125%
o   335   0,131%
au   581   0,228%
ḷ   9   0,004%
ḹ   1   0,000%
k   17147   6,722%
kh   1368   0,536%
g   6267   2,457%
gh   913   0,358%
ṅ   3   0,001%
c   4737   1,857%
ch   674   0,264%
j   4489   1,760%
jh   230   0,090%
ñ   4   0,002%
ṭ   173   0,068%
ṭh   26   0,010%
ḍ   171   0,067%
ḍh   50   0,020%
ṇ   41   0,016%
t   7246   2,841%
th   44   0,017%
d   10142   3,976%
dh   3144   1,233%
n   10507   4,119%
p   27123   10,633%
ph   686   0,269%
b   5191   2,035%
bh   5704   2,236%
m   13821   5,418%
y   3972   1,557%
r   6536   2,562%
l   3385   1,327%
v   23805   9,332%
ś   12607   4,942%
ṣ   836   0,328%
s   32225   12,633%
h   4538   1,779%

Название: Распределение слов по количеству слогов (в санскрите)
Отправлено: Komar от января 16, 2014, 23:46

Цитата: gasyoun от января 16, 2014, 20:38
Нет, так, как ты написал, у меня не написано, вроде проверил, именно так - не написано.

Ну... проверь ещё раз. Что я могу ещё сказать?
Если ты в своей таблице сам разобраться не можешь, то на кой такая таблица нужна?

Цитата: gasyoun от января 16, 2014, 20:38
Так я тебе и дал ссылку на конкретную страницу. Не всю же книгу читать.

Это я тормознул.

Цитата: gasyoun от января 16, 2014, 20:38
Прикольно, но у меня 1 в 1. Но у него, разумеется, понятнее.

Цитата: gasyoun от января 16, 2014, 20:38
Шапка идентичная. Сгенерировал заново, увеличив для слабозрячих.

Ну да, конечно, идентичная. Ты просто убрал ключевую для понимания смысла таблицы фразу - "Ударение падает на n-й слог по счёту от конца слова". А без этой фразы все эти колонки n=1 и пр. выглядят как полный маразм.
(http://i57.fastpic.ru/big/2014/0117/8a/a54f5d321f30869ff0d470be0b3a8b8a.gif)

И ещё в первом файле вместо "слова без ударения" я вижу бессмысленное "слова без".

Цитата: gasyoun от января 16, 2014, 20:38
Здесь я разбираю лишь слова с ударениями. Для слов без ударений есть отдельная статистика. Отдельная таблица. Ничего сомнительного. Распределение слов по месту ударения - тут именно речь про ударения. А "слова на -а без ударения" - отдельная таблица.

Для слов на -а без ударения в этой таблице отведено 2 столбика, и везде стоят прочерки, что означает, что слова без ударений отсутствуют. Получается что ты имеешь в виду одно, а пишешь в таблице совсем другое.

Цитировать1 Sum %
a 28024 10,986%
ā 6385 2,503%
i 1376 0,539%

Это ещё что такое?

Название: Распределение слов по количеству слогов (в санскрите)
Отправлено: gasyoun от января 17, 2014, 18:01

Цитата: Komar от января 16, 2014, 23:46
Ну... проверь ещё раз. Что я могу ещё сказать?

Колонку снимаем, см. ниже.

Цитата: Komar от января 16, 2014, 23:46
Ну да, конечно, идентичная. Ты просто убрал ключевую для понимания смысла таблицы фразу - "Ударение падает на n-й слог по счёту от конца слова". А без этой фразы все эти колонки n=1 и пр. выглядят как полный маразм.

Фразу вернул, простите, не нарошно.

Цитата: Komar от января 16, 2014, 23:46
Для слов на -а без ударения в этой таблице отведено 2 столбика, и везде стоят прочерки, что означает, что слова без ударений отсутствуют. Получается что ты имеешь в виду одно, а пишешь в таблице совсем другое.

В русском языке слов без ударений - единицы. Поэтому весь Обратный словарь русского языка, 121 500 слов можно разложить по таблице и "Слова без ударения" будут единичны. Поэтому они не портят общую картину, не вводят в заблуждение, если рассматривать %. С санскритскими ударениями по веселее, поэтому, согласен, "Слова без ударения" правильнее будет упразднить для санскрита. На сегодня из 270 000 слов на санскрите лишь 20 000 с ударением (из вед). Ну еще из приложений Шмита что-то набереться, у Макдонеля ударения проставлены. Все равно небольшая часть. Вишва Бандху - не оцифрован, там 120 000 с чем-то слов, сколько с ударениями - никто не знает. Но ударения Вишва Бандху и Бётлинга расходятся, по предварительным подсчетам каждый пятый случай, то есть источник небезопасный.

Цитата: Komar от января 16, 2014, 23:461 Sum %
a 28024 10,986%
ā 6385 2,503%
i 1376 0,539%
Это ещё что такое?

Статистика окончаний всех слов, с ударением или без - без разницы. Вместо упраздненной колонки. То есть у меня отдельная таблица окончаний, где я не обращаю внимание на ударения.

Лингвофорум

Теоретический раздел => Индоевропейские языки => Индоиранские языки => Тема начата: gasyoun от января 14, 2014, 17:44