Господа,
По образцу приложений Зализняка сделали подобные вычисления для санскрита. Интересно, или спросите - зачем?
М.Г.
Мне почему-то только вспомнился анекдот про среднюю длину слова в русском языке...
Что-нибудь еще?
Посмотрел.
Вообще не понимаю, что это за циферки.
В первой строке -
слова, образующие хотя бы 1 слог - отсутствуют
односложные слова - 8 штук
слова, содержащие более одного слога - 3221 штука
...
всего слов, имеющих ударение - 12998 штук
Объяснение будет?
Цитата: Komar от января 14, 2014, 19:07
Вообще не понимаю, что это за циферки.
http://yadi.sk/d/IR0eXv9HEV6iX 938 стр. Помогло?
Цитата: Komar от января 14, 2014, 19:07
В первой строке -
слова, образующие хотя бы 1 слог - отсутствуют
односложные слова - 8 штук
слова, содержащие более одного слога - 3221 штука
...
всего слов, имеющих ударение - 12998 штук
Перед нами анализ 20204 слов, все слова с ударениями из словаря Бётлинга. Из них 12998 - столько слов заканчиваются на "-а". Односложные слова - 8 штук, то есть слов из одного слова всего 8, что именно тут требует пояснений?
Ты слегка попутал столбики.
Слова, содержащие более 1 слога - 5594 шт. То есть это 2,3,4,5,6,7 сложные слова.
"слова, образующие хотя бы 1 слог" - такой формулировки у меня нет, не пойму, о чем ты.
"слова, содержащие более одного слога - 3221 штука" такого у меня нет, а есть "Слова, содержащие более 2 слогов - 3221 штука". Почувствуйте разницу. Чтобы понять о чем таблица, тебе нужны примери слов или что-то еще? Ты как-то сбоку на таблицу смотришь и берешь значения из разных колонок, однако этого не требуется для ее расшифровки :)
Цитата: gasyoun от января 16, 2014, 10:06
"слова, образующие хотя бы 1 слог" - такой формулировки у меня нет, не пойму, о чем ты.
Это четвёртый столбик твоей таблицы.
Цитата: gasyoun от января 16, 2014, 10:06
http://yadi.sk/d/IR0eXv9HEV6iX 938 стр. Помогло?
Да, помогло. Только не все 938 страниц, а одна конкретная страница с аналогичной таблицей. У Зализняка таблица нормально подписана и всё понятно. А у тебя информативная часть из шапки выкинута. Потому и не понятно ничего. Умеешь ты сделать из любой полезной информации чепуху.
В принципе, такая статистическая информация иногда могла бы пригодиться.
Только в твоей таблице информация недостоверная. У тебя написано, что в санскрите нет ни одного слова на -а без ударения. Тогда как в санскрите и слова без ударения есть, и туча слов с необозначенным ударением. Верность других данных проверить не могу, но в свете вышесказанного всё выглядит очень сомнительным.
Цитата: Komar от января 16, 2014, 17:02
Это четвёртый столбик твоей таблицы.
Нет, так, как ты написал, у меня не написано, вроде проверил, именно так - не написано.
Цитата: Komar от января 16, 2014, 17:02
Да, помогло. Только не все 938 страниц, а одна конкретная страница с аналогичной таблицей.
Так я тебе и дал ссылку на конкретную страницу. Не всю же книгу читать.
Цитата: Komar от января 16, 2014, 17:02
У Зализняка таблица нормально подписана и всё понятно.
Прикольно, но у меня 1 в 1. Но у него, разумеется, понятнее.
Цитата: Komar от января 16, 2014, 17:02
А у тебя информативная часть из шапки выкинута. Потому и не понятно ничего. Умеешь ты сделать из любой полезной информации чепуху.
Шапка идентичная. Сгенерировал заново, увеличив для слабозрячих.
Цитата: Komar от января 16, 2014, 17:02
В принципе, такая статистическая информация иногда могла бы пригодиться.
Только в твоей таблице информация недостоверная. У тебя написано, что в санскрите нет ни одного слова на -а без ударения. Тогда как в санскрите и слова без ударения есть, и туча слов с необозначенным ударением. Верность других данных проверить не могу, но в свете вышесказанного всё выглядит очень сомнительным.
Здесь я разбираю лишь слова с ударениями. Для слов без ударений есть отдельная статистика. Отдельная таблица. Ничего сомнительного. Распределение слов по месту ударения - тут именно речь про ударения. А "слова на -а без ударения" - отдельная таблица.
1 Sum %
a 28024 10,986%
ā 6385 2,503%
i 1376 0,539%
ī 372 0,146%
u 7300 2,862%
ū 536 0,210%
ṛ 750 0,294%
ṝ 2 0,001%
e 1286 0,504%
ai 319 0,125%
o 335 0,131%
au 581 0,228%
ḷ 9 0,004%
ḹ 1 0,000%
k 17147 6,722%
kh 1368 0,536%
g 6267 2,457%
gh 913 0,358%
ṅ 3 0,001%
c 4737 1,857%
ch 674 0,264%
j 4489 1,760%
jh 230 0,090%
ñ 4 0,002%
ṭ 173 0,068%
ṭh 26 0,010%
ḍ 171 0,067%
ḍh 50 0,020%
ṇ 41 0,016%
t 7246 2,841%
th 44 0,017%
d 10142 3,976%
dh 3144 1,233%
n 10507 4,119%
p 27123 10,633%
ph 686 0,269%
b 5191 2,035%
bh 5704 2,236%
m 13821 5,418%
y 3972 1,557%
r 6536 2,562%
l 3385 1,327%
v 23805 9,332%
ś 12607 4,942%
ṣ 836 0,328%
s 32225 12,633%
h 4538 1,779%
Цитата: gasyoun от января 16, 2014, 20:38
Нет, так, как ты написал, у меня не написано, вроде проверил, именно так - не написано.
Ну... проверь ещё раз. Что я могу ещё сказать?
Если ты в своей таблице сам разобраться не можешь, то на кой такая таблица нужна?
Цитата: gasyoun от января 16, 2014, 20:38
Так я тебе и дал ссылку на конкретную страницу. Не всю же книгу читать.
Это я тормознул.
Цитата: gasyoun от января 16, 2014, 20:38
Прикольно, но у меня 1 в 1. Но у него, разумеется, понятнее.
Цитата: gasyoun от января 16, 2014, 20:38
Шапка идентичная. Сгенерировал заново, увеличив для слабозрячих.
Ну да, конечно, идентичная. Ты просто убрал ключевую для понимания смысла таблицы фразу - "Ударение падает на n-й слог по счёту от конца слова". А без этой фразы все эти колонки n=1 и пр. выглядят как полный маразм.
(http://i57.fastpic.ru/big/2014/0117/8a/a54f5d321f30869ff0d470be0b3a8b8a.gif)
И ещё в первом файле вместо "слова без ударения" я вижу бессмысленное "слова без".
Цитата: gasyoun от января 16, 2014, 20:38
Здесь я разбираю лишь слова с ударениями. Для слов без ударений есть отдельная статистика. Отдельная таблица. Ничего сомнительного. Распределение слов по месту ударения - тут именно речь про ударения. А "слова на -а без ударения" - отдельная таблица.
Для слов на -а без ударения
в этой таблице отведено 2 столбика, и везде стоят прочерки, что означает, что слова без ударений отсутствуют. Получается что ты имеешь в виду одно, а пишешь в таблице совсем другое.
Цитировать1 Sum %
a 28024 10,986%
ā 6385 2,503%
i 1376 0,539%
Это ещё что такое?
Цитата: Komar от января 16, 2014, 23:46
Ну... проверь ещё раз. Что я могу ещё сказать?
Колонку снимаем, см. ниже.
Цитата: Komar от января 16, 2014, 23:46
Ну да, конечно, идентичная. Ты просто убрал ключевую для понимания смысла таблицы фразу - "Ударение падает на n-й слог по счёту от конца слова". А без этой фразы все эти колонки n=1 и пр. выглядят как полный маразм.
Фразу вернул, простите, не нарошно.
Цитата: Komar от января 16, 2014, 23:46
Для слов на -а без ударения в этой таблице отведено 2 столбика, и везде стоят прочерки, что означает, что слова без ударений отсутствуют. Получается что ты имеешь в виду одно, а пишешь в таблице совсем другое.
В русском языке слов без ударений - единицы. Поэтому весь Обратный словарь русского языка, 121 500 слов можно разложить по таблице и "Слова без ударения" будут единичны. Поэтому они не портят общую картину, не вводят в заблуждение, если рассматривать %. С санскритскими ударениями по веселее, поэтому, согласен, "Слова без ударения" правильнее будет упразднить для санскрита. На сегодня из 270 000 слов на санскрите лишь 20 000 с ударением (из вед). Ну еще из приложений Шмита что-то набереться, у Макдонеля ударения проставлены. Все равно небольшая часть. Вишва Бандху - не оцифрован, там 120 000 с чем-то слов, сколько с ударениями - никто не знает. Но ударения Вишва Бандху и Бётлинга расходятся, по предварительным подсчетам каждый пятый случай, то есть источник небезопасный.
Цитата: Komar от января 16, 2014, 23:461 Sum %
a 28024 10,986%
ā 6385 2,503%
i 1376 0,539%
Это ещё что такое?
Статистика окончаний всех слов, с ударением или без - без разницы. Вместо упраздненной колонки. То есть у меня отдельная таблица окончаний, где я не обращаю внимание на ударения.