Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Распределение слов по количеству слогов (в санскрите)

Автор gasyoun, января 14, 2014, 17:44

0 Пользователи и 1 гость просматривают эту тему.

gasyoun

Господа,

  По образцу приложений Зализняка сделали подобные вычисления для санскрита. Интересно, или спросите - зачем?

М.Г.
http://groups.google.com/group/Nagari/ & http://nagari.southindia.ru
Словари санскрита, прописи дэванагари, материалы по авестийскому, хинди

unlight

Мне почему-то только вспомнился анекдот про среднюю длину слова в русском языке...
Ἡ ἀρχή καί ἡ μεσότης καί τό τέλος, τῶν χρόνῳ διαιρετῶν εἰσι γνωρίσματα.

gasyoun

http://groups.google.com/group/Nagari/ & http://nagari.southindia.ru
Словари санскрита, прописи дэванагари, материалы по авестийскому, хинди

Komar

Посмотрел.
Вообще не понимаю, что это за циферки.

В первой строке -

слова, образующие хотя бы 1 слог - отсутствуют
односложные слова - 8 штук
слова, содержащие более одного слога - 3221 штука
...
всего слов, имеющих ударение - 12998 штук

Объяснение будет?
Всему свое время, и время всякой вещи под небом: время рождаться, и время умирать; время насаждать, и время вырывать; время разбрасывать, и время собирать; время молчать, и время флудить.

gasyoun

Цитата: Komar от января 14, 2014, 19:07
Вообще не понимаю, что это за циферки.

http://yadi.sk/d/IR0eXv9HEV6iX 938 стр. Помогло?

Цитата: Komar от января 14, 2014, 19:07
В первой строке -

слова, образующие хотя бы 1 слог - отсутствуют
односложные слова - 8 штук
слова, содержащие более одного слога - 3221 штука
...
всего слов, имеющих ударение - 12998 штук

Перед нами анализ 20204 слов, все слова с ударениями из словаря Бётлинга. Из них 12998 - столько слов заканчиваются на "-а". Односложные слова - 8 штук, то есть слов из одного слова всего 8, что именно тут требует пояснений?
Ты слегка попутал столбики.
Слова, содержащие более 1 слога - 5594 шт. То есть это 2,3,4,5,6,7 сложные слова.
"слова, образующие хотя бы 1 слог" - такой формулировки у меня нет, не пойму, о чем ты.
"слова, содержащие более одного слога - 3221 штука" такого у меня нет, а есть "Слова, содержащие более 2 слогов - 3221 штука". Почувствуйте разницу. Чтобы понять о чем таблица, тебе нужны примери слов или что-то еще? Ты как-то сбоку на таблицу смотришь и берешь значения из разных колонок, однако этого не требуется для ее расшифровки :)
http://groups.google.com/group/Nagari/ & http://nagari.southindia.ru
Словари санскрита, прописи дэванагари, материалы по авестийскому, хинди

Komar

Цитата: gasyoun от января 16, 2014, 10:06
"слова, образующие хотя бы 1 слог" - такой формулировки у меня нет, не пойму, о чем ты.
Это четвёртый столбик твоей таблицы.

Цитата: gasyoun от января 16, 2014, 10:06
http://yadi.sk/d/IR0eXv9HEV6iX 938 стр. Помогло?

Да, помогло. Только не все 938 страниц, а одна конкретная страница с аналогичной таблицей. У Зализняка таблица нормально подписана и всё понятно. А у тебя информативная часть из шапки выкинута. Потому и не понятно ничего. Умеешь ты сделать из любой полезной информации чепуху.

В принципе, такая статистическая информация иногда могла бы пригодиться.

Только в твоей таблице информация недостоверная. У тебя написано, что в санскрите нет ни одного слова на -а без ударения. Тогда как в санскрите и слова без ударения есть, и туча слов с необозначенным ударением. Верность других данных проверить не могу, но в свете вышесказанного всё выглядит очень сомнительным.




Всему свое время, и время всякой вещи под небом: время рождаться, и время умирать; время насаждать, и время вырывать; время разбрасывать, и время собирать; время молчать, и время флудить.

gasyoun

Цитата: Komar от января 16, 2014, 17:02
Это четвёртый столбик твоей таблицы.
Нет, так, как ты написал, у меня не написано, вроде проверил, именно так - не написано.

Цитата: Komar от января 16, 2014, 17:02
Да, помогло. Только не все 938 страниц, а одна конкретная страница с аналогичной таблицей.
Так я тебе и дал ссылку на конкретную страницу. Не всю же книгу читать.

Цитата: Komar от января 16, 2014, 17:02
У Зализняка таблица нормально подписана и всё понятно.
Прикольно, но у меня 1 в 1. Но у него, разумеется, понятнее.

Цитата: Komar от января 16, 2014, 17:02
А у тебя информативная часть из шапки выкинута. Потому и не понятно ничего. Умеешь ты сделать из любой полезной информации чепуху.

Шапка идентичная. Сгенерировал заново, увеличив для слабозрячих.

Цитата: Komar от января 16, 2014, 17:02
В принципе, такая статистическая информация иногда могла бы пригодиться.

Только в твоей таблице информация недостоверная. У тебя написано, что в санскрите нет ни одного слова на -а без ударения. Тогда как в санскрите и слова без ударения есть, и туча слов с необозначенным ударением. Верность других данных проверить не могу, но в свете вышесказанного всё выглядит очень сомнительным.

Здесь я разбираю лишь слова с ударениями. Для слов без ударений есть отдельная статистика. Отдельная таблица. Ничего сомнительного. Распределение слов по месту ударения - тут именно речь про ударения. А "слова на -а без ударения" - отдельная таблица.
1   Sum   %
a   28024   10,986%
ā   6385   2,503%
i   1376   0,539%
ī   372   0,146%
u   7300   2,862%
ū   536   0,210%
ṛ   750   0,294%
ṝ   2   0,001%
e   1286   0,504%
ai   319   0,125%
o   335   0,131%
au   581   0,228%
ḷ   9   0,004%
ḹ   1   0,000%
k   17147   6,722%
kh   1368   0,536%
g   6267   2,457%
gh   913   0,358%
ṅ   3   0,001%
c   4737   1,857%
ch   674   0,264%
j   4489   1,760%
jh   230   0,090%
ñ   4   0,002%
ṭ   173   0,068%
ṭh   26   0,010%
ḍ   171   0,067%
ḍh   50   0,020%
ṇ   41   0,016%
t   7246   2,841%
th   44   0,017%
d   10142   3,976%
dh   3144   1,233%
n   10507   4,119%
p   27123   10,633%
ph   686   0,269%
b   5191   2,035%
bh   5704   2,236%
m   13821   5,418%
y   3972   1,557%
r   6536   2,562%
l   3385   1,327%
v   23805   9,332%
ś   12607   4,942%
ṣ   836   0,328%
s   32225   12,633%
h   4538   1,779%
http://groups.google.com/group/Nagari/ & http://nagari.southindia.ru
Словари санскрита, прописи дэванагари, материалы по авестийскому, хинди

Komar

Цитата: gasyoun от января 16, 2014, 20:38
Нет, так, как ты написал, у меня не написано, вроде проверил, именно так - не написано.
Ну... проверь ещё раз. Что я могу ещё сказать?
Если ты в своей таблице сам разобраться не можешь, то на кой такая таблица нужна?

Цитата: gasyoun от января 16, 2014, 20:38
Так я тебе и дал ссылку на конкретную страницу. Не всю же книгу читать.
Это я тормознул.

Цитата: gasyoun от января 16, 2014, 20:38
Прикольно, но у меня 1 в 1. Но у него, разумеется, понятнее.
Цитата: gasyoun от января 16, 2014, 20:38
Шапка идентичная. Сгенерировал заново, увеличив для слабозрячих.
Ну да, конечно, идентичная. Ты просто убрал ключевую для понимания смысла таблицы фразу - "Ударение падает на n-й слог по счёту от конца слова". А без этой фразы все эти колонки n=1 и пр. выглядят как полный маразм.


И ещё в первом файле вместо "слова без ударения" я вижу бессмысленное "слова без".

Цитата: gasyoun от января 16, 2014, 20:38
Здесь я разбираю лишь слова с ударениями. Для слов без ударений есть отдельная статистика. Отдельная таблица. Ничего сомнительного. Распределение слов по месту ударения - тут именно речь про ударения. А "слова на -а без ударения" - отдельная таблица.
Для слов на -а без ударения в этой таблице отведено 2 столбика, и везде стоят прочерки, что означает, что слова без ударений отсутствуют. Получается что ты имеешь в виду одно, а пишешь в таблице совсем другое.

Цитировать1   Sum   %
a   28024   10,986%
ā   6385   2,503%
i   1376   0,539%
Это ещё что такое?
Всему свое время, и время всякой вещи под небом: время рождаться, и время умирать; время насаждать, и время вырывать; время разбрасывать, и время собирать; время молчать, и время флудить.

gasyoun

Цитата: Komar от января 16, 2014, 23:46
Ну... проверь ещё раз. Что я могу ещё сказать?

Колонку снимаем, см. ниже.

Цитата: Komar от января 16, 2014, 23:46
Ну да, конечно, идентичная. Ты просто убрал ключевую для понимания смысла таблицы фразу - "Ударение падает на n-й слог по счёту от конца слова". А без этой фразы все эти колонки n=1 и пр. выглядят как полный маразм.

Фразу вернул, простите, не нарошно.

Цитата: Komar от января 16, 2014, 23:46
Для слов на -а без ударения в этой таблице отведено 2 столбика, и везде стоят прочерки, что означает, что слова без ударений отсутствуют. Получается что ты имеешь в виду одно, а пишешь в таблице совсем другое.

В русском языке слов без ударений - единицы. Поэтому весь Обратный словарь русского языка, 121 500 слов можно разложить по таблице и  "Слова без ударения" будут единичны. Поэтому они не портят общую картину, не вводят в заблуждение, если рассматривать %. С санскритскими ударениями по веселее, поэтому, согласен, "Слова без ударения" правильнее будет упразднить для санскрита. На сегодня из 270 000 слов на санскрите лишь 20 000 с ударением (из вед). Ну еще из приложений Шмита что-то набереться, у Макдонеля ударения проставлены. Все равно небольшая часть. Вишва Бандху - не оцифрован, там 120 000 с чем-то слов, сколько с ударениями - никто не знает. Но ударения Вишва Бандху и Бётлинга расходятся, по предварительным подсчетам каждый пятый случай, то есть источник небезопасный.

Цитата: Komar от января 16, 2014, 23:461   Sum   %
a   28024   10,986%
ā   6385   2,503%
i   1376   0,539%
Это ещё что такое?

Статистика окончаний всех слов, с ударением или без - без разницы. Вместо упраздненной колонки. То есть у меня отдельная таблица окончаний, где я не обращаю внимание на ударения.
http://groups.google.com/group/Nagari/ & http://nagari.southindia.ru
Словари санскрита, прописи дэванагари, материалы по авестийскому, хинди

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр