Лингвофорум

Теоретический раздел => Общая лингвистика => Структура языков => Тема начата: az-mnogogreshny от июня 19, 2020, 21:15

Название: Валентность. Статистика.
Отправлено: az-mnogogreshny от июня 19, 2020, 21:15
У меня вопрос. Был ли какой-либо подсчёт относительно частотности в текстах переходных и непереходных глаголов. А в случае с переходными, интересно было бы узнать частотность двухвалентных и трёхвалентных. А про трёхвалентным - частотный расклад по семантическим ролям. Инструмент, бенефактив и прочее.
И есть ли статистика по частотности падежей?
Заранее спасибо.
Название: Валентность. Статистика.
Отправлено: asiaron от июня 20, 2020, 21:12
Судя по рускорп переходные (http://processing.ruscorpora.ru/search.xml?env=alpha&api=1.0&mycorp=JSONeyJkb2Nfc3BoZXJlIjogWyLRhdGD0LTQvtC20LXRgdGC0LLQtdC90L3QsNGPIl0sICJkb2NfaV90YWdnaW5nIjogWyIxIl19&mysent=&mysize=3557693&mysentsize=0&dpp=&spp=&spd=&mydocsize=337&mode=main&sort=i_grtagging&lang=ru&nodia=1&text=lexgramm&parent1=0&level1=0&lex1=&gramm1=V%2Ctran&sem1=&flags1=&sem-mod1=sem&sem-mod1=sem2&parent2=0&level2=0&min2=1&max2=1&lex2=&gramm2=&sem2=&flags2=&sem-mod2=sem&sem-mod2=sem2) и непереходные (http://processing.ruscorpora.ru/search.xml?env=alpha&api=1.0&mycorp=JSONeyJkb2Nfc3BoZXJlIjogWyLRhdGD0LTQvtC20LXRgdGC0LLQtdC90L3QsNGPIl0sICJkb2NfaV90YWdnaW5nIjogWyIxIl19&mysent=&mysize=3557693&mysentsize=0&dpp=&spp=&spd=&mydocsize=337&mode=main&sort=i_grtagging&lang=ru&nodia=1&text=lexgramm&parent1=0&level1=0&lex1=&gramm1=V%2Cintr&sem1=&flags1=&sem-mod1=sem&sem-mod1=sem2&parent2=0&level2=0&min2=1&max2=1&lex2=&gramm2=&sem2=&flags2=&sem-mod2=sem&sem-mod2=sem2) примерно равно для русского


Название: Валентность. Статистика.
Отправлено: az-mnogogreshny от июня 20, 2020, 22:36
Цитата: asiaron от июня 20, 2020, 21:12
Судя по рускорп переходные (http://processing.ruscorpora.ru/search.xml?env=alpha&api=1.0&mycorp=JSONeyJkb2Nfc3BoZXJlIjogWyLRhdGD0LTQvtC20LXRgdGC0LLQtdC90L3QsNGPIl0sICJkb2NfaV90YWdnaW5nIjogWyIxIl19&mysent=&mysize=3557693&mysentsize=0&dpp=&spp=&spd=&mydocsize=337&mode=main&sort=i_grtagging&lang=ru&nodia=1&text=lexgramm&parent1=0&level1=0&lex1=&gramm1=V%2Ctran&sem1=&flags1=&sem-mod1=sem&sem-mod1=sem2&parent2=0&level2=0&min2=1&max2=1&lex2=&gramm2=&sem2=&flags2=&sem-mod2=sem&sem-mod2=sem2) и непереходные (http://processing.ruscorpora.ru/search.xml?env=alpha&api=1.0&mycorp=JSONeyJkb2Nfc3BoZXJlIjogWyLRhdGD0LTQvtC20LXRgdGC0LLQtdC90L3QsNGPIl0sICJkb2NfaV90YWdnaW5nIjogWyIxIl19&mysent=&mysize=3557693&mysentsize=0&dpp=&spp=&spd=&mydocsize=337&mode=main&sort=i_grtagging&lang=ru&nodia=1&text=lexgramm&parent1=0&level1=0&lex1=&gramm1=V%2Cintr&sem1=&flags1=&sem-mod1=sem&sem-mod1=sem2&parent2=0&level2=0&min2=1&max2=1&lex2=&gramm2=&sem2=&flags2=&sem-mod2=sem&sem-mod2=sem2) примерно равно для русского
"По оценке  академика В. В. Виноградова, переходные составляют "приблизительно 1/3"
http://www.emory.edu/INTELNET/dar132.html
Но это по списочному составу, а не по частоте в тексте.
И интересно, какая часть из этой трети - трёх и более валентные? Я так понимаю, что трёхвалентные - очень большая редкость. И их в принципе можно свести к двухвалентным по схеме: "Вася дал книгу Пете" = "Вася (сделал так, что) (Петя получил книгу)". Или не всегда можно избавиться от многовалентности таким способом?
Название: Валентность. Статистика.
Отправлено: asiaron от июня 20, 2020, 23:07
А валентность как измеряется, чтобы однозначный ответ получить?

Просто тут (https://elib.bsu.by/bitstream/123456789/10645/3/%D0%92%D0%BE%D1%80%D0%BE%D0%BD%D0%BE%D0%B2%D0%B8%D1%87%20%D0%92.%D0%92.%20%D0%A1%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8C%20%D0%BB%D0%B5%D0%BA%D1%81%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D1%85%20%D0%B2%D0%B0%D0%BB%D0%B5%D0%BD%D1%82%D0%BD%D0%BE%D1%81%D1%82%D0%B5%D0%B9%20%D0%B2%20%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B5%20%D1%80%D1%83%D1%81%D1%81%D0%BA%D0%BE-%D0%B1%D0%B5%D0%BB%D0%BE%D1%80%D1%83%D1%81%D1%81%D0%BA%D0%BE%D0%B3%D0%BE%20%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE%20%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4%D0%B0.pdf). При подсчётам оперировали не двумя-тремя валентными глаголами, а 5, 7, 9. В тексте статьи указаны англо и чешско язычные словари. Если можно выгрузить пару слово валентность, и найти для этого языка статистику частотности для глаголов этого языка, можно сшить вместе, а потом сгруппировать