Здравствуйте! Я разрабатываю программу для синтеза текстов на русском языке. Я программист, углубляться в русский язык начал недавно, появился один вопрос который ставит меня в тупик. Нужна помощь специалистов.
Есть, к примеру, два глагола: "имеется" и "является". Морфологические признаки у них одинаковые, и склоняются они тоже одинаково. Но в предложении они используются по разному:
Экран является сенсорным
<КТО, ЧТО> является <ЧЕМ, КАКИМ>
В телефоне имеется камера
<ГДЕ> имеется <ЧТО>
Поддается ли это какой-то формализации? Мне кажется вариантов использования глаголов не сильно много, может есть какие-то таблицы для этого? Или может я какой-то признак не учел?
P.S. Буду благодарен если еще посоветуете литературу по формальному и более менее полному описанию языка. С табличками всякими, исключениями, что бы было понятно IT-шнику :)
Здравствуйте, inferno! То, о чём Вы пишете, называется аргументной структурой глагола. Каждый глагол описывает ситуацию с определённым количеством участников, в зависимости от этого глаголы разделяются на одно-, двух-, трёхместные и т.д. (максимальное число аргументов у глагола в русском языке — 6). Для каждого аргумента заданы ограничения на то, какой грамматической формой он может выражаться (главным образом это падежные формы и предлоги), и на то, словами каких семантических разрядов он может выражаться.
Ещё ключевые слова для поиска: предикат, актант, валентность, пропозиция, диатеза.
Словарь глагольного управления не подойдёт?
http://mytts.forum2x2.ru/forum-f9/tema-t138.htm
Какая досада! Этого словаря и след простыл. :(
Цитата: myst от апреля 1, 2010, 09:49
Какая досада! Этого словаря и след простыл. :(
В смысле? А это разве не он?
Он, но с Яндекса не хотел скачиваться, я подумал, что он сгинул. :what:
Хм... Фоксом скачивается, Оперой нет. Бред какой-то...
На анонимной вкладке скачивается. Хренасе... Яндекс Опере заподлит?
Это так-называемая copula
Глаголы "бытья" типа "становится", "является" и т.д. имеют форму A = B
пример: мальчик ростет умным (мальчик = умный)
но в русском еще есть предложения типа "Я умный" в которых глагол отсутсвует и это не происходит; хотя в прошлом времени - "Я был умным" - все в порядке
Цитата: inferno от апреля 1, 2010, 07:19
Я разрабатываю программу для синтеза текстов на русском языке.
Про анализ морфологии и синтаксиса с позиций программирования писали на http://habrahabr.ru/в начале года. Там и ссылки на литературу были.
Цитата: inferno от апреля 1, 2010, 07:19
Морфологические признаки у них одинаковые, и склоняются они тоже одинаково.
:???
Цитата: inferno от апреля 1, 2010, 07:19
Поддается ли это какой-то формализации?
С трудом.
Цитата: inferno от апреля 1, 2010, 07:19
Мне кажется вариантов использования глаголов не сильно много, может есть какие-то таблицы для этого?
Много вариантов и частных случаев. Смотрите наработки по проблеме машинного перевода.
Большое спасибо всем ответившим! Ключевые слова хорошо помогли, теперь более ясно стало. Посмотрел словарь глагольного управления, оказывается очень много вариантов употребления глаголов, не учел что с предлогами тоже надо возиться. Еще и с другими частями речи сложности. Значит надо кроме словаря морфологии использовать словарь управления. Кстати это самый полный что есть?
Цитата: I. G. от апреля 1, 2010, 12:10
Цитата: inferno от апреля 1, 2010, 07:19
Морфологические признаки у них одинаковые, и склоняются они тоже одинаково.
:???
Я имел в виду парадигмы слов одинаковые (как в словаре http://aot.ru пишут)
Цитата: I. G. от апреля 1, 2010, 12:07
Про анализ морфологии и синтаксиса с позиций программирования писали на http://habrahabr.ru/в начале года. Там и ссылки на литературу были.
Ага, спасибо, нашел.
Цитата: inferno от апреля 1, 2010, 13:24
Кстати это самый полный что есть?
Хорошо, что хоть это нашлось. С русским языком печальная ситуация. Даже корпус зажали. :(
Придется свой словарь наполнять, я так понял мне еще нужно тета-роли прописывать каждому предикату, так как у меня изначально есть смысловое (семантическое?) дерево. А то будет получаться "Вася бьет кочергу Петей" :)
И много ли Вы хотите слов использовать?
Вроде как не много. В основном описательные слова, как в первом посте.