Цитата: beaver от марта 5, 2013, 23:38В качестве корпуса можно взять http://opencorpora.org/?page=downloads, там есть части речи, но он очень маленький...
Цитата: Phoenix от февраля 25, 2010, 18:29
Здравствуйте. Задача достаточно специфическая. Я программист, и ищу совета у вас.
Я хочу программным путем сделать алгоритм определения части речи заданного слова. Возможно кто сталкивался или знает нюансы по которым можно это определение как можно точнее.
Пока мысли были такие...
Прилагательные разделять по вхождению окончания -ый -ай -ой и т.п.
Глаголы по -ать -ять и т.п.
Но так очень много слов будут не определены или ошибочно определены (это не так важно).
Точное определение части речи не столь важно, мне главное разграничить слова по важности (т.е. существительное, глагол, прилагательное и т.п.)
Цитата: arseniiv от февраля 25, 2010, 18:47О словарях я что то не подумал. Там по идее большая часть слов "распознана" может кому известны их системы распознавания? (т.к. все слова перебором не впишешь). Возможно есть свободные словари? с открытой базой слов...
Если разные формы, то вот ещё: зеваю — караваю. Вроде, до сих пор был один выход: словарь. Но вам тогда нужен будет словарь с кучей форм. Или попробовать по одной форме искать в словаре все возможные остальные. И тут придётся добавить мини-словарь, связывающий "совсем разные" формы: он — его — им — ... И т.д. с модификациями. (Мне кажется, сейчас вроде обычно так делают.)
Цитата: arseniiv от февраля 25, 2010, 18:47Я потом буду строить дерево зависимости от главных (слов) к зависимым (словам). Тем самым получая вложенную структуру, которая со временем будет описывать объект (главное слово) в полном объеме его возможных зависимостей.
Кстати, разбор на что-то типа ключевых слов или какой?
Цитата: Phoenix от февраля 25, 2010, 18:29Даже тут уже плохо: кровать, магний...
Точное определение части речи не столь важно, мне главное разграничить слова по важности (т.е. существительное, глагол, прилагательное и т.п.)
Цитата: Phoenix от февраля 25, 2010, 18:40Удачи вам и целеустремлённости!
У меня в планах разбор предложений, книг и т.п.
Цитата: Евгений от февраля 25, 2010, 18:36
Слово должно быть задано только в начальной форме или в любой?
Страница создана за 0.101 сек. Запросов: 23.