Лингвофорум

Теоретический раздел => Прикладная лингвистика => Компьютерная лингвистика => Topic started by: handler on December 1, 2011, 18:37

Title: Лингвистический парсер словарей
Post by: handler on December 1, 2011, 18:37
Здравствуйте!
Мне необходимо производить лексикографический разбор слов для поисковой системы. Для словарей лучше всего подходит тернарное дерево, словарь думаю взять из lingvo, хранить в БД, но какие структуры создать и какие методы использовать - мне неведомо. Знаю только, что существует нормализованная форма слова, существуют также слова, не участвующие в поиске (союзы, предлоги,...). Меня интересует общий алгоритм и эффективные методы работы со словарями, Буду признателен за полезные статьи и направления. Спасибо. Алексей
Title: Лингвистический парсер словарей
Post by: Alone Coder on December 1, 2011, 22:04
http://www.ruscorpora.ru/
Title: Лингвистический парсер словарей
Post by: handler on December 2, 2011, 04:27
 Это немного не то - у меня на входе строка запроса, а на выходе - исправленная форма + альтернативная "did you mean"