Лингвофорум

Теоретический раздел => Прикладная лингвистика => Компьютерная лингвистика => Тема начата: handler от декабря 1, 2011, 16:37

Название: Лингвистический парсер словарей
Отправлено: handler от декабря 1, 2011, 16:37
Здравствуйте!
Мне необходимо производить лексикографический разбор слов для поисковой системы. Для словарей лучше всего подходит тернарное дерево, словарь думаю взять из lingvo, хранить в БД, но какие структуры создать и какие методы использовать - мне неведомо. Знаю только, что существует нормализованная форма слова, существуют также слова, не участвующие в поиске (союзы, предлоги,...). Меня интересует общий алгоритм и эффективные методы работы со словарями, Буду признателен за полезные статьи и направления. Спасибо. Алексей
Название: Лингвистический парсер словарей
Отправлено: Alone Coder от декабря 1, 2011, 20:04
http://www.ruscorpora.ru/
Название: Лингвистический парсер словарей
Отправлено: handler от декабря 2, 2011, 02:27
 Это немного не то - у меня на входе строка запроса, а на выходе - исправленная форма + альтернативная "did you mean"