Лингвофорум

Теоретический раздел => Общая лингвистика => Тема начата: Василий Степанович от октября 18, 2016, 12:01

Название: Какой словарь использовать для создания Тезауруса?
Отправлено: Василий Степанович от октября 18, 2016, 12:01
Есть задача создать Тезаурус русского языка - дерево сущностей и синонимы для каждой сущности

Какой словарь лучше выбрать для этой работы?

Я выбрал этот -
О. Н. Ляшевская, С. А. Шаров, Частотный словарь современного русского языка (на материалах Национального корпуса русского языка)

Логика такая - ближе к корню дереева сущностей располагаются наиболее частотные слова

Название: Какой словарь использовать для создания Тезауруса?
Отправлено: Bhudh от октября 18, 2016, 19:48
Тезаурус по определению — словарь, содержащий все возможные слова и словосочетания.
Так что ответ только один — ВСЕ словари.
Название: Какой словарь использовать для создания Тезауруса?
Отправлено: Alone Coder от октября 18, 2016, 23:46
Для начала надо определиться, какой язык анализируем - разговорный русский или СРЛЯ.
Название: Какой словарь использовать для создания Тезауруса?
Отправлено: Василий Степанович от октября 19, 2016, 07:40
Тезаурус создается от корня - от общих слов к частным
на начальном этапе важно правильно сформировать корень и основные ветви
в дальнейшем можно добавлять слова бесконечно

какой язык? - обычный современный разговорно-литературный
цель любительская научно-исследовательская - использовать в машинном переводе и ИИ

Название: Какой словарь использовать для создания Тезауруса?
Отправлено: Alone Coder от октября 20, 2016, 01:14
Частотный словарь Шарова составлен по корпусу литературных текстов. В разговорном русском не то что частоты - там и структуры фраз другие. Разговорный язык в основном обслуживает диалог, а литературный - монолог.
Название: Какой словарь использовать для создания Тезауруса?
Отправлено: pomogosha от октября 20, 2016, 17:58
Цитата: Василий Степанович от октября 19, 2016, 07:40
Тезаурус создается от корня - от общих слов к частным
на начальном этапе важно правильно сформировать корень и основные ветви
в дальнейшем можно добавлять слова бесконечно
Поскольку "тезаурус" вы хотите строить "от правильно сформированного корня", то на первом этапе полезным будет СМРЯ: Кузнецова А.И., Ефремова Т.Ф. Словарь морфем русского языка: Ок. 52000 слов.- М.: Рус. яз., 1986.- 1136 с.
Списоки морфем РЯ здесь (все С_М_):  Приложение 1. Корни русского языка, сведённые в морфемы, сс. 1105 - 1121 (http://lingvoforum.net/index.php?action=profile;area=showposts;sa=attach;u=27295))
Далее — Словообразовательно-морфемный словарь русского языка (http://old.kpfu.ru/infres/slovar1/slov.htm)
и Cловари русского языка для скачивания
(http://speakrus.ru/dict/) Выбирайте, скачивайте, стройте свой тезаурус!  :yes:
Название: Какой словарь использовать для создания Тезауруса?
Отправлено: Василий Степанович от октября 21, 2016, 09:43
pomogosha, аргументируй свой совет

если вы разбираетесь в словарях то обьясните ваш выбор
и ваше мнение о  ->  О. Н. Ляшевская, С. А. Шаров, Частотный словарь современного русского языка (на материалах Национального корпуса русского языка)