Информационная система с сущностями, отношениями, свойствами

Автор lofti, мая 29, 2016, 16:23

0 Пользователи и 1 гость просматривают эту тему.

lofti

Например, у нас есть прикладная задача сделать бизнес, для которого (в качестве ресурсов) нужны: самосвал, интернет сайт, знания по бухгалтерии. Мы хотим сделать бизнес без особых вложений, задействовав наших друзей как партнеров. Допустим, у нас есть 500 друзей, с которыми мы знакомились в течение 5 лет. Естественно, информация о том у кого что есть подзатерлась.

Допустим, мы имеем гипотетическую базу знаний, где:
1. есть сущности, которые имеют определенные типы (человек, животное, предмет и т.п.)
2. у сущностей есть взаимосвязи между друг другом, которые тоже имеют определенные типы (например, взаимосвязь А владеет B и тому подобное).
3. у сущностей есть свойства (например цвет, способность)

Допустим, в базе знаний, помимо всего прочего, сохранена информация о 500 друзьях (сущности типа человек). Для ряда из них присутствуют взаимосвязи типа "А владеет B" и свойства "цвет B = зеленый". Например:

Коля владеет машиной

цвет машины = красный

И мы можем задав соответствующий запрос найти себе тех троих (или больше) человек, у кого есть нужные нам ресурсы с нужными свойствами: например Костю с самосвалом (грузоподъемоностью более 5 тон), Сашу с сайтом или способностью создания сайта, Петю со способностями в бухгалтерии.

Важно! Пример прикладной задачи и самого запроса - это всего лишь пример, то есть задача может стоять совсем другая, соответственно будут другие типы сущностей, взаимосвязей и свойства.

Собственно вопросы
1. Есть ли существующие решения, которые позволяют создавать, хранить, пополнять, визуализировать (например, в виде интеллект карты) и отправлять запросы на выборку (пример запроса выше описан) в подобную базу.
2. Возможен ли автоматизированный ввод знаний из текста на естественном языке (хотя бы английском). В частности, речь идет про автоматическое распознавание отношений между сущностями, а также свойства сущностей в произвольном тексте?
3. В какое направление стоит углубиться, чтобы решить мою задачу?

p.s. Понимаю, что все описано очень абстрактно и достаточно спорно (если рассматривать реальную ситуацию), но целью было показать мое общее направление мысли.
p.p.s. Если у вас нечего сказать по теме, но вам интересно данное направление исследований, давайте объединяться - так быстрее найдем ответы на свои вопросы.

_Swetlana

Data Mining.
Подробней не скажу, т.к. не занималась.

ЗЫ. То есть, насколько поняла вашу задачу, нужная вам информация в неструктурированном виде находится в какой-то базе; её нужно извлечь и структурировать. Data Mining, говорят, именно этим и занимается.
🐇

Sirko

Цитата: lofti от мая 29, 2016, 16:23
1. Есть ли существующие решения, которые позволяют создавать, хранить, пополнять, визуализировать (например, в виде интеллект карты) и отправлять запросы на выборку (пример запроса выше описан) в подобную базу.
(wiki/ru) Пролог_(язык_программирования)

_Swetlana

Сирко, я пролог преподаю  :) Много лет.
Пролог - всего лишь язык искусственного интеллекта, удобный для создания чего-то. Например, прототипов экспертных систем. Прототипов, потому что коммерческий программный продукт на прологе не пишут, он медленный. В экспертных системах база знаний создаётся руками и головами разработчиков, это самая долгая и дорогая часть проекта.
То есть топикстартёр даёт вам неструктурированный текст, вы его читаете, вы извлекаете из него информацию, структурируете, создаёте базу знаний (которая не факт что будет корректно составлена), пишите оболочку на прологе или берёте готовую, проверяете, что вас эс действительно даёт на ваши запросы разумные ответы, получаете с топикстартёра денежки.
🐇

Sirko

Цитата: _Swetlana от мая 31, 2016, 10:42
Сирко, я пролог преподаю  :) Много лет.
Пролог - всего лишь язык искусственного интеллекта, удобный для создания чего-то. Например, прототипов экспертных систем. Прототипов, потому что коммерческий программный продукт на прологе не пишут, он медленный. В экспертных системах база знаний создаётся руками и головами разработчиков, это самая долгая и дорогая часть проекта.
То есть топикстартёр даёт вам неструктурированный текст, вы его читаете, вы извлекаете из него информацию, структурируете, создаёте базу знаний (которая не факт что будет корректно составлена), пишите оболочку на прологе или берёте готовую, проверяете, что вас эс действительно даёт на ваши запросы разумные ответы, получаете с топикстартёра денежки.
Я дал ответ на первый вопрос, а не на второй.  :)
Упомянутые сущности, взаимосвязи и свойства соответствуют термам, правилам и фактам Пролога.
ЦитироватьТомита-парсер создан для извлечения структурированных данных из текста на естественном языке.

_Swetlana

Вы неправильно давали ответ. Пролог - лишь язык программирования, не более того. Удобный для определённых задач.
🐇

_Swetlana

Data Mining бурно развивается последние 20 лет, уже должны бы быть и готовые решения, но я не в курсе.
🐇

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Обитатель Вселенной

Самое близкое, что приходит на ум — RDF (Resource Description Framework), в котором, в частности, можно скачать дамп WikiData (как пример большой неструктурированной базы).

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр