Способ и система для хранения и поиска информации, извлекаемой из текстовых документов - RU2015109666A

Код документа: RU2015109666A

Реферат

1. Способ для компьютерной системы, предназначенный для хранения, поиска и обновления данных, извлекаемых из текстовых документов, заключающийся в том, что, по меньшей мере, один раз производят следующую последовательность действий:- производят извлечение по крайней мере одного первого информационного объекта из текстового документа;- формируют по крайней мере один триплет вида <субъект, предикат, объект>;- обеспечивают организацию доступа к хранилищу извлеченной информации, содержащему RDF-граф, включающий множество триплетов вида <субъект, предикат, объект> для множества различных информационных объектов, извлеченных из множества разных текстовых документов;- осуществляют поиск в хранилище извлеченной информации второго информационного объекта, представляющего тот же объект реального мира, что и первый информационный объект, где любые два информационных объекта отождествляются, если указанные объекты имеют по крайней мере общий объектный параметр, и где поиск включает выбор и поиск в, по меньшей мере, одной из трех типов таблиц идентификаторов, содержащих дуплетный, триплетный или квадовый поисковый индекс, где каждый поисковый индекс основан на по крайней мере двух параметрах, выбираемых из множества: субъект, предикат, объект, документ;- и если найден, по меньшей мере, один второй информационный объект, который соотносится с тем же самым объектом реального мира, что и первый информационный объект, обновляют состояние хранилища извлеченной информации посредством добавления по крайней мере одного триплета <субъект, предикат, объект> о первом информационном объекте к RDF-графу и обновляют, по крайней мере, один из 3-х типов индексов.2.

Авторы

Заявители

СПК: G06F40/10 G06F40/211 G06F40/30

Публикация: 2016-10-10

Дата подачи заявки: 2015-03-19

0
0
0
0
Невозможно загрузить содержимое всплывающей подсказки.
Поиск по товарам