CN102893281A - 信息搜索设备、信息搜索方法、计算机程序和数据结构 - Google Patents

信息搜索设备、信息搜索方法、计算机程序和数据结构 Download PDF

Info

Publication number
CN102893281A
CN102893281A CN2011800240419A CN201180024041A CN102893281A CN 102893281 A CN102893281 A CN 102893281A CN 2011800240419 A CN2011800240419 A CN 2011800240419A CN 201180024041 A CN201180024041 A CN 201180024041A CN 102893281 A CN102893281 A CN 102893281A
Authority
CN
China
Prior art keywords
search
information
node
path
path field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011800240419A
Other languages
English (en)
Inventor
有熊威
白石展久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN102893281A publication Critical patent/CN102893281A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • G06F16/94Hypermedia
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures

Abstract

一种信息搜索设备,具有:路径字段生成单元,其为每一个节点生成具有作为起点的节点的路径被连接的路径字段;索引生成单元,其为构成所述图形结构信息的每一个元素生成倒排表,倒排表为由具有包括元素和位置信息的路径字段的节点构成的信息的列表,其中位置信息代表所述元素在路径字段中出现的位置,并生成元素和倒排表相互关联的索引库;搜索路径生成单元,其生成表示搜索条件的搜索路径;和搜索单元,其基于倒排表的位置信息提取路径字段满足搜索路径中的元素的出现序列的节点。

Description

信息搜索设备、信息搜索方法、计算机程序和数据结构
技术领域
本发明涉及被配置为搜索信息的设备,更具体地说涉及被配置为从通过节点和连接节点的边表达的图形结构信息中搜索目标节点的信息搜索设备、信息搜索系统、信息搜索方法、计算机程序和数据结构。
背景技术
已知专利文献1中描述的设备是被配置为从由节点和边构成的图形所表示的图形结构信息中搜索目标节点的信息搜索设备。图形结构信息是将构成预期信息的元素表示为节点并将节点之间的关系表示为边的信息。
专利文献1中描述的信息搜索设备将图形结构信息聚集成子图,并为每一个子图生成其中每一个节点是一个索引的表和其中每一个边是一个索引的表。然后,信息搜索设备基于这些表搜索与查询图一致的子图。
进一步地,已知非专利文献1中也描述了另一种与此类似的信息搜索设备。
非专利文献1中描述的信息搜索设备搜索以RDF(资源描述框架)表达的图形结构信息。如图22所示,信息搜索设备配备有关系数据库(以下,数据库也被称为DB)创建部91、关系数据库92和搜索部93。如图23概念性所示,关系数据库92存储分类表、属性表、类型表、资源表、路径表和三元组表。
在RDF中,信息通过由三种元素构成的句子(以下,也称为三元组)表达,所述三种元素为:主体、谓词和对象。主体代表信息模型中的资源,谓词代表资源的属性,对象代表资源或属性值。此外,在将RDF形象化的RDF图中,资源由节点表达,属性由边(也称为弧)表达。
信息搜索设备以以下方式将信息记录到关系数据库92中。
首先,关系数据库创建部91基于给定的RDF图分别生成分类表、属性表、类型表、资源表和三元组表。
接下来,关系数据库创建部91确定将成为根的资源,并产生从确定的根资源到各个其它资源的所有属性的连接(弧形路径)。
进一步地关系数据库创建部91为生成的每一个弧形路径提供路径ID(pathID),并将代表每一个弧形路径的路径表达式(pathexp)和弧形路径的路径ID记录到路径表。此时,代表弧形路径的路径表达式被表达为一列属性名称。
至于以上述方式生成的关系数据库,搜索部93生成SQL查询并执行搜索。
在搜索由指定的唯一路径所限定的信息时,搜索部93可通过使用路径表有效地进行搜索。例如,就图23中所示的关系数据库92的示例而言,在“displaying all of the titles of paintings drawn bysomeone(显示由某人绘制的图画的所有标题)”的情况下,搜索部93生成只指定一个路径的SQL查询(如下所示)并执行搜索。
SELECT r.resourceName
FROM path AS p,resource AS r
WHERE p.pathID=r.pathID
AND p.pathexp=‘#title<#paints’
另外,在搜索未指定唯一路径所限定的信息时,搜索部93可通过使用三元组表执行搜索。未由指定的唯一路径限定的信息为具有属性的资源,即以特定值作为属性值的资源,具有来自以特定值作为属性值的资源的某些属性的资源等。例如,就图23中所示的关系数据库92的示例而言,在“displaying all of the titles of paintings drawn by PabloPicasso(显示由巴勃罗·毕加索绘制的图画的所有标题)”的情况下,搜索部93生成如下所示查询并执行搜索。
SELECT t1.object
FROM triple AS t1,triple AS t2,triple AS t3,triple AS t4
WHERE t1.predicate=‘paints’
AND t1.subject=t2.subject
AND t2.predicate=‘first’
AND t2.object=‘Picasso’
AND t1.subject=t3.subject
AND t3.predicate=‘last’
AND t3.object=‘Pablo’
[专利文献1]日本未经审查的专利申请公开号2009-258749
[非专利文献1]Akiyoshi Matono等人,“基于路径的关系RDF数据库”ADC’05:澳大拉西亚数据库会议的会议记录,第95-103页(2005)(Akiyoshi Matono et al.,“A Path-based Relational RDFDatabase,”ADC’05:Proceedings of the 16th Australasiandatabase conference,pp95-103(2005))
然而,在专利文献1所描述的技术中,由于随着图形结构信息变得复杂,将边用作索引的表中的元组总数会增加,因此存在用于搜索满足查询图的子图的时间会增加的问题。
另外,非专利文献1中描述的技术存在以下问题,即搜索未由指定的唯一路径所限定的信息需要花费时间。
这是因为许多合并操作是在执行查询时进行的,在该时间无法使用路径表。
另外,非专利文献1中描述的技术存在以下问题,即便在搜索由指定的唯一路径所限定的信息的情况下,随着信息模型变得复杂搜索时间会增加。
这是因为随着信息模型变得复杂,路径表中元组的数量会增加。因此,在非专利文献1中,即便在查询可使用路径表的情况下,比较路径表达式的次数成为搜索键,随着路径数量的顺序增加,且搜索时间大大增加。
发明内容
本发明是为了解决上述问题,本发明的目的是提供即使图形结构信息变得复杂也可快速搜索目标节点的信息搜索设备。
本发明的信息搜索设备是被配置为从图形结构信息中搜索满足搜索条件的目标节点的信息搜索设备,图形结构信息包括多个作为元素的节点和连接节点的边。该信息搜索设备包括:路径字段生成部,其被配置为针对所述图形结构信息中所包括的节点中的每一个提取路径,所述路径中的每一个均为能从作为起点的所述节点追踪的一列元素,并为所述节点中的每一个生成其中所提取的路径被连接起来的路径字段;索引生成部,其被配置为针对配置所述图形结构信息的元素中的每一个生成倒排表,所述倒排表为由具有包括该元素和代表该元素在路径字段中出现的位置的位置信息的路径字段的节点构成的信息的列表,并生成其中所述元素和所述倒排表相互关联的索引库;搜索路径生成部,其被配置为以一列元素的形式生成表示搜索条件的搜索路径;和搜索部,被配置为从所述索引库搜索每一个都具有包括在搜索路径中包括的相应元素的路径字段的节点,并基于所述位置信息从搜索的节点中提取具有满足搜索路径中的元素的出现顺序的路径字段的节点。
进一步地,本发明的数据结构是被配置为存储图形结构信息的数据结构,图形结构信息包括多个作为元素的节点和连接节点的边的图形结构信息。在数据结构中,存储每一个元素和倒排表以便相互关联。为每一个元素生成了倒排表,倒排表是由以下内容构成的信息的列表:节点,其具有路径字段,路径字段包括通过连接路径表示的各个节点的路径字段之中的元素,每一个路径是一列可从每一个作为起点的节点追踪的元素;以及位置信息,其表示元素在路径字段中出现的位置。
进一步地,本发明的信息搜索系统包括:一种图形结构信息存储设备,其被配置为存储包括作为元素的多个节点和连接节点的边的图形结构信息;客户端设备,其被配置为请求从所述图形结构信息中搜索满足搜索条件的目标节点;和信息搜索设备,其被配置为从所述图形结构信息中搜索目标节点,其中,所述信息搜索设备包括:路径字段生成部,其被配置为针对所述图形结构信息中所包括的节点中的每一个提取路径,所述路径中的每一个均为能从作为起点的所述节点追踪的一列元素,并为所述节点中的每一个生成其中所提取的路径被连接起来的路径字段;索引生成部,其被配置为针对配置所述图形结构信息的元素中的每一个生成倒排表,所述倒排表为由具有包括该元素和代表该元素在路径字段中出现的位置的位置信息的路径字段的节点构成的信息的列表,并生成其中所述元素和所述倒排表相互关联的索引库;搜索路径生成部,其被配置为以一列元素的形式生成表示搜索条件的搜索路径;和搜索部,被配置为从所述索引库搜索每一个都具有包括在搜索路径中包括的相应元素的路径字段的节点,并基于所述位置信息从搜索的节点中提取具有满足搜索路径中的元素的出现顺序的路径字段的节点。
进一步地,本发明的计算机程序是用于控制信息搜索设备的操作的计算机程序,信息搜索设备被配置为从包括作为元素的多个节点和连接节点的边的图形结构信息中搜索满足搜索条件的目标节点。该计算机程序包括使计算机执行如下处理的指令:路径字段生成处理,针对所述图形结构信息中所包括的节点中的每一个提取路径,所述路径中的每一个均为能从作为起点的所述节点追踪的一列元素,并为所述节点中的每一个生成其中所提取的路径被连接起来的路径字段;索引生成处理,针对配置所述图形结构信息的元素中的每一个生成倒排表,所述倒排表为由具有包括该元素和代表该元素在路径字段中出现的位置的位置信息的路径字段的节点构成的信息的列表,并生成其中所述元素和所述倒排表相互关联的索引库;搜索路径生成处理,该处理以一列元素的形式生成表示搜索条件的搜索路径;和搜索处理,所述处理从所述索引库搜索每一个都具有包括在搜索路径中包括的相应元素的路径字段的节点,并基于所述位置信息从搜索的节点中提取具有满足搜索路径中的元素的出现顺序的路径字段的节点。
进一步地,本发明的信息搜索方法包括:通过图形结构信息存储设备存储包括作为元素的多个节点和连接节点的边的图形结构信息;通过信息搜索设备:针对所述图形结构信息中所包括的节点中的每一个提取路径,所述路径中的每一个均为能从作为起点的所述节点追踪的一列元素;为所述节点中的每一个生成其中所提取的路径被连接起来的路径字段;针对配置所述图形结构信息的元素中的每一个生成倒排表,所述倒排表为由具有包括该元素和代表该元素在路径字段中出现的位置的位置信息的路径字段的节点构成的信息的列表;以及将所述元素和所述倒排表存储于索引库中,以便彼此相关联;通过客户端设备请求所述信息搜索设备从所述图形结构信息中搜索满足搜索条件的目标节点;和通过信息搜索设备:以一列元素的形式生成表示搜索条件的搜索路径;从所述索引库搜索每一个都具有包括在搜索路径中包括的相应元素的路径字段的节点;以及通过基于所述位置信息从搜索的节点中提取具有满足搜索路径中的元素的出现顺序的路径字段的节点来搜索目标节点。
根据本发明,即便图形结构信息变得复杂,也有可能提供能够快速搜索目标节点的信息搜索设备。
附图说明
图1是作为本发明第一示例实施例的信息搜索系统的硬件配置示意图;
图2是作为本发明第一示例实施例的信息搜索系统的功能块示意图;
图3是解释本发明第一示例实施例中的图形结构信息的示例的概念视图;
图4是解释作为本发明第三示例性实施例的信息搜索系统的索引生成操作的流程图;
图5是解释作为本发明第一示例实施例的信息搜索系统所进行的搜索操作的流程图;
图6是示出作为本发明第二示例实施例的信息搜索系统的配置的功能块示意图;
图7是解释本发明第二示例实施例中的知识信息模型的示例的概念视图;
图8是解释本发明第二示例实施例中的路径字段的示例的视图;
图9是解释储存于本发明第二示例实施例中的路径索引的数据的示例的视图;
图10A、10B和10C是解释储存于本发明第二示例实施例中的文字属性索引中的数据的示例的视图;
图11是解释储存于本发明第二示例实施例中的元数据索引中的数据的示例的视图;
图12是解释储存于本发明第二示例实施例中的模型数据DB中的数据的示例的视图;
图13是解释作为本发明第二示例实施例的信息搜索系统的索引生成操作的流程图;
图14是解释作为本发明第二示例实施例的信息搜索系统的搜索操作的流程图;
图15是解释作为本发明第二示例实施例的信息搜索系统的路径查询生成操作的流程图;
图16是解释本发明第二示例实施例中的短语查询示例的概念视图;
图17是示出作为本发明第三示例性实施例的信息搜索系统的配置的功能块示意图;
图18是解释本发明第三示例实施例中的路径字段示例的视图;
图19是解释作为本发明第三示例性实施例的信息搜索系统的索引生成操作的流程图;
图20是示出作为本发明第四示例性实施例的信息搜索系统的配置的功能块示意图;
图21是解释作为本发明第四示例性实施例的信息搜索系统的索引更新操作的流程图;
图22是示出相关技术的信息搜索设备的配置的功能块示意图;和
图23是示出相关技术的信息搜索设备生成的关系数据库的示例的视图。
具体实施方式
以下,将结合附图描述本发明的示例性实施例。
(第一示例性实施例)
图1示出了作为本发明第一示例实施例的信息搜索系统1的硬件配置。在图1中,信息搜索系统1包括信息搜索设备11、图形结构信息存储设备12和客户端设备13。此外,信息搜索设备11、图形结构信息存储设备12和客户端设备13相互连接以便相互通信。
信息搜索设备11由通用计算机构成,该通用计算机至少包括CPU(中央处理器)1101、RAM(随机存取存储器)1102、ROM(只读存储器)1103、存储设备1104,和网络接口1105。
另外,图形结构信息存储设备12由至少包括CPU 1201、RAM 1202、ROM 1203、存储设备1204和网络接口1205的通用计算机构成。
另外,客户端设备13由至少包括CPU 1301、RAM 1302、ROM 1303、存储设备1304、网络接口1305、输入装置1306和输出装置1307的通用计算机构成。
接下来,图2示出了信息搜索系统1的功能块配置。
图形结构信息存储设备12将包括多个作为元素的节点和连接节点的边的图形结构信息存储于存储设备1204。图3示出了由图形结构信息存储设备12储存的图形结构信息的示例。图3中的图形结构信息包括作为元素的节点A、B1、B2、C1和C2以及连接这些节点的边a、b、c和d。
另外,图形结构信息存储设备12将图形结构信息提供给信息搜索设备11以回应来自信息搜索设备11的请求。
客户端设备13通过输入装置1306获取代表搜索请求的信息,从图形结构信息中搜索满足搜索条件的目标节点。然后,客户端设备13将代表搜索请求的信息传输至信息搜索设备11。此外,客户端设备13通过输出装置1307将代表从信息搜索设备11获得的搜索结果的信息输出。
信息搜索设备11包括路径字段生成部101、索引生成部102、索引库103、搜索部104和搜索路径生成部105。路径字段生成部101、索引生成部102、搜索部104和搜索路径生成部105作为计算机程序储存于存储设备1104中,且由CPU 1101通过加载入RAM 1102而实现。此外,索引库103由存储设备1104构成。
至于包括在图形结构信息中的节点的每一个,路径字段生成部101从图形结构信息中提取一个或多个路径,该路径为可从作为起点的节点追踪的一列列元素(即,一列列节点和边)。然后,路径字段生成部101为每一个节点生成连接所提取的一个或多个路径的路径字段。
索引生成部102以倒排表(posting list)生成与构成图形结构信息的每一个元素(即,每一个节点和每一个边)有关的索引库103。倒排表是为每一个元素生成的列表,且由具有路径字段的节点构成,该路径字段包括该元素和该元素在路径字段中出现的位置的信息。
例如,包括在倒排表中的位置信息可以是代表从开始计数的该元素在该路径字段中出现的位置顺序的数值,或是其它可以说明该元素在该路径字段中出现的位置的信息。
索引库103存储元素和元素的倒排表以便如以上所提到的那样彼此相关。
搜索路径生成部105以一列元素的形式生成代表搜索条件的搜索路径。
搜索部104从索引库103搜索具有包括搜索路径中所包括的元素的路径字段的节点。然后,搜索部104基于倒排表中的位置信息通过从搜索的节点中提取具有满足搜索路径中的元素的出现序列的路径字段的节点来搜索目标节点。
下面将解释具有如上所述配置的信息搜索系统1的操作。
首先,将参考图4描述信息搜索设备11生成索引库103的过程。
首先,索引生成部102从图形结构信息存储设备12加载图形结构信息(步骤S1)。
接下来,路径字段生成部101针对包括在载入的图形结构信息中的每一个节点生成路径字段(步骤S2)。
例如,针对图3中所示的图形结构信息中的节点,路径字段生成部101提取路径[A][a][B1][b][C1]、路径[A][a][B1][d][C2]和路径[A][c][B2]三种路径作为可从作为起点的节点A追踪的一列列元素。然后,路径字段生成部101连接这三个路径生成路径字段[A][a][B1][b][C1][A][a][B1][d][C2][A][c][B2],作为节点A的路径字段。路径字段生成部101还针对节点B1、B2、C1和C2生成路径字段。
接下来,索引生成部102记录构成图形结构信息的各个元素以及各个元素的倒排表到索引库103中,以便使彼此关联(步骤)。
例如,索引生成部102生成构成图3中所示的图形结构信息的元素b的倒排表。X<i>表示某个元素包括在节点X的路径字段中且从路径字段的开始第i个出现,元素b的倒排表为“A<4>,B1<2>”。
然后,索引生成部102将元素b与元素b的倒排表关联起来并记录到索引库103中。同样地,索引生成部102生成其它元素的倒排表,并将生成的倒排表记录到索引库103中。
如此,信息搜索设备11完成生成索引库103的过程。
接下来,将参考图5描述信息搜索系统1搜索目标节点的操作。
首先,客户端设备13请求信息搜索设备11搜索满足搜索条件的目标节点,信息搜索设备11接收该请求(在步骤S4处的“是”)。
例如,客户端设备13请求信息搜索设备11从图3中所示的图形结构信息中“搜索在边b的末端具有节点C1的节点(search for a nodehaving the node C1at the end of the edge b)”。
接下来,搜索路径生成部105生成代表已接受的搜索条件的搜索路径(步骤S5)。例如,搜索路径生成部105针对以上描述的搜索条件的示例生成搜索路径[x][b][C1]。此处,[x]代表目标节点。
接下来,搜索部104从索引库103搜索具有包括搜索路径中包括的各个元素的路径字段的节点,并从搜索的节点中提取路径字段满足搜索路径中包括的元素的出现顺序的节点,作为目标节点(步骤S6)。
例如,搜索部104将节点A和B1作为具有包括搜索路径中包括的元素[b]和[C1]的路径字段的节点进行搜索。然后,搜索部104从搜索的节点A和B1中提取节点B1将其作为路径字段满足搜索路径中[b]第二出现,[C1]第三出现的出现顺序的节点。
如此,信息搜索系统1的操作描述结束。
接下来,将描述本发明第一示例实施例的效果。
即便图形结构信息变得复杂,作为本发明第一示例实施例的信息搜索系统也可快速搜索目标节点。
这是因为图形结构信息通过索引库储存,索引库中构成图形结构信息的各个元素均为索引,因此即便图形结构信息变得复杂也有可能将将要搜索的索引库元组数量限制为构成图形结构信息的元素的数量级。因此,有可能在搜索目标节点时将对比作为索引库索引项的元素和搜索路径中包括的元素的次数限制为构成图形结构信息的元素的数量级,因此可实现上述目的。
另外,作为本发明第一示例实施例的信息搜索系统可降低存储设备的资源消耗量。
这是因为可将作为确定索引库大小的因素的索引项数量限制为构成图形结构信息的元素的数量级。
进一步地,本发明第一示例实施例中的索引库的数据结构有利于存储作为对象节点的搜索对象的图形结构信息。
这是因为索引库存储图形结构信息各个元素的倒排表以便与各个元素关联起来,因此有可能存储图形结构信息,同时限制索引项的数量。在该数据结构中,对路径字段中包括搜索路径中包括的项的节点进行搜索并使用位置信息过滤该节点,因此可快速搜索目标节点。
(第二示例实施例)
接下来,将描述本发明的第二示例实施例。
首先,作为本发明第二示例实施例的信息搜索系统2的配置在图6中示出。在图6中,本发明第一示例实施例中的相同组件以相同的标号表示,且在本示例性实施例将省略相同组件的详细描述。
在图6中,信息搜索系统2包括信息搜索设备21、知识信息库22和客户端设备13。此外,信息搜索设备21、知识信息库22和客户端设备13彼此连接以便能够相互通信。
信息搜索设备21和知识信息库22由作为信息搜索设备11的通用计算机和本发明第一示例实施例中的图形结构信息存储设备12构成。知识信息库22构成本发明中的图形结构信息存储设备的示例性实施例。
首先,将描述知识信息库22的配置。
知识信息库22存储由RDF图表达的知识信息模型。知识信息模型构成本发明的图形结构信息的示例性实施例。储存于知识信息库22的知识信息模型的示例在图7中示出。在以下的描述中,RDF中的资源和文字构成本发明中节点的示例性实施例,RDF中的属性构成本发明中边的示例性实施例。
在图7中,椭圆代表资源、矩形代表具有具体值(即,文字)的资源,箭头代表作为资源之间的关系的属性。资源中的字符串代表用于识别资源的资源ID。属性上的字符串代表用于识别属性类型的属性ID。文字中的字符串代表文字所具有的具体值(即,文字值)。此处,资源ID和属性ID可以是URI、数值、字符串等,只要其是通过其可唯一识别资源和属性的类型的信息。资源ID、属性ID和文字值被称为模型项(以下,也称为项)。
图7示出保险公司中的员工和员工的客户、客户的家庭以及有关客户家庭保险的信息通过RDF图表示的示例。资源b1表示“Corporation(公司)”(企业(company))实体,且具有如“hasEmpl oyee”(员工)的资源e1。“成为“Corporation”(公司)实体”代表资源b1的“type”(类型)为“公司”。资源e1是“Employee”(员工)实体,将xxxyyy.zzz.xx(电子邮件地址)作为“contact”(联系信息),且具有如“hasClient”(客户)的资源c1。资源c1是“Client”(客户)实体,且具有如“hasFamilyMember”(家庭成员)的资源p1。资源p1是“Person”(个人)实体,且具有如“hasInsurance”(保险单)的资源a1和资源a2。资源a1为“Insurance”(保险单)实体,以2010/12/31作为“validUntil”(有效期),并以“true”(真)作为“inNonrefundable”(不可退款保险单或否)。资源a2为“Insurance”(保险单)实体,以2015/12/31作为“val idUnti l”(有效期),并以“fal se”(假)作为“inNonrefundable”(不可退款保险单或否)。
再次参考图6,将描述信息搜索设备21的配置。
信息搜索设备21包括路径字段生成部201、索引生成部202、标记化部212、索引库203、搜索部204、搜索路径生成部205、输入和输出部206以及模型数据DB 207。路径字段生成部201、索引生成部202、标记化部212、搜索部204和搜索路径生成部205被储存于作为计算机程序的计算机的存储设备中,并由CPU通过将其载入RAM来实现。
进一步地,索引库203和模型数据DB 207由计算机的存储设备构成。模型数据DB 207构成本发明中的子图存储部的示例性实施例。
进一步地,输入和输出部206被储存于作为计算机程序的计算机的存储设备中,并由通过载入RAM来执行此的CPU和网络接口构成。
路径字段生成部201像路径字段生成部101那样为构成知识信息模型的每一个资源生成路径字段。
具体而言,路径字段生成部201提取一个或多个路径,每一个路径都代表一列可从每一个作为起点的资源追踪的资源和特性。然后,路径字段生成部201将提取的路径的每一个表达为后缀(postfix)路径,其中资源ID、属性ID和文字值从一开始便与起点资源连接。进一步地,路径字段生成部201为每一个资源生成路径字段,其中代表所有可从一个资源追踪的所有路径的后缀路径被连接。此外,路径字段生成部201用生成的路径字段中的保留项“THIS”替换起点资源的资源ID。
路径字段的示例在图8中示出。图8示出为图7中例证的知识信息模型中的资源e1生成的路径字段。在图8中,通过将可从起点资源追踪的十个路径表示为后缀路径并连接后缀路径生成资源e1的路径字段。此外,在资源e1的路径字段中,起点资源e1的资源IDe1被保留项“THIS”替换。
标记化部212将路径字段生成部201生成的路径字段分割成知识信息模型的项。标记化部212构成本发明中的索引生成部的示例性实施例的一部分。
索引生成部202从知识信息库22获取知识信息模型。然后,索引生成部202使路径字段生成部201为包括在知识信息模型中的每一个资源生成路径字段。
进一步地,索引生成部202使标记化部212将生成的路径字段分割成项,并记录到稍后描述的索引库203的路径索引、文字属性索引组和元数据索引组中。
索引库203具有路径索引、文字属性索引组和元数据索引组。
路径索引存储构成知识信息模型的项(资源ID、属性ID、文字值)及其彼此相关联的倒排表。倒排表是由具有路径字段的资源的资源ID构成的信息的列表,路径字段包括项和项在路径字段中出现的位置信息。
例如,图9示出了与图7中所示的知识信息模型相对应的路径索引的示例。例如,在图9中,路径索引存储项“type”及其相互关联的倒排表。项“type”的倒排表是由资源b1、e1、c1、p1、a1和a2构成的信息的列表,资源b1、e1、c1、p1、a1和a2的每一个都具有包括项“type”以及“type”在路径字段中的位置信息的路径字段。在图9中,其显示为e1<2,7…>,表示“type”在资源e1的路径字段中作为第二个项、第七个项出现,以此类推。路径字段中的位置信息可通过字符串、数值、符号、参照关系等表示而非通过路径字段中的项从开始起的数量表示,只要其是能说明该项在路径字段中出现的位置的信息便可。
进一步地,如图9所示,路径索引还将保留项“THIS”存储为索引项。与保留项“THIS”相关的倒排表显示每一个资源位于路径字段中的路径的何处。保留项并不局限于“THIS”,其可以是不与其它项重叠的信息。
文字属性索引组包括为知识信息模型中具有文字的(即,文字属性)的属性的每一个属性ID生成的索引。每一个文字属性索引存储文字值和属性彼此相关联的资源。
例如,图10示出了与图7中所示的知识信息模型相对应的文字属性索引组的示例。图10示出分别与三种文字属性“contact”、“isNonrefundable”和“validUntil”的属性ID相对应的联系索引(图10A)、不可退款索引(图10B)和有效期索引(图10C)。
包括在文字属性索引组中的文字属性索引的数量并不局限于三种,该数量取决于包括在目标知识信息模型中的文字属性类型的数量。
进一步地,索引库203不需要将文字属性索引组分别存储于不同的表,可将这些文字属性索引组可存储在相同表中以便从逻辑上将其区分。
就知识信息模型中具有特殊意义的属性而言,元数据索引组存储资源和彼此相关联的属性值。
例如,图11示出了图7中所示的知识信息模型的元数据索引的示例。图11中所示的“type”索引是所准备的元数据索引,这是因为作为一种属性,“type”是代表每一个资源种类(也称为“class”或“type”)的特殊属性。“type”索引存储具有“类型”属性的资源及其属性值,以使得彼此相关联。
在本示例性实施例中,提供了将相同字符串信息用作识别资源和特性的种类的资源ID和属性ID以及用作项的示例。反之,当为此使用不同信息时,索引库203可将ID索引作为元数据索引。在这种情况下,ID索引存储资源ID和属性ID,以便与提供给资源ID和属性ID的项关联起来。
进一步地,在包括多个元数据索引的情况下,索引库203不需要将文字属性索引组分别存储于不同的表,可将这些文字属性索引组存储在相同表中以便从逻辑上将其区分。
索引生成部202为每一个代表构成以RDF表示的知识信息模型的每一个资源ID、每一个属性ID和每一个文字值的项生成倒排表。然后,索引生成部202将每一个项和每一个项的倒排表记录到索引库203中以便相互关联。
模型数据DB 207包括图12中所示的子图表。
子图表为构成知识信息模型的资源的每一个从资源中提取子图直至预定深度,并存储与资源ID相关联的资源ID。
在图12所示的示例中,资源ID和子图(直至资源或通过一个属性与具有资源ID的资源相邻的文字值)被储存。储存于子图表中的子图的表现格式可由字符串(比如N3(符号3))、二进制数据(比如JavaTM对象)、序列化二进制数据及其每一个的压缩格式等表示。子图的表示格式可以是任何能再现部分原始知识信息模型的格式。
输入和输出部206从客户端设备13获取搜索条件并将已获得的搜索条件告知搜索部204。此外,输入和输出部206将由搜索部204通知的搜索结果输出至客户端设备13。
搜索部204从输入和输出部206接收搜索条件,并使搜索路径生成部205生成搜索路径和与搜索路径相对应的路径查询。然后,搜索部204使用生成的路径查询搜索索引库203。
进一步地,搜索部204从模型数据DB 207获取搜索结果的资源的子图,并输出至输入和输出部206。
搜索路径生成部205生成像一列资源和特性那样的代表搜索条件的搜索路径。
例如,搜索路径生成部205提取受到限制以便将具体文字值作为搜索条件中的属性的资源作为受限制的资源,并生成与目标资源和受限制的资源相关联的一列资源和特性作为搜索路径。
根据搜索条件的内容,搜索路径可以是资源和特性从开始到结束全都被指定的路径,或者是部分资源或特性被指定且包括未指定的插入点的路径。
进一步地,搜索路径生成部205基于生成的搜索路径中资源和特性的出现顺序就路径索引生成路径查询。此时,在搜索路径包括未指定插入点的情况下,考虑到可插入未指定插入点的元素的数量,搜索路径生成部205生成路径查询。
下面将结合附图解释如上具有所述配置的信息搜索系统2所进行的操作。
首先,将参考图13解释信息搜索设备21生成索引库203的过程。
首先,索引生成部202从知识信息库22获取知识信息模型(步骤S11)。
接下来,路径字段生成部201针对构成知识信息模型的各个资源生成与后缀路径连接的路径字段(步骤S212)。
接下来,标记化部212根据构成知识信息模型的项对每一个生成的路径字段进行标记(步骤S13)。
接下来,索引生成部202为每一个代表构成知识信息模型的每一个资源ID、每一个属性ID和每一个文字值的项生成倒排表。然后,索引生成部202将每一个项及其倒排表彼此相互关联地记录到路径索引中(步骤S14)。在项为文字属性的情况下,索引生成部202将其记录到文字属性索引中。在项为具有特殊属性的资源的情况下,索引生成部202将其记录到元数据索引中。
接下来,索引生成部202提取构成知识信息模型的每一个资源的子图,并将子图记录到模型数据DB 207中(步骤S15)。
如此,信息搜索设备21的索引生成过程结束。
步骤S12至S14的一连串处理与步骤S15的处理之间的执行顺序并不存在依存关系,信息搜索设备21可先执行任何一个。此外,在信息搜索设备21能够同时执行两个处理的情况下,信息搜索设备21可同时执行步骤S12至S14的一连串处理以及步骤S15的处理。
接下来,将参考图14描述信息搜索设备21的搜索过程。
首先,输入和输出部206从客户端设备13获取目标资源的搜索条件(在步骤S21为“是”)。
接下来,搜索部204基于已由输入和输出部206获得的搜索条件提取一组受到限制以便使具体文字值作为特性及其限制内容的受限制资源(步骤S22)。
接下来,针对已被提取的受限制资源的每一个,搜索部204使搜索路径生成部205基于受限制资源的限制内容生成查询以搜索受限制资源的实体(步骤S23)。
接下来,搜索部204使用生成的查询搜索索引库203,从而获得受限制资源的实体集(步骤S24)。
搜索部204反复生成查询(步骤S23)并对在步骤S22提取的所有受限制资源进行反复搜索(步骤S24),从而获取受限制资源组的实体集。
接下来,搜索部204使搜索路径生成部205基于在步骤S21获得的搜索条件以及在步骤S24搜索的受限制资源组的实体集生成搜索路径。然后,搜索部204使搜索路径生成部205基于生成的搜索路径生成用于搜索路径索引的路径查询(步骤S25)。
接下来,搜索部204使用路径查询搜索索引库203并获取代表搜索结果的资源ID组(步骤S26)。
接下来,搜索部204从模型数据DB 207获取代表搜索结果的资源ID组的子图组。然后,搜索部204形成子图组,生成代表搜索结果的图形数据,并将生成的图形数据输出至输入和输出部206。然后,输入和输出部206将代表搜索结果的图形数据输出至客户端设备13(步骤S27)。
如此,信息搜索设备21的搜索过程结束。
下面将结合图15详细描述步骤S25的路径查询生成过程。
首先,搜索路径生成部205从搜索部204接收搜索条件、受限制资源组和受限制资源的实体集组。
接下来,搜索路径生成部205基于搜索条件提取期望获得的目标资源作为搜索结果(步骤S31)。
接下来,搜索路径生成部205对每一个受限制资源执行以下处理。
首先,搜索路径生成部205指定目标资源和受限制资源之间的知识信息模型的特性范围,并生成一列特性作为搜索路径(步骤S32)。
接下来,搜索路径生成部205对受限制资源的实体集执行“或”合并(OR-join),并记录到搜索路径的受限制资源的位置(步骤S33)。
接下来,搜索路径生成部205将代表目标资源的保留项“THIS”记录到搜索路径的目标资源的位置(步骤S34)。
接下来,考虑到未指定插入点,搜索路径生成部205生成允许项之间的最大距离1的短语查询(步骤S35)。存在以下情况,在步骤S32至S34生成的搜索路径包括特性之间未指定资源的未指定插入点。因此,搜索路径生成部205生成有可能将最大资源插入未指定插入点中的特性之间的短语查询。可插入特性之间的元素的数量并不局限于一个,必要时可根据搜索条件的内容设置。
搜索路径生成部205对每一个受限制资源执行步骤S32至S35的处理。
接下来,在搜索条件包括对目标资源的属性的限制的情况下,搜索路径生成部205生成属性查询组(步骤S36)。
接下来,搜索路径生成部205对针对所有受限制资源的短语查询组和目标资源的属性查询组执行“与”合并,并作为路径查询返回至搜索部204(步骤S37)。
如此,路径查询生成过程结束。
接下来,将描述信息搜索设备21的搜索过程的示例。
此处,将再次参考图14和15描述客户端设备13请求信息搜索设备21从图7中所示的知识信息模型搜索“为其家庭成员的不可退款保险单在2010到期的客户所指定的推销员(a salesperson assigned to a personhaving a family member having a nonrefundable insurance policyexpiring within 2010)”的情况。
首先,输入和输出部206从客户端设备13获取代表上述搜索条件的伪SQL陈述(表达式1)(步骤S21)。
[表达式1]
Select x;Where x type Employee,x has Client y,y hasHamily Member z,z has Insurance i,i valid Until<20110101,iis Nonrefundable true,i type Insurance;
接下来,搜索部204从表达式1提取变量i作为受限制资源(步骤S22)。
接下来,搜索部204使搜索路径生成部205通过使用限制变量i的条件生成表达式2的查询,作为用于搜索受限制资源的查询(步骤S23)。
[表达式2]
Select i;Where i validUntil<20110101,i isNonrefundabletrue,i type Insurance;
接下来,搜索部204使用表达式2搜索文字属性索引组和元数据索引组,并获得作为受限制资源实体的资源IDa1(步骤S24)。
接下来,搜索路径生成部205从表达式1提取x作为目标资源(步骤S31)。
接下来,搜索路径生成部205生成:
[hasClient][hasFamilyMember][hasInsurance]作为目标资源x和受限制资源i之间的搜索路径(步骤S32)。
接下来,搜索路径生成部205将受限制资源的实体a1添加至末端,末端是搜索路径中受限制资源的位置,搜索路径变成:[hasClient][hasFamilyMember][hasInsurance][a1](步骤S33)。
此外,搜索路径生成部205将保留项“THIS”添加至起点,起点是目标资源在生成的搜索路径中的位置,搜索路径变成:[THIS][hasClient][hasFamilyMember][hasInsurance][a1](步骤S34)。
接下来,考虑到未指定插入点,搜索路径生成部205基于生成的搜索路径生成允许项之间存在距离1的短语查询(步骤S35)。例如,该短语查询表达为:
THIS.{0,1}hasClient.{0,1}hasFamilyMember.{0,1}hasInsurance.{0,1}a1。
此处,“.{0,1}”表示有可能将一个其它项插入该位置。此外,图16中概念性地示出了该短语查询。因此,考虑到搜索路径中项的出现顺序以及可插入未指定插入点的元素的数量,搜索路径生成部205生成短语查询。
接下来,搜索路径生成部205生成与“x type Employee”相对应的属性查询作为对目标资源x的属性限制(步骤S36)。
接下来,搜索路径生成部205将在步骤S35生成的短语查询与在步骤S36生成的属性查询进行“与”合并(And-join),并作为路径查询返回(步骤S37)。
搜索部204使用路径查询搜索路径索引、文字属性索引组和元数据索引组,并获得作为目标资源的e1(步骤S26)。
此处,将更详细地描述在步骤S26处搜索部204搜索目标资源的操作的示例。
(步骤S26-1):搜索部204从路径索引搜索位于短语查询的起点包括项“THIS”的资源(搜索b1、e1、c1、p1、a1和a2)。
(步骤S26-2):搜索部204从路径索引搜索下一个项“hasClient(拥有客户)”(搜索b1,e1)。
(步骤S26-3):搜索部204以资源为基础将步骤S26-1和S26-2的结果合并(剩下b1,e1)。
(步骤S26-4):搜索部204从路径索引搜索下一个项“hasFami lyMember”(搜索b1、e1,c1)。
(步骤S26-5):搜索部204以资源为基础将步骤S26-3和S26-4的结果合并(剩下b1,e1)。
(步骤S26-6):搜索部204从路径索引搜索下一个项“hasInsurance”(搜索b1、e1、c1,p1)。
(步骤S26-7):搜索部204以资源为基础将步骤S26-5和S26-6的结果合并(剩下b1,e 1)。
(步骤S26-8):搜索部204从路径索引搜索下一个项“a1”(搜索b1、e1、c 1,p1)。
(步骤S26-9):搜索部204以资源为基础将步骤S26-7和S26-8的结果合并(剩下b1,e 1)。
(步骤S26-10):搜索部204基于合并后剩下的资源b1和e1的路径字段的位置信息对资源进行过滤(e1为最终的搜索结果)。
搜索部204可在步骤S26-1至S26-9每一个之后进行步骤S26-10的过滤处理。此外,搜索部204可基于搜索过程或合并处理之后资源数量的增加趋势来判断是否在步骤S26-1至S26-9每一个之后进行过滤处理。
因此,已获得作为搜索结果的资源e1的搜索部204从模型数据DB207获取资源e1的子图,并输出至输入和输出部206(步骤S27)。
客户端设备13所请求的搜索条件的表达形式并不局限于表达式1所显示的伪SQL语句,例如可以是代表RDF图或RDF查询语言(比如SPARQL协议和RDF查询语言(SPARQL))的信息。
接下来,将描述本发明第二示例实施例的效果。
即使知识信息模型变得复杂,作为本发明第二示例实施例的信息搜索系统也可快速搜索目标资源。
这是因为路径索引将构成知识信息模型的项作为索引项,因此即使知识信息模型变得复杂,也有可能将影响搜索速度的索引项的数量限制为知识信息模型的项数量的数量级。
进一步地,这是因为在搜索目标资源时,是从路径索引搜索路径字段包括构成路径查询的各个项的资源,并缩小该资源的范围,因此有可能减少合并处理过程中的计算工作量。反之,非专利文献1中,在搜索目标资源时,搜索并合并分别满足条件“x hasClient y”和“yhasFamilyMember z”的资源。因此,随着知识信息模型变得复杂,合并后剩下的元组的数量也增加,因此需要花费时间来执行合并操作。
因此,即便当包括在搜索请求中的资源范围很长时,作为本发明第二示例实施例的信息搜索系统可以基本上恒定的搜索速度进行搜索而几乎不受到影响。
进一步地,本发明第二示例实施例中的路径索引的数据结构有利于存储在其内搜索目标资源的知识信息模型。
这是因为路径索引存储构成知识信息模型的项,该知识信息模型与项的倒排表相关联,因此有可能存储知识信息模型而不会限制索引项的数量。在该数据结构中,从路径索引搜索路径字段包括构成路径查询的项的资源,然后使用位置信息过滤该资源,结果是可快速搜索目标资源。
进一步地,根据作为本发明第二示例实施例的信息搜索系统,有可能降低存储知识信息模型所消耗的资源的量。
这是因为存储知识信息模型所必需的数据结构可以只是模型数据DB和索引库。此外,搜索时未使用模型数据DB中的子图,该子图是用于显示搜索结果,因此子图也可以压缩格式储存。此外,在索引库中,路径索引可将索引项的数量(其为确定索引大小的因素)限制为项的数量级而非路径的数量级。此外,由于文字属性索引组和元数据索引组远远小于路径索引,且储存于其中的信息只是项和资源ID,因此资源的消耗量很小。因此,模型数据DB和索引库均可以很小,且有可能降低资源的消耗量,比如存储设备。
(第三示例实施例)
接下来,将结合附图描述本发明的第三示例性实施例。
首先,作为本发明第三示例实施例的信息搜索系统3的功能块配置在图17中示出。在图17中,将以相同的标号表示与本发明第二示例实施例中的组件相同的组件,且在本示例性实施例将省略相同组件的详细描述。
信息搜索系统3与本发明第二示例实施例的信息搜索系统2的不同之处在于信息搜索系统3包括信息搜索设备31,信息搜索设备31以路径字段生成部301代替了路径字段生成部201。
路径字段生成部301与路径字段生成部201的不同之处在于路径字段生成部301使用全路径而非后缀路径作为可从作为起点每一个资源追踪的路径。全路径是从根资源至起点资源的路径被连接至从起点资源开始的后缀路径的路径。
例如,图18示出了路径字段生成路径301生成的路径字段的示例。图18示出资源e1的路径字段。资源e1的路径字段是这样的路径字段,即每个都以e1作为起点的十个路径由全路径表达并连接。
下面将结合附图解释具有如上所述配置的本发明第三示例性实施例的操作。
作为本发明第三示例性实施例的信息搜索系统如本发明第二示例实施例那样执行索引生成过程、搜索过程和路径查询生成过程,但是索引生成过程与第二示例实施例的索引生成过程不同。
下面将参考图19描述信息搜索系统3的索引生成过程。信息搜索系统3与图13中所示的本发明第二示例实施例的信息搜索系统2的不同之处在于信息搜索系统3在索引生成过程使用全路径执行生成路径字段的步骤S42,而非步骤S12。
作为步骤S42的示例,下面将描述为图7中所示的知识信息模型的资源e1生成路径字段。路径字段生成部301提取每一个都以资源e1作为起点的十个路径。然后,路径字段生成部301将每一个路径表示为全路径,即从根资源[b1][hasEmployee]至资源e1的路径并且连接从资源e1开始的后缀路径,并且连接全路径作为资源e1的路径字段。
信息搜索设备31如在本发明第二示例实施例的索引生成过程中那样执行步骤S11和步骤S13至S15,然后结束索引生成过程。
接下来,将描述本发明第三示例性实施例的效果。
作为本发明第三示例性实施例的信息搜索系统可增加搜索知识信息模型的功能。
这是因为,通过使用全路径被连接的路径字段有可能响应从受限制资源至目标资源中搜索路径的搜索请求,例如“an employee working in acompany with sales of 500million yen or more(在年销售额为5000000000或者更多的企业中工作的雇员)”。
(第四示例性实施例)
接下来,将结合附图描述本发明的第四示例性实施例。
首先,将参考图20描述作为本发明第四示例性实施例的信息搜索系统4的功能块配置。在图20中,将以相同的标号表示与本发明第二示例实施例中的组件相同的组件,且在本示例性实施例将省略相同组件的详细描述。
信息搜索系统4与本发明第二示例实施例的信息搜索系统2的不同之处在于信息搜索系统4所包括的信息搜索设备41进一步具有索引更新部409。
索引更新部409从知识信息库22获取资源、与该资源相关的属性,以及作为属性对象的资源或文字。然后,索引更新部409将其与模型数据DB207中记录的子图进行对比,并将已被改变、添加或删除的资源指定为差异资源。然后,索引更新部409更新储存于索引库203和模型数据DB207中的与差异资源有关的信息。
下面将结合附图解释具有如上所述配置的信息搜索系统4的操作。
由于信息搜索系统4所执行的索引生成过程、搜索过程和路径查询生成过程与本发明第二示例实施例的信息搜索系统2所执行的操作类似,因此将省略对这些操作的详细解释。
进一步地,信息搜索系统4执行索引更新处理。将参考图21描述信息搜索系统4所执行的索引更新处理。
首先,索引更新部409从知识信息库22获取资源、与该资源相关的属性,以及作为属性对象的资源或文字。然后,索引更新部409将已获得的信息与已记录在模型数据DB 207中的子图进行对比,并临时存储已被改变或更新的差异资源(步骤S51)。
接下来,索引更新部409指定记录在模型数据DB 207中但并不存在于知识信息库22中的资源,并临时将该资源存储为已被删除的差异资源(步骤S52)。
接下来,索引更新部409从模型数据DB 207中删除所有差异资源极其子图(步骤S53)。
接下来,索引更新部409从索引库203中删除与所有差异资源有关的信息(步骤S54)。具体地说,索引更新部409从路径索引中删除与差异资源相对应的元组。此外,索引更新部409从包括与差异资源有关的信息的倒排表中删除该信息。此外,索引更新部409还从文字属性索引组和元数据索引组中删除与差异资源有关的元组。
接下来,索引更新部409对已被改变或添加的差异资源的每一个执行以下处理。
首先,索引更新部409使路径字段生成部201生成该差异资源的路径字段(步骤S55)。
接下来,索引更新部409使标记化部212基于从知识信息库22获得的模型中的项以项为单位标记在步骤S55生成的路径字段(步骤S56)。
接下来,索引更新部409将与差异资源有关的信息记录到索引库203中(步骤S57)。具体而言,索引更新部409基于被标记的路径字段生成该差异资源的倒排表并记录到路径索引中。此外,索引更新部409将该差异资源和该路径字段中的项的位置信息所构成的信息添加至该差异资源的路径字段内所包括的每一个项的倒排表中。此外,在差异资源为具有文字属性或特殊属性的资源的情况下,索引更新部还将其记录到文字属性索引组或元数据索引组中。
接下来,索引更新部409将差异资源和从该资源开始具有预定深度的子图记录到模型数据DB207中(步骤S58)。
对执行已被改变或添加的所有差异资源进行步骤S55至S58的处理之后,信息搜索系统4结束索引更新处理。
接下来,将描述本发明第四示例性实施例的效果。
作为本发明第四示例性实施例的信息搜索系统可更有效地执行更新索引库的处理以便快速从知识信息中搜索目标资源。
这是因为,通过比较知识信息库和模型数据DB,有可能指定知识信息模型的改变位置,且只在索引库和模型数据DB中更新指定的改变位置。此时,由于索引库和模型数据DB的索引项的数量被限制为模型的项的数量级,因此有可能缩短将改变的位置反映给索引库和模型数据DB的更新时间。
在对作为第二至第四示例性实施例的信息搜索系统所进行的描述中,信息搜索系统的每一个从以RDF模型表示为图形信息的知识信息模型中搜索目标资源。然而,每一个信息搜索系统还可应用于从由多个节点和连接节点的边所表示的其它图形结构信息中搜索目标节点的情况。
进一步地,在以上描述的本发明的每一个示例性实施例中,参考每一个流程图描述的信息搜索设备的操作可储存于信息搜索设备的存储设备(存储介质)中作为本发明的计算机程序以便CPU检索并执行该计算机程序。在这种情况下,本发明由计算机程序的代码或存储介质构成。此外,CPU通过执行计算机程序,可实现上述每一个示例性实施例中的功能块示意图中所示出的路径字段生成部、索引生成部、索引更新部、标记化部、搜索部和搜索路径生成部所执行的各个处理。
进一步地,在以上描述的本发明的每一个示例性实施例中,可通过构成信息搜索设备的计算机的存储设备将图形结构存储设备和知识信息库配置为本地文件系统。
进一步地,在以上描述的本发明的每一个示例性实施例中,可通过储存于构成信息搜索设备的计算机的存储设备中的应用程序在相同计算机上实现客户端设备。
进一步地,在以上描述的本发明的每一个示例性实施例中,信息搜索设备可通过输入和输出装置从用户获取搜索请求,而非搜索请求从客户端设备获取搜索请求。在这种情形中,信息搜索设备还可以经由输入和输出设备将搜索结果呈现给用户。
进一步地,可适当地组合并实施以上描述的各个示例性实施例。
进一步地,可在各种模式下执行本发明而不必局限于以上描述的各个示例性实施例。
进一步地,以上公开的全部或部分示例性实施例可被描述为,但并不局限于以下补充说明。
(补充说明1)
一种信息搜索设备,其被配置为从包括作为元素的多个节点和连接节点的边的图形结构信息中搜索满足搜索条件的目标节点,所述信息搜索设备包括:
路径字段生成部,其被配置为针对所述图形结构信息中所包括的节点中的每一个提取路径,所述路径中的每一个均为能从作为起点的所述节点追踪的一列元素,并为所述节点中的每一个生成其中所提取的路径被连接起来的路径字段;
索引生成部,其被配置为针对配置所述图形结构信息的元素中的每一个生成倒排表,所述倒排表为由具有包括该元素和代表该元素在路径字段中出现的位置的位置信息的路径字段的节点构成的信息的列表,并生成其中所述元素和所述倒排表相互关联的索引库;
搜索路径生成部,其被配置为以一列元素的形式生成表示搜索条件的搜索路径;和
搜索部,被配置为从所述索引库搜索每一个都具有包括在搜索路径中包括的相应元素的路径字段的节点,并基于所述位置信息从搜索的节点中提取具有满足搜索路径中的元素的出现顺序的路径字段的节点。
(补充说明2)
根据补充说明1的信息搜索设备,其中,其中,所述搜索部分被配置为,在所述搜索路径的一部分具有未指定的地点的情况下,基于元素在所述搜索路径中出现的顺序以及能被插入该未指定的地点的元素的数量来搜索目标节点。
(补充说明3)
根据补充说明1或2的信息搜索设备,其中,所述路径字段生成部被配置为通过以从所述图形结构信息中的根节点起的一列元素的形式表示能从作为起点的所述节点追踪的路径中的每一个路径来生成路径字段。
(补充说明4)
根据补充说明1至3任何一个的信息搜索设备,进一步包括索引更新部分,其被配置为获取表示图形结构信息中改变的元素的差异信息,并通过基于所述差异信息控制所述路径字段生成部和所述索引生成部来更新所述索引库。
(补充说明5)
根据补充说明1至4任何一个的信息搜索设备,进一步包括:
子图存储部,其被配置为从所述图形结构信息提取以所述节点中的每一个节点作为起点的预定深度的子图,并存储所提取的子图;和
搜索结果呈现部,其被配置为呈现由所述搜索部搜索的目标节点作为起点的子图。
(补充说明6)
一种数据结构,其被配置为存储包括作为元素的多个节点和连接节点的边的图形结构信息,
其中,储存每一个元素以及倒排表以便彼此相关联,为每一个元素生成了倒排表,且倒排表为由以下内容构成的信息的列表:节点,其具有路径字段,路径字段包括通过连接路径表示的各个节点的路径字段之中的元素,每一个路径是一列可从每一个作为起点的节点追踪的元素;以及位置信息,其表示元素在路径字段中出现的位置。
(补充说明7)
根据补充说明6所述的数据结构,其中,包括在倒排表中的位置信息表示路径字段中的位置,其中可从每一个作为起点的节点追踪的路径在图形结构信息中从根节点以一列元素的形式表示,并相互连接。
(补充说明8)
一种信息搜索系统包括:
图形结构信息存储设备,其被配置为存储包括作为元素的多个节点和连接节点的边的图形结构信息;
客户端设备,其被配置为请求从所述图形结构信息中搜索满足搜索条件的目标节点;和
信息搜索设备,其被配置为从所述图形结构信息中搜索目标节点,
其中,所述信息搜索设备包括:
路径字段生成部,其被配置为针对所述图形结构信息中所包括的节点中的每一个提取路径,所述路径中的每一个均为能从作为起点的所述节点追踪的一列元素,并为所述节点中的每一个生成其中所提取的路径被连接起来的路径字段;
索引生成部,其被配置为针对配置所述图形结构信息的元素中的每一个生成倒排表,所述倒排表为由具有包括该元素和代表该元素在路径字段中出现的位置的位置信息的路径字段的节点构成的信息的列表,并生成其中所述元素和所述倒排表相互关联的索引库;
搜索路径生成部,其被配置为以一列元素的形式生成表示搜索条件的搜索路径;和
搜索部,被配置为从所述索引库搜索每一个都具有包括在搜索路径中包括的相应元素的路径字段的节点,并基于所述位置信息从搜索的节点中提取具有满足搜索路径中的元素的出现顺序的路径字段的节点。
(补充说明9)
一种用于控制信息搜索设备的操作的计算机程序,该信息搜索设备被配置为从包括作为元素的多个节点和连接节点的边的图形结构信息中搜索满足搜索条件的目标节点,所述计算机程序包括使计算机执行以下操作的指令:
路径字段生成处理,针对所述图形结构信息中所包括的节点中的每一个提取路径,所述路径中的每一个均为能从作为起点的所述节点追踪的一列元素,并为所述节点中的每一个生成其中所提取的路径被连接起来的路径字段;
索引生成处理,针对配置所述图形结构信息的元素中的每一个生成倒排表,所述倒排表为由具有包括该元素和代表该元素在路径字段中出现的位置的位置信息的路径字段的节点构成的信息的列表,并生成其中所述元素和所述倒排表相互关联的索引库;
搜索路径生成处理,该处理以一列元素的形式生成表示搜索条件的搜索路径;和
搜索处理,所述处理从所述索引库搜索每一个都具有包括在搜索路径中包括的相应元素的路径字段的节点,并基于所述位置信息从搜索的节点中提取具有满足搜索路径中的元素的出现顺序的路径字段的节点。
(补充说明10)
一种信息搜索方法,其包括:
通过图形结构信息存储设备存储包括作为元素的多个节点和连接节点的边的图形结构信息;
通过信息搜索设备:针对所述图形结构信息中所包括的节点中的每一个提取路径,所述路径中的每一个均为能从作为起点的所述节点追踪的一列元素;为所述节点中的每一个生成其中所提取的路径被连接起来的路径字段;针对配置所述图形结构信息的元素中的每一个生成倒排表,所述倒排表为由具有包括该元素和代表该元素在路径字段中出现的位置的位置信息的路径字段的节点构成的信息的列表;以及将所述元素和所述倒排表存储于索引库中,以便彼此相关联;
通过客户端设备请求所述信息搜索设备从所述图形结构信息中搜索满足搜索条件的目标节点;和
通过信息搜索设备:以一列元素的形式生成表示搜索条件的搜索路径;从所述索引库搜索每一个都具有包括在搜索路径中包括的相应元素的路径字段的节点;以及通过基于所述位置信息从搜索的节点中提取具有满足搜索路径中的元素的出现顺序的路径字段的节点来搜索目标节点。
(补充说明11)
一种信息搜索方法,通过被配置为从包括作为元素的多个节点和连接节点的边的图形结构信息中搜索满足搜索条件的目标节点的信息搜索设备,其包括:
针对图形结构信息包括的每一个节点,提取每一个均为一列可从每一个作为起点的节点追踪的元素的路径;
为每一个节点生成提取的路径被连接的路径字段;
针对构成图形结构信息的每一个元素生成倒排表,倒排表是由具有路径字段的节点构成的信息的列表,该路径字段包括元素和元素在路径字段中出现的位置的信息;
将元素和倒排表存储于索引库中以便彼此相关联;
以一列元素的形式生成表示搜索条件的搜索路径;
从索引库搜索每一个都具有包括搜索路径中包括的各个元素的路径字段的节点;和
以及基于位置信息通过从搜索的节点中提取路径字段满足搜索路径中的元素的出现序列的节点来搜索目标节点。
(补充说明12)
根补充说明8的信息搜索系统,其中,信息搜索设备的搜索部被配置为,在部分搜索路径的位置未被指定的情况下,基于元素在搜索路径中出现的顺序以及可被插入未指定插入点的元素的数量搜索目标节点。
(补充说明13)
根据补充说明9的计算机程序包括指令,搜索处理过程中在部分搜索路径的位置未被指定的情况下,该指令可使计算机基于搜索路径中的元素出现的顺序以及可被插入未指定插入点的元素的数量来搜索目标节点。
(补充说明14)
根据补充说明11的信息搜索方法,其中,搜索目标节点时,在部分搜索路径的位置未被指定的情况下,信息搜索设备可基于元素在搜索路径中出现的顺序以及可被插入未指定插入点的元素的数量搜索目标节点。
本发明基于并要求2010年5月14日提交的日本专利申请号2010-111940的优先权的权益,其整个内容通过引用合并于此。
工业实用性
本发明可提供即便图形结构信息变得复杂也能够快速搜索目标节点的信息搜索设备,且例如,作为被配置为从大型知识信息模型中搜索目标资源的知识信息搜索设备其是有利的。
编号描述
1、2、3、4  信息搜索系统
11、21、31、41  信息搜索设备
12    图形结构信息存储设备
13    客户端设备
22    知识信息库
101,201,301    路径字段生成部
102,202    索引生成部
103,203    索引库
104,204    搜索部
105,205    搜索路径生成部
206    输入和输出部
207    模型数据DB
212    标记化部
409    索引更新部

Claims (10)

1.一种信息搜索设备,其被配置为从包括作为元素的多个节点和连接节点的边的图形结构信息中搜索满足搜索条件的目标节点,所述信息搜索设备包括:
路径字段生成部,其被配置为针对所述图形结构信息中所包括的节点中的每一个提取路径,所述路径中的每一个均为能从作为起点的所述节点追踪的一列元素,并为所述节点中的每一个生成其中所提取的路径被连接起来的路径字段;
索引生成部,其被配置为针对配置所述图形结构信息的元素中的每一个生成倒排表,所述倒排表为由具有包括该元素和代表该元素在路径字段中出现的位置的位置信息的路径字段的节点构成的信息的列表,并生成其中所述元素和所述倒排表相互关联的索引库;
搜索路径生成部,其被配置为以一列元素的形式生成表示搜索条件的搜索路径;和
搜索部,被配置为从所述索引库搜索每一个都具有包括在搜索路径中包括的相应元素的路径字段的节点,并基于所述位置信息从搜索的节点中提取具有满足搜索路径中的元素的出现顺序的路径字段的节点。
2.根据权利要求1所述的信息搜索设备,其中,所述搜索部分被配置为,在所述搜索路径的一部分具有未指定的地点的情况下,基于元素在所述搜索路径中出现的顺序以及能被插入该未指定的地点的元素的数量来搜索目标节点。
3.根据权利要求1或2所述的信息搜索设备,其中,所述路径字段生成部被配置为通过以从所述图形结构信息中的根节点起的一列元素的形式表示能从作为起点的所述节点追踪的路径中的每一个路径来生成路径字段。
4.根据权利要求1至3任何一个所述的信息搜索设备,进一步包括索引更新部分,其被配置为获取表示图形结构信息中改变的元素的差异信息,并通过基于所述差异信息控制所述路径字段生成部和所述索引生成部来更新所述索引库。
5.根据权利要求1至4任何一个所述的信息搜索设备,进一步包括:
子图存储部,其被配置为从所述图形结构信息提取以所述节点中的每一个节点作为起点的预定深度的子图,并存储所提取的子图;和
搜索结果呈现部,其被配置为呈现由所述搜索部搜索的目标节点作为起点的子图。
6.一种数据结构,其被配置为存储包括作为元素的多个节点和连接节点的边的图形结构信息,
其中,储存每一个元素以及倒排表以便彼此相关联,为所述每一个元素生成所述倒排表,且所述倒排表为由以下内容构成的信息的列表:节点,其具有路径字段,所述路径字段包括通过连接路径表示的各个节点的路径字段之中的元素,每一个路径是一列可从每一个作为起点的节点追踪的元素;和位置信息,其表示所述元素在所述路径字段中出现的位置。
7.根据权利要求6所述的数据结构,其中,包括在所述倒排表中的位置信息表示路径字段中的位置,其中可从每一个作为起点的节点追踪的路径在所述图形结构信息中从根节点以一列元素的形式表示,并相互连接。
8.一种信息搜索系统,其包括:
图形结构信息存储设备,其被配置为存储包括作为元素的多个节点和连接节点的边的图形结构信息;
客户端设备,其被配置为请求从所述图形结构信息中搜索满足搜索条件的目标节点;和
信息搜索设备,其被配置为从所述图形结构信息中搜索目标节点,
其中,所述信息搜索设备包括:
路径字段生成部,其被配置为针对所述图形结构信息中所包括的节点中的每一个提取路径,所述路径中的每一个均为能从作为起点的所述节点追踪的一列元素,并为所述节点中的每一个生成其中所提取的路径被连接起来的路径字段;
索引生成部,其被配置为针对配置所述图形结构信息的元素中的每一个生成倒排表,所述倒排表为由具有包括该元素和代表该元素在路径字段中出现的位置的位置信息的路径字段的节点构成的信息的列表,并生成其中所述元素和所述倒排表相互关联的索引库;
搜索路径生成部,其被配置为以一列元素的形式生成表示搜索条件的搜索路径;和
搜索部,被配置为从所述索引库搜索每一个都具有包括在搜索路径中包括的相应元素的路径字段的节点,并基于所述位置信息从搜索的节点中提取具有满足搜索路径中的元素的出现顺序的路径字段的节点。
9.一种用于控制信息搜索设备的操作的计算机程序,该信息搜索设备被配置为从包括作为元素的多个节点和连接节点的边的图形结构信息中搜索满足搜索条件的目标节点,所述计算机程序包括使计算机执行以下操作的指令:
路径字段生成处理,针对所述图形结构信息中所包括的节点中的每一个提取路径,所述路径中的每一个均为能从作为起点的所述节点追踪的一列元素,并为所述节点中的每一个生成其中所提取的路径被连接起来的路径字段;
索引生成处理,针对配置所述图形结构信息的元素中的每一个生成倒排表,所述倒排表为由具有包括该元素和代表该元素在路径字段中出现的位置的位置信息的路径字段的节点构成的信息的列表,并生成其中所述元素和所述倒排表相互关联的索引库;
搜索路径生成处理,该处理以一列元素的形式生成表示搜索条件的搜索路径;和
搜索处理,所述处理从所述索引库搜索每一个都具有包括在搜索路径中包括的相应元素的路径字段的节点,并基于所述位置信息从搜索的节点中提取具有满足搜索路径中的元素的出现顺序的路径字段的节点。
10.一种信息搜索方法,其包括:
通过图形结构信息存储设备存储包括作为元素的多个节点和连接节点的边的图形结构信息;
通过信息搜索设备:针对所述图形结构信息中所包括的节点中的每一个提取路径,所述路径中的每一个均为能从作为起点的所述节点追踪的一列元素;为所述节点中的每一个生成其中所提取的路径被连接起来的路径字段;针对配置所述图形结构信息的元素中的每一个生成倒排表,所述倒排表为由具有包括该元素和代表该元素在路径字段中出现的位置的位置信息的路径字段的节点构成的信息的列表;以及将所述元素和所述倒排表存储于索引库中,以便彼此相关联;
通过客户端设备请求所述信息搜索设备从所述图形结构信息中搜索满足搜索条件的目标节点;和
通过信息搜索设备:以一列元素的形式生成表示搜索条件的搜索路径;从所述索引库搜索每一个都具有包括在搜索路径中包括的相应元素的路径字段的节点;以及通过基于所述位置信息从搜索的节点中提取具有满足搜索路径中的元素的出现顺序的路径字段的节点来搜索目标节点。
CN2011800240419A 2010-05-14 2011-05-12 信息搜索设备、信息搜索方法、计算机程序和数据结构 Pending CN102893281A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010-111940 2010-05-14
JP2010111940 2010-05-14
PCT/JP2011/002641 WO2011142134A1 (ja) 2010-05-14 2011-05-12 情報検索装置、情報検索方法、コンピュータ・プログラムおよびデータ構造

Publications (1)

Publication Number Publication Date
CN102893281A true CN102893281A (zh) 2013-01-23

Family

ID=44914194

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011800240419A Pending CN102893281A (zh) 2010-05-14 2011-05-12 信息搜索设备、信息搜索方法、计算机程序和数据结构

Country Status (5)

Country Link
US (1) US9141727B2 (zh)
EP (1) EP2570936A4 (zh)
JP (1) JP4947245B2 (zh)
CN (1) CN102893281A (zh)
WO (1) WO2011142134A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020096A (zh) * 2011-09-22 2013-04-03 富士施乐株式会社 检索装置和检索方法

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11487707B2 (en) * 2012-04-30 2022-11-01 International Business Machines Corporation Efficient file path indexing for a content repository
US20140067781A1 (en) * 2012-08-31 2014-03-06 Scott W. Wolchok Graph Query Language API Querying and Parsing
US9171063B2 (en) 2013-03-13 2015-10-27 Facebook, Inc. Short-term hashes
KR102104496B1 (ko) * 2013-09-06 2020-04-24 삼성전자주식회사 데이터 검색 방법 및 장치
EP2979207A4 (en) 2013-10-10 2016-11-09 Yandex Europe Ag METHODS AND SYSTEMS FOR INDEXING SOURCE DATA FOR DATABASE DOCUMENTS AND FOR DOCUMENT LOCATION IN THE DATABASE
KR101678149B1 (ko) * 2016-02-05 2016-11-25 주식회사 비트나인 데이터베이스의 데이터 탐색방법 및 그 장치와 이를 위한 컴퓨터 프로그램
US10467229B2 (en) 2016-09-30 2019-11-05 Microsoft Technology Licensing, Llc. Query-time analytics on graph queries spanning subgraphs
US10545945B2 (en) 2016-10-28 2020-01-28 Microsoft Technology Licensing, Llc Change monitoring spanning graph queries
US10445361B2 (en) * 2016-12-15 2019-10-15 Microsoft Technology Licensing, Llc Caching of subgraphs and integration of cached subgraphs into graph query results
US10402403B2 (en) * 2016-12-15 2019-09-03 Microsoft Technology Licensing, Llc Utilization of probabilistic characteristics for reduction of graph database traversals
US10242223B2 (en) 2017-02-27 2019-03-26 Microsoft Technology Licensing, Llc Access controlled graph query spanning
US11100406B2 (en) * 2017-03-29 2021-08-24 Futurewei Technologies, Inc. Knowledge network platform
CN108520029A (zh) * 2018-03-27 2018-09-11 四川斐讯信息技术有限公司 一种基于图片和定位信息进行搜索的方法、服务器及系统
CN112214645B (zh) * 2019-07-11 2023-09-19 杭州海康威视数字技术股份有限公司 一种存储轨迹数据的方法及装置
CN111506623B (zh) * 2020-04-08 2024-03-22 北京百度网讯科技有限公司 数据扩充方法、装置、设备以及存储介质
KR20210128096A (ko) * 2020-04-16 2021-10-26 세종대학교산학협력단 사물인터넷 플랫폼 간 연동 방법 및 장치
JP7077387B1 (ja) 2020-11-25 2022-05-30 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP7109522B2 (ja) * 2020-11-25 2022-07-29 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1965316A (zh) * 2004-04-09 2007-05-16 甲骨文国际公司 用于存取xml数据的索引
US20070136382A1 (en) * 2005-12-14 2007-06-14 Sam Idicula Efficient path-based operations while searching across versions in a repository
CN101655862A (zh) * 2009-08-11 2010-02-24 华天清 信息对象搜索的方法和装置
CN101685444A (zh) * 2008-09-27 2010-03-31 国际商业机器公司 用于实现元数据搜索的系统和方法

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3492247B2 (ja) * 1999-07-16 2004-02-03 富士通株式会社 Xmlデータ検索システム
JP4039484B2 (ja) * 2002-02-28 2008-01-30 インターナショナル・ビジネス・マシーンズ・コーポレーション XPath評価方法、これを用いたXML文書処理システム及びプログラム
KR100484138B1 (ko) * 2002-05-08 2005-04-18 삼성전자주식회사 관계형 데이터베이스에서 정규 경로식 질의를 처리하는xml 인덱싱 방법과 자료구조
US7171404B2 (en) * 2002-06-13 2007-01-30 Mark Logic Corporation Parent-child query indexing for XML databases
AUPS300402A0 (en) * 2002-06-17 2002-07-11 Canon Kabushiki Kaisha Indexing and querying structured documents
US7162485B2 (en) * 2002-06-19 2007-01-09 Georg Gottlob Efficient processing of XPath queries
JP2004118543A (ja) 2002-09-26 2004-04-15 Toshiba Corp 構造化文書検索方法、検索支援方法、検索支援装置および検索支援プログラム
JP3982623B2 (ja) * 2003-03-25 2007-09-26 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、データベース検索システム及びプログラム
US7392239B2 (en) * 2003-04-14 2008-06-24 International Business Machines Corporation System and method for querying XML streams
US7877366B2 (en) * 2004-03-12 2011-01-25 Oracle International Corporation Streaming XML data retrieval using XPath
US20050257201A1 (en) * 2004-05-17 2005-11-17 International Business Machines Corporation Optimization of XPath expressions for evaluation upon streaming XML data
US9171100B2 (en) * 2004-09-22 2015-10-27 Primo M. Pettovello MTree an XPath multi-axis structure threaded index
JP4547300B2 (ja) 2005-05-09 2010-09-22 日本電信電話株式会社 共通クエリグラフパターン生成装置、生成方法、生成用プログラム、およびこれらを用いた共通サブグラフ検索装置、検索方法、検索用プログラム
US7685138B2 (en) 2005-11-08 2010-03-23 International Business Machines Corporation Virtual cursors for XML joins
JP4628258B2 (ja) 2005-11-15 2011-02-09 日本電信電話株式会社 グラフ検索装置
US8949455B2 (en) * 2005-11-21 2015-02-03 Oracle International Corporation Path-caching mechanism to improve performance of path-related operations in a repository
US7849091B1 (en) * 2006-01-25 2010-12-07 At&T Intellectual Property Ii, L.P. Meta-data indexing for XPath location steps
US8880506B2 (en) * 2009-10-16 2014-11-04 Oracle International Corporation Leveraging structured XML index data for evaluating database queries
JP2008041082A (ja) * 2006-07-12 2008-02-21 Hitachi Ltd 処理装置及びプログラム
US7765215B2 (en) * 2006-08-22 2010-07-27 International Business Machines Corporation System and method for providing a trustworthy inverted index to enable searching of records
JP4374014B2 (ja) * 2006-11-21 2009-12-02 株式会社日立製作所 インデクス生成装置及びそのプログラム
US7496568B2 (en) * 2006-11-30 2009-02-24 International Business Machines Corporation Efficient multifaceted search in information retrieval systems
US8079020B2 (en) * 2007-03-05 2011-12-13 Microsoft Corporation Preferential path profiling
JP2009295013A (ja) * 2008-06-06 2009-12-17 Hitachi Ltd データベース管理方法、データベース管理装置およびプログラム
JP5476815B2 (ja) 2008-10-08 2014-04-23 Jfeスチール株式会社 真空脱ガス装置における複合ランスを用いた加熱・精錬方法
JP4469016B2 (ja) 2009-07-24 2010-05-26 オリンパス株式会社 光学フィルタ及び光学機器

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1965316A (zh) * 2004-04-09 2007-05-16 甲骨文国际公司 用于存取xml数据的索引
US20070136382A1 (en) * 2005-12-14 2007-06-14 Sam Idicula Efficient path-based operations while searching across versions in a repository
CN101685444A (zh) * 2008-09-27 2010-03-31 国际商业机器公司 用于实现元数据搜索的系统和方法
CN101655862A (zh) * 2009-08-11 2010-02-24 华天清 信息对象搜索的方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020096A (zh) * 2011-09-22 2013-04-03 富士施乐株式会社 检索装置和检索方法
CN103020096B (zh) * 2011-09-22 2017-07-18 富士施乐株式会社 检索装置和检索方法

Also Published As

Publication number Publication date
JPWO2011142134A1 (ja) 2013-07-22
US20130103693A1 (en) 2013-04-25
WO2011142134A1 (ja) 2011-11-17
US9141727B2 (en) 2015-09-22
JP4947245B2 (ja) 2012-06-06
EP2570936A1 (en) 2013-03-20
EP2570936A4 (en) 2015-08-19

Similar Documents

Publication Publication Date Title
CN102893281A (zh) 信息搜索设备、信息搜索方法、计算机程序和数据结构
Zhu et al. Unsupervised entity resolution on multi-type graphs
US8356029B2 (en) Method and system for reconstruction of object model data in a relational database
CN100530185C (zh) 基于网络行为的个性化推荐方法和系统
US8161371B2 (en) Method and system for defining a heirarchical structure
US7797336B2 (en) System, method, and computer program product for knowledge management
US7464084B2 (en) Method for performing an inexact query transformation in a heterogeneous environment
US7788305B2 (en) Hierarchy nodes derived based on parent/child foreign key and/or range values on parent node
JP4385387B1 (ja) 属性付きキー・バリュー・ストアによるデータベース・システム
KR100638695B1 (ko) 구조화 문서의 데이터를 검색하는 장치 및 방법
US20040015486A1 (en) System and method for storing and retrieving data
Rozsnyai et al. Large-scale distributed storage system for business provenance
Abramowicz et al. Filtering the Web to feed data warehouses
JP2008165432A (ja) クエリ制御プログラム、クエリ制御装置およびクエリ制御方法
JP2004030221A (ja) 変更対象テーブル自動検出方法
CN101578579A (zh) 分类对象建模
Paul et al. A Review on Graph Database and its representation
Ravichandran Big Data processing with Hadoop: a review
JP2005316699A (ja) コンテンツ公開システム、コンテンツ公開方法、及びコンテンツ公開プログラム
Hewasinghage et al. Managing polyglot systems metadata with hypergraphs
Atzeni et al. Data modeling across the evolution of database technology
Jie et al. HAO unity: A graph-based system for unifying heterogeneous data
JP2004192657A (ja) 情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体
Solodovnikova et al. Managing Evolution of Heterogeneous Data Sources of a Data Warehouse.
Babić et al. Querying data in NoSQL databases

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130123