CN101278288A - 管理集束数据数据库存储数据联系结构的系统和方法 - Google Patents

管理集束数据数据库存储数据联系结构的系统和方法 Download PDF

Info

Publication number
CN101278288A
CN101278288A CNA2006800359906A CN200680035990A CN101278288A CN 101278288 A CN101278288 A CN 101278288A CN A2006800359906 A CNA2006800359906 A CN A2006800359906A CN 200680035990 A CN200680035990 A CN 200680035990A CN 101278288 A CN101278288 A CN 101278288A
Authority
CN
China
Prior art keywords
word
boundling
data
bundle
core word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800359906A
Other languages
English (en)
Other versions
CN101278288B (zh
Inventor
崔镇根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority claimed from PCT/KR2006/003882 external-priority patent/WO2007037629A1/en
Publication of CN101278288A publication Critical patent/CN101278288A/zh
Application granted granted Critical
Publication of CN101278288B publication Critical patent/CN101278288B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/217Database tuning

Abstract

集束数据库管理系统,其包括:一搜索服务器,其包括一集束定义单元,用于定义核心词和与之有关的关联词,以及核心词和关联词之间的关联关系以生成和存储集束数据;一描述定义单元,用于定义核心词和关联词的相关描述数据;一搜索请求接收单元,用于接收包含用户输入的特定搜索词的搜索请求;一搜索结果页面生成单元,用于生成包含通过以核心词作为搜索词检索到的集束数据和通过核心词检索到了描述数据的搜索结果页面;和一搜索结果页面发送单元,用于将搜索结果页面发送给用户;以及一连接到搜索服务器的用户终端,用于发送搜索请求和接收搜索结果页面。

Description

管理集束数据数据库存储数据联系结构的系统和方法
技术领域
本发明涉及到集束数据库(bundle database)管理系统和方法,特别地,涉及到通过生成定义关于特定词汇的关联词的联系结构的集束数据,将之存储到集束数据库中,并且包括有通过用户输入的搜索词从集束数据库中检索到的为搜索结果形式的集束数据,来提供搜索服务的集束数据库管理系统和方法。
背景技术
传统的搜索系统通过接收的来自用户的搜索词检索搜索数据库(DB)并提供按顺序排列的检索到的数据。例如,当使用者发送一个对于搜索词X的搜索请求,搜索服务器根据范畴分类(如,网站、知识、新闻、词典等等)检索数据并根据每一范畴组别的顺序排列相应的数据以提供一搜索结果页面。
传统的搜索系统主要被涉及用于对特定搜索词的深度搜索,且其仅能提供关于搜索词的信息的简单排列,因而需要用户自己去理解检索到的信息之间的关系。例如,当用户输入“hippie”(嬉皮)作为搜索词时,传统的搜索系统提供与词汇“hippie”(嬉皮)直接相关的信息作为搜索结果。用户从传统的搜索系统可以获得与“hippie”(嬉皮)直接相关的专业知识,而不能获得与“hippie”(嬉皮)有关的周边知识。因此,传统的搜索系统无法扩展到三维和基于词汇的有机联系的适当的相关知识以形成搜索结果,从而不适于通过信息的汇编和联系创造新的知识。
例如,当用户输入“hippie”(嬉皮)作为搜索词时,传统搜索系统生成的搜索结果页面仅显示包括“hippie”(嬉皮)的网站的标题或包括“hippie”(嬉皮)的内容的链接路径。因此,传统的搜索系统具有仅给用户提供与“hippie”(嬉皮)有直接联系的信息的访问机会的局限。
“hippie”(嬉皮)一词与词汇″psychedelic″(迷幻的),″Beatles″(披头士),和″mods look″(现代派外观)均有关联,但是,传统的搜索方法在访问所有与“hippie”(嬉皮)相关的信息时存在困难。
一种替代的方法为访问所有与“hippie”(嬉皮)直接相关的信息,领会相应内容的主旨,并找到“hippie”(嬉皮)与″psychedelic″(迷幻的)之间的联系(这一步并非易与)。接下来,该方法输入搜索词″psychedelic″(迷幻的),并从搜索结果中访问所有与psychedelic″(迷幻的)直接相关的内容,从而为搜索目标扩展知识广度。
然而,此种方法反复执行检验单个搜索结果的主旨和推断检索词的步骤,从而导致用户检索所需时间和精力的增加。
发明内容
技术问题
本发明被设计用于解决现有技术的问题,因此,本发明的目的是生成在单独数据间定义了联系关系的集束数据以构造集束数据库并通过该集束数据库提供搜索服务。这样,本发明减少搜索所需的精力和时间,并为特定搜索词系统地提供类似关联信息以搜索用户事先未思及的关联词,从而为搜索扩展知识广度。
技术解决方案
为达上述目的,在用于生成、存储和搜索在具有相互关系的单独词汇之间定义联系结构的集束数据的集束数据库系统中,根据本发明的用于存储数据联系结构的集束数据库管理系统包括:一搜索服务器,其包括一集束定义单元,用于定义核心词和与之有关的关联词,以及核心词和关联词之间的关联关系以生成和存储集束数据;一描述定义单元,用于定义核心词和关联词的相关描述数据;一搜索请求接收单元,用于接收包含用户输入的特定搜索词的搜索请求;一搜索结果页面生成单元,用于生成包含通过以核心词作为搜索词检索到的集束数据和通过核心词检索到了描述数据的搜索结果页面;和一搜索结果页面发送单元,用于将搜索结果页面发送给用户;以及一连接到搜索服务器的用户终端,用于发送搜索请求和接收搜索结果页面。
进一步地,在用于生成、存储和搜索在具有相互关系的单独词汇之间定义联系结构的集束数据的集束数据库管理方法中,根据本发明的用于存储数据联系结构的集束数据库管理方法包括以下步骤:(1)生成并存储包括核心词和与之有关的关联词,以及核心词和关联词之间定义的关联关系的集束数据;(2)存储核心词和关联词的相关描述数据;(3)接收包括用户输入的特定搜索词的搜索请求;(4)生成包含通过以搜索词作为核心词检索到的集束数据和通过核心词检索到了描述数据的搜索结果页面;以及(5)将搜索结果页面发送到用户终端。
附图说明
本发明优选实施例的这些和其它的特征、方面和优点将在下面的详细描述中结合附图进行更充分的说明。在图中:
图1是根据本发明典型实施例的集束数据库管理系统的结构示意图;
图2是根据本发明典型实施例的集束数据的连接结构图;
图3是根据本发明典型实施例的集束数据的n维连接关系的示例图;
图4是根据本发明典型实施例的搜索服务器的集束连接的示例图;
图5是根据本发明典型实施例的搜索服务器的内部结构图;
图6到11是根据本发明典型实施例的根据六种连接方法的集束数据示例图;
图12是根据本发明典型实施例的集束数据存储示例图;
图13是根据本发明典型实施例的集束数据库管理方法的综合流程图;
图14是根据本发明典型实施例的生成搜索结果页面步骤的详细流程图;
图15是根据本发明典型实施例的搜索结果页面的屏幕示例图;
图16是根据本发明典型实施例的分子集束搜索结果页面的屏幕示例图;
图17是根据本发明典型实施例的分子集束搜索结果页面的屏幕示例图。
具体实施方式
本发明的最佳实施方式
下面,将参考附图对本发明的优选实施例进行详细描述。图1是根据本发明典型实施例的集束数据库管理系统1的结构示意图。
根据本发明典型实施例的集束数据库管理系统1具有搜索服务器2和用户终端3。
搜索服务器2生成集束数据以定义搜索主题的搜索词(词汇)之间的关联(关系)并存储搜索词之间的连接关系,并且将该集束数据存储到集束数据库中。搜索服务器2还接收对来自用户终端3的特定搜索词的搜索请求,并与对应搜索词的搜索结果数据(以下称为描述数据)一起发送集束数据以图形化地显示与搜索词相关的关联数据的连接结构,从而提供搜索服务。
用户终端3通过有线或无线网络连接到用户服务器2上,并传送对用户输入的特定搜索词的搜索请求。用户终端3接收作为搜索请求的响应的搜索结果页面。该搜索结果页面包括搜索词的描述数据以及定义与搜索词相关的关联词的连接结构的集束数据。本发明所提出的集束数据的定义和结构将在下文中详细描述。
图2是是根据本发明典型实施例的集束数据的连接结构图。
在这里,所述词汇既包括具有物理音节的词汇(如:“hippy”嬉皮),也包括典型地公认为一个具有含义的词的词汇。也就是说,词不必是单个词汇,而可以是包含至少两个相互结合的词汇的陈述句(例如:“hippie-cultural”,嬉皮文化)。
i)孤词(solo):单个词可以被定义为一个单元,如果有单个的单元b1,该单元被定义为一个孤词。
ii)集束数据:集束数据包括a)单个核心词,b)与核心词相连的至少一个关联词,c)核心词和关联词之间的连接关系。如果关联单元(词)连接到孤词,该孤词即成为核心词b1,该被连接的单元成为关联词b2。
iii)数据b3的加入:如果在核心词b1上增加新的关联词b3,那么就在b1-b2-b3结构中形成连接。关联词b2和b3可以彼此相关或不相关,但是它们必须与核心词b1有关。
iv)数据b2和b3之间的联系:在上述iii)中如果数据b2成为数据b3的核心词,那么数据b3就通过垂直线连接到数据b2。在这种情况下,核心词b1通过作为关联词和核心词的数据b2与数据b3相联系。
在本发明中,集束数据的连接关系以两种形式表现,即使用水平线的水平连接和使用垂直线的垂直连接。水平连接是关联词到最左侧的核心词的右向连接,垂直连接是从关联词到最下侧的核心词向上连接。垂直连接开始于构成水平连接的关联词,垂直连接的起始词成为水平连接结构的关联词和垂直连接结构的核心词。在水平连接结构中,位于左侧的关联词比位于右侧的关联词具有更强的与核心词的关联性,并且在垂直连接结构中,位于下侧的关联词比位于上侧的关联词具有更强的关联性。
在本发明中,术语孤词、核心词和关联词是根据核心词的标准而改变的相对概念(例如:在图2的(iv)中,b2是核心词b1的关联词和通过垂直线与b2相连的b3的核心词。)。
图3是根据本发明典型实施例的集束数据的n维连接关系的示例图。
图3显示了实际中由六个单元(词)组成的三维(n=3)集束。下述表1通过图3所示的3维集束定义了本发明中术语“集束”的概念。
表1
  名词  定义
  第一集束  一集束,其包括一单独核心词和至少一个通过与该核心词关联而最初连接到该核心词的关联词,如)b1的第一集束:b1(核心词),b2,b3;b2的第一集束:b2(核心词),b4,b5;b4的第一集束:b4(核心词),b6
  第二集束  一集束,其包括作为核心词的构成第一集束的任一关联词及连接到该核心词的附属关联词,如)b1的第二集束:b2(核心词),b4,b5;b2的第二集束:b4(核心词),b6
  第三集束  一集束,其包括作为核心词的构成第二集束的任一关联词及连接到该核心词的附属关联词,如)b1的第三集束:b4,b6
  第n集束  一集束,其具有根据第一、第二和第三集束结构扩展的第n层连接关系
  N-维集束  具有全部n层关系的集束,其包括一原子集束的核心词及全部关联词,如)以b1为基准:b1,b2,b3,b4,b5,b6为第三集束;以b2为基准:b2,b4,b5,b6是第二集束;以b4为基准:b4,b6为第一集束
  原子集束  一集束,其包括以用户搜索词b1为核心词而最初产生的全部关联词
  分子集束  一集束,其包括构成原子集束的作为核心词的关联词以及连接到该核心词的附属关联词,如)分子集束1:b2,b4,b5,b6;分子集束2:b4,b6
参照上述表1,集束的结构描述如图3所示,核心词b1形成了作为一个整体的三维集束。因为该集束被扩展到了基于核心词b1的第三集束b4、b6。该三维集束结构被分成基于b1的包括b1、b2和b3的第一集束,包括b2、b4和b5的第二集束,包括b4和b6的第三集束,并且奇数集束(n=1,3,5...)是其中词汇用水平线连接的集束而偶数集束是其中词汇用垂直线连接的集束。
这里,为了便于描述,其中第一集束通过水平线连接的集束被称为水平集束,在本文中提到集束时,集束应被理解为是水平集束。
同时,核心词b1与最初连接到b1的关联词b2、b3具有直接联系,与b4、b5、b6经由通过作为关联词和核心词的b2和b4的扩展相联系。即是说,b1通过作为关联词和核心词的b2与b4和b5相联系,通过作为关联词和核心词的b4与b6相联系。以这种方式,集束通过经由作为关联词和核心词的词汇(单元)的联系的有机扩展不断形成和发展。
图4是根据本发明典型实施例的搜索服务器2所执行的集束连接示例图。
描述通过任意集束的连接的集束扩展,让我们假设二维集束b4(核心词)-b5(关联词)-b6(关联词)被附加的连接到一维集束i(图4)b1(核心词)-b2(关联词)-b3(关联词)中的b3。对于两个集束的连接,b4-b5-b6的连接结构被逆时针旋转90度(图4中iii的左侧),随后再轴对称旋转(图4中iii的右侧)。接下来,轴对称旋转后的集束(b4-b5-b6)被连接到从b3引出的水平线(图4中的iv)。
如上文所述,当连接集束时,要被连接的集束(b4-b5-b6)被逆时针旋转90度再轴对称旋转以保持集束(b4-b5-b6)的独立集束结构,否则,若集束(b4-b5-b6)不经旋转即被连接,那么b4将失去如图4中ii所示的作为核心词的功能而仅作为b1(核心词)的关联词,因此,集束(b4-b5-b6)不能保持独立结构并被集束(b1-b2-b3)吸收,从而失去其独立结构。
以下将参考图6到11详细说明本发明所提出的集束连接原则。
如图4所示,集束数据可以通过集束连接扩张和发展为n维集束。假设搜索服务器2以b1-b2-b3集束和b4-b5-b6集束为数据库,搜索服务器2接收由用户输入的搜索词b1,通过以b1为核心词选取b1-b2-b3集束,选取具有包括在所选集束中的作为核心词的任一关联词的集束b4-b5-b6,将b1-b2-b3集束和b4-b5-b6集束以上文所述方式相连接并提供给用户。从而可以通过来自与b1有关的所有关联词的信息的集束数据将各个领域的信息提供给用户。
图5是根据本发明典型实施例的搜索服务器2的内部结构图。
根据本发明典型实施例的搜索服务器2包括集束定义单元21,描述定义单元22,搜索请求接收单元23,搜索结果页面生成单元24和搜索结果发送单元25。集束数据库的数据库管理系统(DBMS)还包括集束数据DB 211和描述数据DB 221。
集束定义单元21定义核心词、连接到核心词的关联词,定义核心词和关联词之间的连接关系以生成集束数据,以及将集束数据存储在集束数据DB 211中。生产商构造和生成初始集束数据DB211,之后,提供给用户给定的集束定义界面显示,并且用户生成或删除其中的词汇和连接关系,从而自由地定义集束结构。
例如,用户可以将各种信息定义为集束结构并将之存储在专门指定给成员的他/她的网络博客(博客)或迷你主页中。综上(for incorporating this),最好是在博客或迷你主页中定义核心词和关联词之间的连接关系,并将集束生成工具提供给该博客或迷你主页,以输入与每个词汇相关的描述数据。
描述定义单元22将构成集束数据的单个词汇(核心词或关联词)链接到描述数据,并将之存储在描述数据DB221中。
搜索请求接收单元22接收来自用户终端3的包含用户输入的特定搜索词的搜索请求。
搜索结果页面生成单元24以搜索词作为核心词检索集束数据DB211,并检索其中所有构成原子集束或分子集束的词汇数据以生成基于上述连接关系(水平连接,垂直连接)的图形化集束数据。搜索结果页面生成单元24也通过搜索词(原子集束或分子集束的核心词)检索描述数据DB221以搜索相应的描述数据。并且,搜索结果页面生成单元24生成包括上述图形化集束数据和描述数据的搜索结果页面。
这里,包括在搜索结果页面中的集束数据的单个词汇具有超链接(URL信息),通过该超链接可以参考描述数据。从而,用户终端3接收搜索结果页面并将其显示在屏幕上。当用户选定了集束数据中的特定词汇(单元)的时候,搜索服务器2接收相应的URL信息,查阅相应的描述数据并通过搜索结果页面提供其内容。
搜索结果发送单元25对搜索请求和用户的集束数据选择做出响应,将生成的搜索结果页面发送到用户终端3。
图6到11是根据本发明典型实施例的六种连接方法的集束数据示例图。为了描述方便,在下文中将逆时针方向旋转90度之后再水平轴向翻转的集束称为“旋转集束”。
图6示出了垂直线A型连接方法。当集束(包括孤词)(9~,10~,11~)连接到位于原子集束水平线上的任意关联词2、3、6、8的时候,垂直线A型连接方法实际上是将关联词2,3,6,8转换为核心词,并将集束(9~,10~,11~,12)分别连接到从核心词引出的垂直线。
图7示出了水平线端点B型连接方法。当集束(包括孤词)(9~,10~,11~)分别连接到位于原子集束水平线端点上的任意关联词3、7、8的时候,水平线端点B型连接方法将集束(9~,10~,11~)转换为加入到旋转集束中,并将集束(9~,10~,11~)分别连接到从关联词引出的水平线。
图8示出了水平线B型插入连接方法。水平线B型连接方法在位于原子集束水平线上的关联词2和关联词3之间插入集束(包括孤词)(9~)。此时,要插入的集束(9~)被转换为旋转集束并插入到关联词2和关联词3之间的水平线上。
图9示出了垂直线B型连接方法。当集束(包括孤词)(12~,13~,14~,15)分别连接到位于原子集束的垂直线上的任意关联词5、6、10、11的时候,垂直线B型连接方法将关联词5、6、10、11转换为核心词,将集束(12~,13~,14~,15)转换为加入到旋转集束中并将其分别连接到从关联词5、6、10、11引出的水平线上。
图10示出了垂直线端点A型连接方法。当集束(包括孤词)(12~,13~,14~,15)连接到位于原子集束垂直端点上的任意关联词5、8、9、11的时候,垂直线端点B型连接方法实际上是将集束(12~,13~,14~,15)分别连接加入到关联词5、8、9、11所延伸的垂直线上。
图11示出了垂直线A型插入连接方法。垂直线A型插入连接方法在位于原子集束垂直线上的关联词4和关联词5之间插入集束(包括孤词)(12~)。此时,要插入的集束(12~)实际上是被插入到关联词4和关联词5之间的垂直线上。
图12是根据本发明典型实施例的集束数据示例图。
如图12所示,以下将参考原子集束(b1的四维集束)来描述集束数据DB211的存储结构。
原子集束由b1到b12总共12个词汇(单元)构成,包括作为原子集束核心词的b1和作为分子集束核心词(分子核心词)的b2,b3,b5,b8,b9。
对应六个核心词的六个集束结构存储在集束数据DB211中。下面的表2示出了六个集束的数据结构。
表2
 集束 数据结构
 原子集束(b1) b1(空),b2(b1),b3(b2),b4(b3),b5(b2’),b6(b5),b7(b5’),b8(b3’),b9(b8),b10(b9),b11(b8’),b12(b9’)
 分子集束1(b2) b2(空),b5(b2’),b6(b5),b7(b5’)
 分子集束2(b3) b1(空),b8(b3’),b9(b8),b10(b9),b11(b8’),b12(b9’)
 分子集束3(b5) b5(空),b6(b5)
 分子集束4(b8) b8(空),b9(b8),b10(b9),b12(b9’)
 分子集束5(b9) b9(空),b12(b9’)
在上述表2中,在括号()中显示的词汇代表指向前一个词汇的链接信息,角标′表示通过垂直连接线与前一个词汇相连接。此种数据结构允许集束数据DB211存储词汇数据和词汇数据的连接关系,并允许搜索服务器2通过检索到的集束数据之间的连接关系描绘图形化的集束数据。
图13是根据本发明典型实施例的集束数据库管理方法的总体流程图。
在生成和存储集束数据的步骤(S10)中,搜索服务器2通过将搜索词作为一个(核心)词在词汇之间定义核心词和关联词,并定义核心词和关联词之间的连接关系以将之存储在集束数据DB211内(S10)。搜索服务器2还在描述数据DB211中存储对应构成集束数据的单个词汇的描述数据。
综上(for incorporating this),搜索服务器2将程序装置(program means)提供给集束数据DB生成者(generator),该程序装置使得集束数据DB生成者指定核心词和关联词并通过输入设备为每个词汇输入描述数据。集束数据DB生成者可以是搜索服务器2的执行企业或者是在搜索服务器2上拥有他/她的博客或迷你主页的普通用户。
用户在用户终端3上输入搜索词并将搜索请求发送到搜索服务器2。搜索服务器接收搜索请求(S30)。
搜索服务器2通过搜索词检索集束数据DB211和描述数据DB221以生成搜索结果页面。参照图14进行更详细地描述,接收到的搜索词被设定为核心词(S41)并通过该设定的核心词检索集束数据DB211,以通过检索到的数据生成图形化的集束数据(S42)。与此同时,检索到具有与核心词相连的关联词的另一集束,该关联词作为该另一集束的核心词,这些集束通过上述的方式连接。
通过相连接的集束中包含的所有核心词和关联词检索描述数据DB221,以读取描述数据(S43)。并且生成包括图形化集束数据和描述数据的搜索结果页面(S44)。这里,构成搜索结果页面的图形化集束数据的词汇单元带有指向描述数据的超链接(URL信息)。
作为对搜索请求的响应,搜索服务器2将生成的搜索结果页面发送到用户终端3(S50)。
用户通过在接收到的检索结果页面上所显示的图形化集束数据检索相关的词汇并确定描述数据。此时,当用户在集束数据上选择特定的关联词以获取更详细的信息时,搜索服务器接收词汇(单元)的选择信息(URL信息)(S60)。
搜索服务器2基于选择信息中所包含的URL信息从描述数据DB221中检索相应的描述数据,以生成搜索结果页面并将其发送到用户终端3。
图15是根据本发明典型实施例的搜索结果页面的屏幕示例图。
图15演示了根据用户输入的搜索词“hippie”生成的搜索结果页面。该搜索结果页面包括集束数据画面101和描述数据画面102。
在集束数据画面101中,以用户的搜索词为核心词103的集束数据以图形形式显示。构成图形化集束数据的词汇(单元)具有超链接。如果用户要确定描述数据画面102的信息并获取更详细的信息或相关信息,那么用户选取图形化集束数据上的特定词汇。特定词汇的选择信息以URL信息形式被传送到搜索服务器2。搜索服务器在在描述数据页面102上显示特定词汇的集束数据104(图6)和描述数据。因此,通过检索词的单次输入,同时提供给用户表示关联词汇信息的集束数据和所需的检索结果,从而用户可以搜索更宽范围的知识并掌握当前搜索结果在整个搜索结果中处于什么位置。
图16示出了当使用者选择了图15中的关联词“psychedelic”(迷幻的)时的分子集束搜索结果页面。
图17示出了当使用者选择了图15中的关联词“Art Nouveau”(新艺术主义)时的分子集束搜索结果页面。
如上文所述,根据本发明的用于存储数据联系结构的集束数据库管理系统和方法已被详细说明。但是,应该理解的是,尽管被指定为本发明的优选实施例,由于在不超出本发明精神和范围情况下各种不同的变化和修改对本领域的技术人员来说是显而易见的,因而该详细描述和特定实施例只是以示例形式给出。
工业应用
根据本发明的用于存储数据联系结构的集束数据库管理系统和方法通过技术数据库存储搜索词之间的具有图形层次的联系结构在给出搜索词的直接搜索结果的同时给出了关联词(搜索词)的联系结构,从而提供系统的和高质量的全面知识搜索服务。
进一步,当将搜索结果提供给用户之后,用户在所提供的集束数据之上点击关联词而无需再次输入搜索词,从而简化了搜索界面,在提供搜需搜索结果的同时提供相关知识的搜索结果,缩短了搜索时间。

Claims (15)

1、一种集束数据库管理系统,其用于生成、存储和搜索在具有相互关联的单个词汇之间定义了联系结构的集束数据,该系统包括:
一搜索服务器,其包括:
一集束定义单元,用于定义核心词和连接到该核心词的关联词,以及核心词和关联词之间的连接关系,以生成和存储集束数据;
一描述定义单元,用于存储对应于核心词和关联词的描述数据;
一搜索请求接收单元,用于接收包含用户输入的特定搜索词的搜索请求;
一搜索结果页面生成单元,用于生成包含通过以核心词作为搜索词检索到的集束数据和通过核心词检索到的描述数据的搜索结果页面;以及
一搜索结果页面发送单元,用于将搜索结果页面发送给用户;以及
一连接到搜索服务器的用户终端,用于发送搜索请求和接收搜索结果页面。
2、根据权利要求1所述的集束数据库管理系统,其中搜索服务器生成、存储和搜索由n-维(n>1)集束组成的集束数据,该n-维集束具有多重的连接结构,包括:
第一(n=1)集束,其中连接有至少一个对应单个核心词的关联词;
第二(n=2)集束,其中构成第一集束的任一关联词变为单个核心词,且连接有至少一个连接到该单个核心词的关联词;
第三(n=3)集束,其中构成第二集束的任一关联词变为单个核心词,且连接有至少一个连接到该单个核心词的关联词。
3、根据权利要求1或2所述的集束数据库管理系统,其中搜索服务器以图谱结构向用户显示集束数据,该图谱结构为奇数集束(n=1,3,5,...)中的每个核心词水平连接至少一个关联词,为偶数集束(n=2,4,6,...)中的每个核心词垂直连接至少一个关联词。
4、根据权利要求1或2所述的集束数据库管理系统,其中搜索服务器包括:
一集束数据数据库(DB),用于存储核心词、关联词和构成集束数据的它们之间的连接关系;
一描述数据DB,用于存储对应存储于集束数据库中的单个词汇的描述数据。
5、根据权利要求1或2所述的集束数据库管理系统,其中搜索服务器从用户终端接收特定词汇的选择信息,所述特定词汇构成在搜索结果页面中以图形结构表示的集束数据,并且该搜索服务器包括有通过搜索结果页面中的特定词汇检索到的描述数据,以将其提供给用户终端。
6、根据权利要求1或2所述的集束数据库管理系统,其中在生成搜索结果页面的步骤中,搜索服务器包括有指向对应于在搜索结果页面中构成集束数据的每个核心词和关联词的描述数据的统一资源定位(URL)信息,以将其发送到用户终端。
7、根据权利要求1或2所述的集束数据库管理系统,其中搜索服务器通过从组群中选择的任一种方法或其连接方法来连接集束数据,该组群包括:
水平线A型连接,用于将位于水平线上(奇数集束)的关联词转换为核心词并通过从该核心词引出的垂直线将水平集束连接到该核心词;
水平线端点B型连接,当在水平线的最右侧增加新的关联词(核心词)时,将水平集束进行旋转并通过水平线连接该水平集束;
水平线B型插入连接,用于将集束转换为旋转集束并将该集束插入到位于水平线上的关联词之间;
垂直线B型连接,用于将位于垂直线上(偶数集束)的关联词转换为核心词并通过从该核心词引出的水平线将旋转集束连接到该核心词;
垂直线端点A型连接,用于当在垂直线的最上侧增加新的关联词(核心词)时,通过垂直线连接水平集束;以及
垂直线A型插入连接,用于将集束插入到位于垂直线上的关联词之间。
8、一种集束数据库管理方法,用于生成、存储和搜索在具有相互关系的单个词汇之间定义了联系结构的集束数据,所述方法包括的步骤有:
(1)生成并存储集束数据,该集束数据包括核心词、连接到该核心词的关联词以及核心词与关联词之间的连接关系;
(2)存储对应于核心词和关联词的描述数据;
(3)接收包含用户输入的特定搜索词的搜索请求;
(4)生成包含通过以核心词作为搜索词检索到的集束数据和通过核心词检索到的描述数据的搜索结果页面;以及
(5)将搜索结果页面发送到用户终端。
9、根据权利要求8所述的集束数据库管理方法,其中生成和存储集束数据的步骤(1)包括生成具有n-维(n>1)集束的集束数据并将集束数据存储到集束数据DB中,该n-维集束具有连接结构,该连接结构包括:
第一(n=1)集束,其中连接有至少一个对应单个核心词的关联词;
第二(n=2)集束,其中构成第一集束的任一关联词变为单个核心词,且连接有至少一个连接到该单个核心词的关联词;
第三(n=3)集束,其中构成第二集束的任一关联词变为单个核心词,且连接有至少一个连接到该单个核心词的关联词。
10、根据权利要求8所述的集束数据库管理方法,其中存储描述数据的步骤(2)包括将对应核心词和关键词的描述数据存储到描述数据DB中。
11、根据权利要求8所述的集束数据库管理方法,其中生成搜索结果页面的步骤(4)包括下述步骤:
(4-1)将接收到的搜索词设定为核心词;
(4-2)通过核心词检索集束数据DB以搜索集束数据;
(4-3)通过核心词检索描述数据DB以搜索相应的描述数据;
(4-4)生成包括集束数据和描述数据的搜索结果页面。
12、根据权利要求8或11所述的集束数据库管理方法,其中生成搜索结果页面的步骤(4)包括将集束数据包括在搜索结果页面中的步骤,奇数集束(n=1,3,5,...)中的集束数据以这样的图形结构表示:即用于每个核心词的至少一个关联词为水平连接,在偶数集束(n=2,4,6,...)的集束数据以这样的图形结构表示:即用于每个核心词的至少一个关联词为垂直连接。
13、根据权利要求8或11所述的集束数据库管理方法,其中生成搜索结果页面的步骤(4)包括生成含有URL信息的搜索结果页面,该URL信息指向对应构成集束数据的每个核心词和关联词的描述数据。
14、根据权利要求8或11所述的集束数据库管理方法,其中生成搜索结果页面的步骤(4)包括通过从组群中选择的任一种方法或其连接方法来连接集束数据,该群组包括:
用于将位于水平线上(奇数集束)的关联词转换为核心词并通过从该核心词引出的垂直线将水平集束连接到该核心词的连接(水平线A型连接);
用于当在水平线的最右侧增加新的关联词(核心词)时,将水平集束进行旋转并通过水平线连接该水平集束的连接(水平线端点B型连接);
用于将集束转换为旋转集束并将该集束插入到位于水平线上的关联词之间的连接(水平线B型插入连接);
用于将位于垂直线上(偶数集束)的关联词转换为核心词并通过从该核心词引出的水平线将旋转集束连接到该核心词的连接(垂直线B型连接);
用于当在垂直线的最上侧增加新的关联词(核心词)时,通过垂直线连接水平集束的连接(垂直线端点A型连接);以及
用于将集束插入位于垂直线上的关联词之间的连接(垂直线A型插入连接)。
15、根据权利要求8所述的集束数据库管理方法,其进一步包括以下步骤:
(6)接收来自用户终端的构成集束数据的特定词汇的选择信息,该集束数据在搜索结果页面上以图形结构表示;以及
(7)包括通过检索结果页面上的特定词汇检索到的描述数据并将其提供给用户终端。
CN2006800359906A 2005-09-28 2006-09-28 管理集束数据数据库存储数据联系结构的系统和方法 Expired - Fee Related CN101278288B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR10-2005-0090762 2005-09-28
KR20050090762 2005-09-28
KR1020050104668A KR100724122B1 (ko) 2005-09-28 2005-11-03 데이터의 연관성 구조를 저장하는 번들데이터베이스관리시스템 및 그 관리방법
KR10-2005-0104668 2005-11-03
PCT/KR2006/003882 WO2007037629A1 (en) 2005-09-28 2006-09-28 System and method for managing bundle data database storing data association structure

Publications (2)

Publication Number Publication Date
CN101278288A true CN101278288A (zh) 2008-10-01
CN101278288B CN101278288B (zh) 2011-06-08

Family

ID=38158354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800359906A Expired - Fee Related CN101278288B (zh) 2005-09-28 2006-09-28 管理集束数据数据库存储数据联系结构的系统和方法

Country Status (4)

Country Link
US (2) US7769758B2 (zh)
JP (1) JP4712093B2 (zh)
KR (1) KR100724122B1 (zh)
CN (1) CN101278288B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020070A (zh) * 2011-09-22 2013-04-03 联想(北京)有限公司 搜索方法和电子终端

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080301096A1 (en) * 2007-05-29 2008-12-04 Microsoft Corporation Techniques to manage metadata fields for a taxonomy system
KR101251390B1 (ko) * 2008-08-26 2013-04-05 에스케이플래닛 주식회사 연상 단어망 구축 및 서비스 방법, 이를 위한 시스템 및 이를 위한 연상 단어망 서버
KR101054050B1 (ko) * 2008-11-28 2011-08-03 한국과학기술원 사용자의 정보 검색을 지원하기 위한 개인화된 시각화 방법
US8190601B2 (en) 2009-05-22 2012-05-29 Microsoft Corporation Identifying task groups for organizing search results
US20110082734A1 (en) * 2009-10-02 2011-04-07 Haining Zhang Locating bundled items
US9092810B2 (en) 2011-04-11 2015-07-28 Ebay Inc. Methods and systems for merchandising products in bundles in an online marketplace
US20140172819A1 (en) * 2011-07-31 2014-06-19 Niva Bar-Shimon Human association search engine
KR101458140B1 (ko) * 2012-05-10 2014-11-12 최진근 단어 연관성을 이용하는 정보 수집 시스템 및 정보 수집 방법
US20200341977A1 (en) * 2019-04-25 2020-10-29 Mycelebs Co., Ltd. Method and apparatus for managing attribute language
WO2021097328A1 (en) * 2019-11-15 2021-05-20 Geneva Technologies, Inc. Customizable communications platform

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5983237A (en) * 1996-03-29 1999-11-09 Virage, Inc. Visual dictionary
US6442545B1 (en) * 1999-06-01 2002-08-27 Clearforest Ltd. Term-level text with mining with taxonomies
US7181438B1 (en) * 1999-07-21 2007-02-20 Alberti Anemometer, Llc Database access system
KR100323208B1 (ko) 1999-12-17 2002-02-19 서휘 시소러스 자동구축 및 자동검색 방법
US6751621B1 (en) * 2000-01-27 2004-06-15 Manning & Napier Information Services, Llc. Construction of trainable semantic vectors and clustering, classification, and searching using trainable semantic vectors
US6502091B1 (en) * 2000-02-23 2002-12-31 Hewlett-Packard Company Apparatus and method for discovering context groups and document categories by mining usage logs
DE60143491D1 (de) 2000-03-16 2010-12-30 Poly Vista Inc System und methode zur analyse einer anfrage und zur erzeugung von antworten und damit verbundenen fragen
JP2002032394A (ja) * 2000-07-18 2002-01-31 Ricoh Co Ltd 関連語情報作成装置、関連語提示装置、文書検索装置、関連語情報作成方法、関連語提示方法、文書検索方法および記憶媒体
KR100386804B1 (ko) 2000-08-19 2003-06-09 (주) 지식공학 유의어 전자사전 및 그 전자사전을 이용한 유의어 검색방법
US20030217052A1 (en) * 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
KR20030001134A (ko) 2001-06-28 2003-01-06 주식회사 하이닉스반도체 자기 정렬 콘택 형성 방법
US7028024B1 (en) 2001-07-20 2006-04-11 Vignette Corporation Information retrieval from a collection of information objects tagged with hierarchical keywords
US6792414B2 (en) * 2001-10-19 2004-09-14 Microsoft Corporation Generalized keyword matching for keyword based searching over relational databases
US20050154690A1 (en) * 2002-02-04 2005-07-14 Celestar Lexico-Sciences, Inc Document knowledge management apparatus and method
JP3627715B2 (ja) 2002-03-27 2005-03-09 ソニー株式会社 情報処理装置および方法、記録媒体、プログラム、並びに情報処理システム
US7249117B2 (en) * 2002-05-22 2007-07-24 Estes Timothy W Knowledge discovery agent system and method
US20040015481A1 (en) * 2002-05-23 2004-01-22 Kenneth Zinda Patent data mining
JP3960530B2 (ja) * 2002-06-19 2007-08-15 株式会社日立製作所 テキストマイニングプログラム、方法、及び装置
KR100493688B1 (ko) * 2003-01-08 2005-06-03 주식회사 옵투스 키워드확장장치 및 방법과 키워드확장장치를 이용한검색시스템
CN1315074C (zh) * 2003-01-24 2007-05-09 英业达股份有限公司 具有在线信息搜索功能的信息处理互助式计算机网络系统
JP3823151B2 (ja) * 2003-01-28 2006-09-20 独立行政法人情報通信研究機構 辞書評価支援装置、辞書評価支援プログラム
JP2004287827A (ja) * 2003-03-20 2004-10-14 Fuji Xerox Co Ltd 検索システム、プログラム、及び検索条件選択肢の提示方法
US7930301B2 (en) * 2003-03-31 2011-04-19 Microsoft Corporation System and method for searching computer files and returning identified files and associated files
JP4366479B2 (ja) * 2003-05-30 2009-11-18 カシオ計算機株式会社 情報表示制御装置及びプログラム
CA2536265C (en) * 2003-08-21 2012-11-13 Idilia Inc. System and method for processing a query
US20050171760A1 (en) * 2003-10-08 2005-08-04 Marc Tinkler Visual thesaurus
US20070088683A1 (en) * 2004-08-03 2007-04-19 Gene Feroglia Method and system for search engine enhancement
US20070214126A1 (en) * 2004-01-12 2007-09-13 Otopy, Inc. Enhanced System and Method for Search
US20050210009A1 (en) * 2004-03-18 2005-09-22 Bao Tran Systems and methods for intellectual property management
US20050210008A1 (en) * 2004-03-18 2005-09-22 Bao Tran Systems and methods for analyzing documents over a network
US20050278623A1 (en) * 2004-05-17 2005-12-15 Dehlinger Peter J Code, system, and method for generating documents
US20060036633A1 (en) * 2004-08-11 2006-02-16 Oracle International Corporation System for indexing ontology-based semantic matching operators in a relational database system
US20060047636A1 (en) * 2004-08-26 2006-03-02 Mohania Mukesh K Method and system for context-oriented association of unstructured content with the result of a structured database query
US20080077570A1 (en) * 2004-10-25 2008-03-27 Infovell, Inc. Full Text Query and Search Systems and Method of Use
US8126890B2 (en) * 2004-12-21 2012-02-28 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
WO2006072027A2 (en) * 2004-12-30 2006-07-06 Word Data Corp. System and method for retrieving information from citation-rich documents
US20060259475A1 (en) * 2005-05-10 2006-11-16 Dehlinger Peter J Database system and method for retrieving records from a record library
CA2610088A1 (en) * 2005-06-06 2006-12-14 The Regents Of The University Of California Relationship networks
WO2007037629A1 (en) 2005-09-28 2007-04-05 Jin-Keun Choi System and method for managing bundle data database storing data association structure

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020070A (zh) * 2011-09-22 2013-04-03 联想(北京)有限公司 搜索方法和电子终端
CN103020070B (zh) * 2011-09-22 2016-03-30 联想(北京)有限公司 搜索方法和电子终端

Also Published As

Publication number Publication date
US7769758B2 (en) 2010-08-03
JP4712093B2 (ja) 2011-06-29
US20100281026A1 (en) 2010-11-04
CN101278288B (zh) 2011-06-08
US7958123B2 (en) 2011-06-07
US20080208848A1 (en) 2008-08-28
KR100724122B1 (ko) 2007-06-04
JP2009510591A (ja) 2009-03-12
KR20070035915A (ko) 2007-04-02

Similar Documents

Publication Publication Date Title
CN101278288B (zh) 管理集束数据数据库存储数据联系结构的系统和方法
CN101604324B (zh) 一种基于元搜索的视频服务网站的搜索方法及系统
US6748385B1 (en) Dynamic insertion and updating of hypertext links for internet servers
US6947924B2 (en) Group based search engine generating search results ranking based on at least one nomination previously made by member of the user group where nomination system is independent from visitation system
US6647381B1 (en) Method of defining and utilizing logical domains to partition and to reorganize physical domains
US8037066B2 (en) System and method for generating tag cloud in user collaboration websites
CN101833576B (zh) 一种添加网站快捷导航菜单的方法
US20050010877A1 (en) System and method for dynamic generation of a graphical user interface
JP5147947B2 (ja) クエリ別検索コレクション生成方法およびシステム
NO326743B1 (no) Fremgangsmate for a begrense aksess til sokeresultater og sokemotor som stotter fremgangsmaten
CN101371220B (zh) 用于传送和显示分层数据的设备以及机器实现方法
EP2122490A2 (en) A method and system for integrating a social network and data repository to enable map creation
CN107291940A (zh) 页面内容管理方法、装置及相关服务器
Bar‐Ilan et al. The effects of background information and social interaction on image tagging
US20100174719A1 (en) System, method, and program product for personalization of an open network search engine
CN106547898A (zh) 一种分布式数据库的数据处理方法及装置
CN103823805B (zh) 基于社区的相关帖推荐系统及推荐方法
US20160307121A1 (en) A method of processing a user request within a search result page
US20090138438A1 (en) System and Method for Implementing Browser Milestone Navigation in a Data Processing System
JP2005056371A (ja) Web検索情報の管理方法、管理システム、コンピュータソフトウェアプログラム
US20100005385A1 (en) Systems and methods for maintaining a plurality of common interest community web sites
KR100962342B1 (ko) 홈페이지 생성, 등록 및 관리 서비스 제공 시스템 및 방법
CN106649462A (zh) 一种针对海量数据全文检索场景的实现方法
KR20090111243A (ko) 지식관리 서비스 제공방법
CN101241493A (zh) 互联网分级数据库管理排名装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110608

Termination date: 20150928

EXPY Termination of patent right or utility model