CN101884042B - 使用声誉度量来提高搜索相关度 - Google Patents

使用声誉度量来提高搜索相关度 Download PDF

Info

Publication number
CN101884042B
CN101884042B CN200880118613.8A CN200880118613A CN101884042B CN 101884042 B CN101884042 B CN 101884042B CN 200880118613 A CN200880118613 A CN 200880118613A CN 101884042 B CN101884042 B CN 101884042B
Authority
CN
China
Prior art keywords
degree
correlation
project
user
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200880118613.8A
Other languages
English (en)
Other versions
CN101884042A (zh
Inventor
尼拉科坦·萨达瑞森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
eBay Inc
Original Assignee
eBay Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by eBay Inc filed Critical eBay Inc
Publication of CN101884042A publication Critical patent/CN101884042A/zh
Application granted granted Critical
Publication of CN101884042B publication Critical patent/CN101884042B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06316Sequencing of tasks or work
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Abstract

公开了用于确定动态数据集的相关度的系统和方法。给出了用于互联网市场中的特定实施例,其中与一项目相关联的描述性因素的相关度在用户选择该项目时被增大。为了防止对相关度确定系统的滥用,各种实施例结合了滥用防止措施。在一个实施例中,用户对其自己的项目的选择不会影响相关度系统。在一个实施例中,只有用户对特定项目的第一次选择才会影响相关度系统,对该项目的任何另外选择将没有影响。在另一实施例中,由于特定用户的选择而对相关度系统做出的改变的大小与该用户的声誉得分相联系。

Description

使用声誉度量来提高搜索相关度
相关申请
本申请要求2007年11月30日提交的美国专利申请No.11/948,788(“USING REPUTATION MEASURES TO IMPROVE SEARCHRELEVANCE”)的权益,这里通过引用将该申请全部结合进来。
技术领域
本发明涉及数据检索。具体地但并非限制性地,本发明公开了用于对在计算机搜索中定位的项目的相关度(relevancy)记分的技术。
背景技术
计算机现在被用于存储大量信息。为了定位感兴趣的特定信息,已经创建出了强大且直观的搜索机制。
例如,因特网的万维网部分从二十世纪八十年代末期其首次被引入以来已经获得了指数增长。在万维网的历史的早期,网站的目录被用于引导用户到感兴趣的网站。最著名的早期网站目录之一是“Jerry′s Guide to theWorld Wide Web”,其后来被重命名为“Yahoo!”。然而,因特网的快速实时增长迅速使得万维网目录不可管理且易于过时。诸如Lycos、AltaVista和Google之类的因特网搜索引擎成为了在因特网上找到网站的新方法。因特网搜索引擎使得用户可以输入与感兴趣的主题有关的几个关键字并且返回包含用户输入的这些关键字的一大组搜索结果。
因特网搜索引擎通过在万维网上“爬行”以获知新网页并随后创建访问过的所有网页的可搜索索引来工作。当用户输入一组关键字时,搜索引擎返回包含着用户输入的关键字的一组网页。然而,搜索引擎用户输入的查询大多会映射到包含匹配关键字的数千个甚至数十万个结果。这种信息负荷不是用户希望的。从而,构建一个很好的搜索引擎的真正关键在于按某种类型的相关度度量来整理结果。这样,互联网搜索引擎的用户可以迅速找到期望的内容。
附图说明
在不一定按比例绘制的附图中,相似的数字在几幅图中始终描述基本类似的组件。具有不同字母后缀的相似数字表示基本类似的组件的不同实例。附图以示例而非限制方式概括地图示了本文献中论述的各种实施例。
图1示出了采取计算机系统的示例性形式的机器的图示,在该机器内可以执行用于使得该机器执行这里论述的方法中的任何一个或多个的一组指令。
图2示出了描述一个实施例如何响应于用户选择而修改相关度调整因子的高层流程图。
图3示出了可用于本发明的各种实施例中的一些数据库表。
图4示出了描述在图2的系统中创建的相关度调整因子如何可用于为搜索结果集中的项目调整相关度得分的高层流程图。
图5示出了图2中公开的相关度调整因子系统,其中添加了防止点击其自己项目的激进用户进行的滥用的步骤。
图6示出了图5的相关度得分调整系统,其中与每个用户相关联的声誉得分被用于进行与该声誉得分相联系的调整。
具体实施方式
以下详细描述参考了附图,附图形成了详细描述的一部分。附图根据示例性实施例示出了图示。这些实施例在这里也被称为“示例”,它们被足够详细地描述以使得本领域的技术人员能够实现本发明。对于本领域的技术人员来说将会很明显的是,实现本发明并不必需示例性实施例中的具体细节。虽然示例性实施例主要是参考互联网市场系统来公开的,但是教导也可用于其他类型的结合搜索引擎的系统。例如,社交网络网站或媒体呈现网站可结合本发明的教导。可以组合示例性实施例,可以利用其他实施例,或者可以进行结构、逻辑和电气变化,而不脱离所要求保护的范围。以下详细描述因此不应当被理解为限制性的,并且范围由所附权利要求及其等同物来限定。
在本文献中,正如专利文献中常见的,术语“一”被用于包括一个或多个。在本文献中,术语“或”用于指非排他性的或,例如“A或B”包括“有A但没有B”、“有B但没有A”以及“A和B”,除非另有指明。另外,本文献中引用的所有公布、专利和专利文献在这里通过引用被完全结合进来,就好像分别通过引用结合进来一样。在本文献和通过引用这样结合进来的那些文档之间存在不一致的用法的情况下,所结合的(一个或多个)参考文献中的用法应当被认为是本文献中的用法的补充;对于不可调和的不一致,以本文献中的用法为准。
计算机系统
图1示出了采取计算机系统100的示例性形式的机器的图示,在该机器内可以执行用于使得该机器执行这里论述的方法中的任何一个或多个的一组指令124。在替换实施例中,该机器可以作为独立的设备操作或者可以连接到(例如联网到)其他机器。在联网部署中,该机器在服务器-客户端网络环境中可以作为服务器或客户端机器,或者在对等(或分布式)网络环境中可以作为对等体机器。该机器可以是个人计算机(PC)、平板PC、机顶盒(STB)、个人数字助理(PDA)、蜂窝电话、web用具、网络服务器、网络路由器、网络交换机、网桥或者能够执行规定该机器应采取的动作的一组指令(顺序的或者其他形式的)的任何机器。另外,虽然在图1中只示出单个机器,但是术语“机器”应当也被理解为包括单独或联合执行一组(或多组)指令以执行这里论述的方法中的任何一个或多个的机器的任何集合。
图1所示的示例性计算机系统100包括处理器102(例如,中央处理单元(CPU)、图形处理单元(GPU)或两者)、主存储器104、静态存储器106,它们可经由总线108相互通信。计算机系统100还可包括视频显示适配器110,其驱动诸如液晶显示器(LCD)或阴极射线管(CRT)之类的视频显示系统115。示例性计算机系统100还包括字母数字输入设备112(例如,键盘)、光标控制设备114(例如,鼠标或轨迹球)、盘驱动单元116、信号生成设备118(例如,扬声器)以及网络接口设备120。注意,计算机系统的各种实施例不会始终包括所有这些外围设备。
盘驱动单元116包括机器可读介质122,其上存储着体现这里描述的方法或功能中的任何一个或多个或者被其所利用的一组或多组计算机指令和数据结构(例如,也称为“软件”的指令124)。指令124在其被计算机系统100执行期间可以完全或至少部分地驻留在主存储器104内和/或处理器102内,主存储器104和处理器102也构成机器可读介质。
用于操作计算机系统100的指令124可以利用若干种公知的传输协议(例如,文件传输协议(FTP))中的任何一种经由网络接口设备120通过网络126被发送或接收。
虽然机器可读介质122在示例性实施例中被示为单个介质,但是术语“机器可读介质”应当被理解为包括存储一组或多组指令的单个介质或多个介质(例如,集中式或分布式数据库,和/或相关联的缓存和服务器)。术语“机器可读介质”还应被理解为包括能够存储、编码或携带一组指令以供机器执行并且使得机器执行这里描述的方法中的任何一种或多种的任何介质,或者能够存储、编码或携带被这样一组指令利用或者与这样一组指令相关联的数据结构的任何介质。术语“机器可读介质”因此应当被理解为包括但不限于固态存储器、光介质、闪存、磁介质和载波信号。
对于本说明而言,术语“模块”包括用于实现特定功能、操作、处理或过程的计算机代码、计算或可执行指令、数据或计算对象的可识别部分。模块不是必须用软件来实现;模块可以用软件、硬件/电路或软件和硬件的组合来实现。
搜索引擎
搜索引擎是被设计为使计算机用户可以搜索特定信息域的计算机程序。搜索引擎通常使得计算机用户可以输入一组搜索关键字,随后搜索引擎生成来自搜索域的包含用户指定的关键字的一组搜索结果。
搜索引擎的非常流行的形式是在全球因特网上可获得的万维网搜索引擎。万维网搜索引擎使得web用户可以输入一组搜索关键字,然后万维网搜索引擎返回包含用户指定的搜索关键字的搜索结果集,万维网页面。
万维网搜索引擎通常是通过以下方式来操作的:令获知新网页的自动化程序(通常称为“web爬虫”)访问万维网页以不断地获知在万维网上可得的内容。由自动化web爬虫程序获得的信息被用于创建该自动化web爬虫程序曾访问过的所有网页的可搜索索引。该可搜索索引被因特网搜索引擎用于为来自因特网用户的搜索请求生成搜索结果。
为搜索引擎确定相关度
当用户向搜索引擎中输入一组关键字时,搜索引擎返回包含用户输入的关键字的一组结果。对于因特网用户输入到因特网搜索引擎中的大多数查询,所输入的关键字通常会匹配数千甚至数十万个网站。只是简单地返回具有数十万个网站的这样一大组结果的搜索引擎就不是非常有用。
过量信息不是只不过希望定位出具有关于被输入到搜索引擎中的关键字的信息的良好网站的互联网用户所希望的。因特网用户更宁愿获得与因特网用户真正感兴趣的东西高度相关的良好搜索结果。从而,构建良好的搜索引擎的真正关键在于按某种类型的相关度度量对搜索结果记分,并且在搜索结果列表的顶部呈现被认为最相关的结果。从而,相关度系统的目标是推断出请求因特网搜索的因特网用户的真实意图,以便识别出最佳地满足用户意图的结果。
许多因特网搜索引擎已经实现了各种版本的这种相关度记分系统,以便改善由这些因特网搜索引擎提供的搜索结果的质量。在一种用于万维网站的公知的相关度确定系统中,每个网站被赋予一相关度得分,该相关度得分取决于指向该网站的外部超链接的数目。从而,指向特定网站的其他网站越多,就认为该特定网站越相关。实际上,去到一网站的每个超链接充当在相关度记分系统中对该网站的流行度“投票”。收到最多的这种投票的匹配网站将被放置在搜索结果的顶部或顶部附近。
这种相关度系统的一个缺点在于一旦用于计算相关度得分的系统被广泛知晓,该相关度系统就成为了希望人为地提升其网站的能见度的人的滥用对象。例如,如果特定的商业网站希望为其网站生成大量流量,则该网站可以创建链接到主商业网站的许多外部网站。这样,就可以欺骗因特网搜索引擎的相关度记分系统将该商业站点排名得较高,虽然是同一个实体创建了去到该主网站的所有这多个链接。
动态数据集的相关度
如前一部分中所述,用于确定一数据集中的项目的相关度的一种可能的方法是使用关于该数据集内的项目的相对流行度的某种已知指标。在搜索因特网网站的上下文内,特定网站的相对流行度可以从有多少其他网站链接到该特定网站来推断出。从而,去到特定网站的链接的数目可用作因特网搜索引擎内的相关度得分的一部分。
然而,在域中项目随时都在变化的非常动态的数据域中,对流行度的这种相对静态的指示对于确定相关度并不很有用。例如,在不断呈现可供销售的新项目的在线市场中,搜索域中的项目(当前可供销售的项目)的集合随着项目被销售和新项目被许诺销售而不断变化。从而,可供销售的项目代表“动态数据域”。去到与供销售的项目相关联的网页的任何链接是相对无用的,因为在向与供销售的项目相关联的网页做出许多链接之前,项目通常已经被售出了。从而,需要其他方法来为动态数据域创建相关度得分。
由于动态数据域中的项目不断变化着,所以直接连接到动态域中的特定项目的任何信息(例如去到当前在数据域中的项目的网页的链接)对于一般确定相关度是没有用的,因为该特定项目可能很快就不见了。取而代之,描述数据域中的特定流行项目(并从而可用于描述其他类似项目)的因素对于相关度是有用的。
另外,由于目标是确定搜索动态数据域的用户的意图,所以相关度的任何度量在理想情况下都将与该用户做出的实际搜索请求相联系。为了达成这些目标,已经设计了一种系统,其基于在已响应于用户的搜索请求而向用户呈现了一组搜索结果项目之后做出的用户项目选择来生成相关度排名。
在所公开的动态数据域相关度系统中,系统利用满足用户的搜索请求的要求的一组项目来对用户搜索请求做出响应。这些项目随后通常会以附加信息有限的列表形式来显示。用户随后可选择在搜索结果中呈现的任何项目,以获得关于该所选项目的更多信息。用户对搜索结果中的项目的这种选择充当了在用户的原始搜索的上下文内对该特定项目的流行度投票。注意,为了对将来的相关度确定有用,必须从用户的选择中抽象出所选项目的一些描述性因素,以便将该描述性因素用于将来的相关度确定。这样,当必须对同一搜索请求执行相关度确定,但该所选项目已不存在时,利用从所选项目抽象出的描述性因素,可在识别出动态数据域中具有高相关度的类似项目。
在一个实施例中,将来可用于识别类似相关项目的描述性因素是项目的描述性字段中的附加字词,这些附加字词不是用户的原始搜索查询关键字的一部分。从而,如果用户输入特定的搜索查询,并随后选择了均包含具有不在原始搜索查询中的特定字词的描述字段的一组项目,则具有该特定字词将提升项目针对该特定搜索查询的相关度。类似地,如果查询结果中的一组项目都共享特定的字词,但是这些项目都没有被用户选择,则具有该特定字词可减小项目针对该搜索查询的相关度得分。注意,也可使用其他因素,并且这只是可用于在将来识别类似项目的描述性因素的一个示例。
例如,希望购买便携式数字音乐播放器的用户可以在在线市场的搜索引擎中输入搜索查询“ipod nano”。响应于对在线市场的“ipod nano”搜索查询,系统可以呈现具有在左列列出的描述字段的项目。中间列包含在去除原始搜索查询(“ipod nano”)和常见虚字(and、or、in、the、for等等)之后来自描述字段的各种字词。
表1:“ipod nano”搜索查询的可能搜索查询结果
有兴趣购买新的iPod Nano设备的用户可能点击“sealed 4Gb IpodNano”、“iPod Nano sealed”、以及“New ipod Nano 8GB black”以及“new 4GB white ipod nano”的条目。从而,在将来对“ipod nano”的搜索中,包括曾被用户选择的额外词语的项目应当收到增大的相关度得分。执行这个的一种方法是向每个可能的额外字词赋予一相关度调整因子。与额外字词相关联的该相关度调整因子将调整具有带该额外字词的描述的项目的相关度得分。当用户选择一项目时,与该所选项目相关联的额外字词的相关度调整因子将被增大。从而,与所选的四个项目相关联的额外词语(sealed、4Gb、sealed、new、8GB、black、new、4GB)的相关度调整因子应当被增大。注意,额外字词可能被列出不止一次,因为这些词语存在于用户选择的不止一个项目中。
自然,来自未被选择的项目描述的额外字词的相关度调整得分将被减小。在一个实施例中,这种词语必须没有在任何被选择的项目中,并且必须出现在不止一个未选择项目中。在这种实施例中,词语“transmitter”和“leather”的调整相关度得分可被减小。
确定相关度调整因子
图2示出了描述一个可能的实施例可如何修改描述中的额外字词的相关度调整因子的高层流程图。额外字词的初始相关度调整因子可被设定为中性值,例如一(“1”)。图3示出了可用于本发明的各种实施例中的一些数据库表。
参考图2的顶部,系统首先在阶段210接收搜索查询。接下来,在阶段220,系统创建满足来自阶段210的用户的搜索查询的要求的一组搜索结果。注意,如下所述,可以按相关度来整理该组搜索结果。
在阶段230,系统向用户显示一部分结果。在互联网市场实施例中,结果可包括可供销售的一组项目。在阶段240,查看搜索结果的另一部分,用户可以选择要更详细查看的项目,或者离开这组结果。如果用户决定查看搜索结果的另一部分,则系统选择搜索结果的另一部分来显示,并返回到阶段230以显示这些结果。
如果用户决定更详细查看来自这些搜索结果的一项目,则系统前进到阶段250。由于用户选择了该项目,所以该项目被认为与输入了在阶段210输入的特定搜索查询的人相关。从而,系统将针对此特定搜索查询增大与这个被选择的项目有关的描述性因素的相关度调整因子。
如前所述,一个实施例使用项目的描述性字段中不是搜索查询的一部分的附加字词来作为可用于将来识别类似项目的描述性因素。从而,在阶段250,系统从描述字段中识别不是搜索查询的一部分的字词(如果有的话),并且将这些附加的描述性字词添加到与流行搜索查询的表310中的一搜索查询条目相关联的数据库表320,如果这些附加字词尚未在附加描述性字词数据库表320中的话。
接下来,在阶段355,系统为在先前阶段中识别的附加描述性字词增大相关度调整因子。相关度调整因子可被保存在与附加描述性字词相同的数据库表320中。注意,每个字词的相关度调整因子是针对每个搜索查询进行的,因为描述性字词的相关度将依据项目而有很大变化。例如,“Persian”一词对于地毯可能是非常相关的,而对于iPod则是完全不相关的。
在修改所选项目的附加字词的相关度调整因子之后,系统在阶段260更详细地向用户显示所选项目。另外的处理将取决于阶段270中的用户输入。如果用户请求看下一个或前一个项目,则系统将获得与该项目相关联的信息,并返回到步骤250以处理该项目的适当相关度调整因子修改和显示。如果用户决定返回到搜索结果的列表视图,则系统返回到阶段230,以在列表视图中显示搜索结果。
如果用户在阶段270决定离开此特定搜索查询(或者在更早的阶段240离开此搜索查询),则系统可以判定是否应当进行任何相关度调整因子减小。在阶段280,系统首先判定是否查看了至少一个项目。如果没有查看项目,则可以不进行相关度调整因子变化,因为没有关于用户是否真的对所显示的项目感兴趣或不感兴趣的足够信息。如果查看了至少一个项目,则系统可以前进到步骤290,以可能减小与未被选择的项目相关联的一个或多个相关度调整因子。系统将识别存在于未被选择的项目中的共同附加描述性字词。在一个实施例中,系统要求一描述性字词不在任何所选项目中并且在被呈现给用户但未被用户选择的至少两个项目中,才能减小该描述性字词的相关度调整因子。通过此测试的描述性字词的相关度调整因子可被减小。注意,不是所有的相关度系统实施例都将实现参考阶段680和690公开的相关度调整因子减小系统。
使用相关度调整因子
图4示出了描述一个可能的实施例可如何使用在图2的系统中创建的相关度调整因子来为搜索结果集中的项目调整相关度得分的高层流程图。注意,图4所示的系统可用于图2的系统的阶段220内。
首先,在步骤410接收搜索查询。然后,在阶段420,系统随后搜索项目数据库以生成满足在阶段410输入的搜索查询的要求的初始一组结果。
在获得初始搜索结果之后,必须按相关度来整理搜索结果。为了实现此目标,系统在阶段430检索初始结果中的项目的附加描述性字词的相关度调整因子。
接下来,在阶段440,相关度调整因子被应用到赋予初始搜索结果中的每个项目的相关度调整得分。在一个实施例中,相关度调整因子可以被与赋予给一组搜索查询结果中的项目的初始相关度得分相乘以调整该项目的相关度得分。表2列出了这样一个实施例的一组可能的相关度调整因子,其中列出了与“ipod nano”搜索查询相关联的一些额外字词。这些额外字词的相关度调整因子可被正规化以保持在预定范围内。例如,该组相关度调整因子已被正规化以保持在0至2的范围内。
表2:“ipod nano”搜索查询相关度调整因子
为了应用表2中给出的相关度调整因子,如果一项目在其描述中具有相关联的额外字词,则相关度调整因子被乘以赋予给该项目的初始相关度得分。从而,参考表2,“ipod nano”搜索查询的结果集中的具有诸如“sealed”、“8GB”和“new”之类的高度相关的附加描述性字词的项目的相关度得分将增大。类似地,“ipod nano”搜索查询的结果集中的具有诸如“leather”、“transmitter”或“case”之类的很大程度上不相关的附加描述性字词的项目的相关度得分将减小。可以使用利用相关度调整因子来修改初始相关度得分的许多其他方法。
在替换实施例中,相关度调整因子可以被加到一项目的初始相关度得分以调整该项目的相关度得分。表3列出了这样一个实施例的一组可能的相关度调整因子,其中列出了与“ipod nano”搜索查询相关联的一些额外字词。这些额外字词的相关度调整因子可被正规化以保持在例如-100至100限定范围内。
表3:“ipod nano”搜索查询相关度调整因子
注意在表3中,非常合乎期望的词语(“sealed”、“8GB”和“new”)具有大的正相关度调整因子。类似地,不合期望的词语(“transmitter”、“leather”和“case”)具有大的负得分。其余的中性词语对于相关度得分将具有相对较小的影响。
在调整初始的一组相关度得分之后,随后在阶段450随后根据经调整的相关度得分来对项目排序。经相关度整理的一组项目随后被呈现给用户。由于是在与来自利用同一查询的先前搜索的先前所选项目类似的项目被放置在顶部的情况下整理结果集的,因此用户将迅速能够很快找到期望的项目。
防止对动态数据集的相关度系统的滥用
如对依赖于去到网站的超链接作为该网站的流行度的度量的因特网搜索引擎的论述中所述,这种因特网搜索引擎可能被创建链接到特定网站的数千个无关网站的人所滥用。去到特定网站的这众多链接将创建该特定网站很流行的虚假表象。在先前小节中公开的动态数据集相关度系统上也可尝试类似的滥用方法。
例如,互联网市场上的非常激进的卖家可以创建自动化程序,这些程序反复选择这种激进卖家在互联网市场上发布来供销售的项目。这样,这种激进卖家可能尝试使得其发布到互联网市场上的项目看起来流行,以使得这些项目将接收到增大的相关度得分。
为了防止这种滥用,可以对相关度记分系统施加一组各种不同的限制,以阻止用户滥用相关度记分系统。可实现为防止这种滥用的第一个限制可涉及正是防止前一段中描述的那种场景。图5示出了图2中公开的相关度调整因子系统,但添加了防止点击其自己发布来供销售的项目的激进卖家进行的滥用的步骤。
参考图5,在用户选择一项目来更详细观看后面添加了阶段545。在阶段545,系统判定该所选项目是否是此特定用户所发布的项目或者此用户是否已经查看过此特定项目。如果任一情况为真,则系统跳过相关度调整因子修改阶段550和555,而改为直接去往阶段560,其中系统向用户显示该项目。这样,系统防止了用户反复选择其自己的项目。另外,阶段545防止了用户创建第二账户,然后从该第二账户反复选择其自己的项目。
利用用户声誉得分来防止对相关度系统的滥用
在互联网市场系统中,参与互联网市场的买家和卖家拥有声誉得分,以使得人们拥有关于是否应信任潜在交易的另一方的某种度量,这是很常见的。这些声誉得分一般是通过让用户在互联网市场上的交易完成(或者以其他方式结束)之后提供关于交易另一方的反馈来创建的。在所公开的系统的一个实施例中,这种用户声誉得分被结合到了相关度系统中。将用户声誉得分结合到相关度系统中改善了相关度系统的结果并且减小了滥用相关度系统的可能性。
图6示出了用于动态数据集的相关度得分调整系统,其中与每个用户相关联的声誉得分被结合到相关度系统中。图6的系统与图5的系统相同,只不过在对相关度调整因子做出改变时考虑了用户的声誉。具体而言,阶段655被改变,以表明系统将相关度调整因子增大一与用户的声誉得分相联系的量。类似地,阶段690被改变,以表明用户将相关度调整因子减小一与用户的声誉得分相联系的量。
将用户声誉得分结合到相关度系统中向相关度系统提供了若干重大优点。一个优点在于对相关度调整因子做出的改变可以以与用户的技能相联系的方式来做出。有经验的用户将具有更高的声誉得分,从而该有经验的用户进行的选择对相关度系统的改变将大于新手用户。
另一优点在于,将用户声誉得分结合到相关度系统中可用于防止对相关度系统的滥用。具体而言,激进的卖家可尝试阻挠在阶段645中阐述的只允许特定用户选择一项目一次的限制,以通过创建大量新账户并且从这些新账户中的每一个选择用户的项目来调整该项目。通过将新账户的声誉得分设定为零或另外的低值,这种新账户进行的选择对于相关度系统将没有影响或者只有极小的影响。从而,创建大量新账户无法被用于滥用相关度系统。
在一个实施例中,用户对于在互联网市场上可得的不同类别的产品可能具有不同的声誉得分。从而,一个人在购买和销售电子设备方面的声誉可能较高,而在购买和销售家庭用品方面的则可能只有很新手的声誉。在这种实施例中,系统将会识别所搜索的产品的类别,并且在对相关度调整因子做出改变时使用在该类别中用户的声誉。这样,系统考虑了一个人的特定技能集,使得其在其高声誉的类别中的选择将对相关度系统具有重大影响,而其在其他领域中的选择则不会对相关度系统有重大影响。注意,这将要求用户参与大量成功交易,然后用户的选择才能对相关度具有重大影响。这帮助了防止一个人尝试创建许多账户,每个账户参与一个交易,然后使用这许多账户来滥用相关度系统。
与其他相关度系统集成
已经公开的用于动态数据集的相关度系统可与基于其他因素的其他相关度系统相集成。例如,一种替换系统在确定相关度时可使用卖家的声誉,使得具有更高声誉的卖家比具有低声誉的卖家接收到更高的相关度得分。在这种系统中,在搜索结果的顶部,将向买家呈现更可靠的卖家。所给出的用于动态数据集的相关度系统可与这种系统(或多个其他相关度系统)相组合,以使得组合的相关度得分被用于呈现搜索结果。
虽然已经参考互联网市场实施例公开了相关度系统,但是必须强调,相关度系统可用于许多其他实施例中。在其他实施例中,可以用用户在一系统中的经验的另一类似度量来替换用户声誉得分。例如,在消息发布板的实施例中,可以用该用户发贴的数目来替换用户声誉得分。另外,已经利用在项目的描述字段中的其他字词的描述性因素来描述了本发明,但是也可使用将来可用于识别类似项目的任何其他描述性因素。
本说明书意欲为例示性的而非限制性的。例如,上述实施例(或其一个或多个方面)可以相互组合使用。本领域的技术人员在阅读本说明书之后将明显看出其他实施例。因此,应当参考所附权利要求以及与这种权利要求被授权的范围相等同的完整范围来确定权利要求的范围。在所附权利要求中,术语“including”(包括)和“in which”(其中)用作相应术语“comprising”(包括)和“wherein”(其中)的普通英语等同。另外,在以下权利要求中,术语“including”和“comprising”是开端的,即,包括除了权利要求中的这种术语之后列出的元素以外的元素的系统、设备、物品或过程仍被视为落在该权利要求的范围内。另外,在以下权利要求中,术语“第一”、“第二”和“第三”等等只是用作标签,而并不意欲对其对象施加数值要求。
摘要是遵循37 C.F.R.§1.72(b)提供的,37 C.F.R.§1.72(b)要求其使读者可以迅速地确定技术公开的性质。它是在具有以下理解的情况下提交的:它不会被用于解释或限制权利要求的范围或含义。另外,在以上“具体实施方式”部分中,各种特征被归组在一起以使公开流畅。这不应被解释为希望未要求保护的所公开特征对于任何权利要求是必要的。更确切地说,创造性主题可存在于所公开的特定实施例的非全部特征中。从而,特此将以下权利要求结合到“具体实施方式”部分中,其中每个权利要求独立作为一单独的实施例。

Claims (10)

1.一种从搜索查询结果推断相关度的计算机实现的方法,所述方法包括:
接受来自搜索引擎的用户的搜索查询;
响应于来自所述用户的所述搜索查询生成一组搜索结果项目;
接受所述用户对来自所述一组搜索结果项目中的项目的选择;以及
将与所选项目相关联的描述性因素的相关度调整因子修改与所述用户的声誉得分相联系的一个量,所述修改是增大或减小,所述描述性因素是从所选项目抽象出并且未包含在所述搜索查询中的字词,标识所选项目和类似项目,
其中,响应于来自所述用户的所述搜索查询生成所述一组搜索结果项目包括利用基于所述相关度调整因子调整的相关度得分来对所述搜索结果项目排名,
所述相关度调整因子被与赋予给一组搜索查询结果中的项目的初始相关度得分相乘以调整该项目的相关度得分。
2.如权利要求1所述的从搜索查询结果推断相关度的计算机实现的方法,其中,所述用户的所述声誉得分是基于由与所述用户进行交易的一方给出的评定的。
3.如权利要求1所述的从搜索查询结果推断相关度的计算机实现的方法,其中,所述描述性因素包括来自所选项目的描述字段的、未包含在所述搜索查询中的字词。
4.如权利要求1所述的从搜索查询结果推断相关度的计算机实现的方法,其中,对所述描述性因素的所述相关度调整因子的所述修改在所述用户发布了所选项目时不被执行。
5.如权利要求1所述的从搜索查询结果推断相关度的计算机实现的方法,其中,所述描述性因素的所述相关度调整因子仅对所述搜索查询有效。
6.如权利要求1所述的从搜索查询结果推断相关度的计算机实现的方法,所述方法还包括:
将与所述一组搜索结果中未被所述用户选择的项目相关联的第二描述性因素的相关度调整因子修改与所述用户的所述声誉得分相联系的一个量。
7.如权利要求6所述的从搜索查询结果推断相关度的计算机实现的方法,其中,所述第二描述性因素在不止一个项目中并且不在被所述用户选择的所述项目中。
8.如权利要求1所述的从搜索查询结果推断相关度的计算机实现的方法,其中,所述相关度调整因子被用于调整所述一组搜索结果项目中的每个搜索结果项目的相关度得分。
9.如权利要求1所述的从搜索查询结果推断相关度的计算机实现的方法,其中,所述搜索结果项目包括在在线市场中供销售的项目。
10.一种从搜索查询结果推断相关度的计算机实现的设备,所述设备包括:
用于接受来自搜索引擎的用户的搜索查询的装置;
用于响应于来自所述用户的所述搜索查询生成一组搜索结果项目的装置;
用于接受所述用户对来自所述一组搜索结果项目中的项目的选择的装置;以及
用于将与所选项目相关联的描述性因素的相关度调整因子修改与所述用户的声誉得分相联系的一个量的装置,所述修改是增大或减小,所述描述性因素是从所选项目抽象出并且未包含在所述搜索查询中的字词,标识所选项目和类似项目,
其中,用于响应于来自所述用户的所述搜索查询生成所述一组搜索结果项目的装置包括用于利用基于所述相关度调整因子调整的相关度得分来对所述搜索结果项目排名的装置,
所述相关度调整因子被与赋予给一组搜索查询结果中的项目的初始相关度得分相乘以调整该项目的相关度得分。
CN200880118613.8A 2007-11-30 2008-11-25 使用声誉度量来提高搜索相关度 Active CN101884042B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/948,788 2007-11-30
US11/948,788 US8583633B2 (en) 2007-11-30 2007-11-30 Using reputation measures to improve search relevance
PCT/US2008/013118 WO2009070287A1 (en) 2007-11-30 2008-11-25 Using reputation measures to improve search relevance

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201410274098.XA Division CN104111974A (zh) 2007-11-30 2008-11-25 使用声誉度量来提高搜索相关度

Publications (2)

Publication Number Publication Date
CN101884042A CN101884042A (zh) 2010-11-10
CN101884042B true CN101884042B (zh) 2014-07-16

Family

ID=40676786

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201410274098.XA Pending CN104111974A (zh) 2007-11-30 2008-11-25 使用声誉度量来提高搜索相关度
CN200880118613.8A Active CN101884042B (zh) 2007-11-30 2008-11-25 使用声誉度量来提高搜索相关度

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201410274098.XA Pending CN104111974A (zh) 2007-11-30 2008-11-25 使用声誉度量来提高搜索相关度

Country Status (8)

Country Link
US (3) US8583633B2 (zh)
EP (1) EP2225671A4 (zh)
JP (1) JP5141994B2 (zh)
KR (1) KR101215791B1 (zh)
CN (2) CN104111974A (zh)
AU (1) AU2008330082B2 (zh)
CA (2) CA2856645C (zh)
WO (1) WO2009070287A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9063986B2 (en) 2007-11-30 2015-06-23 Ebay Inc. Using reputation measures to improve search relevance

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4725627B2 (ja) * 2008-10-02 2011-07-13 ブラザー工業株式会社 通信装置
US9336310B2 (en) 2009-07-06 2016-05-10 Google Inc. Monitoring of negative feedback systems
US8627476B1 (en) * 2010-07-05 2014-01-07 Symantec Corporation Altering application behavior based on content provider reputation
CN102456057B (zh) * 2010-11-01 2016-08-17 阿里巴巴集团控股有限公司 基于网上交易平台的检索方法、装置和服务器
US20120210240A1 (en) * 2011-02-10 2012-08-16 Microsoft Corporation User interfaces for personalized recommendations
US9870424B2 (en) * 2011-02-10 2018-01-16 Microsoft Technology Licensing, Llc Social network based contextual ranking
US8819000B1 (en) * 2011-05-03 2014-08-26 Google Inc. Query modification
US8825644B1 (en) 2011-10-14 2014-09-02 Google Inc. Adjusting a ranking of search results
US8887238B2 (en) * 2011-12-07 2014-11-11 Time Warner Cable Enterprises Llc Mechanism for establishing reputation in a network environment
US8606777B1 (en) * 2012-05-15 2013-12-10 International Business Machines Corporation Re-ranking a search result in view of social reputation
US9152714B1 (en) 2012-10-01 2015-10-06 Google Inc. Selecting score improvements
CN103793388B (zh) * 2012-10-29 2017-08-25 阿里巴巴集团控股有限公司 搜索结果的排序方法和装置
US9298785B2 (en) 2013-07-19 2016-03-29 Paypal, Inc. Methods, systems, and apparatus for generating search results
US9866526B2 (en) 2013-10-10 2018-01-09 Go Daddy Operating Company, LLC Presentation of candidate domain name stacks in a user interface
US10140644B1 (en) * 2013-10-10 2018-11-27 Go Daddy Operating Company, LLC System and method for grouping candidate domain names for display
CN103914553A (zh) * 2014-04-14 2014-07-09 百度在线网络技术(北京)有限公司 搜索方法和搜索引擎
CN104899322B (zh) * 2015-06-18 2021-09-17 百度在线网络技术(北京)有限公司 搜索引擎及其实现方法
US10198512B2 (en) * 2015-06-29 2019-02-05 Microsoft Technology Licensing, Llc Search relevance using past searchers' reputation
US10872124B2 (en) * 2018-06-27 2020-12-22 Sap Se Search engine

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1849603A (zh) * 2003-07-28 2006-10-18 Google公司 提供具有搜索查询拓宽的用户接口

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5855015A (en) * 1995-03-20 1998-12-29 Interval Research Corporation System and method for retrieval of hyperlinked information resources
JP3470782B2 (ja) 1996-01-09 2003-11-25 沖電気工業株式会社 情報検索装置
US6493702B1 (en) * 1999-05-05 2002-12-10 Xerox Corporation System and method for searching and recommending documents in a collection using share bookmarks
US7080064B2 (en) * 2000-01-20 2006-07-18 International Business Machines Corporation System and method for integrating on-line user ratings of businesses with search engines
US20020103798A1 (en) * 2001-02-01 2002-08-01 Abrol Mani S. Adaptive document ranking method based on user behavior
US7698276B2 (en) * 2002-06-26 2010-04-13 Microsoft Corporation Framework for providing a subscription based notification system
US20040015416A1 (en) * 2002-07-22 2004-01-22 Benjamin David Foster Seller configurable merchandising in an electronic marketplace
US6829599B2 (en) * 2002-10-02 2004-12-07 Xerox Corporation System and method for improving answer relevance in meta-search engines
GB0227613D0 (en) * 2002-11-27 2002-12-31 Hewlett Packard Co Collecting browsing effectiveness data via refined transport buttons
US7822631B1 (en) * 2003-08-22 2010-10-26 Amazon Technologies, Inc. Assessing content based on assessed trust in users
US20050222987A1 (en) * 2004-04-02 2005-10-06 Vadon Eric R Automated detection of associations between search criteria and item categories based on collective analysis of user activity data
WO2006014454A1 (en) * 2004-07-06 2006-02-09 Icosystem Corporation Methods and apparatus for query refinement using genetic algorithms
US8010460B2 (en) * 2004-09-02 2011-08-30 Linkedin Corporation Method and system for reputation evaluation of online users in a social networking scheme
WO2007002820A2 (en) * 2005-06-28 2007-01-04 Yahoo! Inc. Search engine with augmented relevance ranking by community participation
KR100776697B1 (ko) 2006-01-05 2007-11-16 주식회사 인터파크지마켓 고객 구매행동 분석에 기반한 지능화된 상품 검색 방법 및 시스템
US20070168344A1 (en) * 2006-01-19 2007-07-19 Brinson Robert M Jr Data product search using related concepts
US9443333B2 (en) * 2006-02-09 2016-09-13 Ebay Inc. Methods and systems to communicate information
US7844603B2 (en) * 2006-02-17 2010-11-30 Google Inc. Sharing user distributed search results
US7603350B1 (en) * 2006-05-09 2009-10-13 Google Inc. Search result ranking based on trust
EP1855245A1 (en) * 2006-05-11 2007-11-14 Deutsche Telekom AG A method and a system for detecting a dishonest user in an online rating system
US20070266025A1 (en) * 2006-05-12 2007-11-15 Microsoft Corporation Implicit tokenized result ranking
US20070288602A1 (en) * 2006-06-09 2007-12-13 Ebay Inc. Interest-based communities
JP5122795B2 (ja) * 2006-11-28 2013-01-16 株式会社エヌ・ティ・ティ・ドコモ 検索システムおよび検索方法
US20080288481A1 (en) * 2007-05-15 2008-11-20 Microsoft Corporation Ranking online advertisement using product and seller reputation
US8548996B2 (en) * 2007-06-29 2013-10-01 Pulsepoint, Inc. Ranking content items related to an event
US8583633B2 (en) 2007-11-30 2013-11-12 Ebay Inc. Using reputation measures to improve search relevance
US20100010987A1 (en) * 2008-07-01 2010-01-14 Barry Smyth Searching system having a server which automatically generates search data sets for shared searching
WO2011117737A1 (en) * 2010-03-22 2011-09-29 Heystaks Technologies Limited Systems and methods for user interactive social metasearching

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1849603A (zh) * 2003-07-28 2006-10-18 Google公司 提供具有搜索查询拓宽的用户接口

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9063986B2 (en) 2007-11-30 2015-06-23 Ebay Inc. Using reputation measures to improve search relevance

Also Published As

Publication number Publication date
US20140067785A1 (en) 2014-03-06
CA2856645A1 (en) 2009-06-04
WO2009070287A1 (en) 2009-06-04
EP2225671A1 (en) 2010-09-08
US20150261763A1 (en) 2015-09-17
EP2225671A4 (en) 2011-05-11
US20090144259A1 (en) 2009-06-04
CA2856645C (en) 2017-01-17
US9063986B2 (en) 2015-06-23
CN104111974A (zh) 2014-10-22
JP5141994B2 (ja) 2013-02-13
AU2008330082A1 (en) 2009-06-04
CA2706773C (en) 2014-07-15
AU2008330082B2 (en) 2011-12-22
KR101215791B1 (ko) 2012-12-26
CN101884042A (zh) 2010-11-10
CA2706773A1 (en) 2009-06-04
JP2011505628A (ja) 2011-02-24
KR20100101621A (ko) 2010-09-17
US8583633B2 (en) 2013-11-12

Similar Documents

Publication Publication Date Title
CN101884042B (zh) 使用声誉度量来提高搜索相关度
AU2006262446B2 (en) System to generate related search queries
US10409821B2 (en) Search result ranking using machine learning
CN102207971B (zh) 用于提供搜索结果的系统和方法
US10275534B2 (en) Landing page search results
US20080275863A1 (en) Selecting advertisements based upon search results
US9330071B1 (en) Tag merging
US11561975B2 (en) Dynamic topic adaptation for machine translation using user session context
US9323832B2 (en) Determining desirability value using sale format of item listing
CN108536786A (zh) 一种信息推荐方法、装置、服务器及存储介质
EP3912059A1 (en) System that customizes a re-ranker based upon end user input
US11341141B2 (en) Search system using multiple search streams
JP6433270B2 (ja) コンテンツ検索結果提供システム及びコンテンツ検索結果提供方法
Louis Value production in search: A proposed model of value creation by Google Search as a digital merchant

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20151022

Address after: American California

Patentee after: EBAY INC

Address before: American California

Patentee before: Electonic Bay