CN101454780B - 基于监视用户行为生成网站简档的方法 - Google Patents

基于监视用户行为生成网站简档的方法 Download PDF

Info

Publication number
CN101454780B
CN101454780B CN2007800197484A CN200780019748A CN101454780B CN 101454780 B CN101454780 B CN 101454780B CN 2007800197484 A CN2007800197484 A CN 2007800197484A CN 200780019748 A CN200780019748 A CN 200780019748A CN 101454780 B CN101454780 B CN 101454780B
Authority
CN
China
Prior art keywords
website
search
user
profile
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007800197484A
Other languages
English (en)
Other versions
CN101454780A (zh
Inventor
比尔盖汗·乌伊加尔·厄兹泰金
亚当·J·克莱因
塔赫·H·哈夫利瓦拉
格伦·耶赫
塞潘达·D·卡姆瓦尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN101454780A publication Critical patent/CN101454780A/zh
Application granted granted Critical
Publication of CN101454780B publication Critical patent/CN101454780B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

在对网站建档的方法中,信息服务器从网站接收不同用户提交的多个搜索查询。响应于搜索查询向请求用户提供不同的搜索结果。信息服务器监视在搜索结果上的用户行为并且使用搜索查询和用户行为为网站生成简档。当信息服务器从两个不同的网站接收了相同的搜索查询时,其识别与搜索查询相关联的多个信息项。信息服务器使用两个网站的简档来将信息项定制为两种不同的次序并且以该两种不同的次序将信息项派发到两个网站。

Description

基于监视用户行为生成网站简档的方法
技术领域
本发明总体上涉及在计算机网络系统中的搜索引擎的领域,特别涉及为网站生成简档并且响应于从网站提交的搜索查询使用该简档来定制搜索结果的排名的系统和方法。
背景技术
搜索引擎是从因特网(或内联网)定位和检索文档的强大工具。许多网站在其网页上包括至少一个搜索框。在特定网页上的搜索框典型地使用户能够提交搜索查询以在与该网页相关联的网站上搜索文档、或在因特网上搜索文档。然而,大部分网站不具有用于处理这些搜索查询的专属、专用的搜索引擎系统。如果搜索框使得能够对整个因特网搜索相关文档,则尤为如此。相反地,搜索查询被重定向到第三方搜索引擎(例如,www.google.com)并且由其处理。第三方搜索引擎响应于搜索查询(例如,通过搜索文档的数据库)生成搜索结果,并且向请求用户返回搜索结果。
惯例地,第三方搜索引擎产生的搜索结果独立于提交搜索查询的网站。例如,无论搜索查询是来自苹果计算机用户常访问的在线零售电子商店的网站还是来自杂货店托管的在线购物网站,搜索引擎对于搜索查询“苹果”都生成相同的搜索结果。明显地,到这两个网站的访问者具有不同的兴趣并且应当接收不同的搜索结果。结果,对于搜索查询“苹果”返回的搜索结果可能包括对到这些各个网站的访问者来说没有多大兴趣的结果。
对于包括与不同的网页相关联的多个搜索框的网站,可能出现类似的问题。例如,体育新闻网站可以具有涵盖国内新闻的一个网页以及专用于国际新闻的另一个网页。在国内新闻网页上的搜索框内输入词语“足球”的用户可能对与美式足球相关的新闻感兴趣,而在国际新闻网页上的搜索框内输入同一词语“足球”的用户可能对关于英式足球(在美国以外其被认为是“足球”)的新闻更感兴趣。如果体育新闻网站具有涵盖不同运动的新闻的不同网页,并且在这些页面的每一个中具有搜索框,则可能出现类似的问题。因此,当搜索引擎忽略提交搜索查询的网页时,用户不能接收到最适合其独特兴趣的搜索结果。
鉴于前述,所希望的是具有下述搜索引擎:可以根据提交相对应的搜索查询的网站(或网页)来定制其搜索结果,以使在对提交搜索查询的用户来说最可能感兴趣的搜索结果中突出信息项。此外,所希望的是这样的系统:无需来自用户的关于用户的个人偏好和兴趣的明确输入进行操作,因此使用户不用担心暴露私人信息。
发明内容
在对网站建档的方法中,信息服务器从网站接收不同用户提交的多个搜索查询。响应于搜索查询向请求用户提供不同的搜索结果。信息服务器监视在搜索结果上的用户行为,并且使用搜索查询和用户行为为网站生成简档。
在提供依赖于网站的搜索结果的方法中,信息服务器从两个网站接收相同的查询并且识别与搜索查询相关联的多个信息项。信息服务器使用两个网站的简档来将信息项定制为两种不同的次序并且以该两种不同的次序将信息项派发到两个网站。两个网站简档与两个网站的搜索历史相关。
包括网站简档创建以及搜索结果重新排序和/或评分的本发明可以在客户端-服务器网络环境的客户端侧或服务器端侧上实现。
附图说明
当结合附图考虑时,作为本发明的优选实施例的详细描述的结果,将在下文中更清楚地理解本发明的前述特征和优势以及本发明的附加特征和优势。
图1是根据本发明的一些实施例的包括从信息服务器请求信息的多个网站和客户端的示例分布式系统的框图。
图2是根据本发明的一些实施例的用于使用与网站(或网页)相关联的搜索查询、搜索结果和用户行为生成网站(或网页)简档的过程的流程图。
图3是根据本发明的一些实施例的用于通过将增加的网站(或网页)简档合并入网站(或网页)简档来更新网站(或网页)简档的过程的框图。
图4是表征从网站(或网页)提交的搜索查询的流行性分布的曲线的预言性示例。
图5是示出了根据本发明的一些实施例的如何将创建网站简档的过程分成多个子过程的框图。
图6A是根据本发明的一些实施例的可以被用于生成基于类别的网站简档的示例类别图的框图。
图6B是根据本发明的一些实施例的可以被用于存储基于类别的网站简档的示例数据结构的框图。
图7是根据本发明的一些实施例的可以被用于存储基于词语的网站简档的示例数据结构的框图。
图8是根据本发明的一些实施例的可以被用于存储基于链接的网站简档的示例数据结构的框图。
图9是根据本发明的一些实施例的用于使用网站简档来生成依赖于网站的搜索结果的过程的流程图。
图10是根据本发明的一些实施例的示例数据结构的框图,所述示例数据结构可以被用于存储用于搜索结果中的文档的基于类别、基于词语以及基于链接的提升因素。
图11是根据本发明的一些实施例的用于使用网站简档来生成依赖于网站的搜索结果的另一个过程的流程图。
图12是根据本发明的一些实施例的示例信息服务器的框图。
在附图的全部多个视图中,相同的参考标记是指相对应的部分。
具体实施方式
为了说明性的目的,在下面论述的实施例仅包括基于与网站相关联的搜索历史来生成网站简档,并且然后响应于从该网站提交的搜索查询使用该网站简档来对搜索结果进行排名的系统和方法。然而,对本领域的技术人员显而易见的是,在下面论述的基本原理可以被容易地扩展来创建网页简档并且使用该网页简档来生成依赖于网页的搜索结果。
图1是用于实现本发明的一些实施例的示例环境100的框图。一个或多个网站102和客户端103可以被连接到通信网络104。通信网络104可以被连接到信息服务器106。信息服务器106可以包括前端服务器120、搜索引擎122、文档建档器125、网站建档器129、搜索结果排名器126、文档简档数据库123、内容数据库124、搜索历史数据库127以及网站简档数据库128。
在一些实施例中,信息服务器106包含图1中所示的元件的子集或超集。尽管图1将信息服务器106示出为多个离散项,但是该图更意在作为可以在信息服务器106中展现的各种特征的功能性描述而非各种实施例的结构性示意图。实际上,如在设计这样的系统的领域中的普通技术人员将认识到的那样,分离示出的项可以被组合并且某些项可以被进一步分离。例如,在图中分离示出的四个不同的数据库123、124、127和128可以由单个数据库服务器来实现。构成信息服务器106的计算机的实际数量以及在计算机中的特征的分配将根据实施方式而有所不同,并且可以部分根据信息服务器106在高峰使用期间以及在平均使用期间必须处理的流量。
网站102典型地是与因特网上的域名相关联的网页的集合。每一个网站(或网页)具有在因特网上唯一识别该网站(或网页)的位置的统一资源定位符(URL)。任何访问者可以通过在浏览器窗口中输入网站的URL来访问该网站。网站可以由域名的所有者专有的web服务器或其中其web服务器管理与不同域名相关联的多个网站的因特网服务提供商托管。为了说明性的目的,网站102包括两个网页114和116,每一个分别具有相关联的搜索框115和117。通过搜索框115(或117),到网页114(或116)的访问者可以通过将搜索查询输入到搜索框中来对网站102或整个因特网搜索相关信息。根据上下文,如在该文档中所使用的术语“网站”是指由URL识别的逻辑位置(例如,因特网或内联网位置)、或其是指托管由URL表示的网站的web服务器、或指这两者。
客户端103可以是多个装置中的任何装置(例如,计算机、因特网信息站、个人数字助理、蜂窝电话、游戏装置、台式计算机或膝上型计算机),并且可以包括客户端应用132、客户端助理134和/或客户端存储器136。客户端应用132可以是允许用户与客户端103和/或网络资源相交互以执行一个或多个任务的软件应用。例如,客户端应用132可以是允许用户从客户端103搜索、浏览和/或使用和/或经由通信网络104可以访问在网站102的资源(例如,网页和web服务)的浏览器(例如,Firefox)或其它类型的应用。客户端助理134可以是执行与监视或辅助关于客户端应用132和/或其它应用的用户行为相关的一个或多个任务的软件应用。例如,客户端助理134辅助在客户端103的用户浏览由网站102托管的资源(例如,文件);处理从信息服务器106接收的信息(例如,搜索结果);以及监视在搜索结果上的用户行为。在一些实施例中,客户端助理134是客户端应用132的一部分,其可作为客户端应用132的插件或扩展获得(例如,从各种在线源提供),而在其它的实施例中,客户端应用是与客户端应用132分离的单机程序。在一些实施例中,客户端助理134被嵌入在从诸如信息服务器106的一个或多个服务器下载的一个或多个网页或其它文档中。客户端存储器136可以存储诸如从信息服务器106接收的网页、文档的信息、系统信息和/或关于用户的信息等。
通信网络104可以是任何有线或无线的局域网(LAN)和/或广域网(WAN),诸如内联网、外联网或因特网。通信网络104在网站102、客户端103和信息服务器106之间提供通信能力即可。在一些实施例中,通信网络104使用超文本传输协议(HTTP)以使用传输控制协议/网际协议(TCP/IP)来传输信息。HTTP允许客户端计算机访问经由通信网络104可访问的各种资源。然而,本发明的各种实施例不限于使用任何特定的协议。如该整个说明书所使用的术语“资源”是指经由URL可访问的任何信息片段或服务,并且可以是例如网页、文档、数据库、图像、计算对象、搜索引擎或其它在线信息服务。
为了接收依赖于网站的搜索结果,来自客户端103的用户首先向网站102发送对网页的请求。网站通过识别所请求的网页作出响应,并且将所识别的网页返回到请求客户端103。网页可以包括用户感兴趣的文档(例如,报纸文章)。网页也可以包括搜索框(例如,在或靠近网页的顶部)。当浏览网页的内容时或在浏览网页的内容后,用户可能对获得更多的信息感兴趣。为了这样做,用户可以将搜索查询输入到搜索框中,并且将搜索查询提交到网站102。搜索查询可以包括一个或多个查询词语。
如上所述,许多网站没有专用的搜索引擎。其搜索请求实际上由第三方搜索引擎处理。在一些实施例中,在接收搜索查询后,网站102生成搜索请求并且将其发送到信息服务器106。在一些其它的实施例中,客户端103生成搜索请求并且将其直接发送到信息服务器106而不用通过网站102路由请求。在任一种情况中,搜索请求包括搜索查询以及请求网站102和请求客户端103的唯一标识符。
在信息服务器106内,前端服务器120被配置来处理经由网站102和客户端103与通信网络104的各自的连接而来自网站102和客户端103的各种请求。如图1中所示,分别地,前端服务器120被连接到搜索引擎122并且搜索引擎122被连接到内容数据库124。内容数据库124存储从不同网站检索的大量索引文档。替选地,或另外地,内容数据库124存储在各种网站上存储的文档的索引。在一个实施例中,根据文档的链接结构向每一个索引文档分配一页面排名。页面排名用作文档的重要性的不依赖查询的测量。
前端服务器120将搜索请求传递到搜索引擎122上。搜索引擎122然后响应于搜索请求与内容数据库124相通信来选择多个文档。搜索引擎122基于文档的页面排名、与文档相关联的文本以及搜索查询向每一个文档分配普通排名分值。
搜索引擎122还被连接到文档简档数据库123。文档简档数据库123存储用于内容数据库124中的每一个索引文档的文档简档。文档简档数据库123和内容数据库124都连接到文档建档器125。对于内容数据库124中的每一个文档,文档建档器通过分析文档的内容和其链接结构来生成文档简档。文档简档的生成独立于搜索引擎122的操作。在一个实施例中,每当信息服务器106识别了因特网上的新文档或现有文档的新版本,文档建档器125便被调用来生成文档简档。在另一个实施例中,文档建档器125被周期性地调用来为在预定时间段内识别的所有新文件生成文档简档。在一些实施例中,替代文档简档数据库123和内容数据库124为两个单独的实体,文档简档数据库123和内容数据库124被合并在一起,使得文档和其相关联的简档可以由单个数据库查询来定位。
存在从搜索引擎122到搜索结果排名器126的连接。通过该连接,搜索引擎122将所识别的文档和其相关联的文档简档发送到搜索结果排名器126。搜索结果排名器126具有到网站简档数据库128的连接。如同文档简档数据库123,网站简档数据库128存储包括请求网站102的简档的大量网站简档。使用请求网站102的简档,搜索结果排名器126将每一个所识别的文档的普通排名分值转换为依赖于网站的排名分值。然后根据文档各自的依赖于网站的排名分值对文档重新排序。接着,搜索结果排名器126根据文档的更新次序创建搜索结果,搜索结果包括多个文档链接,每一个文档一个链接。搜索结果或搜索结果的一部分(例如,识别前10、15或20个结果的信息)被返回到请求客户端103并且通过客户端应用132向用户显示。在浏览了搜索结果后,用户可以点击搜索结果中的一个或多个文档链接来下载并查看由搜索结果识别的一个或多个文档。
虽然上面的描述以特定的方式将任务划分在搜索引擎122、搜索结果排名器126和前端服务器120中,但是任务的这种特定划分是示例性的,并且在本发明的其它实施例中可以使用其它的划分。例如,可以将(接收搜索查询的网站的)网站简档与搜索查询一起传送到搜索引擎122,并且搜索引擎122可以使用该信息来计算网站特定文档分值,用于对搜索结果排名。实际上,这会将搜索结果排名器126合并入搜索引擎122中。在还一些其它实施例中,可以使用任务的其它划分。
派发依赖于网站的搜索结果的过程的重要方面是存储在网站简档数据库128中的网站简档的生成和维护。网站简档应当反映相关联的网站的用户的兴趣,并且在许多实施例中,网站简档对其相关联的网站将是唯一的。例如,消费类电子网站应当具有提升与电子产品相关的网页的网站简档,而在线杂货店网站应当具有提级与农产品相关的网页的网站简档。
在大部分实施例中,网站简档不是静态的,因为静态网站简档不太可能致使信息服务器106将最相关的搜索结果派发给相关联的网站的用户。替代地,时常更新网站简档(例如周期性地),以使用网站的用户的当前兴趣来重新排列网站简档。虽然某些网站简档可以在很长一段时间基本上保持静态(例如,为少许、静态用户群服务的网站,所述用户从在之上只有很窄范围的主题的所述网站提交搜索),但是许多网站简档将随时间推移随着网站的用户改变而变化,并且随着网站的用户的兴趣随时间推移变化而变化。
在网站简档和用户简档之间存在相似性。两种简档都可以被用来细微调整搜索引擎生成的搜索结果。两者都需要与至少一个用户的搜索历史有关的信息,以便捕捉用户的动态搜索兴趣。但是在两种类型的简档之间也存在显著差别。典型的用户简档是通过分析个人用户的搜索历史来生成的。该用户简档仅被用来响应于同一用户提交的搜索查询而调节搜索结果。对于相同的搜索查询,如果两个不同的用户具有不同的用户简档,则其可以从同一搜索引擎接收不同的搜索结果。相比之下,网站简档是通过分析多个用户在访问该网站时的搜索历史来生成的,以表征多个用户的兴趣。该网站简档可以被用来响应于任何用户从同一网站提交的搜索查询而调节搜索结果,所述用户包括其先前对网站简档未作出“贡献”的网站的新用户。因此,如果两个网站具有不同的网站简档,则从所述两个不同的网站提交相同的搜索查询的同一用户可以接收不同的搜索结果。
在保护用户的隐私方面,网站简档相对于用户简档也具有重要优势。用户简档与个人用户相关联。为了创建用户简档,个人用户明确地或暗含地(例如,通过监视或记录搜索查询以及用户的其它在线行为)需要完成其个人偏好的调查。该调查指示用户可能对哪些信息项感兴趣。此外,用户必须在网站或搜索引擎系统具有账户,并且用户必须登录入其账户以调用用户简档来使搜索结果个性化。相比之下,网站简档的创建和使用不需要来自任何用户的任何个人信息。网站简档与网站而不是个人用户相关联。在网站上的任何个人用户的行为被归因于网站的所有用户。用户不需要为了使用网站简档而登录入其在网站的账户。只要从网站提交了搜索查询,信息服务器就自动根据网站简档使相对应的搜索结果“个性化”。
如图1所示,网站建档器129负责生成和更新网站简档。为了捕捉与特定网站相关联的当前用户兴趣,网站建档器129需要具有对在网站处的用户搜索历史的访问权。用户搜索历史包括用户在访问网站时提交的搜索查询、响应于搜索查询的搜索结果、以及在搜索结果上的用户行为(例如,对文档链接的选择,有时称为对搜索结果的“点击”、或在文档链接上的鼠标悬停时间)。
例如,当前端服务器120从网站接收搜索查询时,其向搜索引擎122提交搜索查询的副本以要求搜索结果。另外,前端服务器120将搜索查询的另一个副本发送到搜索历史数据库127。搜索历史数据库127然后生成记录,该记录至少包括搜索查询和接收搜索查询的网站的标识符。
响应于搜索查询,搜索结果排名器126准备搜索结果。搜索结果(即,表示搜索结果的至少一部分的信息)通过前端服务器120被发送回请求客户端。搜索结果或搜索结果的一部分的副本也与搜索查询记录一起被存储在搜索历史数据库127中。在请求客户端的客户端助理134监视在搜索结果上的请求用户的行为,例如,记录对搜索结果中的文档链接的用户选择和/或在不同文档链接上的鼠标悬停时间。在一些实施例中,客户端助理134或网站建档器129通过确定在用户选择相对应的文档链接和用户从该文档退出之间的时间量来为用户选择的文档确定文档“驻留时间”。在一些实施例中,客户端助理134包括存储在包含搜索结果的网页中的可执行指令,所述指令监视关于搜索结果的用户行动并且将与所监视的用户行动有关的信息传送回信息服务器106。信息服务器106进而存储被转送回信息服务器106并且存储在搜索历史数据库127中用于以后使用的与这些用户行为有关的信息。
例如,网站建档器129记录用户提交搜索查询的时刻(t0)、用户点击在相对应的搜索结果中的第一文档链接的时刻(t1)以及用户点击在搜索结果中的第二文档链接的时刻(t2)等等。两个连续时刻之间的差(例如,t1-t0或t2-t1)是花费来查看用户选择了其链接的搜索结果或文档的时间量的合理近似值。在一些实施例中,网站建档器129没有与用户选择来查看的搜索结果中的最后文档的用户驻留时间有关的信息。在一些其它的实施例中(例如,其中至少一些用户“选择加入”收集与用户的在线行为有关的附加信息的客户端助理的版本),网站建档器129在用户完成查看来自搜索结果的文档后还接收用户行动的点击和时间戳信息。继续上面的示例,网站建档器129进一步记录用户提交第二查询的时刻(t3)、用户从第二搜索结果选择文档的时刻(t4)等等。此外,网站建档器129可以记录用户何时关闭被用来查看搜索结果和在搜索结果中列出的文档的浏览器窗口或导航远离接收查询的网站的时刻(t5)。该附加信息使网站建档器129能够为用户查看的所有搜索结果文档(即,在搜索结果中列出的文档)确定用户驻留时间,其进而使网站建档器129能够为网站生成更精确的网站简档。
基于网站的搜索历史信息,网站建档器129生成网站简档。图2是根据本发明的一些实施例的用于使用网站的搜索历史来生成网站简档的过程的流程图。初始,网站建档器129识别从网站提交的搜索查询(210)。虽然在大部分情况下,这将包括从网站提交的所有搜索查询,但是在非常流行或繁忙的网站的情况下,所识别的搜索查询可以包括所提交的搜索查询的子集或取样。在预定时间内从网站提交的搜索查询大概地代表使用该网站的用户的普遍兴趣。搜索查询与捕捉随时间变化的动态用户兴趣尤其相关。与搜索查询结合,网站建档器129识别相对应的搜索结果(215)。在一些实施例中,搜索结果与所嵌入的客户端助理134一起被派发到请求用户,该客户端助理134将与搜索结果上的用户行为有关的信息发送到网站建档器127。网站建档器使用客户端助理发送的信息来识别在搜索结果上的用户行为(230)。所识别的用户行为可以包括在搜索结果中的文档链接上的用户点击。在另一个示例中,所识别的用户行为可以包括在文档链接上的鼠标悬停时间。一般而言,如果用户对文档的内容感兴趣,该用户才点击文档链接。类似地,鼠标移动到特定文档链接上并且在那里停留大量时间的事实指示该文档与用户的兴趣相关。在一些实施例中,可能无法使用关于鼠标悬停时间的信息。
网站建档器129可以根据在不同搜索结果上的用户行为来识别网站用户所选择的文档。在一些实施例中,网站建档器129访问内容数据库124以检索相对应的文档的简档(235)。如上所述,每一个所识别的文档可以具有先前生成的简档(例如,类别简档)。如果任何所识别的文档还没有简档,则可以忽略那些文档、或网站建档器可以调用文档建档器125来为那些文档产生文档简档。然后从所检索的文档简档生成网站简档(240)。网站简档可以包括下列的一个或多个:类别的加权列表或向量(有时称为类别简档)、来自搜索查询和/或用户所访问的文档的关键词(有时称为词语简档)、以及与指向用户所访问的文档的链接有关的信息(有时称为链接简档)。该网站简档被存储在网站简档数据库128中。搜索结果排名器126可以检索网站简档以对搜索结果内的文档的排名重新排序。
在一些其它的实施例中,用聚类操作替代操作235和240,在所述聚类操作中完全基于同一用户点击文档的相关联的链接的事实来聚类用户所选择的文档。替选地,网站建档器对照与特定类别相关联的一组已知URL来直接匹配文档的URL。在任一种情况下,网站建档器129不需要为了生成网站简档而访问文档的内容。
在还一些其它实施例中,用将从网站提交的查询映射到一组类别的过程来替代操作230至240。可以基于查询自身中的词语,或通过访问前N个搜索结果(例如,前5、10、15或20个搜索结果)的简档、将那些文档简档合并来为每一个查询产生查询简档并且合并查询简档,来根据网站的搜索框的用户提交的查询的频率对查询的归类进行加权以生成网站简档。如在下面参考图4所论述的,该过程可以排除被认为不可能与网站的用户的主要兴趣相关的查询。
如上所述,时常更新网站简档以便跟踪访问网站的用户的当前兴趣(245)。在一些实施例中,在预定的时间间隔(例如,每周或每天)更新网站简档。在一些其它的实施例中,每当自最后(即,最近)更新后在网站处的新的搜索查询的数量达到阈值,便更新网站简档。每当到更新网站简档的时候,网站建档器129重复前述过程来更新网站简档。
在一些实施例中,不同的网站吸引很大不同量值的流量,并且因此在简档更新方面应当不同对待。例如,流行的网站每天可以接收好几万点击,而不那么流行的网站可以具有低许多的点击率。搜索历史数据库126可以为不同的网站分配存储空间量。结果,在网站的下一排定的简档更新之前,与流行的网站相关联的搜索历史的量不会用尽其指派的空间并且不那么流行的网站没有浪费太多空间。
某些网站太流行以致为了简档更新的目的将所有搜索历史存储在搜索历史数据库127中是不切实际的。例如,在线书店在发布新的畅销书时可以具有显著大量的访问者。在短时间段内具有显著流量的网站存在两个问题。第一,该流量高峰可以使网站的简档有偏差。可能需要特定的照顾来确保网站简档在网站用户的短期和长期兴趣之间具有恰当的平衡。第二,搜索历史数据库127可能没有空间来存储所有的搜索历史。解决该问题的一个方法是有意地忽略搜索查询、搜索结果以及用户行为中的一些。这可以通过对搜索查询、搜索结果和/或用户行为取样来完成,以便产生搜索历史的没有偏差的样本。虽然取样的广度可以根据实施例而有所不同,但是试验表明包含几个月的用户行为的搜索历史将具有足够的数据来生成可靠的网站简档,对于大部分网站,只要(A)以避免显著偏差的方式完成取样,以及(B)其包括与几个星期有代表性的搜索历史相对应的用户行为数据。
替选地,空间不足问题可以通过为搜索历史的不同部分生成一系列增加的(incremental)网站简档并且将增加的网站简档合并入网站简档来解决。如图3所示,网站建档器129首先为搜索历史部分301生成增加的简档311。每一个搜索历史部分301、303、305可以包括预定义量的搜索历史信息,或其可以包括预定义时长(例如,小时)的搜索历史信息,或其可以包括根据预定义的选择标准选择的搜索历史的一部分。生成增加的网站简档的过程类似于在上面与图2结合论述的过程。在表征网站用户的兴趣方面,增加的简档311等同于搜索历史部分301。一旦创建了增加的简档311,数据库中相对应的搜索历史部分301可以被进入数据库的新条目覆盖(overwrite)。类似地,搜索历史部分303可以在生成增加的简档313后被覆盖。在创建增加的简档315后,网站建档器129可以通过将增加的简档311、313和315合并入老的网站简档331来创建新的网站简档337。简言之,通过为搜索历史部分301、303和305创建增加的网站简档并且通过将现有的网站简档与增加的简档311、313和315合并,网站建档器129能够考虑全部搜索历史。
网站简档被用来响应于从特定网站提交的搜索查询而使搜索结果“个性化”或“风味化(flavoring)”。在本说明书中的基本假设是这些搜索查询与网站涵盖的主题或多或少相关。例如,对于高尔夫网站,搜索查询“Tiger Woods(泰格·伍兹)”合理相关,而搜索查询“BritneySpears(布兰妮·斯皮尔斯)”可能毫不相关。但是用户将如“BritneySpears”的非常流行的词语输入到高尔夫网站上的搜索框中是非常可能的。如果搜索框可以被用来搜索整个因特网这尤其可能。如果不仔细过滤掉,则与这些流行但不相关的词语相关联的搜索历史可以严重“污染”网站简档并且将搜索结果歪曲到意想不到的方向。网站简档的污染的另一个源是尽管相关、但是具有非常低的流行性的查询词语。特殊对待可能是必要的,以确保关于非常低的流行性查询词语的用户行为不会显著地使搜索结果有偏差。
图4是表征从网站提交的搜索查询的流行性分布的示例曲线400。通过两个阈值415和425将所有的搜索查询分成三个类别。最左边的类别410包括“异常”流行、但与网站较少相关的那些搜索查询。通过高尔夫网站的搜索窗口提交的搜索查询“Britney Spears”是该类别中的搜索查询的示例。网站建档器129应当通过给予它们相对低的权重来消除或至少减少与这些查询相关联的搜索历史对网站简档的影响。中间类别420包括合理流行并且与网站相关的那些搜索查询。对应于这些搜索查询的搜索历史应当被授予更高的权重以对网站简档作出主要贡献。最后,最右边的类别430包括在网站的搜索框中仅偶尔出现的那些查询。应当以类似于最左边类别410中的查询的方式对待这些查询。
存在确定中间类别420中的搜索查询(或相对应的搜索结果)对网站简档的贡献的多种因素。例如,搜索查询的流行性和在搜索结果上的用户行为的数量影响搜索查询和搜索结果对网站简档的贡献。时间是另一个重要因素。在一些实施例中,在网站简档的形成中,新近的搜索历史比不那么新近的搜索历史发挥更显著的作用。本领域的技术人员可以容易地将类似原理应用于与网站相关联的搜索历史的其它方面。
图5是示出了根据本发明的一些实施例的如何将创建网站简档的过程分成多个子过程的框图。如上所述,使用网站的搜索历史来为该网站创建简档530是非平凡(non-trivial)的过程。搜索历史包括来自不同源的不同类型的信息,诸如用户从网站提交的搜索查询501、搜索引擎响应于搜索查询生成的搜索结果503以及在搜索结果上的用户行为505。在一些实施例中,该过程被进一步分成多个子过程。每一个子过程产生从特定视角表征网站用户的兴趣的特定类型的网站简档。它们是:
·基于类别的简档531—该简档使搜索历史与一组预定义的类别相互关联,其可以以层级的方式来组织,且每一个类别被给予指示类别与网站用户的兴趣的相关性的权重;
·基于词语的简档533—该简档用多个词语来概括搜索历史,其中每一个词语被给予指示词语与网站用户的兴趣的相关性的权重;以及
·基于链接的简档535—该简档识别与搜索历史直接或间接相关的多个链接,且每一个链接被给予指示链接与网站用户的兴趣的相关性的权重。
在一些实施例中,网站简档530仅包括简档531、533、535的子集。例如,网站简档530可以包括基于词语的简档533和基于类别的简档531,但不包括基于链接的简档535。在一些实施例中,网站简档530包括多个简档,所述多个简档中的至少一个是前述简档531、533、535的两个或多个的组合。在一些其它的实施例中,进一步处理基于类别、基于词语和/或基于链接的简档来生成精化的基于类别的(或基于聚类的)简档。在又一些其它的实施例中,该精化的基于类别的(或基于聚类的)简档以多个基于类别的(或基于聚类的)子简档的形式出现以表征网站的不同方面。
例如,通过将搜索历史项(例如,搜索查询、内容项和/或用户所选择的文档)映射到类别,然后聚集由此产生的类别组并且对类别加权,可以构建基于类别的简档531。可以基于其在搜索历史项中出现的频率来对类别加权。另外,可以基于搜索历史项与类别的相关性来对类别加权。在一段时间内累积的搜索历史项可以被视为用于映射到加权类别的组。也可以使用将搜索历史映射到加权类别的其它适当方式。
图6A示出了按照Open Directory Project(开放式目录项目)(http://dmoz.org/)的层级类别图600。从图600的根级别开始,根据诸如“艺术”、“新闻”、“体育”等等的几个主要的主题来组织文档。这些主要的主题通常太宽泛以致不能描述网站用户的特定兴趣。它们被进一步分成多个更具体的子主题。例如,主题“艺术”可以包括如“电影”、“音乐”和“文学”的子主题,并且子主题“音乐”可以进一步包括如“歌词”、“新闻”和“评论”的子子主题。注意,每一个主题(或子主题)与唯一类别标识符相关联,所述标识符如用于“艺术”的1.1、用于“脱口秀”的1.4.2.3以及用于“篮球”的1.6.1。
在图6A中示出的类别仅用于说明性的目的。本领域的技术人员将理解,存在对文档归类的许多其它方式。例如,可以从文档的内容提取不同的概念并且根据这些概念来将相关信息的不同类别分组。特定网站的用户的兴趣可以与在不同级别的多个类别相关联,每一个具有指示类别与用户的兴趣的相关性的权重。可以通过分析与网站相关联的搜索历史来确定类别和其相关联的权重。
图6B是根据本发明的一些实施例的可以被用于存储基于类别的网站简档的示例数据结构(基于类别的网站简档表650)的框图。基于类别的简档表650包括具有多个记录642的表640,每一个记录包括WEBSITE_ID、FLAVOR_ID和指向诸如表660-1的另一个数据结构的指针。网站可以具有一个或多个风味以更好地服务不同的用户组。例如,网站“WEBSITE_1”具有至少两个不同的风味“FLAVOR_1”和“FLAVOR_2”。这两个不同的“风味”可以与不同网页上的不同搜索框相对应。换言之,网站的不同风味的引入精化了网站用户的兴趣。这对于服务宽泛范围的客户的流行网站尤其有用。表660-1包括两列CATEGORY_ID和WEIGHT。CATEGORY_ID列包含如图6A中所示的类别的标识符,以及在WEIGHT列中的值指示类别与网站用户的兴趣的相关性。
在一些实施例中,自动将搜索历史项分类为不同的聚类。聚类通常比类别更动态。如上所述,类别典型地被预先生成。对照相同的类别组来分类与不同网站相关联的搜索历史项。相比之下,可以不存在用于特定网站的预定义的聚类组。与网站相关联的搜索历史项落入自动生成的聚类组。因此,聚类可以更适合表征网站的用户的兴趣和偏好。为了便利,本发明的许多论述将类别用作为示例。但是对本领域的技术人员而言清楚的是,基本算法也可以不经调整或经少许调整应用于聚类。
基于类别图600的网站简档是面向主题的实施方式。在基于类别的简档中的项也可以以其他的方式来组织。在一个实施例中,网站用户的兴趣可以基于网站用户所识别的文档的格式来归类,所述格式诸如HTML、纯文本、PDF、Microsoft Word等等。不同的格式可以具有不同的权重。在另一个实施例中,网站用户的兴趣可以根据所识别的文档的类型来归类,所述类型例如组织的主页、个人的主页、研究论文或新闻组帖子,每一种类型具有相关联的权重。文档也可以按文档来源来归类,例如与每一个文档的主机相关联的国家。在又一个实施例中,在上面所识别的基于类别的简档中的两个或多个可以共存,且每一个反映网站用户的兴趣的各自方面。
图7是根据本发明的一些实施例的可以被用于存储基于词语的网站简档的示例数据结构(基于词语的简档表700)的框图。表700包括多个记录710,每一个记录与网站的基于词语的简档相对应。基于词语的简档记录710包括多列,所述列包括WEBSITE_ID列720和多列(TERM,WEIGHT)对740。WEBSITE_ID列存储网站标识符。每一个(TERM,WEIGHT)对740包括被认为与网站用户的兴趣相关的典型地为一至三个单词的词语以及指示词语的相关性的与词语相关联的权重。词语的权重不一定是正值。负权重暗示网站用户不喜欢在搜索结果中的包括该词语的文档。
除基于词语和基于类别的简档外,另一种类型的网站简档被称为基于链接的简档。如上所述,文档的页面排名基于将该文档连接到因特网上的其它文档的链接结构。具有更多指向其的链接的文档通常被赋予更高的页面排名并且因此搜索引擎认为其更流行。网站的用户所选择的文档的链接信息可以被用来推断网站的用户的兴趣。在一个实施例中,通过分析这些URL的点击率来为网站用户识别优选的URL的列表。可以根据网站用户在URL处的鼠标悬停时间来对每一个优选的URL进一步加权。在另一个实施例中,通过分析在不同web主机处的用户的访问率来为网站用户识别优选的web主机的列表。当两个或多个优选URL与同一web主机相关时,该两个或多个URL的权重可以被组合为该web主机的权重。
图8是根据本发明的一些实施例的可以被用于存储基于链接的网站简档的示例数据结构的框图。基于链接的简档表800包括表810,表810包括多个记录820,每一个记录包括WEBSITE_ID和指向诸如表810-1的另一个数据结构的指针。表810-1可以包括两列LINK_ID 830和WEIGHT840。LINK_ID 830可以与优选的URL或主机相关联。实际的URL/主机可以被存储在表而不是LINK_ID中,然而优选地,存储LINK_ID以节省存储空间。
优选的URL和/或主机的列表包括网站用户已直接识别的URL和/或主机。优选的URL和/或主机的列表可以进一步扩展到使用诸如为本领域的普通技术人员所知的协作过滤或文献计量(bibliometric)分析的方法来间接识别的URL和/或主机。在一个实施例中,间接识别的URL和/或主机包括具有到/自直接识别的URL和/或主机的链接的URL或主机。通过在间接识别的URL和/或主机与直接识别的URL或主机之间的距离来对这些间接识别的URL和/或主机加权。例如,当直接识别的URL或主机具有权重1时,相差一个链接的URL或主机可以具有权重0.5、相差两个链接的URL或主机可以具有权重0.25等等。通过减少与原始URL或主机的主题不相关的链接的权重可以进一步精化该过程,所述链接例如指向版权页或可以被用来查看与用户所选择的URL或主机相关联的文档的web浏览器软件的链接。不相关的链接可以被基于其上下文或其分布来识别。例如,版权链接通常使用特定词语(例如,“版权”和“保留所有版权”是版权链接的锚点文本中常使用的词语);以及从许多不相关的网站指向网站的链接可以暗示该网站不是主题相关的(例如,指向Internet Explorer网站的链接通常被包括在不相关的网站中)。也可以根据一组主题来对间接链接分类,并且可以排除具有非常不同的主题的链接或对其赋予低权重。
在上面论述的三种类型的网站简档总体上相互补充,因为不同的简档从不同的有利点来表征网站用户的兴趣。然而,这并不意味一种类型的网站简档,例如基于类别的简档,不能发挥典型地由另一种类型的网站简档发挥的作用。以示例的方式,基于链接的简档中的优选URL或主机常常与特定主题相关联,例如,finance.yahoo.com是聚焦财经新闻的URL。因此,由包括优选的URL或主机列表的基于链接的简档所实现的作用至少部分也可以由具有涵盖优选URL或主机涵盖的相同主题的一组类别的基于类别的简档来实现。
图9是根据本发明的一些实施例的用于使用各种类型的网站简档来生成依赖于网站的搜索结果的过程的流程图。初始,搜索引擎122从网站102接收用户通过客户端103提交的搜索查询(910)。作为响应,搜索引擎122可以可选地生成查询策略(915)。例如,使搜索查询标准化以使处于适当的形式用于进一步处理,和/或可以根据预定义的标准修改搜索查询以使得自动扩大或缩小搜索查询的范围。接着,搜索引擎122将搜索查询(或查询策略,如果生成了查询策略)提交到内容数据库124。内容数据库124识别匹配搜索查询的一组文档(920),每一个文档具有取决于文档的页面排名和搜索查询的普通排名分值。所有三个操作(910、915和920)典型地由搜索引擎122来处理。
在一些实施例中,在搜索查询中嵌入请求网站的标识符。基于网站标识符,搜索结果排名器126在网站简档数据库128中识别网站的简档(925)。接着,搜索结果排名器126分析每一个所识别的文档以使用网站简档来确定一个或多个提升因素(935)并且然后使用文档的普通排名分值和提升因素来向文档分配依赖于网站的排名分值(940)。搜索结果排名器126对于每个所识别的文档重复该过程(942)。最后,搜索结果排名器126根据文档列表的依赖于网站的排名分值对该文档列表重新排序(945)并且将包括指向该文档列表的链接的搜索结果发送给请求客户端103。
在一些实施例中,在935处对所识别的文档的分析包括确定在文档的内容和网站的简档之间的相互关系。此外,在一些实施例中,该操作包括访问用于文档的先前计算的文档简档并且然后确定在文档简档和网站的简档之间的相互关系。在一些实施例中,确定相互关系包括为“点积”计算的一个或多个操作,如果存在重叠,其确定在文档简档和网站的简档之间的重叠程度。
图10是根据本发明的一些实施例的示例数据结构的框图,所述示例数据结构可以被用于存储用于搜索结果中的文档的基于类别、基于词语以及基于链接的提升因素。对于每一个候选文档,每一个由各自的DOC_ID识别,基于类别的文档信息表1010包括多个所识别的类别和相关联的权重,基于词语的文档信息表1030包括多对相关词语和相关联的权重,以及基于链接的文档信息表1050包括一组链接和相对应的权重。
当使用一种特定类型的网站简档来评价文档时,该三个表(1010、1030和1050)的每一个的最右边列存储该文档的提升因素(即,所计算的分值)。文档的提升因素可以通过组合与文档相关联的项的权重来确定。例如,基于类别或基于词语的提升因素可以如下来计算。网站的用户可能喜欢与具有0.6的权重的科学相关的文档,并且不喜欢与具有-0.2的权重的商业相关的文档。因此,当科学文档匹配搜索查询时,它将被提升到商业文档之上。通常,文档主题分类可以不是唯一的。候选文档可以被分类为具有0.8的概率的科学文档以及具有0.4的概率的商业文档。基于链接的提升因素可以基于分配给在基于链接的简档中的优选URL或主机的相关权重来计算。在一个实施例中,基于词语的简档排名可以使用诸如词频-逆向文档频率(TF-IDF)的已知技术来确定。词语的词频是词语在文档中出现的次数的函数。逆向文档频率是在文档的集合中词语在其中出现的文档的数量的反函数。例如,如“word(单词)”的非常常见的词语在许多文档中出现并且因此被赋予相对较低的逆向文档频率,而如“photograph(照片)”和“microprocessor(微处理器)”的不那么常见的词语被赋予相对较高的逆向文档频率。
在一些实施例中,当搜索引擎响应于搜索查询生成搜索结果时,根据搜索查询向满足搜索查询的候选文档D分配查询分值QueryScore。然后通过文档D的页面排名PageRank来调整该查询分值以生成普通排名分值GenericScore,其被表示为:
GenericScore=QueryScore*PageRank。
如果用户的兴趣与搜索引擎的随机用户的兴趣显著不同,则该普通排名分值不能适当反映文档D的与特定网站的用户的相关性。基于在文档D的内容和网站的基于词语的简档之间的相互关系(此处称为TermBoostFactor),在与文档D相关联的一个或多个类别和网站的基于类别的简档之间的相互关系(此处称为CategoryBoostFactor),以及在文档D的URL和/或主机和网站的基于链接的简档之间的相互关系(此处称为LinkBoostFactor),文档D与网站用户的相关性可以由一组提升因素精确表征。因此,文档D可以被分配依赖于网站的排名分值,其是文档的普通排名分值和各种基于网站简档的提升因素的函数。在一个实施例中,该依赖于网站的排名分值可以被表示为:WebsiteScore=GenericScore*(TermBoostFactor+CategoryBoostFactor+LinkBoostFactor)。
在另一个实施例中,其中网站简档是单个简档,依赖于网站的排名分值可以被表示为:
WebsiteScore=GenericScore*BoostFactor
其中“BoostFactor”基于在文档D的内容和网站的简档之间的相互关系。
图11是根据本发明的一些实施例的用于使用网站简档来生成依赖于网站的搜索结果的另一个过程的流程图。与在上面结合图9论述的实施例不同,通过网站的简档来调整普通查询策略以创建依赖于网站的查询策略(1125,1165)。例如,来自网站简档的相关词语可以与相关联的权重一起被添加到搜索查询。在各种实施例中,分别由搜索引擎122、前端服务器120或搜索结果排名器126来创建依赖于网站的查询策略。在一些其它的实施例中,请求网站102具有网站建档器129生成的其简档的副本并且依赖于网站的查询策略由请求网站102创建。接着,搜索引擎122使用依赖于网站的查询策略搜索内容数据库124(1170)。结果,通过内容数据库124识别的文档的相关联的依赖于网站的排名分值来对该内容数据库124识别的文档隐式排序(1175)。
参考图12,示例信息服务器1200典型地包括一个或多个处理单元(CPU)1202、一个或多个网络或其它通信接口1210、存储器1212以及用于使这些组件互连的一个或多个通信总线1014。通信总线1014可以包括互连并控制系统组件间的通信的电路(有时称为芯片集)。系统1200可以可选地包括用户接口,例如显示器和键盘。存储器1212可以包括高速随机存取存储器并且也可以包括非易失性存储器,诸如一个或多个磁盘存储装置。存储器1212可以包括位于远离CPU1202的位置的海量存储器。在一些实施例中,存储器1212存储下列程序、模块和数据结构,或其子集或超集:
·操作系统1216,其包括用于处理各种基本系统服务和用于执行依赖于硬件的任务的程序;
·网络通信模块1218,其被用来经由诸如因特网、其它广域网、局域网、城域网等等的一个或多个通信网络(有线的或无线的)将信息服务器1200连接到其它服务器或计算机;
·系统初始化模块1220,其初始化对信息服务器1200的适当操作所需要的存储在存储器1212中的其它模块和数据结构;
·搜索引擎122,用于处理搜索查询、根据搜索查询识别搜索结果并对搜索结果排序;
·内容数据库124,用于存储从因特网检索的多个索引文档;
·网站建档器129,用于处理与网站相关联的搜索历史以及创建并更新表征网站用户的兴趣的一个或多个简档;
·搜索历史数据库127,用于存储与不同网站相关联的搜索历史,包括搜索查询、搜索结果和用户行为;
·网站简档数据库123,用于存储与因特网上的不同网站相关联的网站简档;
·文档建档器125,用于分析文档的内容和上下文并且为文档创建简档;
·文档简档数据库123,用于存储与存储在内容数据库124中的不同文档相关联的文档简档;以及
·搜索结果排名器126,用于使用网站简档为搜索引擎122识别的每一个文档生成依赖于网站的排名分值,并且根据搜索结果中的文档的依赖于网站的排名分值对搜索结果中的文档重新排序。
在一些实施例中,信息服务器106可以不必访问与网站相关联的所有搜索历史。例如,关于从网站102提交的搜索查询在网站102和信息服务器106之间可以存在协议。根据该协议,当访问网站1027的用户向信息服务器106提交搜索查询时,信息服务器106被要求向网站102而不是在客户端103的请求用户发送相对应的搜索结果。网站102可以修改搜索结果,例如将广告或其它信息附在搜索结果中,然后将已修改的搜索结果派发给在客户端103的请求用户。
在这种情况下,信息服务器106可能没有识别请求用户和客户端103的信息,并且也可能不能监视在搜索结果上的用户行为。例如,信息服务器106不可以接收识别用户已点击的搜索结果中的文档链接的任何信息。类似地,信息服务器106不可以接收识别用户在之上移动其鼠标链接的文档链接和相对应的鼠标悬停时间的任何信息。换言之,信息服务器106对在搜索结果上的网站用户的行为知之甚少或完全不知。因此,信息服务器106不得不依靠来自其它地点的搜索结果上的用户行为来生成网站简档。
在一些实施例中,通过检查从不同网站提交的搜索查询,信息服务器106可以识别类似于正讨论的网站的另一个网站。如果从两个网站提交的搜索查询的预定义量或百分率相同,则认为两个网站类似。作如下推断也是合理的:两个类似网站的用户可以具有类似的兴趣并且因此与一个网站相关联的用户行为是与另一个网站相关联的用户行为的合理代理。如果信息服务器106可以访问与该两个网站中的一个相关联的用户行为(例如,不存在向网站递送搜索结果的协议),则信息服务器106可以使用相同的用户行为来为另一个网站创建简档。
当不存在与正讨论的网站类似的其它网站时,信息服务器106可以利用与直接提交到搜索引擎的搜索查询(例如,使用与信息服务器106相关联的工具栏搜索框或网页提交的搜索查询)相关联的已监视的用户行为作为特定网站的代理。然而,只有这样的“普通用户群”信息将被用于的搜索查询才是从正讨论的网站提交的查询。例如,搜索查询“在山景城的高尔夫球场”既可以被提交到聚焦高尔夫的网站,又可以被提交到普通用途的搜索引擎。从在该搜索查询的搜索结果上的普通用户群点击(以及从正讨论的网站和从搜索引擎的其他用户提交的其它搜索查询的搜索结果上的普通使用群点击)发展的简档信息被用来通过为从各个网站接收的查询组合或聚集普通用户统计信息而为各个网站生成简档。以这种方式获取的网站简档将典型地与搜索引擎的整个用户群落的一组简档显著不同,并且因此以这种方式生成的网站简档将是下述网站简档的合理近似:如果对搜索引擎响应于从网站提交的搜索查询而返回的搜索结果而言用户行为信息可用,则将生成该网站简档。
在一些实施例中,网站简档也可以被用来为从不同网站提交的搜索查询选择广告。以类似于处理不同文档的方式来处理不同的广告。例如,广告可以具有一组关键词。这组关键词和与网站相关联的基于词语的简档(或基于类别的简档、或两者)之间的相互关系产生用于广告的提升因素。响应于从网站提交的搜索查询,该提升因素可以被用来使特定广告提级或降级。例如,当信息服务器106从专用于英式足球新闻的网站或网页接收了搜索查询“世界杯2006”时,其可以使涵盖英式足球装备、2006 FIFA德国世界杯的门票出售以及在举办英式足球比赛的德国城市的酒店预订等等的那些广告提级。
为了解释的目的,已参考特定的实施例来描述了前面的描述。然而,上面的说明性论述并不意在穷举或将本发明限制在公开的精确形式。鉴于上述教导可以进行许多修改和变更。选择并描述实施例以便最好地解释本发明的原理和其实际应用,从而使本领域的技术人员能够最好地使用本发明和带有适合预期的特定用途的各种修改的各种实施例。

Claims (27)

1.一种对网站建档的计算机实现的方法,包括:
在与搜索引擎相关联的服务器处:
从不同于所述搜索引擎的网站接收用户提交的多个搜索查询;
向请求用户提供响应于所述搜索查询的搜索结果;
监视在所述搜索结果上的所述用户的行为;以及
使用来自所述网站的所述搜索查询和在所述搜索结果上的所述用户行为为所述网站生成网站简档,其中所述网站简档是通过分析多个用户在访问所述网站时的搜索历史来生成的,以表征所述多个用户的兴趣,并且所述网站简档与所述网站相关联并且对所述网站是唯一的。
2.如权利要求1所述的方法,其中所述用户行为包括对所述搜索结果的用户选择和在所述搜索结果上的鼠标悬停时间。
3.如权利要求1所述的方法,其中通过对在预定义时间段内的所述搜索查询的子集取样,使用所述搜索查询的子集来生成所述网站简档。
4.如权利要求1所述的方法,其中使用所述搜索查询的子集来生成所述网站简档,所述搜索查询的所述子集具有预定义范围的发生频率。
5.如权利要求1所述的方法,其中在所述网站简档的生成期间,时间上新近的搜索查询和响应于所述时间上新近的搜索查询的在所述搜索结果上的用户行为被给予比时间上遥远的搜索查询和响应于所述时间上遥远的搜索查询的在所述搜索结果上的用户行为更大的权重。
6.如权利要求1所述的方法,进一步包括:
从所述网站接收用户提交的新的搜索查询;
识别与所述新的搜索查询相关联的多个信息项;
根据所述网站简档对所述信息项排名;以及
将已排名的信息项提供给所述请求用户。
7.如权利要求6所述的方法,其中对信息项的排名进一步包括:
向所述信息项分配普通排名分值;
通过将所述普通排名分值与至少部分通过所述网站简档确定的权重因素相乘来生成依赖于网站的排名分值;以及
根据所述依赖于网站的排名分值对所述信息项重新排名。
8.如权利要求6所述的方法,进一步包括:
监视在所述已排名的信息项上的所述用户的行为;以及
使用所述用户的行为和所述新的搜索查询来更新所述网站简档。
9.如权利要求8所述的方法,其中使用在预定义时间段内累积的新的搜索查询和新的用户行为来生成增加的网站简档,并且将所述增加的网站简档合并入所述网站简档来生成新的网站简档。
10.如权利要求1所述的方法,进一步包括:
将所述搜索查询分成多个组,每一个组与所述网站的至少一个网页相关联并且具有相关联的用户组;
将响应于搜索查询组中的一个组的搜索结果提供给其相关联的用户组;
监视在所述搜索结果上的所述相关联的用户组的行为;以及
使用所述搜索查询组和所述相关联的用户行为来生成网页简档。
11.如权利要求10所述的方法,其中所述网站简档包括多个网页简档,每一个网页简档与在所述网站的至少一个网页上的搜索框相关联。
12.如权利要求10所述的方法,进一步包括:
从所述网站接收用户提交的新的搜索查询;
识别与所述新的搜索查询相关联的多个信息项;
根据所述网页简档对所述信息项排名;以及
将已排名的信息项提供给所述请求用户。
13.如权利要求12所述的方法,其中对信息项的排名进一步包括:
向所述信息项分配普通排名分值;
通过将所述普通排名分值与至少部分通过所述网页简档确定的权重因素相乘来生成依赖于网页的排名分值;以及
根据所述依赖于网页的排名分值对所述信息项重新排名。
14.如权利要求12所述的方法,进一步包括:
监视在所述已排名的信息项上的所述用户的行为;以及
使用所述用户的行为和所述新的搜索查询来更新所述网页简档。
15.如权利要求14所述的方法,其中使用在预定义时间段内累积的新的搜索查询和新的用户行为来生成增加的网页简档,并且将所述增加的网页简档合并入所述网页简档来生成新的网页简档。
16.一种提供搜索结果的计算机实现的方法,包括:
在与搜索引擎相关联的服务器处:
从不同于所述搜索引擎的第一和第二网站接收相同的搜索查询;
识别与所述搜索查询相关联的多个信息项;以及
以第一次序将所述信息项的第一子集提供给所述第一网站并且以不同于所述第一次序的第二次序将所述信息项的第二子集提供给所述第二网站,
其中,至少部分通过与所述第一网站相关联的第一网站简档来确定所述第一次序,并且至少部分通过与所述第二网站相关联的第二网站简档来确定所述第二次序,
其中,所述第一网站简档与所述第一网站的搜索历史相关,并且所述第二网站简档与所述第二网站的搜索历史相关,
其中每个网站简档是通过分析多个用户在访问网站时的搜索历史来生成的,以表征所述多个用户的兴趣,并且该网站简档与所述网站相关联并且对所述网站是唯一的。
17.如权利要求16所述的方法,包括根据所述第一和第二网站各自的搜索历史为所述第一和第二网站生成所述第一和第二网站简档。
18.如权利要求16所述的方法,其中所述第一网站的所述搜索历史包括多个用户在所述第一网站提交的搜索查询、响应于所述搜索查询的搜索结果以及在所述搜索结果上的用户行为。
19.如权利要求16所述的方法,其中所述信息项包括至少一个广告。
20.一种提供搜索结果的计算机实现的方法,包括:
在与搜索引擎相关联的服务器处:
从不同于所述搜索引擎的网站的第一和第二网页接收多个相同的搜索查询;
识别与所述搜索查询相关联的多个信息项;以及
以第一次序将所述信息项的第一子集提供给所述第一网页并且以不同于所述第一次序的第二次序将所述信息项的第二子集提供给所述第二网页;
其中,至少部分通过与所述第一网页相关联的第一网站简档来确定所述第一次序,并且至少部分通过与所述第二网页相关联的第二网站简档来确定所述第二次序;
其中,所述第一网站简档与所述第一网页的搜索历史相关,并且所述第二网站简档与所述第二网页的搜索历史相关,
其中每个网站简档是通过分析多个用户在访问网站时的搜索历史来生成的,以表征所述多个用户的兴趣,并且该网站简档与所述网站相关联并且对所述网站是唯一的。
21.如权利要求20所述的方法,包括根据所述第一和第二网页各自的搜索历史为所述第一和第二网页生成所述第一和第二网站简档。
22.如权利要求20所述的方法,其中所述第一网页的所述搜索历史包括多个用户在所述第一网页提交的搜索查询、响应于所述搜索查询的搜索结果以及在所述搜索结果上的用户行为。
23.如权利要求20所述的方法,其中所述信息项包括至少一个广告。
24.一种对网站建档的计算机实现的方法,包括:
在与搜索引擎相关联的服务器处:
从不同于所述搜索引擎的网站接收所述网站的用户提交的多个搜索查询;
识别响应于所述搜索查询的搜索结果;
识别与在所述搜索结果上的在与所述网站不同的地点的用户的行为有关的统计信息;以及
使用来自所述网站的所述搜索查询和所述统计信息为所述网站生成网站简档,其中所述网站简档是通过分析多个用户在访问所述网站时的搜索历史来生成的,以表征所述多个用户的兴趣,并且所述网站简档与所述网站相关联并且对所述网站是唯一的。
25.如权利要求24所述的方法,进一步包括:
根据所述网站简档对所述搜索结果排名;
将已排名的搜索结果提供给所述网站的所述用户;以及
监视在所述已排名的搜索结果上的所述网站的所述用户的行为。
26.如权利要求25所述的方法,其中所述统计信息包括在所述已排名的搜索结果上的所述网站的所述用户的所述行为。
27.一种对网站建档的计算机实现的系统,所述系统包括:
在与搜索引擎相关联的服务器处:
用于从不同于所述搜索引擎的网站接收用户提交的多个搜索查询的装置;
用于向请求用户提供响应于所述搜索查询的搜索结果的装置;
用于监视在所述搜索结果上的所述用户的行为的装置;以及
用于使用来自所述网站的所述搜索查询和在所述搜索结果上的所述用户行为为所述网站生成网站简档的装置,其中所述网站简档是通过分析多个用户在访问所述网站时的搜索历史来生成的,以表征所述多个用户的兴趣,并且所述网站简档与所述网站相关联并且对所述网站是唯一的。
CN2007800197484A 2006-03-30 2007-03-30 基于监视用户行为生成网站简档的方法 Active CN101454780B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/394,620 US8078607B2 (en) 2006-03-30 2006-03-30 Generating website profiles based on queries from webistes and user activities on the search results
US11/394,620 2006-03-30
PCT/US2007/065710 WO2007115217A2 (en) 2006-03-30 2007-03-30 Method of generating a website profile based on monitoring user activities

Publications (2)

Publication Number Publication Date
CN101454780A CN101454780A (zh) 2009-06-10
CN101454780B true CN101454780B (zh) 2013-09-11

Family

ID=38335819

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800197484A Active CN101454780B (zh) 2006-03-30 2007-03-30 基于监视用户行为生成网站简档的方法

Country Status (4)

Country Link
US (3) US8078607B2 (zh)
EP (1) EP2005339A2 (zh)
CN (1) CN101454780B (zh)
WO (1) WO2007115217A2 (zh)

Families Citing this family (278)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7152031B1 (en) * 2000-02-25 2006-12-19 Novell, Inc. Construction, manipulation, and comparison of a multi-dimensional semantic space
US7434219B2 (en) 2000-01-31 2008-10-07 Commvault Systems, Inc. Storage of application specific profiles correlating to document versions
US20090234718A1 (en) * 2000-09-05 2009-09-17 Novell, Inc. Predictive service systems using emotion detection
JP2005505039A (ja) 2001-09-28 2005-02-17 コムヴォールト・システムズ・インコーポレーテッド 情報記憶装置にオブジェクトをアーカイブする装置及び方法
US7565630B1 (en) 2004-06-15 2009-07-21 Google Inc. Customization of search results for search queries received from third party sites
US20090228447A1 (en) * 2004-07-01 2009-09-10 Creekbaum William J System, method, and solfware application for enabling a user to search an external domain within a visual mapping interface
US9047388B2 (en) 2004-07-01 2015-06-02 Mindjet Llc System, method, and software application for displaying data from a web service in a visual map
GB0506618D0 (en) * 2005-04-01 2005-05-11 Wine Science Ltd A method of supplying information articles at a website and system for supplying such articles
US20060252775A1 (en) * 2005-05-03 2006-11-09 Henderson Samuel T Methods for reducing levels of disease associated proteins
US7925649B2 (en) * 2005-12-30 2011-04-12 Google Inc. Method, system, and graphical user interface for alerting a computer user to new results for a prior search
US7631263B2 (en) * 2006-06-02 2009-12-08 Scenera Technologies, Llc Methods, systems, and computer program products for characterizing links to resources not activated
US9443022B2 (en) 2006-06-05 2016-09-13 Google Inc. Method, system, and graphical user interface for providing personalized recommendations of popular search queries
US8103703B1 (en) 2006-06-29 2012-01-24 Mindjet Llc System and method for providing content-specific topics in a mind mapping system
US7577718B2 (en) * 2006-07-31 2009-08-18 Microsoft Corporation Adaptive dissemination of personalized and contextually relevant information
US7849079B2 (en) * 2006-07-31 2010-12-07 Microsoft Corporation Temporal ranking of search results
US7685199B2 (en) * 2006-07-31 2010-03-23 Microsoft Corporation Presenting information related to topics extracted from event classes
US8117197B1 (en) * 2008-06-10 2012-02-14 Surf Canyon, Inc. Adaptive user interface for real-time search relevance feedback
EP2095313A4 (en) * 2006-10-27 2011-11-02 Cvon Innovations Ltd PROCESS AND DEVICE FOR SUBSCRIBER MANAGEMENT
EP2082366A2 (en) * 2006-11-01 2009-07-29 CVON Innovations Limited Optimization of advertising campaigns on mobile networks
US8661029B1 (en) 2006-11-02 2014-02-25 Google Inc. Modifying search result ranking based on implicit user feedback
US7734669B2 (en) * 2006-12-22 2010-06-08 Commvault Systems, Inc. Managing copies of data
GB2440990B (en) 2007-01-09 2008-08-06 Cvon Innovations Ltd Message scheduling system
US9405830B2 (en) 2007-02-28 2016-08-02 Aol Inc. Personalization techniques using image clouds
US8892780B2 (en) 2007-03-08 2014-11-18 Oracle International Corporation Management of shared storage I/O resources
US20090077033A1 (en) * 2007-04-03 2009-03-19 Mcgary Faith System and method for customized search engine and search result optimization
WO2008122092A1 (en) * 2007-04-10 2008-10-16 Web Evaluation Pty Ltd System and/or method for evaluating network content
US20080270228A1 (en) * 2007-04-24 2008-10-30 Yahoo! Inc. System for displaying advertisements associated with search results
US9396261B2 (en) 2007-04-25 2016-07-19 Yahoo! Inc. System for serving data that matches content related to a search results page
US20080288310A1 (en) * 2007-05-16 2008-11-20 Cvon Innovation Services Oy Methodologies and systems for mobile marketing and advertising
US8935718B2 (en) * 2007-05-22 2015-01-13 Apple Inc. Advertising management method and system
US7984068B2 (en) * 2007-05-25 2011-07-19 Google Inc. Providing profile information to partner content providers
US7818320B2 (en) * 2007-05-31 2010-10-19 Yahoo! Inc. Enhanced search results based on user feedback relating to search result abstracts
US20080313146A1 (en) * 2007-06-15 2008-12-18 Microsoft Corporation Content search service, finding content, and prefetching for thin client
US8099401B1 (en) * 2007-07-18 2012-01-17 Emc Corporation Efficiently indexing and searching similar data
KR101415022B1 (ko) * 2007-07-24 2014-07-09 삼성전자주식회사 복합 알고리즘 이용한 정보 추천 방법 및 장치
US8505046B2 (en) * 2007-08-17 2013-08-06 At&T Intellectual Property I, L.P. Targeted online, telephone and television advertisements based on cross-service subscriber profiling
GB2452789A (en) 2007-09-05 2009-03-18 Cvon Innovations Ltd Selecting information content for transmission by identifying a keyword in a previous message
US20090089246A1 (en) * 2007-09-28 2009-04-02 Yahoo! Inc. System and method for history clustering
US8965888B2 (en) * 2007-10-08 2015-02-24 Sony Computer Entertainment America Llc Evaluating appropriateness of content
GB2453810A (en) 2007-10-15 2009-04-22 Cvon Innovations Ltd System, Method and Computer Program for Modifying Communications by Insertion of a Targeted Media Content or Advertisement
US8626823B2 (en) * 2007-11-13 2014-01-07 Google Inc. Page ranking system employing user sharing data
US20090132366A1 (en) * 2007-11-15 2009-05-21 Microsoft Corporation Recognizing and crediting offline realization of online behavior
US8464270B2 (en) * 2007-11-29 2013-06-11 Red Hat, Inc. Dependency management with atomic decay
US8832255B2 (en) 2007-11-30 2014-09-09 Red Hat, Inc. Using status inquiry and status response messages to exchange management information
US20090157616A1 (en) * 2007-12-12 2009-06-18 Richard Barber System and method for enabling a user to search and retrieve individual topics in a visual mapping system
US20090157801A1 (en) * 2007-12-12 2009-06-18 Richard Barber System and method for integrating external system data in a visual mapping system
US8161396B2 (en) * 2007-12-20 2012-04-17 Mindjet Llc System and method for facilitating collaboration and communication in a visual mapping system by tracking user presence in individual topics
US7984035B2 (en) * 2007-12-28 2011-07-19 Microsoft Corporation Context-based document search
US7797314B2 (en) * 2007-12-31 2010-09-14 International Business Machines Corporation Adaptive searching
US8775416B2 (en) * 2008-01-09 2014-07-08 Yahoo!Inc. Adapting a context-independent relevance function for identifying relevant search results
US8244721B2 (en) * 2008-02-13 2012-08-14 Microsoft Corporation Using related users data to enhance web search
US20090210391A1 (en) * 2008-02-14 2009-08-20 Hall Stephen G Method and system for automated search for, and retrieval and distribution of, information
EP2105846A1 (en) * 2008-03-28 2009-09-30 Sony Corporation Method of recommending content items
US8751481B2 (en) * 2008-04-16 2014-06-10 Iac Search & Media, Inc. Adaptive multi-channel content selection with behavior-aware query analysis
JP5089482B2 (ja) * 2008-05-12 2012-12-05 キヤノン株式会社 情報処理装置、データ処理方法およびプログラム
KR100987330B1 (ko) * 2008-05-21 2010-10-13 성균관대학교산학협력단 사용자 웹 사용 정보에 기반한 멀티 컨셉 네트워크 생성시스템 및 방법
US8510262B2 (en) * 2008-05-21 2013-08-13 Microsoft Corporation Promoting websites based on location
US8769048B2 (en) 2008-06-18 2014-07-01 Commvault Systems, Inc. Data protection scheduling, such as providing a flexible backup window in a data protection system
US8352954B2 (en) 2008-06-19 2013-01-08 Commvault Systems, Inc. Data storage resource allocation by employing dynamic methods and blacklisting resource request pools
US9128883B2 (en) 2008-06-19 2015-09-08 Commvault Systems, Inc Data storage resource allocation by performing abbreviated resource checks based on relative chances of failure of the data storage resources to determine whether data storage requests would fail
US9183323B1 (en) 2008-06-27 2015-11-10 Google Inc. Suggesting alternative query phrases in query results
US8538958B2 (en) * 2008-07-11 2013-09-17 Satyam Computer Services Limited Of Mayfair Centre System and method for context map generation
US8301437B2 (en) * 2008-07-24 2012-10-30 Yahoo! Inc. Tokenization platform
US20100076786A1 (en) * 2008-08-06 2010-03-25 H.Lee Moffitt Cancer Center And Research Institute, Inc. Computer System and Computer-Implemented Method for Providing Personalized Health Information for Multiple Patients and Caregivers
WO2010022459A1 (en) 2008-08-27 2010-03-04 Rob Chamberlain System and/or method for linking network content
US8725688B2 (en) 2008-09-05 2014-05-13 Commvault Systems, Inc. Image level copy or restore, such as image level restore without knowledge of data object metadata
US20100070474A1 (en) 2008-09-12 2010-03-18 Lad Kamleshkumar K Transferring or migrating portions of data objects, such as block-level data migration or chunk-based data migration
US20100070891A1 (en) * 2008-09-18 2010-03-18 Creekbaum William J System and method for configuring an application via a visual map interface
US9772798B2 (en) * 2008-09-19 2017-09-26 Oracle International Corporation Method and system for implementing workload management by monitoring disk utilizations
EP2350875A1 (en) 2008-09-19 2011-08-03 Oracle International Corporation Storage-side storage request management
US8868831B2 (en) 2009-09-14 2014-10-21 Oracle International Corporation Caching data between a database server and a storage system
US20100082434A1 (en) * 2008-09-29 2010-04-01 Yahoo! Inc. Personalized search results to multiple people
US9064021B2 (en) * 2008-10-02 2015-06-23 Liveramp, Inc. Data source attribution system
US9396455B2 (en) * 2008-11-10 2016-07-19 Mindjet Llc System, method, and software application for enabling a user to view and interact with a visual map in an external application
US10380634B2 (en) * 2008-11-22 2019-08-13 Callidus Software, Inc. Intent inference of website visitors and sales leads package generation
US8645837B2 (en) 2008-11-26 2014-02-04 Red Hat, Inc. Graphical user interface for managing services in a distributed computing system
US8713016B2 (en) 2008-12-24 2014-04-29 Comcast Interactive Media, Llc Method and apparatus for organizing segments of media assets and determining relevance of segments to a query
US11531668B2 (en) 2008-12-29 2022-12-20 Comcast Interactive Media, Llc Merging of multiple data sets
US8386475B2 (en) * 2008-12-30 2013-02-26 Novell, Inc. Attribution analysis and correlation
US8296297B2 (en) * 2008-12-30 2012-10-23 Novell, Inc. Content analysis and correlation
US8301622B2 (en) * 2008-12-30 2012-10-30 Novell, Inc. Identity analysis and correlation
EP2386088A1 (en) * 2009-01-06 2011-11-16 Tynt Multimedia Inc. Systems and methods for detecting network resource interaction and improved search result reporting
US8595228B1 (en) * 2009-01-09 2013-11-26 Google Inc. Preferred sites
US20100185612A1 (en) * 2009-01-13 2010-07-22 Hotchalk Inc. Method for Producing an Ordered Search List
US8352319B2 (en) * 2009-03-10 2013-01-08 Google Inc. Generating user profiles
US8176043B2 (en) * 2009-03-12 2012-05-08 Comcast Interactive Media, Llc Ranking search results
US20100250479A1 (en) * 2009-03-31 2010-09-30 Novell, Inc. Intellectual property discovery and mapping systems and methods
US8185544B2 (en) * 2009-04-08 2012-05-22 Google Inc. Generating improved document classification data using historical search results
US20120046995A1 (en) 2009-04-29 2012-02-23 Waldeck Technology, Llc Anonymous crowd comparison
US8122041B2 (en) * 2009-05-08 2012-02-21 Microsoft Corporation Sharing and collaboration of search findings
US20100318538A1 (en) * 2009-06-12 2010-12-16 Google Inc. Predictive searching and associated cache management
US20110153425A1 (en) * 2009-06-21 2011-06-23 James Mercs Knowledge based search engine
US20100331075A1 (en) * 2009-06-26 2010-12-30 Microsoft Corporation Using game elements to motivate learning
US8979538B2 (en) * 2009-06-26 2015-03-17 Microsoft Technology Licensing, Llc Using game play elements to motivate learning
US8392267B1 (en) 2009-06-30 2013-03-05 Mindjet Llc System, method, and software application for dynamically generating a link to an online procurement site within a software application
US8635255B2 (en) * 2009-06-30 2014-01-21 Verizon Patent And Licensing Inc. Methods and systems for automatically customizing an interaction experience of a user with a media content application
US9892730B2 (en) 2009-07-01 2018-02-13 Comcast Interactive Media, Llc Generating topic-specific language models
US8135735B2 (en) 2009-07-10 2012-03-13 Geodex, Llc Computerized system and method for tracking the geographic relevance of website listings and providing graphics and data regarding the same
US8280869B1 (en) * 2009-07-10 2012-10-02 Teradata Us, Inc. Sharing intermediate results
US9201973B2 (en) * 2009-07-10 2015-12-01 Geodex Llc Computerized system and method for tracking the geographic relevance of website listings and providing graphics and data regarding the same
US9213776B1 (en) 2009-07-17 2015-12-15 Open Invention Network, Llc Method and system for searching network resources to locate content
US20110015921A1 (en) * 2009-07-17 2011-01-20 Minerva Advisory Services, Llc System and method for using lingual hierarchy, connotation and weight of authority
US20110035375A1 (en) * 2009-08-06 2011-02-10 Ron Bekkerman Building user profiles for website personalization
US8620929B2 (en) * 2009-08-14 2013-12-31 Google Inc. Context based resource relevance
CN101996215B (zh) * 2009-08-27 2013-07-24 阿里巴巴集团控股有限公司 一种应用于电子商务网站的信息匹配方法和系统
US8498974B1 (en) 2009-08-31 2013-07-30 Google Inc. Refining search results
KR20110031087A (ko) * 2009-09-18 2011-03-24 인터내셔널 비지네스 머신즈 코포레이션 링크 클라우드 및 사용자/커뮤니티로 구동되는 자원의 동적 인터링크 방법
US8990083B1 (en) 2009-09-30 2015-03-24 Cisco Technology, Inc. System and method for generating personal vocabulary from network data
US9201965B1 (en) 2009-09-30 2015-12-01 Cisco Technology, Inc. System and method for providing speech recognition using personal vocabulary in a network environment
US8972391B1 (en) * 2009-10-02 2015-03-03 Google Inc. Recent interest based relevance scoring
US8204892B2 (en) * 2009-10-26 2012-06-19 Oracle International Corporation Performance boost for sort operations
US20110106885A1 (en) * 2009-10-29 2011-05-05 Cisco Technology, Inc. Methods and apparatus for supporting multiple party login into a single session
US8473512B2 (en) 2009-11-06 2013-06-25 Waldeck Technology, Llc Dynamic profile slice
US8805838B1 (en) * 2009-12-22 2014-08-12 Amazon Technologies, Inc. Systems and methods for automatic item classification
US20120063367A1 (en) 2009-12-22 2012-03-15 Waldeck Technology, Llc Crowd and profile based communication addresses
US8849785B1 (en) * 2010-01-15 2014-09-30 Google Inc. Search query reformulation using result term occurrence count
US8301364B2 (en) 2010-01-27 2012-10-30 Navteq B.V. Method of operating a navigation system to provide geographic location information
US8732171B2 (en) * 2010-01-28 2014-05-20 Microsoft Corporation Providing query suggestions
US20110191171A1 (en) * 2010-02-03 2011-08-04 Yahoo! Inc. Search engine output-associated bidding in online advertising
TWI616761B (zh) * 2010-03-09 2018-03-01 Alibaba Group Holding Ltd Information matching method and system applied to e-commerce website
US8620849B2 (en) * 2010-03-10 2013-12-31 Lockheed Martin Corporation Systems and methods for facilitating open source intelligence gathering
US9645996B1 (en) 2010-03-25 2017-05-09 Open Invention Network Llc Method and device for automatically generating a tag from a conversation in a social networking website
US8930351B1 (en) * 2010-03-31 2015-01-06 Google Inc. Grouping of users
US9317613B2 (en) * 2010-04-21 2016-04-19 Yahoo! Inc. Large scale entity-specific resource classification
US20110264796A1 (en) * 2010-04-23 2011-10-27 Ganz Search and navigational rating system for online social environment
US20110270850A1 (en) * 2010-04-30 2011-11-03 Microsoft Corporation Prioritization of Resources based on User Activities
US9697500B2 (en) 2010-05-04 2017-07-04 Microsoft Technology Licensing, Llc Presentation of information describing user activities with regard to resources
US8898217B2 (en) 2010-05-06 2014-11-25 Apple Inc. Content delivery based on user terminal events
US8935274B1 (en) 2010-05-12 2015-01-13 Cisco Technology, Inc System and method for deriving user expertise based on data propagating in a network environment
US8370330B2 (en) 2010-05-28 2013-02-05 Apple Inc. Predicting content and context performance based on performance history of users
US8504419B2 (en) * 2010-05-28 2013-08-06 Apple Inc. Network-based targeted content delivery based on queue adjustment factors calculated using the weighted combination of overall rank, context, and covariance scores for an invitational content item
EP2397952A1 (en) * 2010-06-15 2011-12-21 Axel Springer Digital TV Guide GmbH Profile based content retrieval for recommender systems
US9623119B1 (en) 2010-06-29 2017-04-18 Google Inc. Accentuating search results
US8515980B2 (en) * 2010-07-16 2013-08-20 Ebay Inc. Method and system for ranking search results based on categories
US9020922B2 (en) * 2010-08-10 2015-04-28 Brightedge Technologies, Inc. Search engine optimization at scale
US8640032B2 (en) 2010-08-31 2014-01-28 Apple Inc. Selection and delivery of invitational content based on prediction of user intent
US8510309B2 (en) 2010-08-31 2013-08-13 Apple Inc. Selection and delivery of invitational content based on prediction of user interest
US8577915B2 (en) * 2010-09-10 2013-11-05 Veveo, Inc. Method of and system for conducting personalized federated search and presentation of results therefrom
CN101957847B (zh) * 2010-09-21 2011-11-23 百度在线网络技术(北京)有限公司 一种搜索系统及其实现方法
US8364672B2 (en) 2010-11-23 2013-01-29 Microsoft Corporation Concept disambiguation via search engine search results
US8332426B2 (en) * 2010-11-23 2012-12-11 Microsoft Corporation Indentifying referring expressions for concepts
US20120158712A1 (en) * 2010-12-16 2012-06-21 Sushrut Karanjkar Inferring Geographic Locations for Entities Appearing in Search Queries
US8667169B2 (en) 2010-12-17 2014-03-04 Cisco Technology, Inc. System and method for providing argument maps based on activity in a network environment
US9465795B2 (en) 2010-12-17 2016-10-11 Cisco Technology, Inc. System and method for providing feeds based on activity in a network environment
US20120166428A1 (en) * 2010-12-22 2012-06-28 Yahoo! Inc Method and system for improving quality of web content
US8972412B1 (en) * 2011-01-31 2015-03-03 Go Daddy Operating Company, LLC Predicting improvement in website search engine rankings based upon website linking relationships
US8370365B1 (en) 2011-01-31 2013-02-05 Go Daddy Operating Company, LLC Tools for predicting improvement in website search engine rankings based upon website linking relationships
US8996495B2 (en) * 2011-02-15 2015-03-31 Ebay Inc. Method and system for ranking search results based on category demand normalized using impressions
US8849762B2 (en) 2011-03-31 2014-09-30 Commvault Systems, Inc. Restoring computing environments, such as autorecovery of file systems at certain points in time
US8620136B1 (en) 2011-04-30 2013-12-31 Cisco Technology, Inc. System and method for media intelligent recording in a network environment
US11841912B2 (en) 2011-05-01 2023-12-12 Twittle Search Limited Liability Company System for applying natural language processing and inputs of a group of users to infer commonly desired search results
US20120278318A1 (en) * 2011-05-01 2012-11-01 Reznik Alan M Systems and methods for facilitating enhancements to electronic group searches
US9477574B2 (en) 2011-05-12 2016-10-25 Microsoft Technology Licensing, Llc Collection of intranet activity data
US8819009B2 (en) 2011-05-12 2014-08-26 Microsoft Corporation Automatic social graph calculation
US8909624B2 (en) 2011-05-31 2014-12-09 Cisco Technology, Inc. System and method for evaluating results of a search query in a network environment
US9552425B2 (en) * 2011-06-02 2017-01-24 Ebay Inc. System and method for determining query aspects at appropriate category levels
US9298776B2 (en) * 2011-06-08 2016-03-29 Ebay Inc. System and method for mining category aspect information
US8812483B2 (en) * 2011-06-21 2014-08-19 Julien Bieren System and method for optimizing web searching and scheduling of service providers
US10346856B1 (en) * 2011-07-08 2019-07-09 Microsoft Technology Licensing, Llc Personality aggregation and web browsing
US8886797B2 (en) * 2011-07-14 2014-11-11 Cisco Technology, Inc. System and method for deriving user expertise based on data propagating in a network environment
US9185152B2 (en) * 2011-08-25 2015-11-10 Ustream, Inc. Bidirectional communication on live multimedia broadcasts
US8954423B2 (en) * 2011-09-06 2015-02-10 Microsoft Technology Licensing, Llc Using reading levels in responding to requests
KR101783721B1 (ko) * 2011-09-27 2017-10-11 네이버 주식회사 대역 ip를 이용한 집단 타겟팅 시스템 및 그 방법
US8751591B2 (en) 2011-09-30 2014-06-10 Blackberry Limited Systems and methods of adjusting contact importance for a computing device
US9189550B2 (en) * 2011-11-17 2015-11-17 Microsoft Technology Licensing, Llc Query refinement in a browser toolbar
US8898164B1 (en) * 2011-11-17 2014-11-25 Quantcast Corporation Consumption history privacy
EP2639714A4 (en) * 2011-12-13 2015-03-04 Nec Corp INFORMATION COLLECTION DEVICE, SYSTEM, METHOD, AND PROGRAM
US9292504B2 (en) * 2011-12-15 2016-03-22 Verizon Patent And Licensing Inc. Context generation from active viewing region for context sensitive searching
US8862597B2 (en) * 2011-12-27 2014-10-14 Sap Portals Israel Ltd Providing contextually-relevant content
US8983948B1 (en) * 2011-12-29 2015-03-17 Google Inc. Providing electronic content based on a composition of a social network
CN103186619B (zh) * 2011-12-30 2018-08-07 北京百度网讯科技有限公司 一种基于非点击操作信息的评价搜索结果的方法与设备
US8930339B2 (en) * 2012-01-03 2015-01-06 Microsoft Corporation Search engine performance evaluation using a task-based assessment metric
DE102012100470A1 (de) * 2012-01-20 2013-07-25 Nektoon Ag Verfahren zur Zusammenstellung von Dokumenten
US9201964B2 (en) 2012-01-23 2015-12-01 Microsoft Technology Licensing, Llc Identifying related entities
US8831403B2 (en) 2012-02-01 2014-09-09 Cisco Technology, Inc. System and method for creating customized on-demand video reports in a network environment
US20130204863A1 (en) * 2012-02-04 2013-08-08 Rod Rigole System and Method for Displaying Search Results
US9311650B2 (en) 2012-02-22 2016-04-12 Alibaba Group Holding Limited Determining search result rankings based on trust level values associated with sellers
US10147146B2 (en) * 2012-03-14 2018-12-04 Disney Enterprises, Inc. Tailoring social elements of virtual environments
US10157184B2 (en) 2012-03-30 2018-12-18 Commvault Systems, Inc. Data previewing before recalling large data files
WO2013149220A1 (en) * 2012-03-30 2013-10-03 Xen, Inc. Centralized tracking of user interest information from distributed information sources
US20130297590A1 (en) * 2012-04-09 2013-11-07 Eli Zukovsky Detecting and presenting information to a user based on relevancy to the user's personal interest
US20130290458A1 (en) * 2012-04-30 2013-10-31 Margaret E. Morris Contextual peer based guidance systems and methods
US8930392B1 (en) * 2012-06-05 2015-01-06 Google Inc. Simulated annealing in recommendation systems
US20130332521A1 (en) * 2012-06-07 2013-12-12 United Video Properties, Inc. Systems and methods for compiling media information based on privacy and reliability metrics
US9141504B2 (en) 2012-06-28 2015-09-22 Apple Inc. Presenting status data received from multiple devices
US9535996B1 (en) 2012-08-30 2017-01-03 deviantArt, Inc. Selecting content objects for recommendation based on content object collections
US8938438B2 (en) 2012-10-11 2015-01-20 Go Daddy Operating Company, LLC Optimizing search engine ranking by recommending content including frequently searched questions
DE102013017085A1 (de) * 2012-10-15 2014-04-17 Wixpress Ltd. System für eine tiefe Verknüpfung und Suchmaschinenunterstützung für Webseiten, in die eine Drittanwendung und Komponenten integriert sind
US9779140B2 (en) * 2012-11-16 2017-10-03 Google Inc. Ranking signals for sparse corpora
US9633216B2 (en) 2012-12-27 2017-04-25 Commvault Systems, Inc. Application of information management policies based on operation with a geographic entity
US9459968B2 (en) 2013-03-11 2016-10-04 Commvault Systems, Inc. Single index to query multiple backup formats
US20140280576A1 (en) * 2013-03-14 2014-09-18 Google Inc. Determining activities relevant to groups of individuals
US10152500B2 (en) 2013-03-14 2018-12-11 Oracle International Corporation Read mostly instances
US10356461B2 (en) 2013-03-15 2019-07-16 adRise, Inc. Adaptive multi-device content generation based on associated internet protocol addressing
US20140278993A1 (en) * 2013-03-15 2014-09-18 adRise, Inc. Interactive advertising
US9588675B2 (en) 2013-03-15 2017-03-07 Google Inc. Document scale and position optimization
US10887421B2 (en) 2013-03-15 2021-01-05 Tubi, Inc. Relevant secondary-device content generation based on associated internet protocol addressing
US10594763B2 (en) 2013-03-15 2020-03-17 adRise, Inc. Platform-independent content generation for thin client applications
CN103441860A (zh) * 2013-04-16 2013-12-11 阿里巴巴集团控股有限公司 一种互联网业务的推荐方法以及装置
US9405803B2 (en) 2013-04-23 2016-08-02 Google Inc. Ranking signals in mixed corpora environments
CN104156359B (zh) * 2013-05-13 2018-10-30 腾讯科技(深圳)有限公司 内链信息推荐方法及装置
US20160117391A1 (en) * 2013-05-16 2016-04-28 Yandex Europe Ag Presentation of ranked image query results to a client
US9195703B1 (en) 2013-06-27 2015-11-24 Google Inc. Providing context-relevant information to users
US9330209B1 (en) * 2013-07-09 2016-05-03 Quantcast Corporation Characterizing an entity in an identifier space based on behaviors of unrelated entities in a different identifier space
US20150212710A1 (en) * 2013-10-10 2015-07-30 Go Daddy Operating Company, LLC Card interface for managing domain search results
US9729327B2 (en) 2013-10-29 2017-08-08 International Business Machines Corporation Computer-based optimization of digital signature generation for records based on eventual selection criteria for products and services
US9767178B2 (en) 2013-10-30 2017-09-19 Oracle International Corporation Multi-instance redo apply
CN103810241B (zh) * 2013-11-22 2017-04-05 北京奇虎科技有限公司 一种低频点击的过滤方法和装置
US9465878B2 (en) 2014-01-17 2016-10-11 Go Daddy Operating Company, LLC System and method for depicting backlink metrics for a website
US9460219B2 (en) * 2014-02-03 2016-10-04 Gogobot, Inc. Selection and rating of locations and related content based on user categorization
US9852208B2 (en) * 2014-02-25 2017-12-26 International Business Machines Corporation Discovering communities and expertise of users using semantic analysis of resource access logs
US9798596B2 (en) 2014-02-27 2017-10-24 Commvault Systems, Inc. Automatic alert escalation for an information management system
US9648100B2 (en) 2014-03-05 2017-05-09 Commvault Systems, Inc. Cross-system storage management for transferring data across autonomous information management systems
US20150271211A1 (en) * 2014-03-21 2015-09-24 Konica Minolta Laboratory U.S.A., Inc. Rights management policies with nontraditional rights control
US9823978B2 (en) 2014-04-16 2017-11-21 Commvault Systems, Inc. User-level quota management of data objects stored in information management systems
US9740574B2 (en) 2014-05-09 2017-08-22 Commvault Systems, Inc. Load balancing across multiple data paths
US9582482B1 (en) 2014-07-11 2017-02-28 Google Inc. Providing an annotation linking related entities in onscreen content
US11249858B2 (en) 2014-08-06 2022-02-15 Commvault Systems, Inc. Point-in-time backups of a production application made accessible over fibre channel and/or ISCSI as data sources to a remote application by representing the backups as pseudo-disks operating apart from the production application and its host
US9852026B2 (en) 2014-08-06 2017-12-26 Commvault Systems, Inc. Efficient application recovery in an information management system based on a pseudo-storage-device driver
US9965559B2 (en) 2014-08-21 2018-05-08 Google Llc Providing automatic actions for mobile onscreen content
US10489407B2 (en) * 2014-09-19 2019-11-26 Ebay Inc. Dynamic modifications of results for search interfaces
US11250081B1 (en) * 2014-09-24 2022-02-15 Amazon Technologies, Inc. Predictive search
US9444811B2 (en) 2014-10-21 2016-09-13 Commvault Systems, Inc. Using an enhanced data agent to restore backed up data across autonomous storage management systems
US9922117B2 (en) 2014-10-31 2018-03-20 Bank Of America Corporation Contextual search input from advisors
US9940409B2 (en) 2014-10-31 2018-04-10 Bank Of America Corporation Contextual search tool
US9785304B2 (en) 2014-10-31 2017-10-10 Bank Of America Corporation Linking customer profiles with household profiles
CN104361092A (zh) * 2014-11-18 2015-02-18 百度在线网络技术(北京)有限公司 搜索方法及装置
CN104462357B (zh) * 2014-12-08 2017-11-17 百度在线网络技术(北京)有限公司 实现个性化搜索的方法和装置
US10127285B2 (en) * 2015-07-22 2018-11-13 Ariba, Inc. Customizable ranking of search engine results in multi-tenant architecture
US9766825B2 (en) 2015-07-22 2017-09-19 Commvault Systems, Inc. Browse and restore for block-level backups
US10061817B1 (en) 2015-07-29 2018-08-28 Google Llc Social ranking for apps
US10715612B2 (en) * 2015-09-15 2020-07-14 Oath Inc. Identifying users' identity through tracking common activity
US10970646B2 (en) 2015-10-01 2021-04-06 Google Llc Action suggestions for user-selected content
US10678788B2 (en) 2015-10-22 2020-06-09 Oracle International Corporation Columnar caching in tiered storage
US10747752B2 (en) 2015-10-23 2020-08-18 Oracle International Corporation Space management for transactional consistency of in-memory objects on a standby database
US11657037B2 (en) 2015-10-23 2023-05-23 Oracle International Corporation Query execution against an in-memory standby database
US10055390B2 (en) 2015-11-18 2018-08-21 Google Llc Simulated hyperlinks on a mobile device based on user intent and a centered selection of text
ITUB20156079A1 (it) 2015-12-02 2017-06-02 Torino Politecnico Metodo per individuare i servizi di web tracking
US10296368B2 (en) 2016-03-09 2019-05-21 Commvault Systems, Inc. Hypervisor-independent block-level live browse for access to backed up virtual machine (VM) data and hypervisor-free file-level recovery (block-level pseudo-mount)
KR102604450B1 (ko) * 2016-08-03 2023-11-22 삼성전자주식회사 키워드를 기초로 접속 기록을 저장하는 방법 및 장치
US10698771B2 (en) 2016-09-15 2020-06-30 Oracle International Corporation Zero-data-loss with asynchronous redo shipping to a standby database
US10535005B1 (en) 2016-10-26 2020-01-14 Google Llc Providing contextual actions for mobile onscreen content
US10891291B2 (en) 2016-10-31 2021-01-12 Oracle International Corporation Facilitating operations on pluggable databases using separate logical timestamp services
US20180137179A1 (en) * 2016-11-15 2018-05-17 Cofame, Inc. Systems and methods for digital presence profiler service
US11475006B2 (en) 2016-12-02 2022-10-18 Oracle International Corporation Query and change propagation scheduling for heterogeneous database systems
US11237696B2 (en) 2016-12-19 2022-02-01 Google Llc Smart assist for repeated actions
US10838821B2 (en) 2017-02-08 2020-11-17 Commvault Systems, Inc. Migrating content and metadata from a backup system
US10740193B2 (en) 2017-02-27 2020-08-11 Commvault Systems, Inc. Hypervisor-independent reference copies of virtual machine payload data based on block-level pseudo-mount
US10891069B2 (en) 2017-03-27 2021-01-12 Commvault Systems, Inc. Creating local copies of data stored in online data repositories
US10776329B2 (en) 2017-03-28 2020-09-15 Commvault Systems, Inc. Migration of a database management system to cloud storage
US11074140B2 (en) 2017-03-29 2021-07-27 Commvault Systems, Inc. Live browsing of granular mailbox data
US10423638B2 (en) 2017-04-27 2019-09-24 Google Llc Cloud inference system
US20180336280A1 (en) * 2017-05-17 2018-11-22 Linkedin Corporation Customized search based on user and team activities
US10691722B2 (en) 2017-05-31 2020-06-23 Oracle International Corporation Consistent query execution for big data analytics in a hybrid database
US10664352B2 (en) 2017-06-14 2020-05-26 Commvault Systems, Inc. Live browsing of backed up data residing on cloned disks
US10489425B2 (en) * 2017-10-26 2019-11-26 Salesforce.Com, Inc. User clustering based on query history
US10795927B2 (en) 2018-02-05 2020-10-06 Commvault Systems, Inc. On-demand metadata extraction of clinical image data
US11023551B2 (en) * 2018-02-23 2021-06-01 Accenture Global Solutions Limited Document processing based on proxy logs
CN110232281B (zh) * 2018-03-05 2023-07-04 现代自动车株式会社 充分利用自然语言处理改进集合内的访问控制
US11501006B2 (en) 2018-03-05 2022-11-15 Hyundai Motor Company Leveraging natural language processing to refine access control within collections
US10789387B2 (en) 2018-03-13 2020-09-29 Commvault Systems, Inc. Graphical representation of an information management system
US11216786B2 (en) * 2018-07-17 2022-01-04 Kavita Ramchandani Snyder System and method for dispatching intelligent invitations to users within a network
US11308427B2 (en) * 2018-09-28 2022-04-19 Evernote Corporation Event transcript presentation
US11170002B2 (en) 2018-10-19 2021-11-09 Oracle International Corporation Integrating Kafka data-in-motion with data-at-rest tables
US10860443B2 (en) 2018-12-10 2020-12-08 Commvault Systems, Inc. Evaluation and reporting of recovery readiness in a data storage management system
US11500930B2 (en) * 2019-05-28 2022-11-15 Slack Technologies, Llc Method, apparatus and computer program product for generating tiered search index fields in a group-based communication platform
US11308034B2 (en) 2019-06-27 2022-04-19 Commvault Systems, Inc. Continuously run log backup with minimal configuration and resource usage from the source machine
US11218443B2 (en) 2019-07-25 2022-01-04 Coupang Corp. Dynamic IP address categorization systems and methods
JPWO2021039372A1 (zh) * 2019-08-29 2021-03-04
US11061980B2 (en) * 2019-09-18 2021-07-13 Capital One Services, Llc System and method for integrating content into webpages
US11379532B2 (en) 2019-10-17 2022-07-05 The Toronto-Dominion Bank System and method for generating a recommendation
US11507576B2 (en) * 2020-05-20 2022-11-22 T-Mobile Usa, Inc. Method and system to efficiently analyze and improve database queries
US10987592B1 (en) 2020-06-05 2021-04-27 12traits, Inc. Systems and methods to correlate user behavior patterns within an online game with psychological attributes of users
US20220121549A1 (en) * 2020-10-16 2022-04-21 Oath Inc. Systems and methods for rendering unified and real-time user interest profiles
US11775599B2 (en) * 2020-11-10 2023-10-03 Shopify Inc. System and method for displaying customized search results based on past behaviour
US11206263B1 (en) * 2021-01-25 2021-12-21 12traits, Inc. Systems and methods to determine content to present based on interaction information of a given user
US11727424B2 (en) 2021-06-04 2023-08-15 Solsten, Inc. Systems and methods to correlate user behavior patterns within digital application environments with psychological attributes of users to determine adaptations to the digital application environments
WO2023019089A1 (en) * 2021-08-11 2023-02-16 Google Llc User interfaces for surfacing web browser history data

Family Cites Families (87)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5724567A (en) 1994-04-25 1998-03-03 Apple Computer, Inc. System for directing relevance-ranked data objects to computer users
US6460036B1 (en) * 1994-11-29 2002-10-01 Pinpoint Incorporated System and method for providing customized electronic newspapers and target advertisements
US5758257A (en) 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US6092049A (en) * 1995-06-30 2000-07-18 Microsoft Corporation Method and apparatus for efficiently recommending items using automated collaborative filtering and feature-guided automated collaborative filtering
US6314420B1 (en) * 1996-04-04 2001-11-06 Lycos, Inc. Collaborative/adaptive search engine
US5790426A (en) * 1996-04-30 1998-08-04 Athenium L.L.C. Automated collaborative filtering system
US6285999B1 (en) 1997-01-10 2001-09-04 The Board Of Trustees Of The Leland Stanford Junior University Method for node ranking in a linked database
US6012051A (en) 1997-02-06 2000-01-04 America Online, Inc. Consumer profiling system with analytic decision processor
US6182068B1 (en) * 1997-08-01 2001-01-30 Ask Jeeves, Inc. Personalized search methods
US5974412A (en) * 1997-09-24 1999-10-26 Sapient Health Network Intelligent query system for automatically indexing information in a database and automatically categorizing users
US6421675B1 (en) 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
US6317722B1 (en) 1998-09-18 2001-11-13 Amazon.Com, Inc. Use of electronic shopping carts to generate personal recommendations
US6338066B1 (en) 1998-09-25 2002-01-08 International Business Machines Corporation Surfaid predictor: web-based system for predicting surfer behavior
US6845370B2 (en) * 1998-11-12 2005-01-18 Accenture Llp Advanced information gathering for targeted activities
US6385619B1 (en) 1999-01-08 2002-05-07 International Business Machines Corporation Automatic user interest profile generation from structured document access information
US6907566B1 (en) 1999-04-02 2005-06-14 Overture Services, Inc. Method and system for optimum placement of advertisements on a webpage
US6327590B1 (en) 1999-05-05 2001-12-04 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis
US6493702B1 (en) 1999-05-05 2002-12-10 Xerox Corporation System and method for searching and recommending documents in a collection using share bookmarks
US6606657B1 (en) * 1999-06-22 2003-08-12 Comverse, Ltd. System and method for processing and presenting internet usage information
AUPQ246899A0 (en) * 1999-08-26 1999-09-16 Memetrics An automated communications management agent
US6807574B1 (en) * 1999-10-22 2004-10-19 Tellme Networks, Inc. Method and apparatus for content personalization over a telephone interface
US6978303B1 (en) * 1999-10-26 2005-12-20 Iontal Limited Monitoring of computer usage
US6489968B1 (en) 1999-11-18 2002-12-03 Amazon.Com, Inc. System and method for exposing popular categories of browse tree
EP1107128A1 (en) 1999-12-03 2001-06-13 Hyundai Electronics Industries Co., Ltd. Apparatus and method for checking the validity of links in a computer network
US6785671B1 (en) * 1999-12-08 2004-08-31 Amazon.Com, Inc. System and method for locating web-based product offerings
JP3630057B2 (ja) * 2000-01-26 2005-03-16 日本電気株式会社 検索用データ構造構築方法、その装置、及び機械可読プログラム記録媒体
US6868525B1 (en) 2000-02-01 2005-03-15 Alberti Anemometer Llc Computer graphic display visualization system and method
IL134893A0 (en) * 2000-03-06 2001-05-20 Joinweb Inc Method and system for locating internet users having similar navigation patterns
WO2001071525A1 (en) * 2000-03-23 2001-09-27 Tingo Inc. System and method for managing user-specific data
US7725525B2 (en) * 2000-05-09 2010-05-25 James Duncan Work Method and apparatus for internet-based human network brokering
US20020091736A1 (en) * 2000-06-23 2002-07-11 Decis E-Direct, Inc. Component models
US6535888B1 (en) 2000-07-19 2003-03-18 Oxelis, Inc. Method and system for providing a visual search directory
US6687696B2 (en) 2000-07-26 2004-02-03 Recommind Inc. System and method for personalized search, information filtering, and for generating recommendations utilizing statistical latent class models
US6895406B2 (en) 2000-08-25 2005-05-17 Seaseer R&D, Llc Dynamic personalization method of creating personalized user profiles for searching a database of information
US6959319B1 (en) * 2000-09-11 2005-10-25 International Business Machines Corporation System and method for automatically personalizing web portals and web services based upon usage history
JP5525673B2 (ja) * 2000-09-28 2014-06-18 オラクル・インターナショナル・コーポレイション エンタープライズウェブマイニングシステム及び方法
JP3934325B2 (ja) 2000-10-31 2007-06-20 株式会社日立製作所 文書検索方法、文書検索装置及び文書検索プログラムの記憶媒体
US20020138331A1 (en) * 2001-02-05 2002-09-26 Hosea Devin F. Method and system for web page personalization
US8001118B2 (en) 2001-03-02 2011-08-16 Google Inc. Methods and apparatus for employing usage statistics in document retrieval
US7194454B2 (en) * 2001-03-12 2007-03-20 Lucent Technologies Method for organizing records of database search activity by topical relevance
US20020198882A1 (en) 2001-03-29 2002-12-26 Linden Gregory D. Content personalization based on actions performed during a current browsing session
US7165105B2 (en) * 2001-07-16 2007-01-16 Netgenesis Corporation System and method for logical view analysis and visualization of user behavior in a distributed computer network
US7207062B2 (en) * 2001-08-16 2007-04-17 Lucent Technologies Inc Method and apparatus for protecting web sites from distributed denial-of-service attacks
US6732092B2 (en) * 2001-09-28 2004-05-04 Client Dynamics, Inc. Method and system for database queries and information delivery
US6801917B2 (en) * 2001-11-13 2004-10-05 Koninklijke Philips Electronics N.V. Method and apparatus for partitioning a plurality of items into groups of similar items in a recommender of such items
US7567953B2 (en) * 2002-03-01 2009-07-28 Business Objects Americas System and method for retrieving and organizing information from disparate computer network information sources
US8095589B2 (en) * 2002-03-07 2012-01-10 Compete, Inc. Clickstream analysis methods and systems
US7203909B1 (en) * 2002-04-04 2007-04-10 Microsoft Corporation System and methods for constructing personalized context-sensitive portal pages or views by analyzing patterns of users' information access activities
US6917938B2 (en) * 2002-05-06 2005-07-12 Ideapivot Corporation Collaborative context information management system
US6892198B2 (en) 2002-06-14 2005-05-10 Entopia, Inc. System and method for personalized information retrieval based on user expertise
US20040044571A1 (en) 2002-08-27 2004-03-04 Bronnimann Eric Robert Method and system for providing advertising listing variance in distribution feeds over the internet to maximize revenue to the advertising distributor
US7836391B2 (en) 2003-06-10 2010-11-16 Google Inc. Document search engine including highlighting of confident results
US7363302B2 (en) 2003-06-30 2008-04-22 Googole, Inc. Promoting and/or demoting an advertisement from an advertising spot of one type to an advertising spot of another type
US7505964B2 (en) * 2003-09-12 2009-03-17 Google Inc. Methods and systems for improving a search ranking using related queries
US7610381B2 (en) * 2003-09-12 2009-10-27 Hewlett-Packard Development Company, L.P. System and method for evaluating a capacity of a streaming media server for supporting a workload
US7606798B2 (en) * 2003-09-22 2009-10-20 Google Inc. Methods and systems for improving a search ranking using location awareness
US20050071328A1 (en) 2003-09-30 2005-03-31 Lawrence Stephen R. Personalization of web search
US7797316B2 (en) 2003-09-30 2010-09-14 Google Inc. Systems and methods for determining document freshness
US7346839B2 (en) 2003-09-30 2008-03-18 Google Inc. Information retrieval based on historical data
US7693827B2 (en) 2003-09-30 2010-04-06 Google Inc. Personalization of placed content ordering in search results
US20050096997A1 (en) * 2003-10-31 2005-05-05 Vivek Jain Targeting shoppers in an online shopping environment
US20050108406A1 (en) * 2003-11-07 2005-05-19 Dynalab Inc. System and method for dynamically generating a customized menu page
US7240049B2 (en) * 2003-11-12 2007-07-03 Yahoo! Inc. Systems and methods for search query processing using trend analysis
US7634472B2 (en) 2003-12-01 2009-12-15 Yahoo! Inc. Click-through re-ranking of images and other data
US7885901B2 (en) * 2004-01-29 2011-02-08 Yahoo! Inc. Method and system for seeding online social network contacts
US8631001B2 (en) 2004-03-31 2014-01-14 Google Inc. Systems and methods for weighting a search query result
US20050246391A1 (en) * 2004-04-29 2005-11-03 Gross John N System & method for monitoring web pages
US20070067297A1 (en) * 2004-04-30 2007-03-22 Kublickis Peter J System and methods for a micropayment-enabled marketplace with permission-based, self-service, precision-targeted delivery of advertising, entertainment and informational content and relationship marketing to anonymous internet users
US7562068B2 (en) 2004-06-30 2009-07-14 Microsoft Corporation System and method for ranking search results based on tracked user preferences
US7716219B2 (en) 2004-07-08 2010-05-11 Yahoo ! Inc. Database search system and method of determining a value of a keyword in a search
US7580929B2 (en) * 2004-07-26 2009-08-25 Google Inc. Phrase-based personalization of searches in an information retrieval system
WO2006011819A1 (en) * 2004-07-30 2006-02-02 Eurekster, Inc. Adaptive search engine
US8255413B2 (en) * 2004-08-19 2012-08-28 Carhamm Ltd., Llc Method and apparatus for responding to request for information-personalization
WO2006021088A1 (en) * 2004-08-26 2006-03-02 Omnibranch Wireless Solutions, Inc. Opt-in directory of verified individual profiles
US20060064411A1 (en) 2004-09-22 2006-03-23 William Gross Search engine using user intent
US20060074883A1 (en) 2004-10-05 2006-04-06 Microsoft Corporation Systems, methods, and interfaces for providing personalized search and information access
US20060112079A1 (en) * 2004-11-23 2006-05-25 International Business Machines Corporation System and method for generating personalized web pages
US20060161553A1 (en) * 2005-01-19 2006-07-20 Tiny Engine, Inc. Systems and methods for providing user interaction based profiles
US8812473B1 (en) * 2005-06-16 2014-08-19 Gere Dev. Applications, LLC Analysis and reporting of collected search activity data over multiple search engines
US20070005646A1 (en) * 2005-06-30 2007-01-04 Microsoft Corporation Analysis of topic dynamics of web search
US7831582B1 (en) * 2005-08-23 2010-11-09 Amazon Technologies, Inc. Method and system for associating keywords with online content sources
US7756855B2 (en) * 2006-10-11 2010-07-13 Collarity, Inc. Search phrase refinement by search term replacement
US7580930B2 (en) * 2005-12-27 2009-08-25 Baynote, Inc. Method and apparatus for predicting destinations in a navigation context based upon observed usage patterns
US20070260597A1 (en) 2006-05-02 2007-11-08 Mark Cramer Dynamic search engine results employing user behavior
US7617208B2 (en) * 2006-09-12 2009-11-10 Yahoo! Inc. User query data mining and related techniques
US20080147659A1 (en) * 2006-12-15 2008-06-19 Ratepoint, Inc. System and method for determining behavioral similarity between users and user data to identify groups to share user impressions of ratable objects
US7734641B2 (en) * 2007-05-25 2010-06-08 Peerset, Inc. Recommendation systems and methods using interest correlation

Also Published As

Publication number Publication date
US20070233671A1 (en) 2007-10-04
US20120089598A1 (en) 2012-04-12
WO2007115217A2 (en) 2007-10-11
US8078607B2 (en) 2011-12-13
US20070239680A1 (en) 2007-10-11
EP2005339A2 (en) 2008-12-24
WO2007115217A3 (en) 2008-01-03
CN101454780A (zh) 2009-06-10

Similar Documents

Publication Publication Date Title
CN101454780B (zh) 基于监视用户行为生成网站简档的方法
US7693827B2 (en) Personalization of placed content ordering in search results
US9396238B2 (en) Systems and methods for determining user preferences
US9390144B2 (en) Objective and subjective ranking of comments
CN102246167B (zh) 提供搜索结果
US8321278B2 (en) Targeted advertisements based on user profiles and page profile
JP4638439B2 (ja) ウェブ検索の個人化
US20090228774A1 (en) System for coordinating the presentation of digital content data feeds
US7107264B2 (en) Content bridge for associating host content and guest content wherein guest content is determined by search
US20090164408A1 (en) Method, System and Computer Program for Managing Delivery of Online Content
Wen Development of personalized online systems for web search, recommendations, and e-commerce
Amer-Yahia Recommendation projects at Yahoo!
Kakulapati et al. Survey on web search results personalization techniques
CA2616925A1 (en) Method, system and computer program for managing delivery of online information
CA2624395A1 (en) System for coordinating the presentation of digital content data feeds

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: American California

Patentee after: Google limited liability company

Address before: American California

Patentee before: Google Inc.