CN101410815A - 检测web资源的服务区域 - Google Patents

检测web资源的服务区域 Download PDF

Info

Publication number
CN101410815A
CN101410815A CNA2007800106894A CN200780010689A CN101410815A CN 101410815 A CN101410815 A CN 101410815A CN A2007800106894 A CNA2007800106894 A CN A2007800106894A CN 200780010689 A CN200780010689 A CN 200780010689A CN 101410815 A CN101410815 A CN 101410815A
Authority
CN
China
Prior art keywords
location
weight
assembly
web resource
computer system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800106894A
Other languages
English (en)
Inventor
X·谢
L·王
Q·张
W-Y·马
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN101410815A publication Critical patent/CN101410815A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/52Network services specially adapted for the location of the user terminal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/18Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals
    • H04W4/185Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals by embedding added-value information into content, e.g. geo-tagging
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Hardware Design (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供了用于按照地址、按照查询内容以及按照业务类别来确定web资源的服务区域的方法和系统。一种位置系统可以基于访问web资源的用户的地址来确定该web资源的服务区域。该位置系统可基于导致对网站(或其它web资源)的点进的查询项来确定该网站的服务区域。该位置系统可基于网站(或其它web资源)的业务类别以及与网站相关联的“提供者位置”来确定该网站的服务区域。

Description

检测web资源的服务区域
背景
诸如网页和网站等web资源具有与其相关联的地理服务区域。服务区域表示对该web资源感兴趣的用户的地理分布。或者,服务区域可被认为是表示了该web资源预期延伸到的地理区域。例如,列出了一个市内出售的房屋的网页可具有包含该市的县的服务区域。作为另一示例,具有诸如数学入门等通用信息的网页可能是来自任何位置的用户都感兴趣的,且因此具有全世界的服务区域。
已经开发了许多基于位置的web应用程序来支持移动设备和本地搜索需求。此类基于位置的web应用程序包括导航系统、基于位置的搜索系统、本地广告系统、地理检索系统等等。这些web应用程序通常需要检测web资源的服务区域并将其与用户的当前位置进行匹配。例如,蜂窝电话用户可能希望找到本地汽车特许经销商。web应用程序可以将如由蜂窝电话所指示的该用户的当前位置与汽车经销商的服务区域进行匹配以标识哪些汽车特许经销商可能是适当的以便建议给用户。
通常,web应用程序在web资源中搜索位置信息(例如,城市名),并且在确定该web资源是否匹配用户的位置时使用该信息。此类web应用程序的一个困难是web资源的位置信息可能具有不同的目的且具有不同的含义。例如,关于中国餐馆的网页可能包含地理位置“北京”和“雷蒙德”。地理位置北京指示了该网页的主题以某种方式与中国有关,但是地理位置雷蒙德指示该餐馆位于美国华盛顿州的雷蒙德市。如果一web应用程序试图将用户的当前位置(可能在北京)与该网页的位置进行匹配,则该web应用程序可能会错误地确定服务区域是北京。在这一情况下,该web应用程序可能会向在北京的用户建议在华盛顿州雷蒙德市的餐馆。
概述
提供了用于按照地址、按照查询内容以及按照业务类别来确定web资源的服务区域的方法和系统。一种位置系统可以基于访问web资源的用户的地址来确定该web资源的服务区域。该位置系统可以通过分析诸如web访问日志、点进(click-through)日志等web访问信息来标识对web资源的访问。该位置系统从web访问信息中检索地址,然后确定与该地址相关联的地理位置。在该位置系统标识了每一用户对该网站的访问的位置之后,它分析所标识的位置以确定该web资源的服务区域。该位置系统可使用诸如按照大陆、国家、州和城市来组织的位置分层结构。该位置系统可基于该位置内的用户访问该web资源的次数,并基于分层地位于该位置内的位置内的用户访问该web资源的次数的分布,来选择关于该服务区域的位置。
该位置系统可基于导致对网站(或其它web资源)的点进的查询项来确定该网站的服务区域。该位置系统分析导致点进的查询以标识该查询内的“位置项”。“位置项”以某种方式标识了位置。该位置系统然后生成包含由所标识的位置项所表示的位置的文档。该位置系统然后向所生成的文档应用内容位置检测算法以标识该文档的“内容位置”,该位置系统使用该“内容位置”来表示服务区域。
该位置系统可基于网站(或其它web资源)的业务类别以及与网站相关联的“提供者位置”来确定该网站的服务区域。该位置系统可通过向已被训练来按照业务类别基于其内容对网站分类的分类器提供该网站的内容来确定该网站的类别。该位置系统为每一业务类别定义一范围,该范围指示该业务类别内的网站的服务区域的典型大小。为确定网站的服务区域,该位置系统分析该网站以标识提供者位置。该位置系统然后将该网站的服务区域表示为与所标识的提供者位置相关联的范围。
提供本概述以便以简化的形式介绍将在以下详细描述中进一步描述的一些概念。该概述不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
附图简述
图1是示出一个实施例中的位置分层结构的图示。
图2是示出一个实施例中的位置系统的组件的框图。
图3是示出一个实施例中位置系统的按照IP地址标识服务区域组件的处理的流程图。
图4是示出一个实施例中位置系统的传播访问组件的处理的流程图。
图5是示出一个实施例中位置系统的遍历组件的处理的流程图。
图6是示出一个实施例中位置系统的检索位置组件的处理的流程图。
图7是示出一个实施例中位置系统的按照查询内容标识服务区域组件的处理的流程图。
图8-15是示出一个实施例中内容位置组件的各组件的处理的流程图。
图9是示出一个实施例中内容位置组件的计算权重组件的处理的框图。
图10是示出一个实施例中内容位置组件的计算地理位置权重组件的处理的流程图。
图11是示出一个实施例中内容位置组件的计算功效组件的处理的流程图。
图12是示出一个实施例中内容位置组件的计算子孙贡献组件的处理的流程图。
图13是示出一个实施例中内容位置组件的计算先辈贡献组件的处理的流程图。
图14是示出一个实施例中内容位置组件的计算展布组件的处理的流程图。
图15是示出一个实施例中内容位置组件的遍历组件的处理的流程图。
图16是示出一个实施例中位置系统的按照业务类别标识服务区域组件的处理的流程图。
图17-18是示出一个实施例中位置系统的提供者位置组件的处理的流程图。
图18是示出一个实施例中提供者位置组件的提取位置串和特征组件的处理的流程图。
详细描述
提供了用于确定web资源的服务区域的方法和系统。在一个实施例中,一种位置系统基于访问web资源(例如,网站或ftp服务器)的用户的地址(例如,IP地址)来确定该web资源的服务区域。该位置系统可以通过分析诸如web访问日志、点进(click-through)日志等web访问信息来标识对web资源的访问。web访问日志可以由网站生成,并且可以对用户对该网站的每一次访问包含一条目。每一条目可包括用户的IP地址。点进日志可由搜索引擎生成,并且可对对于查询结果中所包括的对网站的引用的每一选择包含一条目,该选择通常被称为“点进”。该位置系统从web访问信息中检索IP地址,然后确定与该IP地址相关联的地理位置。有许多提供从IP地址到地理位置的映射的商业产品可用,诸如海科萨软件研发公司(Hexasoft Development)的IP2LOcation和科沃法公司(Quova Corp)的GeoPoint。在该位置系统标识了对该网站的每一用户访问的位置之后,它分析所标识的位置以确定该web资源的服务区域。该位置系统可使用诸如按照大陆、国家、州和城市来组织的位置分层结构。该位置系统可基于该位置内的用户访问该web资源的次数,并基于分层地位于该位置内的位置内的用户访问该web资源的次数的分布,来选择用于该服务区域的位置。例如,如果对一网站的90%的访问是由华盛顿州的金(King)县的用户做出的,则金县是该网站的一个可能的服务区域。然而,如果这些访问中的95%是由西雅图市的用户做出的,则西雅图可能是更恰当的服务区域。由于金县的用户所做出的访问中仅有5%是由西雅图外部的用户做出的,因此服务区域西雅图而非金县更精确地描述了服务区域。然而,如果金县中的用户所做出的访问数目均等地分布在该县内的各市之中(对城市人口差别进行调整),则金县可以实际上是该网站的适当的服务区域。以此方式,该位置系统可对web资源标识准确的服务区域。
在一个实施例中,该位置系统基于导致对网站(或其它web资源)的点进的查询项来确定该网站的服务区域。该位置系统分析导致点进的查询以标识该查询内的“位置项”。“位置项”以某种方式标识了位置。例如,查询“Lombardi′s pizza New York City”(纽约市Lombardi匹萨)包含了位置项“NewYork City”(纽约市),而查询“pizza nyc”(纽约市匹萨)包含了表示位置“纽约市”位置项“nyc”。该位置系统然后生成包含由所标识的位置项所表示的位置的文档。例如,该文档可包含对应于该查询中位置项“New York City”的13次出现、位置项“New York”(纽约)的4次出现、以及位置项“nyc”的3次出现的位置纽约市的20次出现。该位置系统然后向所生成的文档应用内容位置检测算法以标识该文档的“内容位置”,该位置系统使用该“内容位置”来表示服务区域。内容位置标识了作为文档主题的地理位置。例如,关于中国长城的网页可具有“China”(中国)作为内容位置,因为该网站的主题是中国。由于位置系统从网站的点进日志的位置项生成文档,因此该文档的内容位置可准确地标识网站的服务区域。
在一个实施例中,该位置系统基于网站(或其它web资源)的业务类别以及与网站相关联的“提供者位置”来确定该网站的服务区域。该位置系统可通过向已被训练来按照业务类别基于其内容对网站分类的分类器提供该网站的内容来确定该网站的类别。例如,业务类别可包括银行服务、运输服务、餐馆等等。该位置系统为每一业务类别定义一范围,该范围指示该业务类别内的网站的服务区域的典型大小。例如,关于银行服务或餐馆的网站可向通常在同一城市中的用户提供服务。相反,关于飞机场的网站可向在更广阔的区域中,诸如在同一州中的用户提供服务。关于软件开发公司的网站可向在还要广阔的区域中,诸如在同一国家中的用户提供服务。因此,该位置系统可将范围表示为城市、州或国家。或者,该位置系统可按照半径(例如,对于餐馆为10英里,对于飞机场为100英里)来表示范围。为确定网站的服务区域,该位置系统分析该网站以标识提供者位置。提供者位置标识了提供该web资源的实体(例如,组织、公司或个人)的地理位置。提供者位置通常是包括街道地址、城市名、州名、邮政编码、国家等的顺序地址串。例如,由某一公司提供的网站的提供者位置可以是该公司的公司总部的地址。该位置系统然后将该网站的服务区域表示为与所标识的提供者位置相关联的范围。例如,如果该网站具有业务类别飞机场,并且提供者位置是西雅图,则由于飞机场业务类别的范围是州而西雅图位于华盛顿州,因此该网站的服务区域是华盛顿州。
在一个实施例中,该位置系统基于访问网站的用户的地址并基于与每一地址相关联的访问数(从IP地址中标识)来确定该网站的服务区域。该位置系统可使用权重度量和展布度量来标识关于服务区域的适当位置。具有高权重和高展布的位置可准确地表示服务区域。权重度量测量某一位置(例如,西雅图)中对一网站感兴趣的用户相对于父位置(例如,金县)中的用户的百分比。在以上给出的示例中,如果金县中的用户对网站做出的访问中的95%是由西雅图的用户做出的,则对于西雅图的权重应相对于金县的权重是高的。该位置系统可基于位置内的用户的访问率与父位置内的用户的访问率之比来计算位置的权重。例如,如果一城市的访问率是95%,而包含该城市的县的访问率是90%,则该城市的权重可以是1.06(即,95%除以90%)。如果另一城市的访问率改为是9%,则该城市的权重可以是.1(即,9%除以90%)。该位置系统可以如下表示权重:
Weight ( w , l ) = Click ( w , l ) / Population ( l ) Click ( w , Parent ( l ) ) / Population ( Parent ( l ) ) - - - ( 1 )
其中Weight(w,l)表示web资源w的位置l的权重,Click(w,l)表示从位置l到网站w的点进的次数,Population(l)表示位置l的人口,而Parent(l)表示位置l的父位置。一位置的人口可以是生活在该位置的人的实际数量、生活在该位置的web用户的数量等等。
展布度量测量了权重在某一位置中的子位置之中的分配。具有对均匀权重的子位置的父位置可能是比其任一子位置都更准确的对服务区域的表示。相反,具有比任何其兄弟位置高得多的权重的子位置可能是比其父位置更准确的对服务区域的表示。该位置系统可以如下表示位置展布:
Spread ( w , l ) = - Σ i = 1 n Weight ( w , l i ) Σ j = 1 n Weight ( w , l j ) × log ( Weight ( w , l i ) Σ j = 1 n Weight ( w , l j ) ) log n - - - ( 2 )
其中Spread(w,l)表示web资源w的位置l的展布,Weight(w,l)表示web资源w的位置l的权重,lx表示位置l的子位置x,而n表示位置l的子位置的数目。
该位置系统通过以自顶向下的方式遍历位置分层结构来标识表示服务区域的位置。当该位置系统访问位置分层结构中的一个位置时,该位置系统确定该位置的权重和展布。如果一位置的权重大于阈值权重,则该位置是可能的服务区域。如果该位置的展布较低,则该位置系统假定子位置之一将是对服务区域的更好表示并访问这些子位置。然而,如果该位置的展布较高(即,意味着子位置的权重是均匀分布的),则该位置系统将该位置标记为服务区域。当遍历完成时,所标记的位置代表了服务区域。
在一个实施例中,该位置系统基于对搜索或查询日志内的位置项的分析来标识网站的服务区域。在从导致对网站的点进的查询中提取了位置项之后,位置系统用其别名来替换位置项(例如,用“New York City”替换“nyc”)。该位置系统还可消除有歧义的位置项的歧义(例如,用“New York”而非“NewYork City”来替换“ny”。该位置系统然后生成包含该位置项的位置项文档,然后使用内容位置检测算法来标识所生成的文档的内容位置。该位置系统使用位置的地理分层结构、向每一位置分配指示该位置是否可能是网站主题的权重、以及为每一位置计算功效和展布,来标识内容位置。在计算了每一位置的功效和展布之后,该位置系统然后将其功效满足阈值功效且其展布满足阈值展布的位置标识为内容位置。功效是一位置与网站的相关性的度量,而展布是功效在地理分层结构的兄弟位置之中的均匀性的度量。该位置系统可以按照下式来表示功效:
Power ( w , l ) = Wt ( w , l ) + Σ j = 1 n Wt ( w , Chil d j ( l ) ) + Σ i = 1 m Wt ( w , Ancesto r i ( l ) ) | Sibling i ( l ) | - - - ( 3 )
其中Power(w,l)是位于地理分层结构中的位置l处的web资源w的功效,Wt(w,l)是web资源w的位置l的权重,Childj(l)是子孙位置l,n是位置l的所有子孙位置的数目,Ancestori(l)是位置l的先辈位置,m是位置l的所有先辈位置的数目,而|Siblingi(l)|是在以Ancestori(l)为根的子树内与位置l位于同一层的位置的数目。该功效等式除了当前位置的权重之外还考虑了先辈和子孙位置的权重。该位置系统可以用自底向上的方式遍历位置分层结构以对子孙位置的权重求和。该位置系统可以用自顶向下的方式遍历位置分层结构以对先辈位置的权重求和。在该式中,位置的功效包括先辈位置的功效在兄弟位置之中均分。本领域的技术人员将理解,可以使用考虑兄弟位置的地理区域或人口密度的更复杂的策略来分配先辈位置的功效。
在一个实施例中,位置系统在标识内容位置时基于从查询中提取并包括在生成位置文档中的位置项来计算位置的权重。例如,位置项可以包括地理名称(例如,雷蒙德)、邮政编码(例如,98052)、电话号码(例如,425-555-5555)等等。位置系统可以向邮政编码和电话号码分配较高的权重,因为它们与地理名称相比是对内容位置的更准确的指示符。例如,某些地理名称可能会有歧义地指代不同的地理位置,例如“华盛顿”可以指代华盛顿州或华盛顿特区。并且,某些地理名称可能会有歧义地指代地理位置和人,例如“华盛顿”可以指代乔治·华盛顿或华盛顿州。位置系统可以按照下式来定义位置的权重:
Figure A20078001068900121
其中Wt(gk)表示地理位置项gk的权重,Wt(zt)表示邮政编码和电话号码的共同权重,ldf(gn)是每一地理名称(gn)作为地理位置项的文档频率,而idf(gn)是gn作为通用项的文档频率。由于邮政编码和电话号码在正确标识唯一地理位置中的高可靠性,因此位置系统并不区分它们,并且使用相同的常数Wt(zt)(例如,大于0但小于1)来表示其共同的权重。位置系统向所有地理名称分配服从公共因子(1-Wt(zt))的权重。位置系统使用Wt(zt)来控制邮政编码/电话号码和地理名称之间的权重平衡。每一个别地理名称的权重通过ldf(gn)/idf(gn)来调整。ldf(gn)和idf(gn)的值从两个语料库中计算。一个语料库是地理相关文档语料库,其中位置系统假定对gn的每一引用来自地理观点并且ldf(gn)标识每一地理名称的引用频率。另一语料库是用于计算idf(gn)的通用文档语料库。按照ldf(gn)与idf(gn)之比对每一地理位置加权的根本原因源自这样的观察结果:如果一地理名称在地理语料库中比在通用语料库中被更频繁地引用,则该地理名称更有可能是真正关于一地理位置的。
在计算了每一位置项的权重之后,位置系统然后通过对作为该位置项的别名的位置项的权重求和来计算每一位置的权重。例如,雷蒙德的位置可以具有别名雷蒙德、邮政编码98052和地区码425。位置系统可以按照下式来表示位置的权重:
Wt ( w , l ) = Σ gk rf ( w , gk ) × Wt ( gk ) - - - ( 5 )
其中Wt(w,l)表示web资源w的位置l的权重,gk(即,地理关键词)表示位置l的任何可能的表示或别名,rf(w,gk)表示gk在web资源w中的引用频率,而Wt(gk)是gk的权重。
在一个实施例中,位置系统出于标识内容位置的目的按照以下等式来定义位置的展布:
Spread ( w , l ) = - Σ i = 1 n Power ( w , l i ) Σ j = 1 n Power ( w , l j ) × log ( Power ( w , l i ) Σ j = 1 n Power ( w , l j ) ) log n - - - ( 6 )
其中Spread(w,l)是web资源w的位置l的展布,位置li或位置lj是位置l的直接子孙位置,而n是l的所有直接子孙的数目。在对位置计算了Power和Spread之后,位置系统通过从根位置开始以自顶向下的方式遍历位置分层结构来标识内容位置。位置系统在其根位置的Spread或Power比(即,power(位置)/power(父位置))分别不超过给定阈值Ts或Tp的时候剪除任何子树。当遍历完成时,地理分层结构中剩余的位置表示内容位置。
在一个实施例中,位置系统基于网站的业务类别以及与网站相关联的提供者位置来标识该网站的服务区域。可向位置系统提供业务类别,该业务类别可以由用户手动指定。位置系统可以通过分析点进数据或通过使用用户提供的范围来标识每一业务类别的范围。位置系统可以训练一分类器以根据业务类别来对网站分类。位置系统使用包括网站及其相应的业务类别的训练数据来训练分类器。位置系统可使用基于支持矢量机(“SVM”)的分类器。支持向量机通过在可能的输入的空间中寻找超曲面来操作。超曲面尝试通过将最接近的正和负示例之间的距离对于该超曲面最大化来从负示例中分解正示例。这允许相似于但不同于训练数据的数据的正确的分类。可使用多种技术训练支持向量机。一种技术使用将大二次编程问题分解成一系列可被分析上求解的小二次编程问题的顺序最小优化算法。(请参考在http://research.microsoft.com/~jplatt/smo.html上的顺序最小优化。)
在一个实施例中,位置系统通过标识潜在提供者位置然后使用分类器来将潜在提供者位置分类为是或不是提供者位置来标识提供者位置。位置系统最初可通过生成包括潜在提供者位置、作为特征向量的web资源的相关联特征以及分类的训练数据来训练分类器。训练数据可从web资源语料库中导出。例如,位置系统可从web资源中提取是潜在提供者位置的串。例如,位置系统可查找web资源内的街道地址、城市名、州名、邮政编码和国家。位置系统然后提取可指示所提取的串是否为提供者位置的web资源的特征。所提取的特征可包括网站内的网页的URL、标题、锚文本、页面内容、引用频率、等级以及所提取的串在网页上的空间位置。标题、URL或锚文本中的某些项(例如,“about us”(关于我们)和“contact us”(联系我们))可以是该网页包含提供者位置的提示。引用频率指示一位置在网站内被引用的次数。由于提供者的地址通常是在网站的多个网页上提供的,因此高引用频率往往指示所提取的串是提供者位置。并且,由于提供者位置通常是在网站的第一级或第二级网页上提供的,因此从中提取位置串的网页的等级可指示所提取的位置串是否是提供者位置。由于提供者位置通常位于网页的页脚中,因此位置串在网页内的放置可用于帮助标识该位置串是否是提供者位置。
图1是示出一个实施例中的位置分层结构的图示。位置系统100包括大陆层101、国家层102、州层103、县层104和市层105。本领域的技术人员将认识到,可使用许多不同类型的层,例如,国家可被划分成诸如北、南、东和西等地区。在此示例中,华盛顿州具有先辈位置北美和美国,并且具有子孙位置金和皮尔斯县以及西雅图和雷蒙德市。金和皮尔斯县是其直接先辈(或父)位置华盛顿州的直接子孙(或子)位置,并且是兄弟位置。
图2是示出一个实施例中的位置系统的组件的框图。位置系统230经由通信链路220连接到网站210和用户设备215。位置系统包括地址组件240、查询内容组件250以及业务类别组件260。地址组件包括按照IP地址标识服务区域组件241、传播访问组件242、遍历组件243以及检索位置组件244。按照IP地址标识服务区域组件调用传播访问组件、遍历组件和检索位置组件以标识网站的服务区域。查询内容组件包括按照查询内容标识服务区域组件251以及标识位置组件252。按照查询内容标识服务区域组件标识位置项、消除位置项的歧义、并调用标识位置组件来标识内容位置。业务类别组件包括按照业务类别标识服务区域组件261、训练分类器组件262、提取地址串和特征组件263、以及训练业务类别分类器组件264。按照业务类别标识服务区域组件确定网站的业务类别、从网站的网页中确定提供者位置、并基于业务类别和提供者位置的范围来设置服务区域。训练分类器组件用于训练分类器以标识网页的提供者位置。提取地址串和特征组件生成输入到分类器的网页的特征向量。训练业务类别分类器组件训练一分类器以根据业务类别对网站分类。位置系统还包括点进数据存储271和位置分层结构数据存储272。
在其上实现位置系统的计算设备可包括中央处理单元、存储器、输入设备(例如,键盘和定点设备)、输出设备(例如显示设备)和存储设备(例如,盘驱动器)。存储器和存储设备是含有实现该位置系统的指令的计算机可读介质。此外,数据结构和消息结构可被存储或经由诸如通信链路上的信号之类的数据传送介质发送。可以使用各种通信链路,诸如因特网、局域网、广域网、点对点拨号连接、蜂窝电话网络等。
位置系统的各实施例可以在各种操作环境中实现,这些操作环境包括个人计算机、服务器计算机、手持式或膝上型设备、多处理器系统、基于微处理器的系统、可编程消费电子产品、数码相机、网络PC、小型计算机、大型计算机、包括上述系统或设备中的任一种的分布式计算环境等。计算机系统可以是蜂窝电话、个人数字助理、智能电话、个人计算机、可编程消费电子产品、数码照相机等。
位置系统可以在由一个或多个计算机或其他设备执行的诸如程序模块等计算机可执行指令的通用上下文中描述。一般而言,程序模块包括执行特定的任务或实现特定的抽象数据类型的例程、程序、对象、组件、数据结构等等。通常,程序模块的功能可以在各个实施例中按需进行组合或分布。
图3是示出一个实施例中位置系统的按照IP地址标识服务区域组件的处理的流程图。向该组件传递一网站,并且该组件基于访问该网站的用户的IP地址来标识其服务区域。在框301,该组件收集指示访问该网站的用户的IP地址的访问信息。在框302,该组件标识与每一IP地址相关联的地理位置。在框303,该组件确定对每一位置的访问的计数。在框304,该组件调用传播访问组件以将该访问计数在位置分层结构中向上传播。在框305,该组件调用遍历组件以遍历该位置分层结构并标识具有足够权重和展布的位置。在框306,该组件调用检索位置组件以检索有足够权重和展布的叶位置。该组件使用所检索的位置作为服务区域然后完成。
图4是示出一个实施例中位置系统的传播访问组件的处理的流程图。该组件递归地调用其自身以将访问计数从位置分层结构的叶位置传播到根位置。从根节点开始,向该组件传递位置节点。在判定框401,如果所传递的节点具有子节点,则该组件在框402处继续,否则该组件位于叶节点处并返回。在框402-405中,该组件循环选择所传递的节点的每一子节点,并递归地调用传播访问组件以用深度优先方式遍历位置分层结构。在框402,该组件选择所传递的节点的下一个子节点。在判定框403,如果已经选择了所有子节点,则组件返回,否则组件继续至框404。在框404处,该组件递归地调用传播访问组件。在框405处,该组件将所选子节点的访问计数累计为所传递节点的访问计数。该组件随后循环至框402以选择下一子节点。
图5是示出一个实施例中位置系统的遍历组件的处理的流程图。向该组件传递一节点,并且该组件从该节点开始以深度优先的方式遍历位置分层结构。该组件通过递归地调用其自身来搜索表示具有权重和足够展布的位置的节点。在判定框501,如果所传递的节点具有大于一权重阈值的权重,则该组件在框502处继续,否则该组件通过返回来剪除由所传递的节点表示的子树。在框502,该组件将所传递的节点标记为具有足够的权重。在判定框503,如果所传递的节点具有子节点,则该组件在框504处继续,否则所传递的节点表示具有足够权重来表示服务区域的叶节点并且该组件返回。在框504-506,该组件循环计算每一子节点的权重。在框504,该组件选择所传递的节点的下一个子节点。在判定框505,如果所有的子节点都已被选择,则该组件在框507继续,否则该组件在框506继续。在框506中,该组件调用计算权重组件并传递所选的子节点,然后循环至框504来选择下一子节点。在框507处,该组件调用计算展布组件以基于子节点的权重来对所传递的节点计算展布。在判定框508,如果展布大于一展布阈值,则所传递的节点具有足够权重和展布来表示服务区域并且该组件返回,否则该组件在框509处继续。在框509-511中,该组件循环确定哪一子节点具有足够权重和展布来表示服务区域。在框509,该组件选择下一子节点。在判定框510,如果所有子节点都已被选择,则该组件返回,否则该组件在框511处继续。在框511处,该组件递归地调用其自身然后循环至框509来选择下一子节点。
图6是示出一个实施例中位置系统的检索位置组件的处理的流程图。该组件检索与被遍历组件标记的那些节点的叶节点相关联的位置。该组件以深度优先的方式遍历位置分层结构。在判定框601,如果所传递的节点具有任何标记的子节点,则该组件在框602处继续,否则该组件在框605处继续。在框602-604中,该组件对每一标记的子节点递归地循环调用其自身。在框602,该组件选择下一标记的子节点。在判定框603,如果所有标记的子节点都已被选择,则该组件返回,否则该组件在框604处继续。在框604,该组件递归地调用其自身并传递所选节点。该组件随后循环至框602以选择下一标记的子节点。在框605,该组件在所传递的节点没有标记的子节点时将所传递的节点的位置添加到服务区域列表。该组件然后返回。
图7是示出一个实施例中位置系统的按照查询内容标识服务区域组件的处理的流程图。调用该组件来基于查询内容确定所传递的网站的服务区域。在框701,该组件标识查询内的位置项。在框702,该组件消除任何有歧义的位置的歧义。例如,查询可包括“ny”,它有歧义地指代纽约市或纽约州。该组件确定由于其它查询都涉及纽约市,因此“ny”也可能指代纽约市。在框703,该组件创建所标识的位置项的文档。在框704,该组件调用标识位置组件来标识所创建的文档内的内容位置。该组件然后返回所标识的内容位置作为所传递的网站的服务区域。
图8-15是示出一个实施例中内容位置组件的各组件的处理的流程图。图8是示出一个实施例中内容位置组件的标识位置组件的处理的流程图。该组件控制标识目标网页的内容位置的总过程。在框801,该组件调用计算权重组件来对目标网页计算在位置分层结构内的位置的权重。在框802,该组件调用计算功效组件来基于其权重计算在位置分层结构内的位置的功效。在框803,该组件调用计算展布组件来基于其功效计算在位置分层结构内的位置的展布。在框804,该组件调用遍历组件来遍历位置分层结构以标识目标网页的内容位置。该组件然后完成。
图9是示出一个实施例中内容位置组件的计算权重组件的处理的框图。该组件循环选择目标网页的地理位置并计算其权重。在框901,该组件选择位置分层结构的下一地理位置。在判定框902,如果所有地理位置都已被选择,则该组件返回,否则该组件在框903处继续。在框903,该组件调用计算地理位置权重组件并传递所选的地理位置来计算目标网页的地理位置的权重。该组件随后循环至框901以选择下一地理位置。本领域的技术人员可以理解,计算权重组件的处理可以替换地首先标识目标网页的地理位置,然后计算位置分层结构的位置的权重,而非首先选择位置分层结构的每一位置。一般而言,这些流程图示出了组件的功能处理以便于描述该技术。本领域的技术人员可以理解,这些组件可以用各种方式来优化。
图10是示出一个实施例中内容位置组件的计算地理位置权重组件的处理的流程图。向该组件传递一地理位置,并且该组件对目标网页计算该地理位置的权重。该组件循环地对所传递的地理位置的别名的贡献求和。在框1001,该组件选择目标网页上所传递的位置的下一别名。在判定框1002,如果目标网页上的所有别名都已被选择,则该组件完成,否则该组件在框1003处继续。在判别框1003中,如果所选择的别名是邮政编码或电话号码,则该组件在框1005处继续,否则该组件在框1004处继续。在框1004,该组件计算地理名称的权重。在框1005,该组件计算邮政编码或电话号码的权重。在框1006,该组件确定所选别名在目标网页上被引用的次数。在框1007,该组件计算所选别名的权重贡献。在框1008,该组件将所选别名的权重贡献添加到所传递的地理位置的权重。该组件随后循环至框1001以选择下一别名。
图11是示出一个实施例中内容位置组件的计算功效组件的处理的流程图。该组件以自底向上的方式循环地计算位置分层结构的每一地理位置的功效。在框1101,该组件选择位置分层结构的下一地理位置。在判定框1102,如果所有地理位置都已被选择,则该组件返回,否则该组件在框1103处继续。在框1103,该组件检索所选地理位置的权重。在框1104,该组件调用计算子孙贡献组件以计算子孙对功效的贡献。在框1105,该组件调用计算先辈贡献组件以计算先辈对功效的贡献。在框1106,该组件计算功效为所检索的权重和贡献的组合。该组件随后循环至框1101以选择下一地理位置。
图12是示出一个实施例中内容位置组件的计算子孙贡献组件的处理的流程图。该组件循环地选择所传递的地理位置的子孙并计算其权重对于所传递的地理位置的功效的贡献。在框1201,该组件选择下一子孙。在判定框1202,如果所有子孙都已被选择,则该组件返回,否则该组件在框1203处继续。在框1203,该组件检索所选子孙的权重。在框1204,该组件将所检索的权重添加到所传递的子孙的地理位置的累加总计权重。该组件随后循环至框1201以选择下一子孙。
图13是示出一个实施例中内容位置组件的计算先辈贡献组件的处理的流程图。该组件循环地选择所传递的地理位置的先辈位置并累积其权重对于所传递的地理位置的功效的贡献。在框1301,该组件选择所传递的地理位置的下一先辈位置。在判定框1302,如果所有的先辈位置都已被选择,则该组件在框1305处继续,否则该组件在框1303处继续。在框1303,该组件检索所选先辈位置的权重。在框1304,该组件将所检索的权重添加到先辈位置的权重的累加总计。该组件随后循环至框1301以选择下一先辈位置。在框1305,该组件将累加权重除以所传递的地理位置的兄弟位置的数目,然后返回。
图14是示出一个实施例中内容位置组件的计算展布组件的处理的流程图。该组件对位置分层结构的每一地理位置循环地计算展布。在框1401,该组件选择位置分层结构的下一地理位置。在判定框1402,如果所有地理位置都已被选择,则该组件返回,否则该组件在框1403处继续。在框1403,该组件对所选地理位置的所有先辈位置的功效求和。在框1404-1407,该组件循环地计算对所选地理位置的每一直接先辈位置的展布的贡献。在框1404,该组件选择所选的地理位置的下一直接子孙位置。在判定框1405,如果所选地理位置的所有直接子孙位置都已被选择,则该组件循环至框1401以选择下一地理位置,否则该组件在框1406处继续。在框1406,该组件检索所选直接子孙位置的功效。在框1407,该组件将所检索的功效添加到所选地理位置的展布,然后循环到框1404以选择所选地理位置的下一直接子孙位置。
图15是示出一个实施例中内容位置组件的遍历组件的处理的流程图。该组件被示为以自顶向下方式遍历位置分层结构的递归组件。向该组件传递当前被访问的地理位置。在框1501-1506中,该组件循环地选择所传递的位置的每一直接子孙位置,并且或者剪除该位置,或者将其位置标记为内容位置并递归地调用遍历组件。在框1501,该组件选择所传递的位置的下一直接子孙位置。在判定框1502,如果所有直接子孙位置都已被选择,则该组件返回,否则该组件在框1503处继续。在判定框1503,如果所选直接子孙位置的展布大于一阈值展布,则该组件在框1504处继续,否则该组件通过循环到框1501以选择所传递的地理位置的下一直接子孙位置来剪除以所选直接子孙位置作为其根的子树。在判定框1504,如果所选直接子孙位置的功效比大于一阈值功效比,则该组件在框1505处继续,否则该组件通过循环到框1501以选择所传递的地理位置的下一直接子孙位置来剪除以所选直接子孙位置作为其根的子树。在框1505,该组件将所传递的地理位置标记为内容位置。在框1506,该组件递归地调用遍历组件并传递所选直接子孙位置。该组件随后循环至框1501以选择下一直接子孙位置。
图16是示出一个实施例中位置系统的按照业务类别标识服务区域组件的处理的流程图。该组件基于所传递的网站的业务类别和其提供者位置来标识其服务区域。在框1601,该组件使用已训练的分类器按照业务类别来对网站分类。在框1602,该组件检索网站的网页。在框1603,该组件调用提取地址串和特征组件来生成要用于标识提供者位置的特征。在框1604,该组件调用分类器来标识网站的提供者位置。在框1605,该组件检索网站的业务类别的范围。在框1606,该组件在位置分层结构中搜索对应于该范围的提供者位置的先辈位置。如果提供者位置本身对应于该范围,则该组件不需要搜索。该组件返回所搜索的位置(或提供者位置)作为网站的服务区域。
图17-18是示出一个实施例中位置系统的提供者位置组件的处理的流程图。图17是示出一个实施例中提供者位置组件的训练分类器组件的处理的流程图。该组件循环地对训练数据的网页存储的网站的网页提取提供者位置串和特征向量。该组件然后训练分类器。在框1701,该组件选择网页存储的下一网站。在判定框1702,如果所有网站都已被选择,则该组件在框1706处继续,否则该组件在框1703处继续。在框1703,该组件检索所选网站的网页。在框1704,该组件通过调用提取位置串和特征组件来提取所选网页的位置串和特征向量。在框1705,该组件输入对所提取的位置串的分类。例如,该组件可提示用户指示每一位置串是否表示提供者位置。该组件然后循环至框1701以选择网页存储的下一网站。在框1706,该组件使用特征和分类来训练分类器。
图18是示出一个实施例中提供者位置组件的提取位置串和特征组件的处理的流程图。该组件循环地在所选网站的网页内搜索位置串。在框1801,该组件寻找网页内的下一位置串。在判定框1802,如果所有位置串都已被找到,则该组件返回,否则该组件在框1803处继续。在框1803-1804中,该组件生成对应于所找到的位置串的特征向量,然后循环到框1801以选择下一位置串。如上所述,特征向量可以包括从中提取位置串的网页的各种特征,诸如位置串在网页上的位置、网页在网站内的分层结构层次、网页内的位置串的频率等等。
尽管用对结构特征和/或方法动作专用的语言描述了本主题,但可以理解,所附权利要求书中定义的主题不必限于上述具体特征或动作。相反,上述具体特征和动作是作为实现权利要求的示例形式公开的。该位置系统可使用上述技术的组合来标识web资源的服务区域。例如,该位置系统可正常地按照地址或按照查询内容来标识网站的服务区域。然而,如果该位置系统没有对于网站的足够访问信息(例如,新启动的网站),则该位置系统可使用业务类别技术来确定服务区域。并且,也可以有并不能被任何单个范围很好地表示的某些业务类别。例如,政府业务类别可对应于城市、州或国家范围。在这一情况下,该位置系统可基于内容位置而非依赖于范围和提供者位置来确定服务区域。该位置系统能够使用诸如用户的电子邮件地址等地址来标识用户的位置。如果一网站维护用户的数据库,则该位置系统能够基于储存在该数据库中的地址(例如,城市)来检索用户的位置。在这一情况下,该位置系统可用访问请求来接收用户标识符(例如,储存在cookie中)。并且,对于网站的地址-位置映射不准确(例如,通常对于IP地址发生的),则该位置系统可按照查询内容而非按照地址来标识服务区域。因此,本发明只由所附权利要求来限制。

Claims (20)

1.一种用于基于用户的地址来确定web资源的服务区域的计算机系统,包括:
对于对所述web资源的每一次访问包括访问所述web资源的用户的地址的访问信息存储(271);
将所述访问信息的地址映射到一位置分层结构内的位置的地址映射组件(244);以及
基于所述分层结构的一位置内的用户对所述web资源的访问次数,并基于分层地在该位置内的各位置内的用户对所述web资源的访问次数的展布,来将该位置标识为所述web资源的服务区域的标识组件(241)。
2.如权利要求1所述的计算机系统,其特征在于,所述地址是IP地址。
3.如权利要求1所述的计算机系统,其特征在于,所述访问信息是从点进日志中导出的。
4.如权利要求1所述的计算机系统,其特征在于,所述标识组件计算位置的权重,所述权重基于所述位置的访问率与所述位置的父位置的访问率之比。
5.如权利要求4所述的计算机系统,其特征在于,所述权重被表示如下:
Weight ( w , l ) = Click ( w , l ) / Population ( l ) Click ( w , Parent ( l ) ) / Population ( Parent ( l ) )
其中Weight(w,l)表示web资源w的位置l的权重,Click(w,l)表示从位置l到网站w的点进的次数,Population(l)表示位置l的人口,而Parent(l)表示位置l的父位置。
6.如权利要求1所述的计算机系统,其特征在于,所述标识组件计算位置的展布,所述展布指示所述位置的访问在其子位置中的分布。
7.如权利要求6所述的计算机系统,其特征在于,所述展布被表示如下:
Spread ( w , l ) = - Σ i = 1 n Weight ( w , l i ) Σ j = 1 n Weight ( w , l j ) × log ( Weight ( w , l i ) Σ j = 1 n Weight ( w , l j ) ) log n
其中Spread(w,l)表示web资源w的位置l的展布,Weight(w,l)表示web资源w的位置l的权重,lx表示位置l的子位置,而n表示位置l的子位置的数目。
8.如权利要求1所述的计算机系统,其特征在于,所述地址是IP地址,所述访问信息是从点进日志中导出的,所述标识组件计算位置权重,所述权重基于所述位置的访问率与所述位置的父位置的访问率之比,并且所述标识组件计算位置的展布,所述展布指示所述位置的访问在其子位置之中的分布。
9.一种用于基于查询项来确定web资源的服务区域的计算机系统,包括:
指示其搜索结果包括对用户所选的web资源的引用的查询的点进存储(271);
标识所述查询中作为位置项的项的位置项标识组件(252);
通过向所标识的项应用内容位置检测算法来将内容位置标识为所述服务区域的服务区域标识组件(251)。
10.如权利要求9所述的计算机系统,其特征在于,包括生成包含所标识的位置项的文档的组件,并且其中所述服务区域标识组件向所生成的文档应用所述内容位置检测算法。
11.如权利要求9所述的计算机系统,其特征在于,包括消除位置项的歧义的歧义消除组件。
12.如权利要求9所述的计算机系统,其特征在于,所述位置是在一分层结构内定义的,并且其中所述内容位置检测算法基于位置项的权重并基于所述权重在分层地在所述分层结构的一位置内的各位置中的展布来将该位置标识为内容位置。
13.如权利要求12所述的计算机系统,其特征在于,所述权重基于所述位置的别名的权重。
14.如权利要求12所述的计算机系统,其特征在于,所述内容位置检测算法对每一位置生成考虑了先辈和子孙位置的权重的功效。
15.如权利要求9所述的计算机系统,其特征在于,包括消除位置项的歧义的组件,以及生成包含所标识的位置项的文档的组件,其中所述服务区域标识组件向所生成的文档应用所述内容位置检测算法,其中所述位置是在一分层结构内定义的,并且其中所述内容位置检测算法基于位置项的权重并基于所述权重在分层地在所述分层结构的一位置内的各位置中的展布来将该位置标识为内容位置。
16.一种用于基于业务类别来确定web资源的服务区域的计算机系统,包括:
将所述web资源分类成业务类别的分类器组件(264);
将业务类别映射到该业务类别内的企业所服务的区域的范围的业务类别-范围映射;
从所述web资源的内容确定提供者位置的位置提供者组件(263);以及
标识一位置分层结构内包括所述提供者位置并对应于所述web资源的业务类别的范围的位置的服务区域标识组件(261)。
17.如权利要求16所述的计算机系统,其特征在于,所述位置提供者组件使用分类器来从提取自所述web资源的内容中标识提供者位置。
18.如权利要求16所述的计算机系统,其特征在于,所述区域的范围包括城市、州和国家。
19.如权利要求16所述的计算机系统,其特征在于,所述范围对应于表示所述服务区域的半径的距离。
20.如权利要求16所述的计算机系统,其特征在于,所述位置提供者组件使用分类器来从提取自所述web资源的内容中标识提供者位置,并且其中所述区域的范围包括城市、州和国家。
CNA2007800106894A 2006-03-28 2007-02-28 检测web资源的服务区域 Pending CN101410815A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/277,704 US7606875B2 (en) 2006-03-28 2006-03-28 Detecting serving area of a web resource
US11/277,704 2006-03-28

Publications (1)

Publication Number Publication Date
CN101410815A true CN101410815A (zh) 2009-04-15

Family

ID=38560750

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007800106894A Pending CN101410815A (zh) 2006-03-28 2007-02-28 检测web资源的服务区域

Country Status (6)

Country Link
US (1) US7606875B2 (zh)
EP (1) EP2011016B1 (zh)
JP (1) JP2009531773A (zh)
KR (1) KR20090003270A (zh)
CN (1) CN101410815A (zh)
WO (1) WO2007126530A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105593841A (zh) * 2013-09-30 2016-05-18 谷歌公司 自动为网页的内容项确定大小
CN106464734A (zh) * 2014-05-20 2017-02-22 普罗克西斯托有限公司 地理定位方法
WO2018010133A1 (en) * 2016-07-14 2018-01-18 Microsoft Technology Licensing, Llc Extracting and propagating geolocation information
US10102545B2 (en) 2011-08-31 2018-10-16 Google Llc Retargeting in a search environment
US10431209B2 (en) 2016-12-30 2019-10-01 Google Llc Feedback controller for data transmissions
US10614153B2 (en) 2013-09-30 2020-04-07 Google Llc Resource size-based content item selection
US10630751B2 (en) 2016-12-30 2020-04-21 Google Llc Sequence dependent data message consolidation in a voice activated computer network environment
US10956485B2 (en) 2011-08-31 2021-03-23 Google Llc Retargeting in a search environment
CN115474170A (zh) * 2016-02-10 2022-12-13 北极星工业有限公司 利于休闲车辆的使用的方法和系统、休闲车辆及用户接口

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2002075525A1 (ja) * 2001-03-19 2004-07-08 ソニー株式会社 ソフトウエア更新システム、ソフトウエア更新方法、およびソフトウエア更新プログラム
US7574530B2 (en) * 2005-03-10 2009-08-11 Microsoft Corporation Method and system for web resource location classification and detection
US7444343B2 (en) * 2006-03-31 2008-10-28 Microsoft Corporation Hybrid location and keyword index
US7650431B2 (en) * 2006-08-28 2010-01-19 Microsoft Corporation Serving locally relevant advertisements
US8666821B2 (en) 2006-08-28 2014-03-04 Microsoft Corporation Selecting advertisements based on serving area and map area
US8745647B1 (en) * 2006-12-26 2014-06-03 Visible Measures Corp. Method and system for internet video and rich media behavioral measurement
US7840344B2 (en) * 2007-02-12 2010-11-23 Microsoft Corporation Accessing content via a geographic map
US7774348B2 (en) * 2007-03-28 2010-08-10 Yahoo, Inc. System for providing geographically relevant content to a search query with local intent
US7805450B2 (en) 2007-03-28 2010-09-28 Yahoo, Inc. System for determining the geographic range of local intent in a search query
US20080244053A1 (en) * 2007-03-30 2008-10-02 Yahoo! Inc. Geographic reader display data
US8112501B2 (en) 2007-03-30 2012-02-07 Yahoo! Inc. Centralized registration for distributed social content services
US8286086B2 (en) 2007-03-30 2012-10-09 Yahoo! Inc. On-widget data control
US7870141B2 (en) * 2007-04-17 2011-01-11 International Business Machines Corporation Method and system for finding a focus of a document
US8312108B2 (en) 2007-05-22 2012-11-13 Yahoo! Inc. Hot within my communities
US7801950B2 (en) * 2007-06-01 2010-09-21 Clustrmaps Ltd. System for analyzing and visualizing access statistics for a web site
KR100996327B1 (ko) * 2008-03-17 2010-11-23 야후! 인크. 전자지도 상에 표시하기 위한 광고를 광고 등록 서버에 등록하고 사용자 단말기 상에 광고를 표시하는 방법
US8510262B2 (en) * 2008-05-21 2013-08-13 Microsoft Corporation Promoting websites based on location
US8725727B2 (en) * 2008-09-24 2014-05-13 Sony Corporation System and method for determining website popularity by location
EP2380096B1 (en) 2008-11-25 2018-12-26 Apple Inc. Computer-implemented method for providing location related content to a mobile device
US20100185652A1 (en) * 2009-01-16 2010-07-22 International Business Machines Corporation Multi-Dimensional Resource Fallback
KR101138751B1 (ko) * 2009-04-02 2012-04-24 한국전자통신연구원 지역정보 추출을 활용한 웹 정보 가공 장치 및 방법
US9201973B2 (en) * 2009-07-10 2015-12-01 Geodex Llc Computerized system and method for tracking the geographic relevance of website listings and providing graphics and data regarding the same
US8135735B2 (en) 2009-07-10 2012-03-13 Geodex, Llc Computerized system and method for tracking the geographic relevance of website listings and providing graphics and data regarding the same
US8396888B2 (en) 2009-12-04 2013-03-12 Google Inc. Location-based searching using a search area that corresponds to a geographical location of a computing device
US20110196602A1 (en) * 2010-02-08 2011-08-11 Navteq North America, Llc Destination search in a navigation system using a spatial index structure
US9760643B2 (en) * 2010-04-09 2017-09-12 Aol Inc. Systems and methods for identifying electronic content
US8473433B2 (en) * 2010-11-04 2013-06-25 At&T Intellectual Property I, L.P. Systems and methods to facilitate local searches via location disambiguation
JP2012173937A (ja) * 2011-02-21 2012-09-10 Dainippon Printing Co Ltd 情報配信システム
US9563644B1 (en) * 2011-04-11 2017-02-07 Groupon, Inc. System, method, and computer program product for generation of local content corpus
US20150199357A1 (en) * 2011-04-14 2015-07-16 Google Inc. Selecting primary resources
US20120317087A1 (en) * 2011-06-07 2012-12-13 Microsoft Corporation Location-Aware Search Ranking
US20130006771A1 (en) * 2011-06-29 2013-01-03 Jignashu Parikh Infer location from publisher's page and match with advertisers
US20130080435A1 (en) * 2011-09-23 2013-03-28 Nokia Corporation Method and apparatus for managing online content collections
US20140032314A1 (en) * 2012-07-30 2014-01-30 Nokia Corporation Method and apparatus for providing collection-based feature programming
US9529856B2 (en) * 2013-06-03 2016-12-27 Google Inc. Query suggestion templates
US20170171323A1 (en) * 2015-12-14 2017-06-15 ZenPhone LLC Dynamic Assignment of Phone Numbers for Call Forwarding
US11887155B2 (en) 2020-11-30 2024-01-30 Direct Cursus Technology L.L.C Method and a system for selecting a targeted message to be included within a web resource

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5930474A (en) * 1996-01-31 1999-07-27 Z Land Llc Internet organizer for accessing geographically and topically based information
US6731612B1 (en) * 1998-06-29 2004-05-04 Microsoft Corporation Location-based web browsing
US6973438B1 (en) * 1998-09-11 2005-12-06 L.V. Partners, L.P. Method and apparatus for delivering information from a remote site on a network based on statistical information
US6629136B1 (en) * 1999-11-15 2003-09-30 @ Security Broadband Corp. System and method for providing geographically-related content over a network
US6516311B1 (en) * 2000-02-24 2003-02-04 Tau (Tony) Qiu & Howard Hoffenberg, As Tenants In Common Method for linking on the internet with an advertising feature
US6684250B2 (en) * 2000-04-03 2004-01-27 Quova, Inc. Method and apparatus for estimating a geographic location of a networked entity
US7076255B2 (en) * 2000-04-05 2006-07-11 Microsoft Corporation Context-aware and location-aware cellular phones and methods
US6976090B2 (en) * 2000-04-20 2005-12-13 Actona Technologies Ltd. Differentiated content and application delivery via internet
US6885860B2 (en) * 2001-01-19 2005-04-26 Microsoft Corporation Information management and processing in a wireless network
US8538803B2 (en) * 2001-06-14 2013-09-17 Frank C. Nicholas Method and system for providing network based target advertising and encapsulation
US20020156779A1 (en) * 2001-09-28 2002-10-24 Elliott Margaret E. Internet search engine
US7136871B2 (en) * 2001-11-21 2006-11-14 Microsoft Corporation Methods and systems for selectively displaying advertisements
US20030216930A1 (en) * 2002-05-16 2003-11-20 Dunham Carl A. Cost-per-action search engine system, method and apparatus
JP2004221680A (ja) * 2003-01-09 2004-08-05 Sony Corp 通信システム
US20040225562A1 (en) * 2003-05-09 2004-11-11 Aquantive, Inc. Method of maximizing revenue from performance-based internet advertising agreements
US8346770B2 (en) * 2003-09-22 2013-01-01 Google Inc. Systems and methods for clustering search results
US7606798B2 (en) * 2003-09-22 2009-10-20 Google Inc. Methods and systems for improving a search ranking using location awareness
KR100576933B1 (ko) * 2003-10-13 2006-05-10 한국전자통신연구원 지능형 웹 에이전트를 이용한 위치기반정보 제공장치 및방법
US7752210B2 (en) * 2003-11-13 2010-07-06 Yahoo! Inc. Method of determining geographical location from IP address information
KR100572751B1 (ko) * 2003-12-27 2006-04-24 학교법인 정석학원 웹 기반의 지리정보 검색 시스템
US20050216547A1 (en) * 2004-03-10 2005-09-29 Foltz-Smith Russell A System for organizing advertisements on a web page and related method
US7257577B2 (en) * 2004-05-07 2007-08-14 International Business Machines Corporation System, method and service for ranking search results using a modular scoring system
US20060059225A1 (en) * 2004-09-14 2006-03-16 A9.Com, Inc. Methods and apparatus for automatic generation of recommended links
US8768766B2 (en) * 2005-03-07 2014-07-01 Turn Inc. Enhanced online advertising system
US7822751B2 (en) * 2005-05-27 2010-10-26 Google Inc. Scoring local search results based on location prominence
US20060282455A1 (en) * 2005-06-13 2006-12-14 It Interactive Services Inc. System and method for ranking web content
US20080134042A1 (en) * 2005-09-14 2008-06-05 Magiq Technologies, Dac , A Corporation Qkd System Wth Ambiguous Control
US7650431B2 (en) * 2006-08-28 2010-01-19 Microsoft Corporation Serving locally relevant advertisements
US8666821B2 (en) * 2006-08-28 2014-03-04 Microsoft Corporation Selecting advertisements based on serving area and map area

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10102545B2 (en) 2011-08-31 2018-10-16 Google Llc Retargeting in a search environment
US10956485B2 (en) 2011-08-31 2021-03-23 Google Llc Retargeting in a search environment
US10445406B1 (en) 2013-09-30 2019-10-15 Google Llc Automatically determining a size for a content item for a web page
CN105593841B (zh) * 2013-09-30 2019-10-15 谷歌有限责任公司 自动为网页的内容项确定大小
US10614153B2 (en) 2013-09-30 2020-04-07 Google Llc Resource size-based content item selection
US11610045B2 (en) 2013-09-30 2023-03-21 Google Llc Resource size-based content item selection
US11586801B2 (en) 2013-09-30 2023-02-21 Google Llc Automatically determining a size for a content item for a web page
CN105593841A (zh) * 2013-09-30 2016-05-18 谷歌公司 自动为网页的内容项确定大小
US11093686B2 (en) 2013-09-30 2021-08-17 Google Llc Resource size-based content item selection
US11120194B2 (en) 2013-09-30 2021-09-14 Google Llc Automatically determining a size for a content item for a web page
US11120195B2 (en) 2013-09-30 2021-09-14 Google Llc Resource size-based content item selection
CN106464734A (zh) * 2014-05-20 2017-02-22 普罗克西斯托有限公司 地理定位方法
US11963064B2 (en) 2016-02-10 2024-04-16 Polaris Industries Inc. Recreational vehicle group management system
CN115474170A (zh) * 2016-02-10 2022-12-13 北极星工业有限公司 利于休闲车辆的使用的方法和系统、休闲车辆及用户接口
WO2018010133A1 (en) * 2016-07-14 2018-01-18 Microsoft Technology Licensing, Llc Extracting and propagating geolocation information
US10893088B2 (en) 2016-12-30 2021-01-12 Google Llc Sequence dependent data message consolidation in a voice activated computer network environment
US11475886B2 (en) 2016-12-30 2022-10-18 Google Llc Feedback controller for data transmissions
US10643608B2 (en) 2016-12-30 2020-05-05 Google Llc Feedback controller for data transmissions
US10630751B2 (en) 2016-12-30 2020-04-21 Google Llc Sequence dependent data message consolidation in a voice activated computer network environment
US10431209B2 (en) 2016-12-30 2019-10-01 Google Llc Feedback controller for data transmissions

Also Published As

Publication number Publication date
EP2011016B1 (en) 2017-03-22
US20070233864A1 (en) 2007-10-04
WO2007126530A1 (en) 2007-11-08
KR20090003270A (ko) 2009-01-09
US7606875B2 (en) 2009-10-20
JP2009531773A (ja) 2009-09-03
EP2011016A1 (en) 2009-01-07
EP2011016A4 (en) 2015-01-07

Similar Documents

Publication Publication Date Title
CN101410815A (zh) 检测web资源的服务区域
US7574530B2 (en) Method and system for web resource location classification and detection
US11151626B2 (en) System for browsing by walking
US20230367827A1 (en) Dynamic radius threshold selection
US20050004903A1 (en) Regional information retrieving method and regional information retrieval apparatus
US7096233B2 (en) Server, user terminal, information providing service system and information providing service method for providing information in conjunction with a geographical mapping application
CN101636935B (zh) 搜索查询中的位置
EP2549233B1 (en) Method of operating a navigation system to provide geographic location information
CN101512586A (zh) 对相关广告的本地服务
US20130036012A1 (en) Location-based service system
EP2081141A1 (en) Advertisement information providing method, advertisement information providing system and advertisement information providing program
US20110184636A1 (en) Method of Operating a Navigation System to Provide Geographic Location Information
CN101542516A (zh) 基于位置的、内容定向的信息
CN105556512A (zh) 用于分析关注实体特性的设备、系统以及方法
US20100306190A1 (en) Retrieval-Time Ranking for Community Content
US9558210B1 (en) Determining the quality of locations based on travel time investment
Wang et al. User preference awareness in city traveler helper system based on naïve bayes classification
CN117290473A (zh) 一种基于大数据的信息传播分析方法
Nayak et al. Knowledge discovery in mobile business data
KR20110103147A (ko) 정규화된 입력폼을 활용한 디지털콘텐츠 등록방법 및 그 장치와 소셜 네트워크 시스템을 활용한 디지털콘텐츠 제공방법 및 그 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20090415