CN1340785A - 以一个平行坐标系可视地分析点击流数据的系统与方法 - Google Patents

以一个平行坐标系可视地分析点击流数据的系统与方法 Download PDF

Info

Publication number
CN1340785A
CN1340785A CN01125226.XA CN01125226A CN1340785A CN 1340785 A CN1340785 A CN 1340785A CN 01125226 A CN01125226 A CN 01125226A CN 1340785 A CN1340785 A CN 1340785A
Authority
CN
China
Prior art keywords
session
product
shopping
request
web server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN01125226.XA
Other languages
English (en)
Inventor
托马斯·安舍尼·科菲诺
斯蒂芬·H·戈莫里
李峻荣
马克·爱德华·波德拉赛克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1340785A publication Critical patent/CN1340785A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Abstract

一种计算机系统和方法,它向一个网络应用的一个或多个用户提供一个或多个可视化结果。该计算机执行一个会话化过程,从一个或多个在线商店接收一个或多个Web服务器日志,并为从Web服务器日志中记录的请求中找到的每一个会话生成一个会话表。一个购物步骤探测器过程随后接收一个或多个会话表并为每个给出的会话表生成一个微转换表。最后,一个可视化过程接收一个或多个微转换表并生成一个或多个微转换的一个或多个微转换可视化结果。

Description

以一个平行坐标系可视地分析点击流数据的系统与方法
技术领域
本发明涉及通过一个计算机网络进行购物。更具体地,本发明涉及对来自一个或多个在线商店的点击流数据的可视化与分析,其中通过使用一种扩展的平行坐标系来可视化并分析点击流数据。
背景技术
通过网络进行的商务,特别是通过因特网进行的电子商务已经在过去几年中得到了显著的增长。电子商务的部分使用户/客户能够从不同的商务网站(即在线商店)访问产品信息并购买它们。在因特网上有大量目前正在运营的在线商店,包括:Amazon.com,e-Toys.com,Wal-Mart.com,LLBean.com和Macys.com。这些在线商店提供各种客户服务,来使通过网站的商务活动成为可能。基本服务的一些例子是商品目录、购物车和结帐处理,其中商品目录既是可以浏览的,又是可以根据不同的产品属性来搜索的(如关键词、名称、制造商和型号)。一些在线商店还提供高级客户服务如祝愿列表(wish list)、礼品登记、日历、产品定制配置、购买者组、聊天、电子邮件通知、产品评估、产品推荐和背景销售(in-context sales)。
由于在因特网上的购物体验变得更深入更广泛,对于在线商店的店主来说,理解并分析客户的行为并使用这种分析在他们的在线商店中来改进购物体验就成为了一个重要的任务。这种分析的一个基本单元是来自在线商店的点击流数据。点击流数据是一个一般术语,用来描述访问者通过一个或多个网站的路径。一个访问者在单次访问中所请求的一系列网页被称为一个会话。在一个在线商店中的点击流数据是在该站点上的会话的集合。点击流数据可以从记录在Web服务器日志文件中的原始页面请求(称为点击,hit)及其关联的信息(如时标、IP地址、URL、状态、已发送字节数、推荐者(referrer)、用户代理商及有时候是cookie数据)来导出。点击流的分析显示出一个网站是如何被其访问者导航并使用的。
在一个电子商务环境中,在线商店中的点击流提供十分重要的信息,以了解市场推广及经营努力的有效性,如客户如何找到商店、他们看了什么产品以及他们购买了什么产品。(虽然不是所有这些信息都可以从Web服务器的日志文件中得到,但可以从关联数据源如商务服务器数据库中提取出来,并与HTTP请求数据结合在一起。)这种对嵌入在点击流数据中的信息的分析对于提高在线商店中Web推销和交易的效果是关键性的。从对解释Web服务器日志文件中的Web使用数据的兴趣中产生出了对于Web日志分析工具的活跃的市场,该分析工具分析、概括并将Web使用模式可视化。
从对解释Web服务器日志文件中的Web使用数据的兴趣中产生出了对于Web日志分析工具的活跃的市场,该分析工具分析、概括并将Web使用模式可视化。虽然在某种程度上是有用的,但大多数现有的工具都存在以下缺点:(1)它们提供的概要掩盖了有用的详细信息,(2)如柱状图和饼图等静态显示将用户限制在被动解释上,以及(3)在购买数据与导航数据之间薄弱的(或缺乏)联系限制了对该站点投资回报效果的了解。
本发明的一个目的是一个改进的系统与方法,用于显示与一个独立变量相关的过程中的步骤。
本发明的一个目的是一个改进的系统与方法,用于显示一个过程中的顺序步骤,特别是一个网站的点击流。
本发明的一个目的是一个改进的系统与方法,用于显示一个网站的点击流数据而不会掩盖详细的信息。
本发明的一个目的是一个改进的系统与方法,用于显示一个网站上的点击流数据,既包括购买数据,也包括导航数据。
发明内容
本发明是一种计算机系统与方法,提供对一个网络应用的一个或多个用户的一个或多个可视化结果。计算机执行一个会话化过程,从一个或多个在线商店接收一个或多个Web服务器日志,并为每个从记录在Web服务器日志中的请求中找到的会话生成一个会话表。在一个优选实施方案中,这是一个按会话标识和时标(timestamp)来排序的请求列表。一个购物步骤探测器(finder)过程随后接收一个或多个会话表并为每个给出的会话表生成一个微转换(micro-conversion)表。最后,一个可视化过程接收一个或多个微转换表并生成一个或多个微转换的一个或多个微转换可视化结果。在一个优选实施方案中,微转换可视化结果被以平行坐标进行显示。
附图说明
前述及其他目的、方面和优点将从下面参照附图对本发明优选实施方案所进行的非限定性的详细叙述中得到更好的理解,附图包括:
图1是一个优选系统体系结构的方块图。
图2是一个优选业务过程的流程图。
图3是一个在线商店结构的示例。
图4是一个在线商店的Web服务器日志的示例。
图5是在一个优选实施方案中使用的一个在线商店的会话示例。
图6是在一个在线商店中微转换的示例。
图6A是一个购物步骤探测器过程的流程图。
图7是一个现有技术的平行坐标系的示例。
图8是一个使用一个平行坐标系的微转换可视化结果的示例。
图9是一个带有过滤器的微转换可视化结果示例。
图10是浏览一个以上的在线商店的会话示例。
图11是浏览一个以上的在线商店的会话的微转换示例。
图12是访问一个以上在线商店的可视化会话示例。
具体实施方式
本发明提供了一种交互平行坐标系,它能够被用于向用户提供更大的能力来解释并探查在Web上的在线商店的点击流数据。平行坐标是一种可视化方法,用于显示多变量数据组,从而标识出变量之间的关系。一个平行坐标系包括一系列平行线,它们垂直于一个笛卡尔坐标系统的x轴(或y轴),并且最好每个相邻的轴是等距离的,虽然等距离并不是必须的。每个平行轴被赋予一个规定的相关变量,并且相关变量的值沿各自的轴向绘制。独立变量由连接与该独立变量相关的对应相关变量值的多边折线来表示,并且它说明了一个独立变量与出现在每个轴上的相关变量的关系。
在本发明中的交互平行坐标系使用系统的多个轴来代表其在一个Web站点上导航期间发生的会话的顺序步骤,并将大量的单独会话显示为多边折线。该会话是一组事件(事件可以被分割为事件子集。每个轴代表会话中的一个事件。与在相应轴上表示的事件相关联的一个独立变量是为会话中的一个或多个事件而绘制的。例如,一个会话的点击流由一个多边折线来表示,它与其由事件相应轴来表示的一个事件的时标值相交。
在一个替换实施方案中,会话还可以被分类。例如,平行坐标系的一个或多个轴可以被用来通过以一个轴变量为分类器(classifier)而对会话进行分类。例如,如果“分类器轴”的变量是服务提供商,则所有从服务提供商“A”发起的会话会从在分类器轴上的点“A”开始,而所有从服务提供商“B”发起的会话则会从在分类器轴上的点“B”开始。比如,借助一个或多个可将赋予轴的会话分类的变量,如推荐者和主机名,系统可以将会话类别与导航路径之间的关系可视化。
在一个实施方案中,会话不是始终具有在所有轴上绘制的事件。通过按时间序列的顺序安排这些轴,一个用户能够确定每个会话在时间序列顺序中的哪点结束。如果一个特定轴被选定为“终止”步骤,如产品购买,本发明会向用户给出一个清晰的可视显示,指示出有多少会话在该“终止步骤”结束,如有多少客户会话在一个产品购买中结束。进而,通过观察一个多边折线结束的轴,可以直接看到在什么点位会话离开了该站点。
在另一个实施方案中,通过提供用于过滤、颜色编码、子分类及动态查询的设备,本发明帮助用户主动地探查并解释感兴趣的数据。
图1(100)是一个优选系统体系结构的方块图,显示了被购物者所使用的一个或多个计算机(101)、在因特网上的一个在线商店(103)、一个被用于在用户计算机(101)和在线商店(103)之间进行通信的计算机网络(102)、将来自在线商店(103)的web服务器日志数据(400)转换为会话数据(500)的会话化过程(109)、将会话数据(500)转换为微转换数据(600)购物步骤探测器过程(111),以及通过使用一个平行坐标系将微转换数据(600)转换为购物活动可视化结果(800)的可视化过程(113)。
当一个购物者想要通过使用因特网(102)来寻找某种产品信息和/或购买一个或多个产品时,他/她启动在其计算机(101)中的一个Web浏览器程序(105),并访问在因特网上销售其感兴趣产品的一个在线商店(103)。在线商店(103)是由一个接收来自购物者的Web页面请求(106)并将所请求的Web页面(107)发送回购物者的Web服务器系统(104)来实现的。对于在购物者的计算机(101)和在线商店(103)之间的这种通信,Web浏览程序(105)和Web服务器(104)通常使用HTTP(超文本传输协议),它是一种为此目的而定义并实施的网络协议。一个购物者导航到一个在线商店(103),即,通过网络(102)请求Web页面,并浏览提供在该店中销售的一个或多个产品的信息的Web页面。
在线商店(103)中的Web服务器系统(104)在其Web服务器日志(400)中记录下购物者对在线商店(103)的导航。即,Web服务器系统(104)在Web服务器日志(400)中记录其从购物者处接收到的所有请求(106),连同一些辅助数据,如时标(401)、会话标识(402)以及在每个请求(106)所请求的Web页面(405)中所显示的链接。这些辅助数据的细节稍后将会在图4(400)中进行叙述。在一个优选实施方案中,一个会话化过程(109)接收储存在Web服务器日志(400)中的一组请求(106)作为输入,并从该请求中提取出会话(500)。在这个实施方案中,会话化过程(109)包括用会话标识(402)、再用时标(401)对Web服务器日志(400)进行排序。其他实施方案是可以预见的。
一个会话是由一次单独访问中的一个购物者所发出的一系列Web页面请求(106)。购物步骤探测器过程(111)在图6A中进行了详细叙述。通常,购物步骤探测器过程确定是否存在与平行坐标的一个轴匹配的请求,以及在相应轴上绘制的独立变量的值是什么。例如,探测器过程得到由会话化过程(109)提取出的会话(500)作为输入,并标识输入的每个会话(500)的每个购物步骤中所见到的产品。购物步骤探测过程(111)的输出被称为微转换(600),并且,在该例中,显示出在一个购物步骤中所见的产品有多少被转换为下一个购物步骤。
在一个非限制性示例中,一个优选的购物步骤组包括产品印象(product impression)(604)、点击通过(click-through)(605)、购物篮放置(basket placement)(606)和购买(607),并且将在图6(600)中对其进行详细叙述。
关于一个更详尽的微转换描述,可以参考美国专利申请号09/238,861,由J.Lee,L.Morgenstern,M.Podlaseck,E.Schonberg,和D.Wood所著,题为“一种用于收集与分析与在一个网络(万维网)环境中所请求内容有关的信息的系统与方法”,受理于1999年1月27日;并可参考美国专利申请号09/238,348,由J.Lee,L.Morgenstern,M.Pldlaseck,E.Schonberg和D.Wood所著,题为“汇总并分析与在一个电子商务Web环境中所请求的内容相关的信息,以确定转换率”,受理于1999年1月27日。
最后,可视化过程(113)得到由前一个过程(111)所生成的微转换(600)作为输入,并通过使用一个平行坐标系生成在线商店中一个或多个购物活动的可视化结果(800)作为输出。可视化过程(113)在平行坐标系中为每个具有匹配轴的请求在相应轴上绘制独立变量的值。在一个优选实施方案中,可视化过程还生成多边折线(使用已知技术)来连接在每个相应轴上所绘的点。在替换实施方案中,可视化过程(113)绘制不同类型的线条(如不同粗细、颜色类型等)来进一步对已绘特征进行子分类。例如,由不同客户级别启动的会话可以用不同颜色的线条来表示。会话还可以由其他标准来分类,如访问在线商店的类型,以及所用浏览器程序和/或操作系统的类型与版本。
图2(200)是一个优选业务过程的流程图。本发明提供了在一个在线商店(103)中的购物者活动的可视化结果(800),它可以被在线商店的店主使用,以理解其商店的效率和/或识别其商店的一个或多个瓶颈。店主可以使用这个信息来调整其Web设计和/或交易与推销策略来提高其商店的性能。这个业务过程的第一个步骤(202)是以在线商店(103)的Web服务器(104)在其Web服务器日志(400)中记录所有来自购物者的请求(106)而开始的。
然后,在(203),储存在Web服务器日志(400)中的数据被周期性地,即每天、和/或根据需要,为分析的目的而进行检索。接下来,(分别在步骤204,205和206),如前面所解释的,Web服务器日志数据(400)被会话化过程(109)、购物步骤探测器过程(111)和可视化过程(113)所处理,来生成在该在线商店(103)中的购物者活动的一个或多个可视化结果(800)。
在某些优选实施方案中,生成的可视化结果(800)通常伴有不同的过滤器,业务分析员可以交互地使用它们,以根据其需要来选择和/或淘汰一个或多个数据组。例如,业务分析员可以识别商店在什么地方失去客户、以及有多少客户被失去了,了解不同经商战术的效果,并了解及比较不同购物者组的购物行为,如来自不同推荐者(将购物者引导到该在线商店的Web站点)的购物者、来自不同ISP(因特网服务提供商)的购物者、和/或使用不同方法来寻找商店中的产品信息(如分级浏览、关键词搜索、参数搜索、和/或推荐)的购物者。在图9(900)、6(600)和6A(650)中将对可视化结果(800)过滤器的使用进行详细的描述。
下一步(207),通过检查已生成的在线商店(103)中的购物者活动可视化结果(800),业务分析员了解了其商店的效果和/或识别出其商店的一个或多个问题,如促销产品的一个中断的链接、或者一个冗长的和麻烦的结帐过程。业务分析员根据他们的发现为商店的改进提出建议。
通过使用来自业务分析员的分析结果,在线商店(103)的市场人员、商务人员和网站设计人员在步骤(208)开发和/或更新他们的网站设计策略、市场和商业策略,并且为新的/更新的策略生成适当的建议。最后,在(209),来自网站设计人员、市场人员和商务人员的建议被送达网站编程人员和在线商店(103)的管理员那里,他们来实现所建议的在网站外观方面的变化和/或在线商店(103)的导航路径,及该商店在市场推广和商业努力上的其他Web方面的表现,如在象Yahoo!、AltaVista、Lycos和Excite@Home这样的门户站点上的旗帜广告和其他链接。
见美国专利申请号XXX,题为“用于以一个平行坐标系来可视地分析点击流数据的业务方法”,与本申请受理于同一天,由JuhnyoungLee等人所著,收编于此以供整体参考。
图3(300)是一个现有技术的在线商店结构的示例,显示了在线商店(103)的购物者能够请求的所有Web页面。它们包括首页(301),产品类别A(302),产品类别B(303),从首页(301)上进行促销的产品P1(304),搜索页(305)和搜索结果页(311),属于产品类别A(302)的产品A1(306)和A2(307),属于产品类别B(303)的产品B1(308),B2(309)和B3(310),购物篮页(312),购买页(313),以及感谢页(315)。图中两个方框之间的箭头线表示从源页面到目的页面有一个链接,以便购物者能够直接从源页面去访问目的页面。也就是说,一个Web页面中包含到从该页面可以访问的所有目的页面的超级链接。例如,产品P1页(304)是从首页(301)可以直接访问到的,但不能从产品A1页(306)直接访问。同样,首页301包含到四个不同Web页面的超级链接:产品类别A(302)、产品类别B(303)、产品P1(304)和搜索页(305)。产品P1页(304)只包含一个到购物篮页(312)的超级链接。注意,搜索结果页(311)是一个动态页面,其内容根据在搜索页(305)中所使用的关键词而变化。除了到购物篮页(312)的超级链接之外,搜索结果页(311)还可以包含零个或多个到产品页面的超级链接。
图4(400)是一个在线商店Web服务器日志的示例,显示了多个对在线商店(103)的请求,103的结构如图3(300)所示。每个请求由若干属性组成,包括时标(401)、会话标识(402)、推荐者(403)、所请求的页面(404)和链接(405)。时标(401)是当请求被发向Web服务器系统(104)时系统生成的时间。在本日志数据(400)中,请求是以时标升序排列的。会话标识(402)是对不同会话的唯一标识号码。如前面所解释的那样,一个会话是在一次单独访问中由购物者请求的一系列Web页面。在这个日志数据(400)中,有三个会话,其标识为S1、S2和S3。来自这三个会话的请求根据其时标被交替插入日志中。一个推荐者(403)是当他/她作出这个请求时所处于的Web页面。例如,会话S1的第一个请求(在T1时刻作出)的推荐者是R1,一个外部Web页面,而S1的第二个请求(在T3时刻作出)的推荐者是首页,它也是前一个请求的当前页(404)。链接(405)是包含在当前页(404)中的超级链接。例如,在T1时刻,当前页(404),即首页(301)的链接(405)是产品类别A(302)、产品类别B(303)、产品P1(304)和搜索页(305)。在T9,当前页(404),即搜索结果页(311)的链接(405)是到三个产品页的超级链接,即A2(307)、B1(308)和B2(309),它们是由在线商店的搜索功能动态生成的。在服务器日志(400)中使用这些链接(405)是新颖的。
图5(500)是在一个在线商店中的会话示例,显示了从Web服务器日志(400)中提取的三个会话。会话化过程(109)借助使用时标(401)和会话标识(402)从Web服务器日志(400)中的请求(106)中提取会话。在这个示例中,过程(109)提取出了三个会话S1(501)、S2(502)和S3(503)。每个会话的结构与Web服务器日志(400)相同,具有时标(501)、会话标识(505)、推荐者(506)、当前页(607)和链接(508)。在每个会话中的请求与在Web服务器日志(400)中的请求相同,除非它们现在被以不同的会话表所分离,每个会话一个表。
图6(600)是一个在线商店中微转换的示例,显示了在不同购物步骤中不同会话(即购物者)(500)的转换。购物步骤探测器过程(111)标识在所考虑的每个购物步骤中见到的产品。一个优选的在线商店购物步骤组由以下四个步骤组成:产品印象(查看到一个展示产品的Web页面的超级链接)(604),点击通过(在该超级链接上点击并观看该产品的Web页面)(605),购物篮放置(将物品放入购物篮中)(606),以及购买(物品的购买,即交易完成)(607)。微转换是指一个购物者为一个产品移动到下一个购物步骤。在这个示例中,购物步骤探测器(111)为每个会话S1(601)、S2(602)和S3(603)生成一个微转换表。例如,S1(601)具有五次产品印象,T1、T3、T10、T12和T14。在T1时,S1见到的是P1的印象。在T3,S1见到的是A1和A2的印象。在T10,S1见到的是P1的印象。在T12,S1见到的是B1、B2和B3的印象。在T14,S1再次见到了B1、B2和B3的印象。在这些产品印象之中,只有三个被转换为点击通过,即T3时的A1、T12时的B2和T14时的B3。接着出自这三个中的两个点击通过被转换为购物篮放置,A1和B3。最后,两个购物篮放置,即A1和B3都被转换为购买。购物步骤探测器过程(111)以相同的方式识别会话S2和S3的微转换,并生成微转换表(600(b)和600(c))。
图6A(650)是一个购物步骤探测器过程(111)的流程图。该过程以两种类型的输入开始:在一个会话中标记为{R}的一个请求集合,和标记为{S}的一个(购物)步骤集合,过程将在属于{R}的请求中进行识别。{S}的元素,即(购物)步骤,提供标准,用于决定一个请求是否属于每个步骤。例如,如果请求(507)的Web页面包含一个或多个到一个产品页面的超级链接(508),则在一个会话中的一个请求属于产品印象步骤(604)。同样,如果请求(507)的当前页是一个产品页面,则一个请求属于点击通过步骤(605)。如果请求(507)的当前页是一个购物篮页面,则一个请求属于购物篮放置步骤(606)。最后,如果请求(507)的当前页是一个购买页面,则一个请求属于购买步骤(607)。
购物步骤探测器过程(111和650)通过使用每个步骤的判决准则来检查哪个请求属于什么步骤(655)。当过程发现一个请求属于一个步骤,则它将该请求标记为该步骤的一个元素(656)。在{R}中的每个元素,即在给定会话中的每个请求都对{S}中的每个步骤进行了这个检查之后,过程输出另一个集合{C},其元素Ci代表包括在步骤(659)被标记为一个特定步骤,集合{S}的Si,的一个或多个请求的微转换。购物步骤探测器过程(111和650)为每个会话(500)执行,以识别该会话的购物步骤,它将被一个平行坐标系(113)进行可视化。
图7(700)是一个现有技术的平行坐标系示例,它是为显示多变量数据集合以识别集合中变量之间的关系而开发的。一个平行坐标系(700)包括一系列平行线(701,702,703和704),它们被等距排列。每个平行轴被赋予一个规定的相关变量(如X(701),Y(702),Z(703)和W(704)),并且沿各个轴绘制相关变量值(705)。独立变量是由多边折线(706)来表示的,(706)连接相应的相关变量值(也被称为数据点)(705),并且描绘了一个独立变量与出现在每个轴上的相关变量之间的关系。
图8(800)是带有一个平行坐标系的微转换可视化结果的示例。在这张图中,每个多边折线代表一个单独的会话(501,502或503),以及其在一个在线商店(103)中的进展(progression)。第一平行轴(801)代表一个会话分类器(categorizer),在本示例中,是每个会话的初始推荐者(506)。在图中有两个推荐者,即A(806)和B(807)。后面四个平行轴代表在一个在线商店(103)中的购物步骤,即,产品印象(802)、点击通过(803)、购物篮放置(804)和购买(805)。对于购物步骤轴中的数据点,使用会话的时标。对数据点使用时标的一个优点是,因为它们对各个会话是唯一的,没有两个会话在这些轴上会共享相同的数据点。使用对各个会话唯一的数据点防止在两条平行轴之间发生重迭线的问题,这在平行坐标可视化中是严重的,因为它有时会影响可视化的准确性。对数据点使用时标的一个缺点是它们不能承载任何有意义的值。也就是说,在一个购物步骤轴中一个数据点的存在不能说明有多少产品被查看了、放到购物篮中了、或者购买了。它仅仅说明有一个或多个产品被查看、放入购物篮或购买了。
在这张图中,重要的是应当注意,有些多边折线(808,809,810,812和813)在它们到达最后的购物步骤,即购买(805)之前就终止了。如果会话没有转换到下一个步骤,则本发明中的平行坐标系不能给与一个会话下一个购物步骤以及后面步骤的一个数据点值。因此,每个多边折线在会话所到达的最后步骤处终止,这显示出会话离开商店的点(位置)。本图(800)显示,当多边折线由左至右直至购买线(805)时,连接两个相邻平行轴的线条数目减少了。多边折线的中断(dropout)可视化地显示出商店在什么地方失去了它的客户。
关于本图的另一个注意点是,每条代表一个会话的多边折线可以与一个或多个超级链接相关联。在这些超级链接上的点击带来了一个或多个提供关于关联会话更多信息的Web页面,如关于会话所有者和在会话中追踪的产品的信息。这个特点被称为超级链接关联。
图9(900)是一个带有过滤器的微转换(micro-conversion)可视化示例。在本发明中的平行坐标系可以有零个或多个过滤器,它们帮助用户在可视化中交互地选择和/或淘汰一个或多个会话和客户组。一个过滤器也可以与第一平行轴(901)相关,(901)是一个会话分类器。在本图中,有两个过滤器,即推荐者(910)和产品类别(920)。推荐者过滤器(910)有三个值,推荐者A、B和C。在本例中,推荐者A和B被选定,而C则没有。这个推荐者过滤器也由第一平行轴来代表,并且显示了两个值A(906)和B(907)。在这个平行坐标系中被可视化的所有会话来自A或B网站。现实世界中有关的推荐者例子可能包括门户站点如Yahoo!,AltaVista,Lycos和Excite@Home。产品类别过滤器有四个值,并且它们中的两个值男用和女用被选中。即,在本图中被可视化的所有会话会见到或者来自男用类别,或者来自女用类别的产品。为了对那些见到了女用产品的会话和见到男用产品的会话进行区分,平行坐标系可以使用不同的颜色来显示多边折线。例如,使用蓝色来显示见到男用产品的会话的多边折线,而对见到女用产品的会话使用红色。
图10(1000)是对一个以上的在线商店进行浏览的会话的示例。当一个购物者试图在因特网上或现实世界中寻找一个或多个感兴趣的产品时,他/他经常会访问一个以上的在线商店来浏览并比较在不同商店中所销售的产品。通过汇总带有通常在多个在线商店之间共享的购物者会话标识的来自一个或多个在线商店(103)的Web服务器日志(400),一个扩展会话化过程(109)可以构筑浏览多个在线商店的会话。在本图中(1000),一个标记为S3(1002)的会话访问了三个商店,第一个是ST1,而后是ST2,最后是ST3(1003)。除了商店列(1003)之外,会话表(1000)包含相同的会话属性,即时标(1001)、会话标识(1002)、推荐者(1004)、当前页(1005)和链接(1006)。
图11(1100)是一个浏览一个以上在线商店的会话的微转换的示例。从图10(1000)中所示的扩展会话表中,一个扩展购物步骤探测器过程(111)能够为一个访问多个在线商店的会话生成一个微转换表。本图(1100)显示了图10(1000)所示的会话S3的产品印象(1101)、点击通过(1102)、购物篮放置103)和购买(1104)。与对一个在线商店的微转换表(600)不同,本表在每个数据条目中具有商店名称、如ST1、ST2或ST3,以及时标和产品名称。
图12(1200)是一个访问一个以上在线商店的可视化会话的示例。在四个商店,商店1(1206)、商店2(1207)、商店3(1208)和商店4(1209)中,本图可视化了两个会话的进展,会话X(1210)和会话Y(1211)在本平行坐标系中的第一平行轴(1201)将商店用作会话分类器。后面四个轴(1202,1203,1204和1205)是四个购物步骤,即产品印象、点击通过、购物篮放置和购买,如前所述。注意,在购物步骤轴中的数据点是相应活动的时标。可视化结果描绘了会话X(1210)首先访问了商店1(1206),但在点击通过步骤(1212)离开了该商店。然后它(1210)访问了商店2(1207)并在点击通过步骤(1213)再次离开该商店。接着会话X(1210)访问了商店3(1208)并从该商店进行了购买(1215)。而另一方面,会话Y(1211)首先访问了商店2并在购物篮放置步骤(1214)离开了该商店。然后它(1211)访问商店4(1209),却在点击通过步骤(1216)离开了该商店。最后,会话Y(1211)访问了商店1(1206)并在该商店进行了购买(1217)。

Claims (20)

1.一个计算机系统,用于为用户提供一个或多个可视化结果,该系统包括:
一个或多个中央处理单元,一个或多个存储器,以及一个或多个到一个或多个网络的网络接口;
一个会话化过程,它从一个或多个在线商店接收一个或多个Web服务器日志,并为每个从记录在Web服务器日志中的请求中找出的会话生成一个会话表;
一个购物步骤探测器过程,它接收一个或多个会话表,并为每个给出的会话表生成一个微转换表;以及
一个可视化过程,它接收一个或多个微转换表,并生成一个或多个微转换的一个或多个微转换的可视化结果。
2.权利要求1中的一个系统,其特征在于Web服务器日志包括一个或多个Web页面请求记录。
3.权利要求2中的一个系统,其特征在于Web页面请求记录包括一个时标,它是发出请求时的系统生成的时间;一个用户标识,它是标识发出请求的用户的唯一号码;一个会话标识,它是标识一个发出请求的会话的唯一标识;一个推荐者,它是发出这个请求之前刚刚看到的Web页面;一个当前页,它是所请求的Web页面;以及一个超级链接组,它包含在当前页中。
4.权利要求1中的一个系统,其特征在于会话表包括一个或多个Web页面请求记录,在一个会话表中所有会话标识值是相同的。
5.权利要求1的一个系统,其特征在于微转换表包括在一个在线商店中的购物步骤和每个购物步骤的产品条目。
6.权利要求5中的一个系统,其特征在于购物步骤包括一个产品印象步骤,它是对一个到展示一种产品和/或服务的Web页面的超级链接的查看;一个点击通过步骤,它是在该超级链接上点击并查看该产品和/或服务的Web页面;一个购物篮放置步骤,它是将物品放置在购物篮中;以及一个购买步骤,它是购买物品并完成交易。
7.权利要求5中的一个系统,其特征在于产品或服务条目包括一个产品或服务标识,它是标识该产品或服务的唯一号码;以及一个在相应购物活动发生时的时标。
8.权利要求1中的一个系统,其特征在于微转换可视化结果包括一个传统的平行坐标系和一个或多个扩展组件。
9.权利要求8中的一个系统,其特征在于传统平行坐标系是一个包括一系列等距排列的平行线的平行坐标系,每条平行线被赋予一个规定的相关变量,并且相关变量值被沿各自的轴向进行绘制,以及一个独立变量,它由连接相应相关变量值(也被称为数据点)的多边折线来表示,它说明一个独立变量和每个轴上出现的相关变量之间的关系。
10.权利要求8中的一个系统,其特征在于扩展组件包括顺序事件的一个或多个平行轴,时标的一个或多个相关变量,多边折线的一个或多个中断,一个或多个过滤器,一个或多个分类器,以及一个或多个超级链接关联。
11.权利要求10中的一个系统,其特征在于顺序事件的平行轴是将一系列顺序事件分配给平行坐标系中的平行线。
12.权利要求11中的一个系统,其特征在于顺序事件包括在一个或多个在线商店中的一个或多个购物步骤,以及一个或多个产品或服务开发步骤。
13.权利要求10中的一个系统,其特征在于时标的相关变量值是将时标值赋予一系列顺序事件的数据点,它们在平行坐标系中被赋予相同数目的平行轴。
14.权利要求10中的一个系统,其特征在于一个多边折线的中断是一个多边折线在线条到达一个带有顺序事件的平行轴的平行坐标系中的最后一个平行轴之前就消失了。
15.权利要求10中的一个系统,其特征在于过滤器是一个装置,用于选择和/或淘汰在一个平行坐标系中所看到的一个或多个多边折线组。
16.权利要求10中的一个系统,其特征在于分类器是在平行坐标系中的一个平行轴,其目的是在系统中对多边折线进行分类。
17.权利要求16中的一个系统,其特征在于分类器包括一个或多个以下内容:会话推荐者的Web站点,会话的ISP(因特网服务提供商),会话的长度,会话寻找产品或服务信息所使用的方法,会话所来自的地理区域,会话所有者的年龄、性别、教育水平以及收入水平,会话所有者的销售历史记录,会话或者会话所有者所访问的Web页面模式,或者按照或者不按照会话或时间来排序。
18.权利要求10中的一个系统,其特征在于超级链接关联是一个或多个带有表示一个会话的多边折线的超级链接,在多边折线上进行点击可以打开一个传达会话详细信息的Web页面。
19.一种方法,用于可视地分析点击流数据,它包括以下步骤:
从一个或多个在线商店的Web服务器系统接收一个或多个Web服务器日志;
从给出的Web服务器日志中生成一个或多个会话表;
从所生成的会话表生成一个或多个微转换表;
从所生成的微转换表生成一个或多个微转换可视化结果;以及
根据来自一个或多个用户的交互请求,交互地生成一个或多个所生成的微转换可视化结果的变体。
20.一个用于可视地分析点击流数据的计算机系统包括:
用于从一个或多个在线商店的Web服务器系统接收一个或多个Web服务器日志的装置;
用于从给出的Web服务器日志中生成一个或多个会话表的装置;
用于从所生成的会话表生成一个或多个微转换表的装置;
用于从所生成的微转换表生成一个或多个微转换可视化结果的装置;以及
用于根据来自一个或多个用户的交互请求,交互地生成一个或多个所生成的微转换可视化结果的变体的装置。
CN01125226.XA 2000-09-01 2001-08-31 以一个平行坐标系可视地分析点击流数据的系统与方法 Pending CN1340785A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/654,202 US6996536B1 (en) 2000-09-01 2000-09-01 System and method for visually analyzing clickstream data with a parallel coordinate system
US09/654,202 2000-09-01

Publications (1)

Publication Number Publication Date
CN1340785A true CN1340785A (zh) 2002-03-20

Family

ID=24623870

Family Applications (1)

Application Number Title Priority Date Filing Date
CN01125226.XA Pending CN1340785A (zh) 2000-09-01 2001-08-31 以一个平行坐标系可视地分析点击流数据的系统与方法

Country Status (4)

Country Link
US (1) US6996536B1 (zh)
EP (1) EP1204036A1 (zh)
CN (1) CN1340785A (zh)
SG (1) SG108271A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101188521B (zh) * 2007-12-05 2010-07-14 北京金山软件有限公司 一种挖掘用户行为数据的方法和网站服务器
CN103314635A (zh) * 2010-11-15 2013-09-18 捷讯研究有限公司 控制移动设备上的数据传送
CN104091276A (zh) * 2013-12-10 2014-10-08 深圳市腾讯计算机系统有限公司 在线分析点击流数据的方法和相关装置及系统
CN107004370A (zh) * 2014-12-22 2017-08-01 英特尔公司 上下文导出的行为建模和反馈
CN107169089A (zh) * 2017-05-12 2017-09-15 武汉理工大学 一种基于聚类的多维流数据可视分析方法
CN113037823A (zh) * 2015-01-23 2021-06-25 电子湾有限公司 消息传递系统和方法
US11818049B2 (en) 2015-01-23 2023-11-14 Ebay Inc. Processing high volume network data

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7962603B1 (en) 2000-06-06 2011-06-14 Nobuyoshi Morimoto System and method for identifying individual users accessing a web site
US7660869B1 (en) * 2000-08-21 2010-02-09 Vignette Software, LLC Network real estate analysis
US7278105B1 (en) 2000-08-21 2007-10-02 Vignette Corporation Visualization and analysis of user clickpaths
GB0025299D0 (en) * 2000-10-13 2000-11-29 Ibm Request tracking for analysis of website navigation
US7565304B2 (en) 2002-06-21 2009-07-21 Hewlett-Packard Development Company, L.P. Business processes based on a predictive model
US7610211B2 (en) * 2002-06-21 2009-10-27 Hewlett-Packard Development Company, L.P. Investigating business processes
US7627688B1 (en) * 2002-07-09 2009-12-01 Vignette Corporation Method and system for detecting gaps in a data stream
US7461120B1 (en) 2002-07-09 2008-12-02 Vignette Corporation Method and system for identifying a visitor at a website server by requesting additional characteristic of a visitor computer from a visitor server
US7603430B1 (en) 2002-07-09 2009-10-13 Vignette Corporation System and method of associating events with requests
US7349827B1 (en) * 2002-09-18 2008-03-25 Doubleclick Inc. System and method for reporting website activity based on inferred attribution methodology
US7853684B2 (en) * 2002-10-15 2010-12-14 Sas Institute Inc. System and method for processing web activity data
US7567979B2 (en) * 2003-08-15 2009-07-28 Microsoft Corporation Expression-based web logger for usage and navigational behavior tracking
US8103880B2 (en) * 2005-06-03 2012-01-24 Adobe Systems Incorporated Method for communication between computing devices using coded values
US8311663B2 (en) * 2005-08-31 2012-11-13 International Business Machines Corporation Apparatus and method to store information
US8487930B2 (en) * 2006-03-10 2013-07-16 Honeywell International Inc. Process monitoring using multivariate data
US10110687B2 (en) * 2006-10-06 2018-10-23 International Business Machines Corporation Session based web usage reporter
US8396834B2 (en) * 2006-10-10 2013-03-12 International Business Machines Corporation Real time web usage reporter using RAM
WO2008094712A2 (en) 2007-02-01 2008-08-07 7 Billion People Dynamic reconfiguration of web pages based on user behavioral portrait
US10642794B2 (en) * 2008-09-11 2020-05-05 Vmware, Inc. Computer storage deduplication
US20100070856A1 (en) * 2008-09-12 2010-03-18 International Business Machines Corporation Method for Graphical Visualization of Multiple Traversed Breadcrumb Trails
WO2010135430A1 (en) 2009-05-19 2010-11-25 Vmware, Inc. Shortcut input/output in virtual machine systems
US9083756B2 (en) * 2010-08-09 2015-07-14 Ebay Inc. Session analysis systems and methods
US8655907B2 (en) 2011-07-18 2014-02-18 Google Inc. Multi-channel conversion path position reporting
US20130030908A1 (en) * 2011-07-28 2013-01-31 Google Inc. Conversion Path Comparison Reporting
US8959450B2 (en) 2011-08-22 2015-02-17 Google Inc. Path explorer visualization
US20130085837A1 (en) * 2011-10-03 2013-04-04 Google Inc. Conversion/Non-Conversion Comparison
US9280590B1 (en) 2013-10-10 2016-03-08 Google Inc. Systems and methods for attribute-based user data visualizations
US10965573B1 (en) 2014-09-09 2021-03-30 Wells Fargo Bank, N.A. Systems and methods for online user path analysis
JP6532762B2 (ja) * 2015-06-02 2019-06-19 株式会社東芝 情報生成システム、装置、方法、及びプログラム
TWI564831B (zh) 2015-12-11 2017-01-01 財團法人工業技術研究院 資料視覺化方法與資料視覺化裝置
US10198753B2 (en) * 2016-05-18 2019-02-05 Nec Corporation Privacy-aware in-network personalization system
CN109325825B (zh) * 2018-09-04 2020-06-30 口口相传(北京)网络技术有限公司 流量数据的调控方法及装置
US20200175522A1 (en) * 2018-11-29 2020-06-04 Fmr Llc Predicting online customer service requests based on clickstream key patterns
US11501295B2 (en) * 2019-07-24 2022-11-15 Advanced New Technologies Co., Ltd. Object distribution processing
US10986200B1 (en) * 2020-06-30 2021-04-20 TD Ameritrade IP Company, Inc String processing of clickstream data

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5546516A (en) 1994-12-14 1996-08-13 International Business Machines Corporation System and method for visually querying a data set exhibited in a parallel coordinate system
US6181935B1 (en) 1996-09-27 2001-01-30 Software.Com, Inc. Mobility extended telephone application programming interface and method of use
US6112238A (en) * 1997-02-14 2000-08-29 Webtrends Corporation System and method for analyzing remote traffic data in a distributed computing environment
JP4155363B2 (ja) * 1997-06-19 2008-09-24 富士通株式会社 データ表示装置、データ表示方法、およびデータ表示用プログラムを記録した記録媒体
JP2000513916A (ja) 1997-06-25 2000-10-17 サムソン エレクトロニクス カンパニー リミテッド ホームネットワーク自動ツリー生成器に対する方法及び装置
US6175838B1 (en) * 1998-04-29 2001-01-16 Ncr Corporation Method and apparatus for forming page map to present internet data meaningful to management and business operation
US6286030B1 (en) 1998-07-10 2001-09-04 Sap Aktiengesellschaft Systems and methods for recording and visually recreating sessions in a client-server environment
US6223215B1 (en) * 1998-09-22 2001-04-24 Sony Corporation Tracking a user's purchases on the internet by associating the user with an inbound source and a session identifier
US6466970B1 (en) * 1999-01-27 2002-10-15 International Business Machines Corporation System and method for collecting and analyzing information about content requested in a network (World Wide Web) environment
US6850988B1 (en) * 2000-09-15 2005-02-01 Oracle International Corporation System and method for dynamically evaluating an electronic commerce business model through click stream analysis

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101188521B (zh) * 2007-12-05 2010-07-14 北京金山软件有限公司 一种挖掘用户行为数据的方法和网站服务器
CN103314635A (zh) * 2010-11-15 2013-09-18 捷讯研究有限公司 控制移动设备上的数据传送
CN103314635B (zh) * 2010-11-15 2017-01-18 黑莓有限公司 控制移动设备上的数据传送
CN104091276A (zh) * 2013-12-10 2014-10-08 深圳市腾讯计算机系统有限公司 在线分析点击流数据的方法和相关装置及系统
CN107004370A (zh) * 2014-12-22 2017-08-01 英特尔公司 上下文导出的行为建模和反馈
CN113037823A (zh) * 2015-01-23 2021-06-25 电子湾有限公司 消息传递系统和方法
US11818049B2 (en) 2015-01-23 2023-11-14 Ebay Inc. Processing high volume network data
US11916727B2 (en) 2015-01-23 2024-02-27 Ebay Inc. Processing high volume network data
CN113037823B (zh) * 2015-01-23 2024-03-22 电子湾有限公司 消息传递系统和方法
CN107169089A (zh) * 2017-05-12 2017-09-15 武汉理工大学 一种基于聚类的多维流数据可视分析方法
CN107169089B (zh) * 2017-05-12 2020-09-01 武汉理工大学 一种基于聚类的多维流数据可视分析方法

Also Published As

Publication number Publication date
SG108271A1 (en) 2005-01-28
US6996536B1 (en) 2006-02-07
EP1204036A1 (en) 2002-05-08

Similar Documents

Publication Publication Date Title
CN1340785A (zh) 以一个平行坐标系可视地分析点击流数据的系统与方法
US9652433B2 (en) Clickstream analysis methods and systems related to improvements in online stores and media content
Mena Data mining your website
Abels et al. Identifying user‐based criteria for Web pages
Lee et al. Visualization and analysis of clickstream data of online stores for understanding web merchandising
Srivastava et al. Web mining–concepts, applications and research directions
US6466970B1 (en) System and method for collecting and analyzing information about content requested in a network (World Wide Web) environment
US20070043583A1 (en) Reward driven online system utilizing user-generated tags as a bridge to suggested links
KR20060028673A (ko) 유사도 분석 방법 및 제품
CN103150352A (zh) 用于生成相关搜索查询的系统
EP1151379A1 (en) Method and apparatus for evaluating visitors to a web server
US20030023511A1 (en) Automated system and method for tracking online activity to initiating information source
Theusinger et al. Analyzing the footsteps of your customers
KR20100037754A (ko) 인터넷을 통한 기업 홍보와 광고 제공방법
Zhang Research of personalization services in e-commerce site based on web data mining
US11922457B2 (en) Management of cannibalistic ads to improve internet advertising efficiency
Raju Online Visitor Classification and Unified Creation With Clickstream Data
Becher et al. Tutorial on E-commerce and Clickstream Mining
Dalal et al. Ch. 12. The promise and challenge of mining web transaction data
Smith et al. Personalizing e-commerce with data mining
Dalal et al. Mining Gold from E-Commerce Transactions: Challenges
Hu Selected Readings on Electronic Commerce Technologies: Contemporary Applications: Contemporary Applications
Akani Search Engine Marketing and Social Media Performance of Online Retailers in Rivers State
Dalal et al. The Promise and Challenge of Mining Web
Postma The marketing domino model

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication