CN103154928A - 用于处理非参数化的多维的空间和时间人类行为或普遍测量的技术观测数据的网络服务器装配及其相关方法 - Google Patents

用于处理非参数化的多维的空间和时间人类行为或普遍测量的技术观测数据的网络服务器装配及其相关方法 Download PDF

Info

Publication number
CN103154928A
CN103154928A CN2010800684538A CN201080068453A CN103154928A CN 103154928 A CN103154928 A CN 103154928A CN 2010800684538 A CN2010800684538 A CN 2010800684538A CN 201080068453 A CN201080068453 A CN 201080068453A CN 103154928 A CN103154928 A CN 103154928A
Authority
CN
China
Prior art keywords
data
behavior
entity
user
assembling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010800684538A
Other languages
English (en)
Other versions
CN103154928B (zh
Inventor
H·维卡萨洛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zokem Oy
Original Assignee
Zokem Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zokem Oy filed Critical Zokem Oy
Publication of CN103154928A publication Critical patent/CN103154928A/zh
Application granted granted Critical
Publication of CN103154928B publication Critical patent/CN103154928B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • G06F16/24565Triggers; Constraints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences

Abstract

本发明一般讨论无线装置、服务器和通信网络。尤其,本发明涉及:在一个或多个移动终端中执行观测,并且在服务器端系统中通过分层数据处理活动和通过利用统计过滤和语义数据结构的非参数化数据到参数化形式的转换来处理和分布相关数据。进一步解释了这样的多层参数化数据可如何被用于预测目的、以及可如何构建与物理世界的反馈回路来改进未来的预测。本发明可应用于各种应用,例如可应用于这样的系统,在这些系统中,需要持续地构建精确的数字用户分布图,并且需要将这样的分布图与由数据中出现的特性而被触发的一个或几个动作动态地链接。即使输入数据是非常无组织的、不是按时间顺序的、零星的,多层方法也使得可将输出统计数据结构化为连续的标准化的周期性的数据集。类似地,本发明描述了多层数据存储结构和所选的统计操作如何使得可基于输出数据流来构建几乎无限数量的进一步聚合和平均。

Description

用于处理非参数化的多维的空间和时间人类行为或普遍测量的技术观测数据的网络服务器装配及其相关方法
技术领域
本发明总地涉及无线装置和通信网络。尤其,但不仅限于,本发明涉及在服务器端系统中通过分层数据处理活动和非参数化数据到参数化形式的转换来处理和分布与在一个或多个移动装置中执行的观测相关的数据,所述转换包括可应用技术(比如,统计过滤和语义数据结构)的利用。
背景技术
越来越多的数据可从移动装置(比如,移动终端(比如,智能电话))收集,并且可基于相关联的观测来创建事务馈送(transactionalfeed)。然而,在详尽地或者甚至充分地表征所考虑的移动装置用户时,这些馈送不是自包含的,尽管这些馈送无可否认地可告诉关于相关的、例如面向事务的、时间依赖的(时间点)和上下文的(事件可与属性(比如,位置或天气)链接)事件的一些细节(比如,用户在日常生活的过程中的移动)。
第二,当行为数据或技术观测数据需要被处理时,考虑到多个因素(比如,处理速度、存储器要求、或者历史数据的一般可得性以及使得它可供复杂的进一步处理或统计分析使用),目前的数据库和数据处理解决方案不是优化的。
第三,尽管事实是在原则上存在巨量关于人们的生活的可用信息,但是当代的系统不幸地大多不考虑历史数据/模型与实时数据(即,实际应用)之间的联系,并且未能确认在给定广泛可用的数据库、储存器和数据处理硬件的情况下它们的技术实现是可行的。
然而,若干个(数个)现有技术出版物仍描述了如何收集数据点、定位用户、或者使上下文数据点可供移动装置的其他应用程序本地使用。例如,现有技术出版物WO2008118119公开了用于以下操作的移动装置和方法:按周期性间隔将移动装置的定位数据传送到服务器;在移动装置中响应于服务器自动地产生与该装置的当前地理位置相关联的当前位置分布图(profile);在移动装置中同时将由服务器提供的一组相邻分布图产生为远离移动装置的当前地理位置的方向;并且在移动装置中按所述周期性间隔刷新当前位置分布图和所述组相邻分布图。
尽管鉴于上述存在用于存储移动装置相关事件的各种现有技术解决方案,但是仍存在改进的空间和对以下的需求:描述尤其是特别是关于人类行为的多维数据可如何通过分层机制被存储和处理,以使得:不仅优化性能、或者使得能够实现复杂的分析过程,而且还从所述数据产生更有意义的语义指示符和分布图、并且出于技术原因和法律原因两者物理地分离不同的抽象层。
发明内容
本发明的目的是,缓解现有技术解决方案的前述缺点中的一个或多个,并且优选地,满足相关联的前述需求。
该目的通过提供更智能的、更灵活的和更自适应的、用于物理地存储和技术地分析(可能连续地利用分层方法)人类行为的数据馈送的替换方案来实现。
根据本发明的实施例的服务器装配可被配置为以多种协调方式接收和处理观测数据,并且该数据可被进一步发展为这样的输出,该输出从观测者的角度来讲是可理解的,并且有利地包含甚至可被用于预测目的的关系。在各种另外的补充性实施例或可替换实施例中,优选地,可用与数据处理活动相关的反馈回路来生成与一个或多个用户的生活相关的度量,以便使得能够持续不断地或者根据触发条件的特定需要或要求来校准技术过程。本发明的各种实施例使得能够确定无线装置收集的非参数化数据可如何与例如移动服务的利用结合地被高效率地用于构建派生的更抽象的(更高层次的)数据实体(比如,描述用户的使用和生活习惯的矢量或者围绕用户的技术要素)。该信息可使用多个抽象层来生成,便利于几乎任何类型的进一步聚合过程,并物理地节省处理数据时所需的存储容量和动作数量。建议的解决方案的一些实施例事实上可被装配为将原始层次的数据转换为各种应用(包括例如移动广告或网络性能分析/优化)中可使用的更高层次的数据。此外,可基于先前接收的数据将移动用户的物理存在和(过去的)动作实时地与被存储到数据库中的模式相联系或相比较。可预测用户的进一步行为。可针对不同的可能连续的数据流对所述解决方案进行优化,所述数据流包含从无线移动装置和/或充当数据源或数据中介的其他可应用装置接收的非参数化的多维数据(比如,传感器数据)。
从而,在本发明的一个方面,一种网络服务器装配包括:
数据输入实体,其被配置为接收从若干个移动装置(比如,智能电话)获得的多维非参数化数据(比如,传感器数据);
处理实体,其被配置为使所述多维非参数化数据参数化;
存储器实体,其被配置为将参数化的数据作为多层数据优选地存储在多个不同的抽象层上;
聚合引擎,其被配置为将若干个聚合和/或数据建模活动(比如,时间序列操作、求平均值运算和/或求和运算)指定于成批的所述参数化的数据(可选地,相对于某一时间段、某一位置、某一移动应用程序(应用)或应用程序类别、某一移动用户和/或用户群),以便从数据批次确定若干个描述性的更高层次的行为指示符和/或技术指示符,所述指示符的运行优选地基本上在至少预定的足够数量的数据或信息变为可用或者触发器被释放时的任何特定时刻被激活;和
数据导出实体(比如,API(应用程序编程接口)),其被配置为将所述若干个行为指示符和/或技术指示符或者从其推导的信息提供给外部实体,比如,分别地,提供给移动营销实体以用于为一个或多个移动用户选择个性化广告,或者提供给网络分析或管理实体以用于评估网络性能和/或用户体验并且可选地使得它能够基于所述评估来进一步优化所述性能和/或所述用户体验。
确定行为指示符的过程可包括用于确保平稳操作的各种创新项目。
也就是说,在一个实施例中,可针对存储的经过处理的数据定义通用本体,这可通过本发明的数据结构化特征来实现,所述数据结构化特征基于接收数据的内容和/或动态属性(比如,位置、用户标识或时间)来将该接收数据结构化为至少一个特定的数据实体(比如,表),优选地将处理分类信息添加到所述数据实体,以便于使后来的处理更容易。
在另一个补充性实施例或可替换实施例中,可将可以从在无线装置中运行的一个或几个软件模块收集的非参数化输入数据变成更充实的、更结构化的和有利地参数化的数据,并且优选地同时,可对可即时执行的的数据进行若干个过程,这从而减轻了可能的其他模块的负荷。这个目标可通过这样的实体来实现,所述实体被配置为在将传入的数据流移交到存储器模块之前对它们进行处理。
在另一个补充性实施例或可替换实施例中,可确定反应移动用户在给定数量的维度上的真实行为的、动态的、带时间戳的矢量,这可通过利用例如通过若干个脚本来生成丰富多样的预定义统计数据的实体来实现,所述若干个脚本成批地对数据块进行处理,并应用先进的统计技术、处理活动和/或其他脚本撰写的动作来周期性地产生用户层次的、带时间戳的统计数据。所述矢量有利地为便于未来的简单转换的形式,所述转换包括例如通过利用给定的统计方法(例如,算术平均)来将给定的一组日层次(day-level)的行为矢量变换为每周矢量。
然而,在另一个实施例中,所述装配可被配置为以智能的方式利用已经计算的行为指示符和矢量来生成更完整的统计数据集合。为此,可应用被称为矢量聚合的特征,该特征可对来自早前计算的更细粒度的数据的数据进行处理、求平均值和外推,并产生范围稍微不同的有意义的统计数据作为输出,将统计数据输出到不同时间段中或者输出到用户群,而不是单个用户。
仍然,在另一个补充性实施例或可替换实施例中,可关于给定用户的动态行为(趋势分析)或者所述装配的任何两个用户之间的差异计算若干个测度,这可通过被称为行为矢量的关联的特征来实现,该特征本质上可输出传达被研究的实体(例如,用户或时间段)之间的关键差异的类型和所及范围的测度。
在一些实施例中,本发明还力求理解显著差异并基于这些差异来产生警报或动作。这个目标通过被称为矢量触发器的特征来实现,该特征是一组预定义的配置,这些配置告诉在哪些条件下,在将任何两个特定矢量相关联或者计算新的行为指示符之后,应该产生某一警报并通过信令将该警报传递到内部模块或外部模块。
仍然,根据本发明的一些实施例,建议的解决方案可有利地区分与用户行为相关的各种数据源。为了从例如单独的表产生语义结构,可形成传入数据馈送的本体,并且可将该本体存储在单独的数据库中。在后台,存在将数据存档为在适当的位置上具有语义的更大批次的逻辑,并且优选地,将多级聚合过程和/或求平均值与例如聚类分析和/或模式识别一起应用于传入数据。可针对每个用户计算多维行为矢量,这也涉及用于使得能够实现动态应用程序的时间维度。可针对特定时间段(比如,针对一周)计算所述矢量,并且从将例如所谓的活动测度(每时间段的动作)和/或使用频率(关于所述矢量的计算中所包括的所有时间段中有多少个某一活动发生的较小时间段)并入到同一矢量中的意义上来讲,所述矢量是多维的。所述矢量反映用户行为的语义理解,所描述的示例性矢量包括旅游活动、移动活动、音乐消费活动、压力程度和睡眠活动。
可基于本文描述的技术路线和调度创新,考虑从数据源(比如,智能电话)获得的数据的性质来计算行为指示符(矢量),所述性质可能涉及例如相当数量的黑色时间段(即,无数据可用的时间段)、数据和(在许多情况下)不完整的和/或非标准化的、可能为不具有预定义结构的非参数化形式的数据流(即,典型的通过独立的客户端应用程序而收集的传感器数据)的不定时同步。可相对于重叠时间段计算所述矢量,本发明提出在不消耗太多存储空间的情况下存储动态矢量的可应用技术。行为矢量此外可被用于基于参考用户的相对比例(换句话讲,较大群内的当前用户的百分位数)来定义用于每个用户的行为类,所述参考用户例如在特定的行为维度上获得比所考虑的用户低的得分。不同用户的矢量(皮尔逊(Pearson)相关)也可彼此相关,以对任何对用户推导被称为相似性指数的度量,该度量又用作用户细分模型的基础。有利地,当新信息传入时可用时,可自动地且动态地计算所述行为矢量,确认所述装配的输出在任何特定时间以优化的形式反映最近的可用信息内容。通过与标准化矢量的分析相关的触发器,可识别行为中的显著变化。本公开内容还描述了建议的解决方案可如何被用于提高移动广告的智能和动态性能。
优选地,可始终无缝地执行建议的解决方案,并且有时通过密集的非标准化的数据流来执行建议的解决方案。为了这个目的,本发明的一些实施例包括被称为“高速缓存”的特征,该特征使得能够引导传入的数据流通过一个或多个系统化管道,这些系统化管道确保通过结构化处理链按正确的顺序对数据进行处理,并确保可以以最佳方式支持参数化处理。高速缓存还便利于有利动作,所述有利动作比如,将非参数化数据转换为参数化数据、以及协调的良好管理的这样的处理,在该处理中,在移动到接下来的动作之前,需要完成某些动作,并且可能需要以特定的方式(例如,按时间排序)组织输入数据。
在一些实施例中,出于关键任务目的(比如,基于实时分析的移动广告或优化动作),可能期望基本上实时地计算有意义的行为度量,这可通过被称为实时处理的特征来实现,该特征与高速缓存的运行相关,并且基于预定义的规则,计算关于某些行为事件的简单的指示符(比如,布尔(Boolean)变量)或者进行计数来反映某些动作的频率。
为了使不同类型的数据彼此分开,并且为了基于与数据点的利用率相关的需求或者基于与各个聚合层的可能的交互来结构化地划分这些数据点以使得演算负荷和所需时间可被优化,可实现本发明的各个实施例的被称为“使用行为数据的分层数据挖掘”的有利特征,该特征通过分层模型来管理数据流,在所述分层模型中,原始数据区别于更精炼的(polished)数据,其中,精炼(polishing)可以是指在特定维度上修改、过滤和/或充实事务数据,以使得它更可理解、更简洁和更易于在后面的步骤中进行处理,并且精炼的事务数据可区别于聚合和统计数据,所述聚合和统计数据将相关信息压缩成更具体的数字和指示符,更好地反映个体行为模式和/或技术模式,并且便利于内部系统或外部系统更简单地利用信息。
在另一个补充性实施例或可替换实施例中,可提供访问行为数据并在之上构建定制的视图或统计数据的可伸缩(scalable)部件。被称为“中间层表”的特征可被配置为有效地将至少部分聚合的数据存储为易于引导到其他系统进行进一步聚合或可视化的形式。
在另一个补充性实施例或可替换实施例中,相关联的目标之一可以是避免根据数据处理或聚合对于在最终输出和/或报告中需要什么类型的统计数据采取固定的立场,因此,可提供“进一步聚合”的特征,以有效地依赖于被装配到以下描述的中间层表中的行为指示符,并产生内部目的或外部目的所期望的类型的统计数据。
在另一个补充性实施例或可替换实施例中,确保最小所需存储容量、保护消费者权益和/或便利于快速数据处理的目标,可提供被称为“周期性清理”的特征,该特征意味着,所述解决方案可自动地、周期性地遍历存储的原始数据表和推导数据表,并根据预定标准将不需要的数据点从存储器中全部一起处理掉。
在另一个补充性实施例或可替换实施例中,可灵活地分布数据处理和存储。建议的解决方案可包括“管理分布式数据挖掘”的特征,该特征有效地保持跟踪用户来自哪里、他或她的数据点被存储在哪、以及如果例如时间戳以某种方式产生影响,则数据处理和存储应该在哪发生。
从无线装置或其他数据源传入的数据可首先被存储在数据库中,该数据库负责高速缓存数据集,并使它们为批量处理做好准备。因为例如经过XML(可扩展标记语言)处理的数据在被高速缓存时不总是具有预定目标形式,所以在这个步骤也可对数据进行处理(例如,排序)。在高速缓存之后,可首先将数据存档到存储所有原始数据的原始层次的数据库(所谓的“传感器数据库”)中,其次,可将它引导到不同的分析过程,这些分析过程通常在处理、聚合和/或求平均值之后将数据以优化的形式存储到所谓的“中间层”表中。
在将数据存储到中间层表中之前所需的聚合和其他处理动作是例如可基于已经在高速缓存储存器中的数据的量和性质而被触发的某些动作。中间层表可包含更简洁的简化形式的数据,该形式的数据可以以可能复杂的方式被更快速地分析和进一步聚合。这些中间层表可被周期性地或实时地用于生成所谓的包含可容易理解的信息和明确定义的统计数据的“派生表”。
派生表可被外部应用程序直接使用,并且优选地,周期性地从旧的数据实体清理它们。在这种类型的数据结构中,还周期性地清理传感器数据库中的数据,以仅保存有足够意义的并且在未来的某一时刻在进一步聚合中可能需要的数据。因为较大型数据库系统的单个实例可在本地(例如,在不同国家)被实现,所以整个结构被设计为可伸缩的。在不同层次,在数据模型的物理分离的层次上,可保证不同层次的隐私(例如,个人ID信息的存储)。
可以存在这样的集中式系统,该集中式系统知道哪些用户的数据被存储到哪个区域数据库或功能数据库中,因此,关于传入数据的负荷可被分布,关于数据分析的负荷也一样。类似地,提取数据的编程接口可使用集中式指针来知道在哪搜索数据。在这个提议的系统中,数据库服务器有利地不仅在它们之间分布数据的存储,而且还在它们之间分布数据功能性方面的处理。例如,派生数据库可驻留在与所需的中间层数据不同的服务器中,并且服务器可自己协调数据提取活动和处理活动。整个系统可被看作这样的数据管道,该数据管道遵循例如FIFO(先进先出)排队的逻辑,但是同时,应用用于数据处理和存储分辨率逐步部分降低的新的解决方案。
在另一个补充性实施例或可替换实施例中,可通过被称为“虚拟访问”的特征来使可能许多个(例如,数百个)用户方便查询计算的数据点和统计数据,该特征产生用户的行为指示符的抽象,并使中间层表虚拟化,以使得它们更易于访问。“虚拟访问”特征可将多个网络服务器连接在一起,以为正在主动使用API的客户提供类同的用户体验。
根据另一个补充性实施例或可替换实施例,可构建语义数据模型,于是建议的解决方案可分别地告诉不同的概念(比如,睡眠或移动),优选地,周期性地将重要的数据点(比如,位置和时间段)附加到它们,并忽略收集的原始观测数据。“转换特征”可将语义信息添加到所述数据点,并使得能够实现更面向自然语言的语义查询。
根据本发明的一个实施例,可对经过处理的数据执行过滤任务和/或排除任务。因为外部用户可向提供的装配请求大量信息,所以优选的是,存在一组过滤和排除任务,这些任务能够检查数据中的特定方面,并丢弃或操纵数据点,以使得输出更结构化、更有意义。
建议的解决方案通常可定义这样的平台,该平台提供与外部无线装置或网络服务器的虚拟数据库接口,以访问位于另一个网络服务器中的实时行为和上下文信息。所述平台可以不仅提供单个的数据点,而且还可以对数据进行更智能的复杂动作以缩短查询装置上所需的处理时间或者降低查询装置上的功能处理要求(复杂性),并且能够通过分批数据处理来为输出数据提供语义意义。
根据实施例,提出了用于所述接口的查询语言模型,基于该查询语言模型,所述接口可主动地(请求装置发起)或者被动地(当例如变化发生时)提取信息,并且在实践中及时地将准备的答复递送给查询装置。代替提供例如最新位置或者除了提供例如最新位置之外,所述接口可提供在预定时间段(比如,过去60分钟)期间行进的距离、或者从例如60分钟前开始的位置点和当前位置点(这些位置点然后可被处理以在查询装置计算所需信息)。
所谓的统计过滤器可被嵌入到所述解决方案中,以使得可能复杂的数据馈送可被引导通过过滤器,所述过滤器对所述数据中的大部分进行预处理,有时将它从一种形式转换为另一种形式并执行早前对它编写的处理。这使得更易于为选定的分析法提供基于分布图的解决方案,以使得根据被查询的数据点和数据源的标识(例如,无线装置ID号),可执行不同类型的过滤器和预定义的分析过程,并在返回时提供标准化矢量。所述平台适合于支持各种不同的物理数据源,需要被提供分析数据的各种应用可被支持。
在另一个补充性实施例或可替换实施例中,不仅考虑到通过度量和带时间戳的事务来理解用户行为,而且还考虑到产生关于行为模式的更高层次的描述符,可提供被称为“抽象”的特征,该特征有效地组合可用行为矢量中的多维矢量(例如,小时层次的位置动态)。通过该特征,可产生这样的矢量,这些矢量可每次使用略有不同的参数来被表征为行为踪迹,但是仍描述某一行为模式。在这种类型的面向聚合的数据抽象之后,应该注意到,行为矢量尽管已经是一种类型的抽象,但是用户的生活更易于通过机器学习和模式识别进行分析。
在另一个实施例中,设置了预测什么人有可能做出下一个给定历史行为和当前上下文的目标。为了实现这个目标,动态地构建用户行为模型,该用户行为模型包括作为其元素的行为抽象以及元素之间所描绘的例如马尔可夫(Markov)链类型的动态。作为一个用例,该预测模型可被用于:动态地计算系统中的不同转变的权重和可能性,并且几乎在任何时间提供具有关于系统的下一个可能状态的可能性的矢量。
在一些实施例中,可实现从到达数据中学习。被称为“反馈回路”的特征可被配置为:可选地连续地更新预测模型,并计算可能连续的、描绘模型的预测在任何给定时间有多成功的度量。通过某些选定的阈值,可实时地解决预测引擎的性能。反馈回路使得预测引擎能够真正地进行自主学习。
在一些实施例中,可以例如出于移动广告(上下文相关的、预测性的、针对性的广告)的目的而动态地给予预测。为了这样的目的,状态机(例如,马尔可夫模型)可基于动态查询来连续地给予对下一个状态(例如,下一个位置、用户呼叫的下一个人的姓名、他接着将要聆听的音乐艺术家)的预测,并且通过计算的性能指示符(模型有多可能是正确的)和提供指定广告库的外部模块或内部模块,如果条件具有足够的预见性,则所述系统可触发特定动作(比如,某一广告的弹出)。
在另一个方面,一种电子装配将执行的用于对观测数据进行处理的方法包括:
-接收从若干个移动装置(比如,智能电话)获得的非参数化的多维的空间和时间人类行为和/或技术观测数据(比如,传感器数据);
-对接收的数据进行参数化,可选地对接收的数据进行分类和/或结构化;
-成批地对参数化的数据进行若干个聚合和/或数据建模活动,以便从数据批次确定若干个描述性的更高层次的行为指示符和/或技术指示符;和
-将所述若干个行为指示符和/或技术指示符或者从其推导的信息提供给外部实体,比如,分别地,提供给移动营销实体以用于为一个或多个移动用户选择个性化广告,或者提供给网络分析或管理实体以用于评估网络性能和/或用户体验并且可选地使得它能够基于所述评估来进一步优化所述性能和/或所述用户体验。
如技术人员意识到的,本文给出的关于所述装配的实施例的各种考虑可灵活地比照应用于方法的实施例,反之亦然。
此外,关于本发明的效用,本发明可以例如与这样的系统结合应用于各种使用场景,在这些系统中,需要例如连续地构建准确的数字用户分布图,并且需要将这些分布图动态地与由数据中出现的特性而触发的一个或多个动作相联系。若干个语义指示符和分布图可基于可能逻辑地和物理地分离的抽象层次的观测数据馈送来确定。关于用户的生活或者围绕技术上下文的度量可以以实时的方式构建。例如基于智能电话的观测和相关技术过程的行为处理被如此装配。因此,与移动观测相关的馈送内容可被作为输入提供,并且通过例如状态机方法和数据聚类方法的组合而产生的相关行为矢量可被作为输出提供。
建议的解决方案便利于例如数据块的批量处理和历史数据的最终移除(该最终移除对于节约存储容量是优选的)。另一方面,新的传入数据已快速地为分析做好准备,并且如果需要的话,甚至历史数据也可供分析使用。新技术的数据库解决方案因此被提供来支持能够基于数据的处理要求将数据划分到不同层中的分析处理和时间序列分析。此外,由于技术原因和法律原因,数据存储可物理地分布在不同的服务器或其他实体之间。
传感器数据可物理地区别于更精炼的数据,并且可构建用于连续地生成刷新的关于移动装置用户的生活的解析的可持续自动操作。大量应用程序可能需要使用关于人类行为的行为数据和上下文数据。为了对数据执行有意义的操作,建议的解决方案被配置为使多种类型的数据请求便利,以降低带宽需求、符合实时要求、支持系统的服务端的、需要动态数据处理的更智能的查询、以及支持触发动作和数据分布的部分自动操作。物理地分开的系统可交换行为信息并划分数据处理中的责任,尤其是在从无线装置收集传感器数据并且一个或几个网络服务器正对该传感器数据进行进一步处理的情况下,所述数据包含多种类型的不同数据点和聚合矢量。
最后,回到历史数据的可得性和可用性,行为数据和上下文数据的数据库的累积使得能够构建人的可能动作的理解,换句话讲,将预测特征构建到商用解决方案(比如,社交网络)中。
作为本发明的适用性的实际例子,可考虑外部web应用,所述外部web应用自动地反映在选定的用户的生活中发生的重大事件(例如,当某个人在任何给定7天中去了至少3个国家时,通过将电子邮件报告发送给他/她的朋友来反映重大事件)。
一种其他应用程序可被配置为基于从移动装置用户的最近行为的学习来将自动的针对性的广告发送给该用户(例如,当某个人在具有有效金属乐队折扣的唱片店附近时,将金属乐队唱片折扣优惠券送给他/她,并且这个人在接下来的10天中聆听金属乐队的可能性被确定为高于2%)。
作为又一个例子,本发明可被用于规定不同类型的数据首先应如何被存储到数据库中,以使得它们可被位于不同抽象层中的应用程序编程接口巧妙地访问。作为实用的实施例,以下解释可采取多种形式(包括蜂窝塔ID、WiFi热点ID和GPS定位点)的位置信息的存储,并且还公开了使存储数据点的实际方式抽象化的方式。基于这些描述,进一步解释关于以下的关键处理:上下文敏感的重复模式在用户行为中的辨识、以及反映识别的模式的唯一性和重要性的统计数据的计算。
然而,作为实用的实施例,以下描述:获得的数据可如何按多个批次进行处理;以及物理地分开的信息源(例如,蜂窝塔的地理坐标和蜂窝塔的精确事务日志)可如何被并行地用于处理和建模处理。用户生活模式的输出日志(包括行为指示符和相关的聚合数据流以及行为模型或预测模型)可与新的传入数据动态地联系,并且某些过滤器和/或触发器可被编程为当一个或多个预定条件满足时执行选定的动作,并且预测引擎可计算一些事情发生的可能性。
在本文档中进一步回顾了相关联的信令过程。提议的解决方案能够使单独定义的估计模型和例如推导的马尔可夫场景与实时的数据馈送相匹配,使得有效地实时地推测用户的下一个移动。可提供向预测引擎指示预测是否成功的物理机制。
表达“行为指示符”在本文中是指例如一维特定指示符的情况下的数值或范畴值、或者多维行为指示符的情况下的多个值,所述多维行为指示符比如某一天中的平均移动距离和这样的移动的平均方向,或者作为另一个例子,描述例如用户的语音呼叫频率和每单位时间语音呼叫所花费的平均时间的行为矢量,这些行为指示符传达用户的行为活动,可能包括关于动作的反映频率、活动、类型和/或其他种类的度量的可能的尺度和语义分类和/或标记。
“即时地”是指基本上实时的处理。
“技术的”在这里被参照与被观测的技术上下文或事件(而非行为上下文或事件)相关的数据、聚合、指示符和统计数据来使用,意指例如从蜂窝网络测量的参数(包括正被接入的网络的信号强度和类型)。
“非参数化”是指不直接与其他数据点联系的数据点,换句话讲,数据在筒仓中,每个数据实体来自一个特定组,与任何其他数据点没有明确的限定关系。
“”参数化”是指彼此联系的数据点,例如,网络基站观测数据同时还包括对于当前吞吐量和信号强度的测量。
“内部模块”是指物理系统或装置装配内部的逻辑模块、或者本发明描绘的其他实体。
“外部模块”相应地是位于本文公开的本发明的实现的物理反映的外部的模块。
“API”是指应用程序编程接口,基本上是指以协调的方式从所述装配拉出数据或者将数据推到所述装配的优选可编程的框架。
“分析”在本文中是指基于事实信息和/或定量信息进行决策。
“观测者”在本文中是指能够基于例如查询和无线装置的操作系统能力的使用来产生数据项的处理。观测者在功能上是传感器,有时在物理上也是传感器,可能不总是驻留在无线装置中和连续地运行,这些传感器可自动地感测例如蜂窝基站使用中所识别的变化(例如,当装置从一个塔的覆盖范围跳转到下一个塔的覆盖范围时)。观测者还可以指用户产生内容(例如,博客条目或编写的文本消息)的信道。
“触发器”是指触发(诱发)某一动作的规则和处理。具体地讲,它们可定义可如何更有效地、自动地在无线装置中进行观测。触发器可以基于时间间隔、上下文变化和观测、外部请求或内部请求(例如,在一些其他数据点需要更多数据的情况下)。
“智能”的概念在本文档中被用于指代协调相关联的实体的总体过程或单个的微处理(例如,触发逻辑)的一组规则、算法、数据库和/或处理。智能是以更优化的方式(例如节约能源并改进精度)使得相关系统更巧妙地工作的事情。它可以基于固定算法和/或自主学习的自适应算法,并且也基于外部输入。
“服务器”在本文中总地是指存在于一个或多个网络(例如,互联网)中并可通过这些网络访问的一个节点或者几个节点的至少逻辑聚合。服务器可为客户端(例如,在无线装置和其他实体(比如,各种网络服务)中运行的移动代理程序)提供服务。客户端因此可与一个或多个集中式服务器通信。客户端-服务器架构是在互联网中构建系统的常用拓扑。
“处理”的概念在本文档中被用于指代可以以静态的方式或者更动态的即时的方式对数据执行的各种类型的动作。除了其他动作之外,这些动作包括数据转换、变换、公式化、组合、混搭充实、相关、聚类、因子分解、规范化和/或过滤。一些形式的处理可被积极地用在本发明的各个实施例中,所述一些形式的处理包括组合和混搭(例如,将数据点链接在一起并构建关系数据结构)、转换(从原始层次的未被排序的数据项(比如,被观测的位置点)产生例如信息实体的有意义的流)、充实(例如,添加元数据并使得数据比最初充实)和/或过滤(例如,除去不相关的或者不再需要的数据)。
“智能电话”在本文档中被定义为能够运行操作系统的无线装置,所述操作系统使附加应用程序的安装便利,并使得能够实现包数据与目标网络(比如,互联网)的连接。
“装配”在本文中是指比如设备(比如,服务器设备)的实体或者若干个至少功能上互连的设备的系统。
表达“多个”在本文中是指从二(2)开始的任何整数(比如,二个、三个或四个)。
表达“若干个”在本文中是指从一(1)开始的任何整数(比如,一个、两个或三个)。
表达“实体”和“模块”在本文中互换使用。
附图说明
以下,参照附图来更详细地描述本发明,其中:
图1从功能角度示出根据本发明的服务器装配的实施例的总构思和主模块(即,总体架构和设计原理)。
图2示出所述装配的实施例的不同特征,主要集中于行为指示符(比如,矢量)的演算。
图3是所述装配的一个实施例的组合框图和流程图,该图主要示出分层数据挖掘逻辑的不同方面。
图4是可应用于建议的装配中的数据输出接口(比如,上下文/行为应用程序编程接口)的一个实施例的组合框图和流程图。
图5是可与提供的装配结合应用的数据预测模块或预测引擎的一个实施例的组合框图和流程图。
图6是根据本发明的服务器装配实体的实施例的框图。
图7是公开根据本发明的方法的实施例的流程图。
具体实施方式
鉴于前述并且具体参照图1,通过(网络)服务器装配(部署)102的实施例来描述本发明的总构思,其中,装配102包括数据输入实体100(比如,日志读取器)、用于处理数据的处理实体200、用于存储数据的多层存储器实体300、集中式逻辑模块400、以及用于组织分析结果的一个或多个输出实体/模块480和500,数据输入实体100用于输入和高速缓存由若干个优选无线的移动装置106(可选地,通过至少一个通信通信网络104(比如,举例来说,移动网络或其他接入网络和/或互联网))提供的数据,集中式逻辑模块400协调各层次的数据分析、聚合,有利地还协调用于基于触发器来查询和分析数据的单元的托管。
输入实体100因此可被配置为执行预定的例如物理地将数据结构化到不同数据表中并按正确的顺序对实体进行处理的可重构逻辑。
处理实体200可被配置为保证传入数据的可伸缩接收和高速缓存分批进行,并且可包括例如过滤模块或者至少在功能上与例如过滤模块连接,所述过滤模块能够修改和处理传入数据以使进到内部分析模块或连接的分析模块的数据流标准化。
也被称为聚合实体/模块的集中式逻辑实体400还可以能够对例如数据批次进行处理,并且优选地能够确定预定义数量的描述这些批次的指示符。它可包含预测实体/模块480或者至少在功能上与预测实体/模块480连接,和/或包含反馈实体/模块或者至少在功能上与反馈实体/模块连接,所述预测实体/模块480能够优选连续地找到模式矢量和所谓的矢量标识符,将该矢量/这些矢量与传入的实时信息相匹配,并动态地触发预测,所述反馈实体/模块将反映预测是否正确的信息提供回预测模块,以下更详细地描述该预测模块和反馈模块。
此外,所述装配可包括数据库(管理)实体300,所述数据库(管理)实体300能够使用各个抽象层来存储数据,并且如果需要的话,基于聚合的层次或者基于以下将更详细地描述的其他标准(比如,用户的细分)来物理地分布数据的存储。
因此,例如从相关装配的观点来讲,本发明的各个实施例一般可应用于定义关于基本上所有存储的经过处理的数据的通用本体,这可通过本发明的数据结构化特征的实施例来实现,该数据结构化特征被配置为可基于所有传入数据的内容和动态属性(比如,位置、用户标识或时间)来将这些数据结构化到至少一个特定表中,优选地在该过程期间添加分类信息以便于使以后的处理更容易。典型的类别分类可包括选自由以下类别构成的组的至少一个类别:
1.应用程序使用数据(点击流)
2.移动web浏览使用数据(点击流)
3.网络性能数据
4.装置特征使用数据
5.装置系统数据(例如,电池状态)
6.WiFi网络性能数据
7.存储器系统数据
8.警报时钟数据
9.日历数据
10.电话簿内容
11.消息日志,和
12.语音呼叫日志
本发明的一个或多个实体(比如,处理实体200和/或处理实体200中所包括的实体或者与处理实体200连接的实体)可有利地在网络端将可通过使用在无线移动装置中运行的一个或几个软件模块(例如,代理程序)而收集的非参数化输入数据变成更充实的、更结构化的和/或参数化的数据,并且同时对该数据进行可即时实行的过程,从而减轻所述装配的其他模块或者所述装配外部的其他模块的负荷。所述装配的实体(例如,处理实体200)可被分配在将传入数据流移交到存储器模块之前对这些传入数据流进行处理的责任。
例如,可结合参数化来进行以下动作中的任何一个或多个:
1.通过下述方式将应用程序分类(应用程序类别和应用程序类)添加到应用程序名称:首先将任何特定的应用程序名称映射到统一的应用程序ID(例如,默认web浏览器的所有不同本地化将被转化为唯一应用程序ID),然后将类别名称、应用程序类型和类名称映射到同一行,
2.添加关于web域名的信息(站点/页面类别等),以及
3.将位置标签添加到观测数据
在参数化处理中,不同表之间的通过位置或时间接近性的系统化关系或者包括识别其他common demonitors(包括例如技术数据(比如,网络基站蜂窝ID或WiFi热点索引))的启发式过程可有利地被用于从独立的非参数化的观测数据中组合更充实的参数化数据,该更充实的参数化数据也包括可从系统外部获取的参数,除了其他参数之外,所述可从系统外部获取的参数包括例如天气数据、地理位置名称、网络状态信息。
可连续地计算有意义的矢量,以使得它们反映移动用户的真实行为,并且模块(比如,集中式逻辑/聚合实体400和/或集中式逻辑/聚合实体400中所包括的实体或者与集中式逻辑/聚合实体400连接的实体)可被配置为:例如通过成批地对数据块进行处理的脚本生成丰富多样的预定义统计数据,并周期性地应用先进统计技术、处理活动或其他脚本撰写的动作来产生用户层次的带时间戳的统计数据。
例如,可基于从移动装置收集的数据来计算以下类型的行为指示符中的任何一个或多个:
1.按照使用量的每预定时间段(比如,一天)的预定单位(比如,分钟)的平均浏览面对时间,
2.某一用户在预定时间段(比如,2009年12月)期间的数小时的平均睡眠时间
3.每用户每日预定单位(比如,km或英里)的平均日常移动跨距
4.某一用户在某一日期内的位置动态的平均熵
可行的度量取决于应用程序和需求,但是典型地,度量为以下形式:分钟;会话;事务;或者每单位时间的其他事件;频率度量,另一方面传达关于事件在定义的时间段期间的相对发生率;以及似然测度,传达关于某一事情相对于一些其他事情有条件地发生或者无条件地发生的相对倾向性,在这些情况下,在给定的一组条件和上下文(比如,时间段)下,似然性可能是更静态的数字。关键度量本身通常是有意义的,并且它们促成所有类型的派生度量(包括例如如果超过某一使用活动阈值就使用的布尔变量)。
为了利用已经计算的行为指示符和/或矢量来生成更完整的统计数据集,所述装配的实施例可包括前述被称为矢量聚合的特征,该特征可对先前计算的更细粒度的数据进行处理、求平均值和/或外推,并可产生范围略有不同的有意义的统计数据作为输出,例如确定例如与不同时间段或用户群(而不是单个用户)相关的统计数据。
关于以上要点,根据本发明的装配的实施例可被配置为:计算例如每日统计数据,并基于该每日统计数据来推导例如以下类似的统计数据中的至少任何一个:
·每周统计数据(使用活动、频率、用户渗透率)
·每月统计数据
·每年统计数据
为了计算关于给定用户的动态行为(趋势分析)或者系统的任何两个用户之间的差异的测度,可确定行为矢量的相关性,如前所述,该相关性可导致这样的输出测度,这些输出测度表达例如被研究的实体之间的关键差异的类型和/或所及范围。可通过规范化矢量从彼此的演绎来查明所述差异。例如,可通过多维皮尔逊相关系数找到相关性。
为了理解用户行为的差异和/或基于这些差异产生警报或动作,可利用矢量触发器。矢量触发器是描述这样的条件的一组预定义配置,在这些条件下,在将任何两个特定矢量相关或者计算新的行为指示符之后,应该产生某一警报,并且可选地通过信令将给该警报传递到内部模块或外部模块。在实践中,这种类型的触发器可以是反映例如用户已睡醒、在移动中、或者正要去睡一会的触发器。
事实上,参照图2(特别公开与行为指示符的演算特别相关的特征的实施例),数据处理实体200可被使得负责第一手数据预处理活动和即时转换,而处理实体200中所包括的或者至少在功能上与处理实体200连接的下一个实体(用于结构化、参数化和/或添加语义的实体210)可负责基于数据的内容和属性来将数据划分到若干个结构化实体(比如,表)中,优选地能够利用内部的或外部的支持引擎220(其可包括比如位置预置(provisioning)或天气API的模块)来将例如远程接收的和/或本地产生的参数添加到该数据,所述添加的步骤还可包括可选的这样的过程,在该过程中,可将来自不同数据表的一个或多个数据点与其他数据点混合,以作为结果,充实原始数据点或者形成完全新类型的数据点。
存储器模块300可负责管理多层数据存储和其他相关功能,而用于数据聚合的(集中式)逻辑400通过能够在例如按离散的间隔成批地分析数据时经历例如预编程的或脚本撰写的活动来实现有利特征。在数据聚合中,来自一个或几个数据实体(比如,表)的一个或多个数据点可被成批地处理,其中,例如时间序列操作、求平均值运算和/或求和运算可被用于从事务(带时间戳的)数据巧取有意义的统计数据。
如前所述,数据聚合模块400可包括若干个完全不同的模块或者至少在功能上与若干个完全不同的模块连接,所述若干个完全不同的模块包括:矢量计算410——演算统计数据和行为指示符,并输出包括所有这样的输出的预定义矢量;矢量聚合420——针对例如一组用户或者针对某一时间段对计算的矢量进行求平均值和聚合;以及矢量相关430——自动地或者应请求将任何两个矢量彼此进行比较。
最后,前面所解释的矢量触发器440可定义如果预定的相关性输出某些特定结果,则需要采取的若干个动作。
回到支持引擎块220,以下提供能够作为以接收数据为目标的预处理动作的一部分对(原始)数据进行充实的模块的例子。
位置处理模块可输入原始数据(包括各种形式的位置相关信息),并以更标准化的方式和/或格式将位置数据返回给任何请求模块。在位置处理模块中,可在特定的位置变量中例如用纬度和经度地理坐标(例如,4位小数的度数)记录位置。可提供所谓的主位置实体(比如,表),在该主位置实体中将存储每个单个位置的更新。另外,可存在在其中将针对给定的时间段(例如,针对5分钟时间段)、针对每个用户对位置进行聚合的实体(比如,表),以方便与其他表聚合和映射以及优选地通过基本统计方法排除异常值。
关于位置,位置处理模块可输入例如蜂窝网络的工作基站的每个变化(以及另外,覆盖可见基站在给定频率的扫描的输入数据)、WiFi热点在给定频率的扫描上的周期性或非周期性数据、GPS定位点在给定频率的周期性或非周期性数据、和/或来自移动装置的位置应用程序编程接口的数据。
位置处理器有利地系统化地处理它接收的每条独立的位置信息。对于传入的新的当前未知的基站或WiFi热点索引,可从能够将基站索引或热点索引映射到地理坐标的内部的或外部的其他位置处理器检索坐标。另外,位置处理器可维护它自己的将基站索引和WiFi热点索引映射到地理坐标的数据库。位置处理器可处理几乎所有的传入数据,以对每个传入的位置相关观测数据(比如,无线电网络层次的参数)添加有形的位置坐标。
如果通过移动装置的API接收到GPS或精确位置坐标,则将在位置处理器的内部数据库中更新关于当前工作基站和此时工作的WiFi热点的位置信息。
除了原始数据之外,这些可能的位置戳可被收集到专用位置表中,该专用位置表指示所考虑的用户、时间以及位置点和精度。在适度的情况下,例如,可在每次基站扫描或变化时在表中更新位置。关于所述表,当创建新的条目(包括例如建筑名称/地名、地址、区域、城市、邮政地址和/或城市)时,可同时添加位置名称。例如,可从可响应于地理坐标返回地名的外部模块或内部模块检索位置名称。
关于基于基站和WiFi的位置查找,还可存在存储各个坐标的位置名称的其他表,以使得它们不需要额外的位置名称查找。例如,可存在独立的索引表,在该索引表中,每个基站索引被映射到相关地名。关于基于GPS的位置查找和基于无线装置API的位置查找,可实时地从内部模块/外部模块检索位置名称。
通过对所有位置观测期间的每个时间段使用中值函数或类似的函数,可将位置表进一步聚合为这样的形式,在该形式中,针对给定时间段(例如,5分钟时间段)存储位置。
作为整个数据处理的一部分,本发明的各个实施例可在选定的情况下应用所谓的排队,其中,通过另外两个步骤来对数据点进行处理,以便便于任何两个表之间的信息的智能映射或匹配。
如前面所公开的,本发明的各个实施例还可包括将通常更易于以标准化的方式从各种源收集的非参数化数据转换和/或处理为被存储到最终表中的参数化观测数据和更充实的信息,从这些数据和信息,可进行更复杂的聚合。
作为与位置聚合和参数化处理尤其相关的例子,可如下执行将位置数据匹配到观测中的过程。
1.在覆盖预定时间段(例如,几天(比如,3天))的人类(用户)行为的较大数据块中接收几种不同的观测类型。
2.在第一层次的精炼之后,将数据流引导到3步处理中。
a.在第一步中,因为不能总是假定输入数据是按顺序的,所以优选地,按时间顺序对给定数据块中的基本所有的数据进行排序。
b.在第二步中,逐行地对所述数据块中的数据进行处理,并且仅对与位置(比如,GPS定位点)、基站变化、基站扫描和WiFi扫描相关的数据点进行处理,并且使用单独的位置处理模块来将该信息全部映射到地理坐标。结果,位置处理模块的输出(包括标准化的位置戳,而不是单个的技术观测数据)被存储到新的表中,在该表中,存储所有位置的更新。另外,创建更标准化的位置表,在该位置表中,针对定义的时间段(例如,针对每一个5分钟时间段)更新平均位置信息。统计方法(比如,中值)可被用于推导该时间段内的位置的足够良好的逼近。另外,即使给定时间段不存在位置更新,所述处理也可产生该丢失时间段的位置戳,条件是例如可从所述数据启发式地确定在过去5分钟或其他预定时间段期间位置最有可能没有变化的事实。
c.在第三步,按时间顺序引导所有其他数据通过,并且可容易地将先前处理的位置数据映射到各个观测数据,因此,可产生参数化的数据作为输出。
作为本发明的某一优选实体,分层数据挖掘(以下将更详细地描述)能够发起这样的处理,在该处理中,对数据进行聚合,并应用统计过程来将它转换为对于外部系统比原始事务层次的观测数据更可理解的输出形式。
因此,作为相关例子,这里就智能电话的使用来解释如何计算410、聚合420和关联430关于人类行为的行为矢量。
作为输入,本发明的这个示例性实施例接收关于智能电话应用程序使用的一批数据(例如,日志行)。在原始观测数据中,每行可描述例如智能电话应用程序在无线装置的用户接口中的激活。每行早前可能已经被处理,这意味着所谓的映射ID可能已被附加到所述应用程序的原始层次的最初技术名称,其构思是无论记入日志的原始层次的名称如何,都将唯一标识符给予每个应用程序实体,所述原始层次的名称可以例如取决于无线装置的用户接口的语言。映射ID可另外用进一步的数据/表来充实,所述进一步的数据/表将每个唯一应用程序标识符映射到一组其他变量(比如,应用程序类型、应用程序类别、应用程序子类别等)。
基于映射处理,可从所述数据移除所有不表示实际应用程序(例如,不同类型的菜单、屏幕保护程序和/或主屏幕应用程序)的应用程序行。作为所述处理的一部分,优选地,还排除异常值(包括例如异常长的应用程序会话)。另一方面,精炼的数据流应被清除重复情况,在所述重复情况下,在精炼之后,可能存在具有非常相似的名称、但是时间戳不同的两行,这是由于例如在应用程序会话期间偶然地跳转到例如主屏幕应用程序而导致的,人们从主屏幕应用程序立即返回到最初的(实际的)应用程序。在排除不表示实际使用的应用程序之后,可能依次存在呈现同一应用程序的两行,因此,它们应被组合在一起,因为这些行表示同一使用会话。应用程序使用上的预处理数据流可以例如因此包括具有唯一用户ID、时间戳和/或某种类型的应用程序标识符的一组行,但是可包括附加信息(比如,应用程序类别等)。
在从这种类型的准备就绪的专用数据计算行为矢量时,矢量演算引擎(410,420,430)能够从数据聚合实体400得到这些行的数据块。
负责所述过程的实体可工作,以使得它获得作为参数的起始时间和结束时间以及应被处理的一组用户ID。在接收到原始层次的数据之后,实体可排除不适合其批量运行参数的数据。其次,行为指示符可具有两个关键维度,第一关键维度是应该描述的反映和/或抽象,第二关键维度是时间尺度,应该反映该时间尺度的例如活动。时间尺度可以是例如一天或一周,这意味着,所考虑的指示符将被计算,以使得它描述在观测时间段期间分别在一天中或一周内的平均活动。
实体然后可执行的聚合相关任务可包括计算例如分别有多少个不同天或不同周观测到特定应用程序或装置特征的一些使用。在假定可能的使用时间单位可被推导(换句话讲,有多少天存在可用的一些数据并且装置实际上被开启)的情况下,这设置了用于计算频率相关统计数据的基准,以使得计算反映可能会使用或进行其他活动的每日的平均行为的统计数据更容易。作为例子,可能接收到与一年的时间段对应的数据块,这意味着第一观测日期是该年的第一个日期,最后观测日期是该年的最后一个日期。
然而,在中间的4个月内,没有接收到数据,可能是因为数据收集特征被禁用。首先,可执行简单的聚合过程来确定有多少个不同月可能会使用,该聚合过程在这种情况下将导致8个月的结果,8个月然后用作基准。
在对基准的可能使用或活动时间进行聚合之后,所述处理可更深入地进入计算。在这个具体例子中,目标是针对关于应用程序使用程度的有形反映的获取。原始层次的应用程序数据流对于这没有明显地告知很多。因此,可能存在更好地描述应用程序的使用的多种类型的不同矢量,并且一个关键的设计目标可以是使用最少数量的轮次或批次运行来计算这些矢量。在这个具体例子中,更详尽地解释两个这样的矢量,所述矢量可在同一批次运行期间被计算。
第一个矢量可指示应用程序面对时间,所述应用程序面对时间告知人们用他们的移动电话在某一应用程序前面所花费的时间。第二个矢量可反映应用程序使用频率,所述应用程序使用频率告知使用的相对发生率。为了这个具体例子的目的,假设唯一关注的是关于应用程序使用活动的日层次的统计数据和关于应用程序使用频率的月层次的统计数据,但是数据本身可覆盖一些其他时间段(比如,举例来说,全年)。关于这些变量,所述处理首先聚合输出文件,在该输出文件中,针对每个用户,针对每个日历日,计算在这天中对每个应用程序花费的累积面对时间的总和。结果,将构造聚合数据表,该聚合数据表包含关于以下的信息:每个用户每日使用的应用程序;它是否被使用(基本上意指行是否存在,因为如果没有观测到使用,则对于应用程序不存在行)的事实;以及使用的活动(意指就例如所花费的面对时间或会话数量而言的使用程度),该信息活动被作为每行的变量存储。这种类型的聚合表因此反映了所有应用程序上使用的存在或不存在以及使用的活动。这种类型的表还易于进一步聚合。
接着,可进一步对这个信息进行聚合,以使得最终构造聚合文件,在该聚合文件中,对于每个用户,对于整个日历年,对于每个应用程序,存在关于以下的信息:在该时间段期间对该应用程序所花费的总时间;以及在其期间使用该应用程序的不同天的总数。对于这个表,进行了合并操作,这意味着引进了一开始计算的关于那年内的可能的使用天数或活动天数的信息。在该操作之后,可通过简单的除法运算来计算平均起来任何特定用户在可能会使用的每日对特定的应用程序花费多少分钟。通过将观测到使用特定应用程序的不同天数除以可能的总使用天数的另一种除法运算,我们最终得到最大可具有值100%、最小可具有值0%的频率矢量,该频率矢量告知该应用程序的相对发生似然性,该相对发生似然性反映用户的使用如何重复。
作为输出,可通过不同的平均过程或者通过简单地将这些矢量累加来将这些类型的行为矢量组合在一起,以使得对于某一时间段(比如,一天、一周、一个月或一年),组合的矢量通过一个或多个度量告知使用活动,这意味着每一被研究的应用程序或其他活动的度量或行为指示符的数量共同形成多维,所述多维意指不同应用程序或活动的数量。在这种类型的组合、平均或求和处理中,更详细地讲,通常对例如每日层次(daily level)的矢量进行处理来给出被观测行为的周层次(week level)的平均值。重要的是承认在一些情况下在行为演算中存在信息丢失。例如,当计算关于特定一周对web浏览器所花费的平均时间的行为指示符时,从这个度量,不可能推导关于月层次的web浏览器使用频率数字的频率测度,因为用于这种类型的演算的输入数据要求该数据是在日层次上,并且同时,需要知道对于可能使用(意指那个特定月内的不同使用天数)的了解。
对于不同类型的聚合层次,可重复相同过程。例如,代替应用程序实体,基本聚合实体可以是应用程序类别、应用程序子类别或其他一些实体,比如,从移动web浏览日志,它可以是用户访问过的域名,或者从装置特征日志,它可以是任何特定的感兴趣的装置特征。
当计算行为矢量(例如,关于应用程序使用的行为矢量)时,所得的矢量可贯穿于整个标准回归分析,其中例如,时间戳是关键的独立变量,并且通过这种类型的先进相关方法,可研究可能的时间趋势,并且可确定例如该趋势的平均斜率。
作为另一个例子,可对照例如年层次的任何两个用户的行为矢量来计算标准皮尔逊相关系数或类似的任何项,因此可确定行为相似性指数。
作为另一个例子,这里就人类位置动态(换句话讲,移动)的建模来解释可如何计算410、聚合420和关联430行为矢量。
首先可获得位置数据的数据块,该数据块通常识别在预处理期间可能已推导的所有可能的位置更新,所述预处理可组合来自几个源(包括WiFi热点扫描和基站扫描或GPS定位点)的数据,并且例如表形式的这个位置信息通常形成非标准化的数据流。聚合实体可首先将这个位置流变成更标准化一些的形式,例如,它可计算关于每个例如5分钟时间段的表行,在该表行中,从事务层次的数据计算近似位置,这可通过例如利用中值函数的统计建模来执行以最终得到最佳逼近。这通常还解决了异常值的问题。可将启发法附加到这个处理,以使得例如如果某一5分钟时间段丢失了数据(可能是因为没有进行位置更新,但是通过其他数据表,显然看出装置被开启),则可基于之前的5分钟时间段的位置点来创建这个5分钟时间段的位置点,以最终得到更标准化的位置流。
接着,可推导关于例如用户的每日移动的行为指示符。为了这样做,可发起简单的聚类,在该聚类期间,可将根据所用标准紧密邻接的所有地理坐标分组到例如一个显著位置斑点中。通过应用标准网络分析和聚类方法,可有效地进行这个操作,因此,对于例如每个5分钟时间段,可建立描述不同位置的索引。此后,如果最终关注的是最终得到每日层次的关于用户的移动的行为矢量,则将跟着进行聚合过程;对于每个用户,对于每日,可计算维度坐标的例如5%和95%百分位数以及经度坐标的相应地5%和95%百分位数,随后是关于特定的这一天中的不同数量的地方索引。
通过百分位数,可排除异常值和/或例如可形成4点正方形,以逼近用户在一天中多半移动的区域。现在通过计算两个最远点的地理距离(意指对角线的长度),可建立被称为移动球体的测度,所述移动球体反映平均起来用户在这一天中移动的区域。另外,可计算被称为地方熵(place entropy)的行为指示符,该行为指示符简单地反映用户在特定的一天中去过多少个不同的地方,在这种情况下,用户在这些地方花费至少5分钟。结果,可针对每个用户每日形成关于他/她的位置模式的二维矢量。该二维矢量的维度反映位置动态的广度和多样性。
然后可进一步聚合这些仅示例性的位置指示符。例如,可从这些矢量或者例如关于一群人的聚合位置行为指示符形成月层次的平均值。此外,通过关联,可研究例如一周的某一天是否影响位置动态的广度或多样性。为此,可使用标准方差分析工具。
有利地启用本发明的各个实施例来执行以下操作:使不同类型的数据彼此分离;以及基于与数据点的利用相关的需求或者基于与各个聚合层的可能交互来结构化地划分这些数据点,以使得演算负荷和所需时间可被优化。这些目标可通过前述总地被称为“使用行为数据的分层数据挖掘”的特征来实现,通过该特征,指的是通过分层模型来管理数据流,在所述分层模型中,原始数据区别于更精炼的数据,并且精炼的事务数据区别于聚合和统计数据。总共,至少可存在关于数据处理和存储的以下类型的层:
1.原始层次的数据(例如,从移动装置接收的、可能为非参数化形式的事务观测数据),
2.度量数据(例如,经过处理的、经过过滤的、经过精炼的可能参数化的数据),
3.中间层数据(例如,聚合和/或重构数据),和
4.解析数据(例如,高层次的聚合(比如,现成的行为指示符或技术指示符))
可替换地,举例来说,例如层3可以不存在,并且在一些情况下,可根据相关数据的性质将它们包括在层2和层4中。例如,在对照在蜂窝网络中花费的所有时间计算关于在3G网络中花费的平均时间的技术指示符时,可直接从度量数据计算关于某一天的技术指示符,而不是在之间进行任何聚合。在这样的活动满足以下两个条件中的任何一个或两者的情况下,使用多层链式聚合:
1.聚合处理使数据简化,或者推导出更好地反映被观测的技术或行为事件的细节或性质的、特定类型的聚合度量或数据结构
2.聚合处理通过例如平均而导致这样的情况,在该情况下,输出的表的访问或进一步处理大大加快。
可提供可伸缩部件,该可伸缩部件访问行为数据,并在之上构建定制的视图或统计数据。为了这个目的,被称为“中间层表”的特征,用于有效地将至少部分聚合的数据存储为这样的形式,该形式易于通过统计方法或者更描述性的方法来改善和/或进一步处理和/或引导到例如其他系统进行进一步聚合或可视化。数据可被存储在例如基于SQL(简单查询语言)的表(比如,MySQL)中,但是优选地,也可易于通过SPSS(社会科学统计软件包)或其他广泛使用的统计软件工具来访问。数据可被存储在至少一个关系数据库中,并且关系的数量可随着更多的数据被分析而增加(应当记住数据被以非参数化的方式收集)。
优选地,所述装配的实施例不被配置为在数据处理或聚合的任务中对于在最终报告中需要什么类型的统计数据采取固定的观点,于是存在前述被称为“进一步聚合”的特征,该特征可有效地依赖于被计算到中间层表中的行为指示符,并产生几乎所有任何内部目的或外部目的所期望的类型的统计数据。示例性的推导的统计数据可包括:
1.应用程序粘性,在每周使用特定的应用程序或应用程序类别的人之中有多少人每天使用该应用程序或应用程序类别(即,较短时间段(较频繁的用户)对较长时间段(不太频繁的用户)类型分析)
2.移动网站相对注意数字,将在某一时间段期间在某一域名上花费的时间的绝对量与对web浏览花费的所有时间进行比较
3.良好睡眠与不良睡眠的比率(长度小于6个小时的晚上与对用户进行测量的所有晚上的比率)
本发明的一些实施例是以使所需的存储容量最小、保护消费者的权益和/或便于快速数据处理为目的进行设计的,由此可应用被称为“周期性清理”的特征。在所述过程期间,所述装配可有利地自动地、周期性地遍历一个或多个存储的原始层次的数据表和/或更高层次的数据表或其他实体,并将不需要的数据点/实体从储存器全部一起处理掉。
另外或者可替换地,可在本发明的实施例的上下文中灵活地分布数据处理和存储。为此,可利用前述被称为“管理分布式数据挖掘”的特征来有效地保持跟踪:例如,用户来自哪里;他或她的数据点被存储在哪里;以及如果时间戳以任何方式产生影响,则数据处理和存储应该在哪里发生。传入数据的存储及其后处理有利地遵循系统的集中式配置。
图3描绘了本发明的分层数据挖掘方面的实施例。首先,在确保存储器可便于/服务所有传入请求以及以协调的方式对传入数据进行例如重要的转换和变换(如果需要的话)时,可能需要高速缓存350。存储器实体300可关注关于数据存储的核心活动(管理操作负荷和/或任务的分布,最重要地,控制所有数据)。存储器不仅可应用以上解释的“清理”模块来移除异常数据点,而且还可应用以上解释的“清理”模块来改进最终客户(例如,数据API的用户)数据的质量以及分布例如尽可能有意义的、结构良好的和/或丰富的信息。最后,清理模块可被配置为移除较旧的、已经分析过的数据。存储功能性370可被配置为管理数据层,所述数据可被定义为包括,但不限于,例如,如前面简要地回顾的“观测者数据”371、“度量数据”372、“中间层”或“中间层次”数据373、以及“解析(insights)数据”374。模块370可主动地使对构造的(移动)观测信息数据库的访问虚拟化。再次,数据聚合400被配置为:对接收数据执行预定义的动作,并且例如确保对数据进行批量处理460或者通过更动态地更新例如关键的选定的统计数据来对数据进行处理450。
作为分层数据挖掘逻辑的一部分,接下来描述本发明的一个实施例来示出这样的模型的物理输入和输出的实现。
使数据存储分层并且进一步执行聚合过程的一个原因可以是由于这样的模型可以以高效率的方式将几乎任何数量的行为观测数据转换为各种聚合指示符的事实。具体地讲,因为用于计算行为矢量的相关引擎在这些情况下可能变得非常复杂,可能的查询操作和统计操作的量可能非常大,所以分层数据挖掘模型使得可前瞻性地预先对各种表进行聚合,以使得行为矢量演算的最终步骤尽可能地高效率地执行,并且它们的产生在大多数情况下甚至可以是实时的。
在实际人类行为被连续测量、但是要求所述装配的预期输出包括启动例如移动广告平台将消息发送给客户的通信动作的应用中,行为矢量演算模块可能不具有执行将花费太多时间或者覆盖太多查询的演算操作的实用可能性,因此,应该能够权衡利用在计算过去行为的高层次平均数字时已经聚合的表以及反映该平均行为是否不同于当前行为的简单测度。
作为例子,此处描述可如何通过分层数据挖掘模型来准备位置。在第一层次的数据中,每个位置更新被加上了时间戳,并且信息量可能非常高。在下一步中,在第一层次的数据处理之后,存在输出文件,在该输出文件中,通过使用启发法和其他过程(比如,如本发明中指定的支持引擎),对每个5分钟时间段写入近似的平滑位置。另外,对数据进行充实,所以将例如地名(建筑、街道、城市、国家)添加到行,以生成具有多一点语义的数据描述。
在下一步中,在分层位置数据处理中,存在可在任何特定时间(例如,每晚)被启动的处理,该处理采取特定范围(例如,特定起始日期与结束日期之间的时间段)的位置数据作为输入。这是所谓的周期性地,而非实时地处理数据的批量处理。
在实际应用中,该处理可被设计为在期望的最佳时间段内(例如,每24小时)运行,并且它可每日处理例如过去3天的数据。根据结果得到的天数,从而可(有目的地)确定重叠聚合。如果仅在一天(而不是前一天)从某一用户接收到覆盖他/她过去3天的行为的新数据,则重要的是,这一天的批量处理能够填充丢失间隙,并且不仅针对这一天,而且还针对所述过去几天,更新关于该用户的关键聚合。所述架构可被设计为使得如果存在重叠数据,则新的聚合可超控旧的聚合。
在聚合引擎中,周期性处理将依次完成若干个项目:
1.它将计算聚合实体(比如,表),在该聚合实体中,对于每个用户,对于每个日期,以及对于每个小时,将计算关于每个聚合实体(例如,城市)的一行,该行指示用户在该位置上花费了多少个5分钟时间段或者任何其他时间相关单位。
2.还将使用步骤1的输出聚合来计算类似的实体/表,以最终得到这样的表,在该表中,对于每个用户,对于每个日期,将给出类似的位置中断。
3.最后,通过接下来的步骤,可存在这样的聚合过程,该聚合过程将计算非常长时间(例如,一年)内的这样的信息,该信息精确地反映用户的更高层次的位置模式。更高层次的位置模式在例如研究用户住在哪里时可能更有趣,因为日常生活的随机性和变化不限制分析,这意味着这样的事实,即,在低层次数据表中,存在许多噪声(例如,短暂地到过的数千个地方,还有比如假日发生的与正常生活模式的可能异常的偏差),并且通过将统计数据聚合到较长时间段并且还过滤非重要地方,查明重要地方更容易,并且用户生活中的时间偏差产生任何影响的似然性降低很多。
在这种类型的多层数据模型的设计中,使用上述步骤的输出来形成所谓的聚合(派生表或多层表),这使得进一步计算更容易。例如,基于项目1的输出,针对每周、针对每个位置实体计算最典型的(中值)小时相对简单,这使得可启发式地获取例如关于那是办公室位置还是家庭位置的观点。
此外,在任何时间可使用这些类型的聚合输出(例如,项目2的输出(表))来推导进一步聚合,所述进一步聚合针对每个工作日描述位置排名,使得可就活动、移动轨迹和时间花费来理解每周模式。
根据中间层表,在数据处理中存在表示为最高层的所有类型的行为演算和/或处理,包括求平均值、求和、方差估计、相关系数的偏差、测量熵等。例如,这样的过程,在这些过程中,平均使用活动(比如,所花费的面对web浏览器的时间、用于发送多媒体消息的最大每月使用频率、就一天中往返的千米而言的用户的位置动态的平均方差、以及在不良信号强度条件下花费的时间份额的聚合指示符)都是通常可针对某一时间段计算的输出变量,并且可仅通过进行一个层次的平均或组合而被直接用于相关报告或分析实践,但是就信息内容而言,数据本身在最高层次上。基于聚合表,通过简单的查询和过程,可计算有意义的统计数据(比如,在特定的一周内在家里花费的平均时间)。这实际上将不可能从原始层次的数据快速地转换,因为在推导实际的高层次的度量或指示符之前,首先需要对数据进行聚合、计算时间戳、识别家庭位置等。聚合表以及动态负荷平衡和责任划分使得本发明的聚合和数据挖掘功能性的不同实体能够彼此独立地进行,并且一个处理的输出(例如,估计的某一天中使用web浏览器的面对时间)可以是其他处理(例如,推导关于web浏览器的使用时间在多天中的方差的度量的处理)的直接输入。通过批量处理方法(在该批量处理方法中,通过在其期间推导更有意义的指示符和度量的处理来例如周期性地发送经过处理的传入数据),最近的数据实际上是最短可能时间内的,例如,在每天之后,计算这一天的以便于复杂计算(如果需要的话)的最佳形式可用的关键统计数据。换句话讲,所述设计能够使聚合工作与统计和行为矢量计算分开,以使得系统可更高效率地处理大量数据,尽管就应用程序(比如,移动广告或汽车用户剖析(profling)解决方案)所假定的关键要求而言仍然快。
以类似的方式,多层聚合和计算引擎可被设计用于处理例如应用程序使用日志、web浏览器点击流、音乐消费、睡眠数据以及甚至音频和视频信号观测数据。
如上所述,存储功能性370可被配置为管理不同的数据层:
1.“观测数据”(371),包括例如基本形式的原始层次的事务(应用程序使用、语音呼叫、消息)和扫描(WiFi扫描、蓝牙扫描、存储器文件系统扫描等),
2.“度量数据”(372),包括例如精炼的(经过处理的/经过改善的)数据(排除的异常值、添加的元数据、转换为参数化形式的数据流),
3.“中间层”数据(373),包括例如(较低层次的)聚合和重新组织的更结构化的数据,有时支持度量被充实和附加,并且准备用于最终度量的演算的关键信息点,
4.“解析”数据(374),包括例如关键统计数据和最终聚合结果。
有利地,本发明可服务于愿意例如通过查询计算的数据点和统计数据来在任何特定时间从提供的装配检索数据以访问它的例如数百个客户。前述被称为“虚拟访问”的特征可被配置为:构造用户的行为指示符的抽象,并使中间层表虚拟化,以使得它们更易于访问。“虚拟访问”特征可将一个或多个网络服务器连接在一起,以为正积极地使用提供的API的客户提供例如类同的用户体验。虚拟化的访问可提供:客户无需知道有多少个服务器收集日期、服务器的物理位置、等等,因为所描述的装配可提供用于将技术查询键入到系统中的类同的视图。
本发明的各个实施例可有利地被构建为支持语义数据模型,因此可启用提供的装配来分别地描述概念(比如,(用户)睡眠或移动),周期性地将重要数据点(比如,位置和时间段)附加到它们,并忽略例如收集的原始观测数据。例如与处理实体/模块210结合实现的相关的“转换特征”可被配置为将语义信息添加到数据点,并使得能够实现更面向自然语言的语义请求。除了其他数据点之外,这些语义数据点可包括以下语义数据点中的任何一个或多个:
1.位置名称(NYC、北京)和描述符(中餐厅、高尔夫球场),
2.聆听的音乐类型(例如,MP3、WAV)和/或风格(例如,重摇滚、蓝调、舞曲、古典音乐),
3.关于重要位置(比如,“家里”和“办公室”)的信息
优选地,本发明的实现确保可对经过分析的和/或经过处理的数据进行所需的过滤和排除任务。因为外方(即,客户)可向提供的装配请求大量信息,所以可取的是存在一组/若干个过滤和排除任务,这些任务能够检查数据中的预定的特定事物,并丢弃或操纵相关联的数据点,以使得输出是优选的,比如更结构化且更有意义。例如,可能需要仅针对某些组用户或者仅针对某一时间段推导某些统计数据。
图4描绘了数据输出接口500(例如,应用程序编程接口(API))和相关数据分布逻辑的实施例。在所述处理中,可首先过滤用于输出的现成的数据(包括例如关键统计数据、指示符,有时甚至还有中间层度量),并且可选地,过滤器和数据预测模块480可对与以下将描述的预测引擎487的通信进行处理。数据API500可被配置为管理与API使用相关的预定操作,而隐私引擎481可动态地提供关于例如对于任何特定用户或用户群可存储什么类型的数据或统计数据的准则和/或设置。类似地,过滤引擎482可具体包括用于过滤传出情况的规则和/或使数据输出统一(甚至出于客户特定的目的)的规则,所述过滤的步骤例如,因为某些类型的数据点的低统计显著性而移除这些数据点、或者因为例如访问或隐私相关原因而限制对某组人的输出。请求处理模块520可与所述装配的客户/用户(或者是机器(通过定义的API命令),或者是人类(通过特设的API请求))通信,并且其主要目的有利地是解释什么数据点需要被向前传递。报告模块510可负责自动地或者应请求产生报告或数据表,这些报告或数据表将一组定义的数据点包含在定义的数据结构中。这些报告可被存储到客户特定的下载站点511或其他实体中,或者可通过预置(provisioning)模块512被进一步传送,预置模块512可以甚至通过电子邮件或者一些其他支持媒介将输出数据(比如,表和报告)向前发送。
图5描绘了根据本发明的预测引擎的实施例。有利地,预测引擎被配置为通过整合模块480将实时行为矢量的处理整合在所述装配中。抽象(比如,某一时间帧内部的行为矢量的聚类)可以在基本上执行关于预测的其他动作之前被形成在相关联的模块486中。预测模块487可包括多维的复杂模块中,该复杂模块包括用于不同类型的行为抽象的若干个状态机。反馈回路488可出于性能评估的目的而引进实时数据,并连续地维护例如反映任何特定预测的成功似然性的指示符。最后,前面解释的数据输入模块100可通过接口连接观测数据流和相关的外部模块(比如,举例来说,广告网络)。
通过组合可用行为矢量中的多维矢量(例如,小时层次的位置动态)的“抽象”模块,可产生可被表征为行为踪迹的矢量,这些矢量在时间单元之间自然地有时会体验到许多变化,但是仍然描述如先前已经仔细考虑的某一行为模式。在抽象之后,用户的生活可更易于通过机器学习和/或模式识别的工具来进行分析。关于用户的示例性描述符矢量可以是:在地方X睡醒、从X移动到Y、碰到H、从Y移动到Z。
为了预测什么人有可能接着做,可动态地构建用户行为模型487(即,预测模型),该模型包括作为元素的行为的抽象以及元素之间的例如马尔可夫链类型的动态。作为进一步的特征,该预测模型可被配置为:动态地计算模型权重和/或底层系统(装配)中不同转变的似然性,并且几乎在任何时间提供具有系统(装配)的下一可能状态的似然性的矢量。
连续学习处理可被应用于新的到达数据。反馈回路488可被配置为例如:更新预测模型487,并计算例如描绘模型的预测在任何给定时间有多成功的(连续)度量。通过某些阈值,可实时地解决预测引擎的性能。反馈回路可以使得预测引擎能够真正地自主学习。
例如可以出于移动广告(上下文相关的、预测性的、针对性的广告)或者网络性能分析和可选的优化的目的而动态地提供预测。为了前一目的,相关联的状态机(例如,马尔可夫模型)可被配置为(连续地)提供对下一状态(例如,下一个位置、用户呼叫的下一个人的姓名、他接着正要聆听的音乐艺术家)的预测,并且通过计算的性能指示符(模型正确的可能性有多大)和提供指定广告库的外部模块或内部模块,如果根据所用标准,条件具有足够的预见性,则所述系统可触发特定动作(比如,某一广告的弹出)。
回到预测模型487,它可被用于获得关于人们在短期内(比如,在接下来的几分钟内)或者在长期的未来(意指例如在下一周内)的可能的来来去去的有根据的推测。预测模型487可被配置维护相对大的(移动)用户状态网络。所述状态可以是多维的。例如,(家里,睡眠)和(家里,会议中)可表示行为数据挖掘引擎正输出的例如位置状态和社会状态上的二维状态。
预测引擎可被构造为使得能够(容易地)在没有大量数据处理活动的情况下以标准化的方式更新相关联的模型、变权边缘(re-weightedge)(箭头)和/或输入数据。作为例子,可启用预测引擎来在多个维度(比如,位置、移动、会议状态、电池状态、应用程序使用、web浏览点击流和接近状态)上输入行为数据和/技术数据,其中,对于每个维度,使用类别变量或尺度变量来区分可能的状态。然后使用预测模型来创建多层关系数据库模型,该多层关系数据库模型被针对面向网络的数据存储和网络建模进行了优化。从这个存储中,预测引擎然后可刷新所谓的预测模型487。预测模型487可以例如非常特定于位置模式,或者它们可以更复杂和更多维,通过多维状态将比如位置和社会活动的事物包括在同一模型中。然而,这不改变预测模型487中的基本构思,在该基本构思中,该模型通常被描绘为马尔可夫状态机、或者可用描述关系的双向矢量来支持多维网络结构的任何其他相关模型。
在预测模型487中,描述不同状态的节点之间的链接被加权到两个方向上;在假定从当前状态的移动将发生的情况下,它们描述移动用户在它们之间移动的似然性。预测模型487不是静态的,所以新数据可一直被输入,并且对给定链接的权重有贡献的每个观测数据也被戳记上属性(比如,时间,工作日、社会上下文、电池状态等)。这使得所述装配可做两件事情:
1.首先,为了通过试错法来给予关于某一事情相对于一些其他事情是否有可能接着发生的快速的高层次的推荐,因为存在到系统的反馈回路,所以它可获悉一个人推测的优先级何时更有可能正确或不正确的关键阈值。该模型一般能够告知人在接下来的几个小时内的可能模式,能够计算人在接下来的几个小时内例如离开点A、到访点B并最后到点C或D的高层次的概率。同样可适用于预测例如在与妻子通话之后,用户更可能开始移动,还是更可能开始开会。该方法更多的是静态的,更多的是剖析用户的上下文。
2.另一可能性是预测更动态,更多的是预测短期事件。如上所述的系统的实现是这样的类型,即,如果该系统知道用户的当前上下文(当前状态),并且它知道各种其他(重要)变量(比如,当前位置、时间和工作日),则它可使用更复杂的统计建模来得到以下的快速估计:在当前状况给定的情况下在接下来的5分钟内开始移动的似然性是多少、或者关闭移动装置的似然性是多少。这些更动态的智能预测是可能的,因为呈现链接的被观测反映的某一观测背后的总体历史数据是多维的且参数化的,因此,在假定足够的上下文数据可用的条件下,使得可对具体问题给予更精确的答复。
在本发明的关于预测建模的一个实施例中,所述装配能够对每个链接或链接组、链接矢量计算测度(比如,可预测性),这些测度于是不仅反映用户的行为分布图(换句话讲,他/她的移动模式非常不合常理并且不可预测),并且还用作用于处理请求和决定某一请求是否可被可靠地答复的输入。
在预测引擎中,总体装配与数据库结构和使用行为数据的多维数据挖掘密切相关连。预测模型是所述模型的一个产物,但是它通过移动网站或其他内容提供者上的应用程序(比如,移动广告或实时内容优化)与真实世界相关连。其他应用程序可包括例如能够前瞻性地向你警告交通拥堵的自适应服务。
在状态机的加权和概率建模中,基于标准网络模型和马尔可夫模型的机器学习方法可与1度、2-度或更多度马尔可夫模型一起使用。时间序列数据以及不止当前状态或先前状态,可被用作用于任何给定预测的输入。在预测更具体的单一事件时,所述装配可使用任何已知的方法(甚至线性回归方法和非线性回归方法)来拟合现存数据、估计模型,并且使用这些方法来给予关于可能的结果可能是什么的建议、或者例如在当前和过去行为和/或技术状态给定的情况下对某一事件估计的时间。
在预测引擎中,一个方面是利用多个不同层的数据来最佳地推测人的可能的未来行为(例如,在接下来的60分钟内从地方A变到B的似然性)、以及将历史数据和相关联的模型与来自移动装置的更多实时数据相关连并建立与真实世界事件的直接的实时的反馈回路的可能性。关键在于多维状态机,在所述多维状态机中,每个链接或行为跳转具有足够的便于更复杂的预测的后台观测。同时,作为更静态的实体的模型本身可给予关于人的行为模式的具体输出,或者它可被用于发送基于细分模型的非常具有针对性的活动消息。预测模型反映过去的行为,并给予关于在已知该过去行为的情况下未来看起来像什么样的似然性。
图6示出了本发明的各个技术方面和根据某一可行实施例的相关装配。服务器装配660可设有能够处理指令和其他数据的一个或多个处理装置(比如,一个或多个微处理器、微控制器、DSP(数字信号处理器)、可编成逻辑芯片等)。处理实体650作为功能实体因此可物理地包括例如多个相互合作的处理器和/或与中央处理单元连接的若干个子处理器。处理实体650被配置为执行存储在存储器652中的代码。用于实现本发明的观测数据收集、处理和分析系统的软件658可利用专用的或共享的处理器650来执行它的任务。软件功能性658可被实现为一个或几个相互通信的软件应用程序和/或模块。类似地,存储器实体652可在一个或多个物理存储芯片或其他存储元件之间划分。存储器652还可以指的是其他存储介质(比如,优选可拆卸的存储卡、软盘、CD-ROM或固定存储介质(比如,硬盘驱动器)),并且可包括这些存储介质。就性质而言,存储器652可以是非易失性的(例如,ROM(只读存储器))和/或易失性的(例如,RAM(随机存取存储器))。
UI(用户接口656)可包括显示器和/或与外部显示器或数据投影仪的连接器、以及键盘/键区、或者被配置为向其操作者提供可实行的数据可视化和装置控制方法的其他可应用控制输入部件(例如,触摸屏或语音控制输入、或者单独的按键/按钮/旋钮/开关)。UI656可包括一个或多个扬声器和相关联的电路系统(比如,用于声音输出的D/A(数模)转换器)、以及具有用于声音输入的A/D转换器的麦克风。另外,实体660包括通信接口,比如,用于与其他实体和/或网络基础设施(比如,一个或多个无线电收发器(例如,WLAN)或者有线收发器/接口(例如,Firewire、USB(通用串行总线)、LAN(局域网)适配器(比如,以太网适配器)、等等)的常规通信的无线和/或有线接口。
软件(产品)658可被提供在载体介质(比如,存储卡、记忆棒、光学盘(例如,CD-ROM或DVD)、或者一些其他存储载体)上。实现应用程序所需的指令可作为可执行的格式或者以其他一些(例如,压缩)格式被存储在载体介质中,以使得该软件可通过载体介质被传输到目标装置并被安装在目标装置中(例如,目标装置的硬盘中),或者在目标装置中通过例如将相关指令加载到目标装置的存储器、直到执行为止来直接从载体介质执行该软件。可替换地,软件可经由无线收发器或者通过有线通信连接被空中发送到目标装置。
图7公开了根据本发明的方法的仅示例性实施例的简化流程图。
在714,获得根据本发明的实施例的服务器装配,并例如通过用于管理来源于移动装置或其他数据源的观测数据的相关软件的安装和执行来配置该服务器装配。在716,接收并存储观测(原始)数据。可选地,还从若干个外部数据源接收补充数据(例如,提供位置信息的元数据)。在718,可成块地或成批地对接收数据进行参数化、分类、结构化等(即,进一步处理)。在720,可基于参数化的参数来推导各种聚合、抽象和/或预测。可建立例如描述所述数据的不同行为指示符和/或技术指示符。可执行预测任务。可激活如前面解释的警报和/或触发器。有利地,使用几个(抽象)层来存储数据,以便于更快速的未来处理。在722,通过在返回时提供被查询的指示符和/或其他更高层次的信息来服务外部数据查询。可替换地,可基于预定计划表或者例如数据服务订阅来将更高层次的信息推送到一个或多个外方。环回的虚线箭头描绘根据前面阐述的教导的不同方法项目的可重复性。新的原始数据可被接收,并且更高层次的实体(比如,聚合)可被更新。
技术人员认识到,示出的流程图实际上仅仅是示例性的,并且方法步骤的性质和数量(这些方法步骤的相互顺序也包括在内)可被动态地和/或用例特定地调整。
本发明的范围可在权利要求中找到。尽管前面详细描述了各种实施例,但是本领域技术人员将理解,在不脱离如本文中阐述的并且由独立权利要求限定的本发明的要点的情况下,可将不同修改引入到明确公开的解决方案。

Claims (25)

1.一种网络服务器装配(102,658,660),包括:
数据输入实体(100,654),其被配置为接收从数个移动装置获得的多维非参数化数据,所述移动装置比如智能电话,所述非参数化数据比如传感器数据;
处理实体(200,210,650),其被配置为使所述多维非参数化数据参数化;
存储器实体(300,370,371,372,373,374,652),其被配置为将参数化的数据作为多层数据优选地存储在多个不同的抽象层上;
聚合引擎(400,410,420,430,460),其被配置为可选地相对于某一时间段、某一位置、某一移动应用或应用类别、某一移动用户和/或用户群,将比如时间序列操作、求平均值运算和/或求和运算的数个聚合和/或数据建模活动指定于成批的所述参数化的数据,以便从数据批次确定数个描述性的更高层次的行为指示符和/或技术指示符,所述指示符的运行基本上在至少预定的足够数量的数据变为可用或者触发器被释放时的任何特定时刻被激活;和
数据导出实体(500,520),比如API应用程序编程接口,其被配置为将所述数个行为指示符和/或技术指示符或者从其推导的信息提供给外部实体,比如,分别地,提供给移动营销实体以用于为一个或多个移动用户选择个性化广告,或者提供给网络分析或管理实体以用于评估网络性能和/或用户体验并且可选地使得它能够基于所述评估来进一步优化所述性能和/或所述用户体验。
2.根据权利要求1所述的装配,其被配置为对接收的数据执行选自由以下构成的组的至少一个处理和/或参数化动作:分类、结构化、基于所述数据的内容和/或一个或多个属性的结构化、添加位置标签、添加web域名数据、添加移动应用数据、以及确定统一ID,所述统一ID比如应用ID或移动内容实体ID。
3.根据前面任一权利要求所述的装配,其被配置为利用选自由以下构成的组的至少一个类别来对接收的数据进行分类:应用使用数据、web浏览使用数据、网络性能数据、接入网络扫描数据、蜂窝网络扫描数据、WiFi(无线保真)扫描数据、存储器使用数据、装置特征使用数据、装置系统数据、警报时钟数据、日历数据、媒体使用数据、内容使用数据、电话簿内容、消息日志、语音呼叫日志和定位数据。
4.根据前面任一权利要求所述的装配,包括预测实体(480,486,487),所述预测实体(480,486,487)被配置为托管预测模型,比如马尔可夫状态机,所述预测模型用于基于先前接收的数据来反映移动用户的过去行为,并且可选地动态地,给出关于与所述用户相关的预定事件或模式的未来状态的可能性,所述未来状态比如未来事件、模式、位置和/或时间。
5.根据权利要求4所述的装配,包括反馈实体(488),所述反馈实体(488)被配置为将关于预测是否成功的信息提供回所述预测实体,以使得能够实现所述模型的自适应。
6.根据前面任一权利要求所述的装配,还包括支持引擎(220),所述支持引擎(220)被配置为将一个或多个远程接收的和/或本地产生的参数添加到接收的数据,比如标准化的位置戳。
7.根据前面任一权利要求所述的装配,其被装配为确定选自由以下构成的组的至少一个行为指示符或统计指示符:每预定时间段的预定单位内的平均浏览面对时间,所述预定时间段比如一天,所述预定单位比如分钟;预定时间段期间的平均睡眠时间;每预定时间段的预定单位的日常移动的平均跨度;某一用户在某一时间段内的位置动态的平均熵;应用使用活动;以及应用使用频率。
8.根据前面任一权利要求所述的装配,其被配置为确定行为指示符值的数个优选多维行为矢量(410),所述多维行为矢量比如指示旅行活动、移动活动、音乐消费活动、压力程度和睡眠活动的矢量。
9.根据前面任一权利要求所述的装配,其被配置为聚合(420)先前确定的行为指示符和/或矢量,以构造进一步的统计数据,所述聚合(420)可选地包括求平均值。
10.根据前面任一权利要求所述的装配,其被配置为至少通过行为指示符值的至少两个行为矢量之间的比较技术来确定关于至少一个给定用户的动态行为(趋势分析)或者至少两个用户之间的差异的数个测度(430),可选地以获得行为相似性指数或者比如所述行为相似性指数的平均斜率的时间趋势数据,所述比较技术比如相关、皮尔逊相关系数的确定和/或回归分析。
11.根据前面任一权利要求所述的装配,其被配置为基于数个触发条件来触发(440)警报或其他动作,所述数个触发条件与行为指示符值的两个预定行为矢量之间的比较结果相关、或者与新的行为指示符的计算相关,所述比较结果比如相关结果。
12.根据前面任一权利要求所述的装配,其被配置为托管语义数据模型,所述语义数据模型将数个语义概念与接收的数据和/或从接收的数据推导的数据相关联,以使得能够实现面向自然语言的语义数据查询,所述数个语义概念比如睡眠、移动、位置名称、位置的性质和/或消耗的应用或数据类型。
13.根据前面任一权利要求所述的装配,其被配置为基于百分位数来定义用于用户的行为类,所述百分位数为较大组内的在特定的行为维度上根据所利用的度量获得比所考虑的用户低的得分的用户的百分位数。
14.根据前面任一权利要求所述的装配,其被配置为周期性地遍历存储的数据,并根据一个或多个预定标准将不需要的部分处理掉。
15.根据前面任一权利要求所述的装配,其被配置为在多个区域数据库或功能数据库之间分配数据,以分布相关联的处理和存储负荷。
16.根据前面任一权利要求所述的装配,其被配置为将虚拟数据库接口提供给外部装置,所述虚拟数据库接口用于访问实时行为和在数个至少功能上连接的设备之间划分的上下文信息。
17.根据前面任一权利要求所述的装配,其被配置为通过基于行为指示符值的已经可用的行为矢量确定数个多维行为矢量来使行为数据抽象化,以描述行为模式(486)。
18.根据前面任一权利要求所述的装配,其被配置为可选地通过语义数据来确定用户的空间-时间行为模式和/或相关统计数据,以提供概念信息,所述概念信息比如位置名称,并且被配置为应用启发法来确定相关联的位置的性质,所述位置比如工作场所和家里。
19.根据前面任一权利要求所述的装配,其被配置为通过考虑丢失部分之前和/或之后的数据自动地扩大所述丢失部分来基于间断的接收数据确定基本上连续的行为实体,所述行为实体比如矢量。
20.根据前面任一权利要求所述的装配,其被配置为使数据处理活动与存储活动逻辑地和/或物理地分离,和/或基于用户标识符和/或所需计算或聚合过程的类型和/或时间标准来在多个网络服务器之间划分相似的活动。
21.根据前面任一权利要求所述的装配,包括分层平均模块(450),所述分层平均模块(450)适于在选定的用户群或时间段上进行动态平均,可选地利用滚动平均,并且出于高效率地处理来自所述装配外部的复杂查询的目的,优选地与聚合引擎逻辑地分离,并且出于其他原因,可选地分离独立的数据集,所述其他原因包括法律上的。
22.根据前面任一权利要求所述的装配,其被配置为将数据层与数个服务器实体物理地链接,所述数个服务器实体能够用语义充实数据,所述语义可选地通过多维匹配过程被添加到所述数据。
23.一种要由电子装配执行的用于对观测数据进行处理的方法,包括:
-接收从数个移动装置获得的非参数化的多维的空间和时间人类行为和/或技术观测数据(716),所述移动装置比如智能电话,所述观测数据比如传感器数据;
-对接收的数据进行参数化,可选地对接收的数据进行分类和/或结构化(718);
-成批地对参数化的数据进行数个聚合和/或数据建模活动,以便从数据批次确定数个描述性的更高层次的行为指示符和/或技术指示符(720);和
-将所述数个行为指示符和/或技术指示符或者从其推导的信息提供给外部实体(722),比如,分别地,提供给移动营销实体以用于为一个或多个移动用户选择个性化广告,或者提供给网络分析或管理实体以用于评估网络性能和/或用户体验并且可选地使得它能够基于所述评估来进一步优化所述性能和/或所述用户体验。
24.一种计算机程序,包括当在计算机上运行时适于执行权利要求23的方法的代码装置。
25.一种载体介质,比如光学盘、软盘或存储卡或记忆棒,包括根据权利要求24所述的计算机程序。
CN201080068453.8A 2010-06-24 2010-06-24 网络服务器系统及其相关方法 Active CN103154928B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/FI2010/050548 WO2011161303A1 (en) 2010-06-24 2010-06-24 Network server arrangement for processing non-parametric, multi-dimensional, spatial and temporal human behavior or technical observations measured pervasively, and related method for the same

Publications (2)

Publication Number Publication Date
CN103154928A true CN103154928A (zh) 2013-06-12
CN103154928B CN103154928B (zh) 2016-08-03

Family

ID=45370891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080068453.8A Active CN103154928B (zh) 2010-06-24 2010-06-24 网络服务器系统及其相关方法

Country Status (8)

Country Link
US (2) US9148458B2 (zh)
EP (1) EP2585941A4 (zh)
JP (1) JP5896382B2 (zh)
KR (1) KR101650993B1 (zh)
CN (1) CN103154928B (zh)
AU (1) AU2010355789B2 (zh)
CA (2) CA3020551C (zh)
WO (1) WO2011161303A1 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105683942A (zh) * 2013-07-24 2016-06-15 微软技术许可有限责任公司 性能数据的事件可视化
CN106413082A (zh) * 2015-07-31 2017-02-15 北京奇宝科技有限公司 地理位置监测方法及设备
CN106663258A (zh) * 2014-02-26 2017-05-10 威图数据研究公司 通过混合的基于统计和用户测量方法测量多屏幕互联网用户概况、交易行为和用户群体结构
WO2017181520A1 (zh) * 2016-04-20 2017-10-26 中兴通讯股份有限公司 一种数据同步方法和装置
CN107873099A (zh) * 2015-06-17 2018-04-03 谷歌有限责任公司 使用聚合的呼叫日志数据来测量广告的呼叫转化
CN108399267A (zh) * 2018-03-27 2018-08-14 东北大学 一种基于簇语义特征分析的反馈式聚类方法
CN108475381A (zh) * 2015-11-19 2018-08-31 真实眼私人有限公司 用于媒体内容的表现的直接预测的方法和设备
CN108475532A (zh) * 2015-12-30 2018-08-31 皇家飞利浦有限公司 医学报告装置
US10346292B2 (en) 2013-11-13 2019-07-09 Microsoft Technology Licensing, Llc Software component recommendation based on multiple trace runs
CN110309434A (zh) * 2018-10-10 2019-10-08 腾讯大地通途(北京)科技有限公司 一种轨迹数据处理方法、装置以及相关设备
CN110622196A (zh) * 2017-09-18 2019-12-27 谷歌有限责任公司 评估依赖于聚合历史数据的模型
CN110659320A (zh) * 2019-09-02 2020-01-07 恩亿科(北京)数据科技有限公司 一种职住地分布的解析方法、解析装置及可读存储介质
CN111859573A (zh) * 2020-07-22 2020-10-30 重庆大学 一种工艺过程的结构化表征方法

Families Citing this family (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9104650B2 (en) * 2005-07-11 2015-08-11 Brooks Automation, Inc. Intelligent condition monitoring and fault diagnostic system for preventative maintenance
EP2427831A4 (en) 2009-05-08 2013-07-10 Arbitron Mobile Oy SYSTEM AND METHOD FOR BEHAVIOR AND CONTEXT DATA ANALYSIS
CA3020551C (en) 2010-06-24 2022-06-07 Arbitron Mobile Oy Network server arrangement for processing non-parametric, multi-dimensional, spatial and temporal human behavior or technical observations measured pervasively, and related method for the same
US8340685B2 (en) 2010-08-25 2012-12-25 The Nielsen Company (Us), Llc Methods, systems and apparatus to generate market segmentation data with anonymous location data
US10102100B2 (en) * 2011-11-29 2018-10-16 International Business Machines Corporation Optimizing automated interactions with computer software applications
US9183258B1 (en) * 2012-02-10 2015-11-10 Amazon Technologies, Inc. Behavior based processing of content
EP2645321A1 (en) * 2012-03-30 2013-10-02 Samsung Electronics Co., Ltd Situation-aware recommendation using correlation
US20140046653A1 (en) * 2012-08-10 2014-02-13 Xurmo Technologies Pvt. Ltd. Method and system for building entity hierarchy from big data
WO2014053192A1 (en) * 2012-10-05 2014-04-10 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for ranking users within a network
US9992729B2 (en) 2012-10-22 2018-06-05 The Nielsen Company (Us), Llc Systems and methods for wirelessly modifying detection characteristics of portable devices
CN105532030B (zh) * 2013-03-15 2019-06-28 美国结构数据有限公司 用于分析目标实体的移动的装置、系统和方法
US10771936B2 (en) 2013-08-22 2020-09-08 Sensoriant, Inc. System and method of creating abstractions of real and virtual environments and objects subject to latency constraints
EP3036923A4 (en) 2013-08-22 2017-05-10 Inc. Sensoriant Method and system for addressing the problem of discovering relevant services and applications that are available over the internet or other communcations network
US10289742B2 (en) 2013-08-22 2019-05-14 Sensoriant, Inc. Method and system for addressing the problem of discovering relevant services and applications that are available over the internet or other communications network
CN103729397B (zh) * 2013-10-28 2017-03-08 公安部第三研究所 基于时间轨迹实现电子证据数据分析的方法
TW201520945A (zh) * 2013-11-20 2015-06-01 Chunghwa Telecom Co Ltd 行動裝置上提供在地化服務之系統與方法
US9824112B1 (en) 2014-02-18 2017-11-21 Google Inc. Creating event streams from raw data
US9860123B2 (en) 2014-04-11 2018-01-02 International Business Machines Corporation Role and proximity-based management of networks
EP2937828A1 (en) * 2014-04-23 2015-10-28 Fujitsu Limited Consumer profiling using network connectivity
US9465831B2 (en) * 2014-07-18 2016-10-11 Wipro Limited System and method for optimizing storage of multi-dimensional data in data storage
US10417201B2 (en) * 2014-08-13 2019-09-17 Finca International, Inc Systems and methods for adaptively identifying and mitigating statistical outliers in aggregated data
US10824440B2 (en) 2014-08-22 2020-11-03 Sensoriant, Inc. Deriving personalized experiences of smart environments
US10824958B2 (en) * 2014-08-26 2020-11-03 Google Llc Localized learning from a global model
US9853863B1 (en) 2014-10-08 2017-12-26 Servicenow, Inc. Collision detection using state management of configuration items
US10769826B2 (en) 2014-12-31 2020-09-08 Servicenow, Inc. Visual task board visualization
EP3257200A4 (en) * 2015-02-09 2018-11-21 Shamim A. Naqvi A system and method of creating abstractions of real and virtual environments and objects subject to latency constraints
EP3079116A1 (en) * 2015-04-10 2016-10-12 Tata Consultancy Services Limited System and method for generating recommendations
WO2017008084A1 (en) 2015-07-09 2017-01-12 Sensoriant, Inc. Method and system for creating adaptive user interfaces using user provided and controlled data
US10397355B2 (en) * 2015-10-30 2019-08-27 American University Of Beirut System and method for multi-device continuum and seamless sensing platform for context aware analytics
CN105491522A (zh) * 2015-12-02 2016-04-13 北京泰合佳通信息技术有限公司 一种基于移动管道数据的用户移动轨迹定位方法
US10726354B2 (en) 2016-01-29 2020-07-28 Splunk Inc. Concurrently forecasting multiple time series
CN107153836A (zh) * 2016-03-03 2017-09-12 腾讯科技(深圳)有限公司 一种业务参数选取方法及相关设备
JP6623119B2 (ja) * 2016-05-27 2019-12-18 株式会社日立製作所 データ対応付け装置及び方法
WO2018017973A1 (en) * 2016-07-22 2018-01-25 Sri International Computational analysis of observations for determination of feedback
US10719777B2 (en) 2016-07-28 2020-07-21 At&T Intellectual Propery I, L.P. Optimization of multiple services via machine learning
US10216959B2 (en) 2016-08-01 2019-02-26 Mitsubishi Electric Research Laboratories, Inc Method and systems using privacy-preserving analytics for aggregate data
US10885131B2 (en) 2016-09-12 2021-01-05 Ebrahim Bagheri System and method for temporal identification of latent user communities using electronic content
US11100415B2 (en) * 2016-10-04 2021-08-24 University Of Louisiana At Lafayette Architecture and method for providing insights in networks domain
US10803403B2 (en) * 2017-05-11 2020-10-13 Nice Ltd. Method for adaptive tuning via automated simulation and optimization
US10468775B2 (en) * 2017-05-12 2019-11-05 Autel Robotics Co., Ltd. Antenna assembly, wireless communications electronic device and remote control having the same
US20180349954A1 (en) * 2017-06-06 2018-12-06 Adobe Systems Incorporated Optimizing notification triggers for geo-fence communication systems
JP6963433B2 (ja) * 2017-07-21 2021-11-10 株式会社日立情報通信エンジニアリング 行動特徴量解析システムおよび行動特徴量解析方法
US20190080116A1 (en) * 2017-09-13 2019-03-14 Microsoft Technology Licensing, Llc Random noise based privacy mechanism
US10664538B1 (en) 2017-09-26 2020-05-26 Amazon Technologies, Inc. Data security and data access auditing for network accessible content
US10726095B1 (en) 2017-09-26 2020-07-28 Amazon Technologies, Inc. Network content layout using an intermediary system
US11143532B2 (en) * 2017-10-19 2021-10-12 International Business Machines Corporation Adaptive calibration of sensors through cognitive learning
CN110417827B (zh) * 2018-04-26 2023-05-26 杭州米越科技有限公司 一种校园内学生互动监测分析系统及其分析方法
RU2692045C1 (ru) * 2018-05-18 2019-06-19 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для рекомендации свежих саджестов поисковых запросов в поисковой системе
US11924297B2 (en) 2018-05-24 2024-03-05 People.ai, Inc. Systems and methods for generating a filtered data set
US11463441B2 (en) 2018-05-24 2022-10-04 People.ai, Inc. Systems and methods for managing the generation or deletion of record objects based on electronic activities and communication policies
US10565229B2 (en) 2018-05-24 2020-02-18 People.ai, Inc. Systems and methods for matching electronic activities directly to record objects of systems of record
WO2020018063A1 (en) * 2018-07-16 2020-01-23 Hewlett-Packard Development Company, L.P. Predicted usage based on monitored usage
US11146911B2 (en) * 2018-08-17 2021-10-12 xAd, Inc. Systems and methods for pacing information campaigns based on predicted and observed location events
US11172324B2 (en) * 2018-08-17 2021-11-09 xAd, Inc. Systems and methods for predicting targeted location events
US10853246B2 (en) * 2018-10-30 2020-12-01 EMC IP Holding Company LLC Increasing performance of write throughput using machine learning
US10887727B2 (en) * 2018-12-07 2021-01-05 Microsoft Technology Licensing, Llc Computer-implemented detection of a work-related visit based on data from movement-sensing mechanism(s)
EP3674915A1 (en) * 2018-12-27 2020-07-01 Telefonica Innovacion Alpha S.L Method and system for automatic optimization of user's behavioural changes
JP7246956B2 (ja) * 2019-02-13 2023-03-28 株式会社キーエンス データ分析装置及びデータ分析方法
US11080629B2 (en) 2019-03-22 2021-08-03 Microsoft Technology Licensing, Llc Automatically generating activity summaries based on signals obtained from plural devices and logic components
US11379274B2 (en) * 2019-05-31 2022-07-05 Hitachi, Ltd. Hybrid spatial-temporal event probability prediction method
US11250071B2 (en) * 2019-06-12 2022-02-15 Microsoft Technology Licensing, Llc Trigger-based contextual information feature
EP3757818B1 (en) * 2019-06-28 2022-09-28 AO Kaspersky Lab Systems and methods for automatic service activation on a computing device
RU2746201C2 (ru) 2019-06-28 2021-04-08 Акционерное общество "Лаборатория Касперского" Система и способ невербальной активации сервиса на мобильном устройстве
TWI745712B (zh) * 2019-07-08 2021-11-11 旭智科技股份有限公司 應用於移動載具之資訊投放方法及其裝置之結構
US11062272B2 (en) 2019-07-15 2021-07-13 Microsoft Technology Licensing, Llc Recommending meeting spaces using automatically-generated visit data, with geo-tagging of the meeting spaces
CA3159291A1 (en) 2019-12-20 2021-06-24 Citrix Systems, Inc. Virtual workspace experience visualization and optimization
CN111159486B (zh) * 2019-12-31 2024-03-19 奇安信科技集团股份有限公司 网络数据的处理方法、装置、计算机设备和存储介质
US11756063B2 (en) * 2021-01-14 2023-09-12 Spectrum Communications & Consulting, LLC Sales and marketing assistance system using predictive analytics and method
US20220245567A1 (en) * 2021-02-02 2022-08-04 Motorola Solutions, Inc. Asset tracking management system for categorizing a dormant status of an asset
US20220309578A1 (en) * 2021-03-23 2022-09-29 Zensar Technologies Limited System and method for autonomously generating service proposal response
WO2023081241A1 (en) * 2021-11-03 2023-05-11 Peircy Inc. User experience modeling system

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1776694A (zh) * 2005-12-15 2006-05-24 上海交通大学 用于整车运输仿真系统的商品车参数化建模方法
CN101040242A (zh) * 2004-10-15 2007-09-19 皇家飞利浦电子股份有限公司 用于使用手的3d呈现应用的系统
CN101124578A (zh) * 2005-01-14 2008-02-13 国际商业机器公司 包括增值和请求式数据传送的可共享多租户参考数据实用工具和储存库以及运行方法
US20090187463A1 (en) * 2008-01-18 2009-07-23 Sony Corporation Personalized Location-Based Advertisements
US20090262919A1 (en) * 2008-04-18 2009-10-22 American Well Inc. Establishment of a Telephone Based Engagement
WO2010019925A1 (en) * 2008-08-15 2010-02-18 Brown Technology Partnerships Method and apparatus for estimating body shape

Family Cites Families (197)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4099591A (en) 1976-09-02 1978-07-11 Westinghouse Electric Corp. Vehicle control scanning system
US4361851A (en) 1980-01-04 1982-11-30 Asip William F System for remote monitoring and data transmission over non-dedicated telephone lines
US4973952A (en) 1987-09-21 1990-11-27 Information Resources, Inc. Shopping cart display system
US5014206A (en) 1988-08-22 1991-05-07 Facilitech International Incorporated Tracking system
US4990892A (en) 1989-08-07 1991-02-05 Westcom, A Division Of Westside Communications Of Jacksonville, Inc. Personnel locator system
US5119104A (en) 1990-05-04 1992-06-02 Heller Alan C Location system adapted for use in multipath environments
CA2044718C (en) 1990-06-18 1998-07-28 Katsumi Omuro Rerouting and change-back systems for asynchronous transfer mode network
US5345392A (en) 1991-01-25 1994-09-06 International Business Machines Corporation Battery charge monitor for a personal computer
US5233642A (en) 1991-05-24 1993-08-03 Omnitronix, Inc. Cellular telephone usage monitoring system
US5214687A (en) 1991-06-05 1993-05-25 Nokia Mobile Phones Ltd. Method to determine transmission quality
US5319638A (en) 1991-09-12 1994-06-07 Bell Communications Research, Inc. Link-by-link congestion control for packet transmission systems
US5515378A (en) 1991-12-12 1996-05-07 Arraycomm, Inc. Spatial division multiple access wireless communication systems
US8208014B2 (en) 1992-01-16 2012-06-26 Klever Marketing, Inc. Electronic shopping cart display system
FI90703C (fi) 1992-02-14 1994-03-10 Nokia Mobile Phones Ltd Diversiteettiboosteri
US5999908A (en) 1992-08-06 1999-12-07 Abelow; Daniel H. Customer-based product design module
US5483468A (en) 1992-10-23 1996-01-09 International Business Machines Corporation System and method for concurrent recording and displaying of system performance data
FI106505B (fi) 1993-09-27 2001-02-15 Nokia Networks Oy Langattoman tilaajaliittymän toteuttava radiojärjestelmä sekä tilaajalaite radiojärjestelmää varten
US5497373A (en) 1994-03-22 1996-03-05 Ericsson Messaging Systems Inc. Multi-media interface
NO942031L (no) 1994-06-01 1995-12-04 Ericsson As Creative Engineeri System for overvåkning av telefonnett og/eller datakommunikasjonsnett, spesielt mobiltelefonnett
US5692215A (en) 1994-12-23 1997-11-25 Gerotech, Inc. System for generating periodic reports, generating trend analysis, and intervention in accordance with trend analysis from a detection subsystem for monitoring daily living activity
JPH08256102A (ja) 1995-01-19 1996-10-01 Sony Corp セルラーシステム
US6581025B2 (en) 1995-04-17 2003-06-17 Discovision Associates Time and work tracker for wireless devices
US5521907A (en) 1995-04-25 1996-05-28 Visual Networks, Inc. Method and apparatus for non-intrusive measurement of round trip delay in communications networks
US5835061A (en) 1995-06-06 1998-11-10 Wayport, Inc. Method and apparatus for geographic-based communications service
US5675510A (en) 1995-06-07 1997-10-07 Pc Meter L.P. Computer use meter and analyzer
US6138147A (en) 1995-07-14 2000-10-24 Oracle Corporation Method and apparatus for implementing seamless playback of continuous media feeds
US5872588A (en) 1995-12-06 1999-02-16 International Business Machines Corporation Method and apparatus for monitoring audio-visual materials presented to a subscriber
US5848396A (en) 1996-04-26 1998-12-08 Freedom Of Information, Inc. Method and apparatus for determining behavioral profile of a computer user
US5799154A (en) 1996-06-27 1998-08-25 Mci Communications Corporation System and method for the remote monitoring of wireless packet data networks
US5859838A (en) 1996-07-30 1999-01-12 Qualcomm Incorporated Load monitoring and management in a CDMA wireless communication system
US6108637A (en) 1996-09-03 2000-08-22 Nielsen Media Research, Inc. Content display monitor
US6837436B2 (en) 1996-09-05 2005-01-04 Symbol Technologies, Inc. Consumer interactive shopping system
US6085243A (en) 1996-12-13 2000-07-04 3Com Corporation Distributed remote management (dRMON) for networks
US5974237A (en) 1996-12-18 1999-10-26 Northern Telecom Limited Communications network monitoring
US5796952A (en) 1997-03-21 1998-08-18 Dot Com Development, Inc. Method and apparatus for tracking client interaction with a network resource and creating client profiles and resource database
US6088588A (en) 1997-03-25 2000-07-11 Nortel Networks Corporation Method and wireless terminal for monitoring communications and providing network with terminal operation information
US6144944A (en) 1997-04-24 2000-11-07 Imgis, Inc. Computer system for efficiently selecting and providing information
US5991806A (en) 1997-06-09 1999-11-23 Dell Usa, L.P. Dynamic system control via messaging in a network management system
US6091956A (en) 1997-06-12 2000-07-18 Hollenberg; Dennis D. Situation information system
US6353929B1 (en) 1997-06-23 2002-03-05 One River Worldtrek, Inc. Cooperative system for measuring electronic media
JPH1141232A (ja) 1997-07-17 1999-02-12 Fujitsu Ltd Lanシステムにおける従量課金方式
US6377993B1 (en) 1997-09-26 2002-04-23 Mci Worldcom, Inc. Integrated proxy interface for web based data management reports
JPH11259422A (ja) 1998-03-06 1999-09-24 Yazaki Corp インターネット端末装置及び課金管理方法
US6609102B2 (en) 1998-07-20 2003-08-19 Usa Technologies, Inc. Universal interactive advertizing and payment system for public access electronic commerce and business related products and services
US6119160A (en) 1998-10-13 2000-09-12 Cisco Technology, Inc. Multiple-level internet protocol accounting
ATE273538T1 (de) 1998-10-28 2004-08-15 Verticalone Corp Gerät und verfahren für automatische aggregation und abgabe von elektronischer persönlicher information oder daten
US6301471B1 (en) 1998-11-02 2001-10-09 Openwave System Inc. Online churn reduction and loyalty system
US6480497B1 (en) 1998-11-23 2002-11-12 Ricochet Networks, Inc. Method and apparatus for maximizing data throughput in a packet radio mesh network
US20020072966A1 (en) 2000-08-31 2002-06-13 Eldering Charles A. System for providing targeted advertisements using advertiser-specific target groups
US6397256B1 (en) 1999-01-27 2002-05-28 International Business Machines Corporation Monitoring system for computers and internet browsers
US6516189B1 (en) 1999-03-17 2003-02-04 Telephia, Inc. System and method for gathering data from wireless communications networks
US6405251B1 (en) 1999-03-25 2002-06-11 Nortel Networks Limited Enhancement of network accounting records
US7194758B1 (en) 1999-05-24 2007-03-20 Matsushita Electric Industrial Co., Ltd. Digital broadcast system and its component devices that provide services in accordance with a broadcast watched by viewers
US7523191B1 (en) 2000-06-02 2009-04-21 Yahoo! Inc. System and method for monitoring user interaction with web pages
WO2000079449A2 (en) 1999-06-09 2000-12-28 Teralytics, Inc. System, method and computer program product for generating an inventory-centric demographic hyper-cube
JP2001056805A (ja) * 1999-08-18 2001-02-27 Sony Corp 行動予測方法及びその装置
US6442748B1 (en) 1999-08-31 2002-08-27 Accenture Llp System, method and article of manufacture for a persistent state and persistent object separator in an information services patterns environment
US6477580B1 (en) 1999-08-31 2002-11-05 Accenture Llp Self-described stream in a communication services patterns environment
US6763458B1 (en) 1999-09-27 2004-07-13 Captaris, Inc. System and method for installing and servicing an operating system in a computer or information appliance
US6526413B2 (en) 1999-09-28 2003-02-25 Microsoft Corporation Architecture for a hierarchical folder structure in hand-held computers
JP2001103086A (ja) 1999-09-29 2001-04-13 Nec Soft Ltd Ipアドレス監視システムとipアドレス監視方法及び記録媒体
US6697944B1 (en) 1999-10-01 2004-02-24 Microsoft Corporation Digital content distribution, transmission and protection system and method, and portable device for use therewith
US20030182567A1 (en) 1999-10-20 2003-09-25 Tivo Inc. Client-side multimedia content targeting system
FR2802368B1 (fr) 1999-12-14 2002-01-18 Net Value Mesure d'audience sur reseau de communication
AU2001229654A1 (en) 2000-01-21 2001-07-31 Angara E-Commerce Services, Inc. Electronic commerce services
US6587835B1 (en) 2000-02-09 2003-07-01 G. Victor Treyz Shopping assistance with handheld computing device
US6834308B1 (en) 2000-02-17 2004-12-21 Audible Magic Corporation Method and apparatus for identifying media content presented on a media playing device
US6928280B1 (en) 2000-03-20 2005-08-09 Telephia, Inc. Method and system for measuring data quality of service in a wireless network using multiple remote units and a back end processor
US7319847B2 (en) 2000-03-20 2008-01-15 Nielsen Mobile, Inc. Bitwise monitoring of network performance
MXPA02009907A (es) 2000-04-05 2004-10-14 Ods Properties Inc Sistemas y metodos para colocar apuestas parimutuel en eventos futuros.
US20020002504A1 (en) 2000-05-05 2002-01-03 Andrew Engel Mobile shopping assistant system and device
US8073565B2 (en) 2000-06-07 2011-12-06 Apple Inc. System and method for alerting a first mobile data processing system nearby a second mobile data processing system
US6883168B1 (en) 2000-06-21 2005-04-19 Microsoft Corporation Methods, systems, architectures and data structures for delivering software via a network
US7149549B1 (en) 2000-10-26 2006-12-12 Ortiz Luis M Providing multiple perspectives for a venue activity through an electronic hand held device
US6912507B1 (en) 2000-08-05 2005-06-28 Motorola, Inc. Method and apparatus for interactive shopping
US6647269B2 (en) 2000-08-07 2003-11-11 Telcontar Method and system for analyzing advertisements delivered to a mobile unit
US6973491B1 (en) 2000-08-09 2005-12-06 Sun Microsystems, Inc. System and method for monitoring and managing system assets and asset configurations
US7209473B1 (en) 2000-08-18 2007-04-24 Juniper Networks, Inc. Method and apparatus for monitoring and processing voice over internet protocol packets
US20020025795A1 (en) 2000-08-24 2002-02-28 Msafe Inc., Method, system and device for monitoring activity of a wireless communication device
US20020186818A1 (en) 2000-08-29 2002-12-12 Osteonet, Inc. System and method for building and manipulating a centralized measurement value database
US6745011B1 (en) 2000-09-01 2004-06-01 Telephia, Inc. System and method for measuring wireless device and network usage and performance metrics
US6754470B2 (en) 2000-09-01 2004-06-22 Telephia, Inc. System and method for measuring wireless device and network usage and performance metrics
WO2002023934A1 (en) 2000-09-15 2002-03-21 Mspect, Inc. Wireless network monitoring
US6840861B2 (en) 2000-11-20 2005-01-11 Kent Wilcoxson Jordan Method and apparatus for interactive real time distributed gaming
US6879960B2 (en) 2000-12-01 2005-04-12 Claritas, Inc. Method and system for using customer preferences in real time to customize a commercial transaction
US6999715B2 (en) 2000-12-11 2006-02-14 Gary Alan Hayter Broadcast audience surveillance using intercepted audio
US20020112048A1 (en) 2000-12-11 2002-08-15 Francois Gruyer System and method for providing behavioral information of a user accessing on-line resources
US7181519B2 (en) 2000-12-11 2007-02-20 Silverback Technologies, Inc. Distributed network monitoring and control system
US7555571B1 (en) 2001-01-05 2009-06-30 Palm, Inc. Activation of mobile computing device on a cellular network
US7343317B2 (en) 2001-01-18 2008-03-11 Nokia Corporation Real-time wireless e-coupon (promotion) definition based on available segment
KR100405594B1 (ko) 2001-03-13 2003-11-14 (주)애니 유저넷 인터넷폰 사용요금 징수장치 및 방법
US6757543B2 (en) 2001-03-20 2004-06-29 Keynote Systems, Inc. System and method for wireless data performance monitoring
US20020184208A1 (en) 2001-04-24 2002-12-05 Saul Kato System and method for dynamically generating content on a portable computing device
US6968178B2 (en) 2001-04-27 2005-11-22 Hewlett-Packard Development Company, L.P. Profiles for information acquisition by devices in a wireless network
US6950646B2 (en) 2001-04-27 2005-09-27 Hewlett-Packard Development Company, L.P. Information acquisition decision making by devices in a wireless network
WO2002098029A1 (en) 2001-05-25 2002-12-05 Think Tank & Associates Interactive system and method for collecting data and generating reports regarding viewer habits
US7689521B2 (en) 2001-06-28 2010-03-30 Microsoft Corporation Continuous time bayesian network models for predicting users' presence, activities, and component usage
KR100456719B1 (ko) 2001-08-17 2004-11-10 엘지전자 주식회사 무선망 통합 감시 및 시험 시스템 및 그 방법
US20030054757A1 (en) 2001-09-19 2003-03-20 Kolessar Ronald S. Monitoring usage of media data with non-program data elimination
US20040155816A1 (en) 2001-11-05 2004-08-12 Soliman Samir S. Wireless coordination and management system
US6920550B2 (en) 2001-11-15 2005-07-19 Hewlett-Packard Development Company, L.P. System and method for decoding and executing program binaries
US7426717B1 (en) 2001-11-27 2008-09-16 Adobe Systems Incorporated System and method for debugging files in a runtime environment
US7155210B2 (en) 2001-12-13 2006-12-26 Ncr Corporation System and method for short-range wireless retail advertising aimed at short-range wireless protocol-enabled personal devices
US7038619B2 (en) 2001-12-31 2006-05-02 Rdp Associates, Incorporated Satellite positioning system enabled media measurement system and method
US7320070B2 (en) 2002-01-08 2008-01-15 Verizon Services Corp. Methods and apparatus for protecting against IP address assignments based on a false MAC address
US20030149743A1 (en) 2002-02-06 2003-08-07 Shumeet Baluja Data logging for resident applications within portable electronic devices
US7127261B2 (en) 2002-02-22 2006-10-24 Julian Van Erlach Enhanced telecommunication services
US7392310B2 (en) 2002-12-26 2008-06-24 Ricoh Company, Ltd. Method and system for using data structures to store database information for multiple vendors and model support for remotely monitored devices
US8549133B2 (en) 2002-03-11 2013-10-01 Qwest Communications International Inc. Systems and methods for tracking the reliability of communications networks
US20030177488A1 (en) 2002-03-12 2003-09-18 Smith Geoff S. Systems and methods for media audience measurement
US6816886B2 (en) 2002-03-14 2004-11-09 Microsoft Corporation Measuring performance metrics of networked computing entities
US7206647B2 (en) 2002-03-21 2007-04-17 Ncr Corporation E-appliance for mobile online retailing
EP2654224B1 (en) 2002-04-22 2017-06-21 Nielsen Media Research, Inc. Methods and apparatus to collect audience information associated with a media presentation
WO2003096669A2 (en) 2002-05-10 2003-11-20 Reisman Richard R Method and apparatus for browsing using multiple coordinated device
US7627872B2 (en) 2002-07-26 2009-12-01 Arbitron Inc. Media data usage measurement and reporting systems and methods
US8333652B2 (en) 2006-09-01 2012-12-18 Igt Intelligent casino gaming table and systems thereof
US7093243B2 (en) 2002-10-09 2006-08-15 International Business Machines Corporation Software mechanism for efficient compiling and loading of java server pages (JSPs)
US20040122939A1 (en) 2002-12-19 2004-06-24 Russell Perkins Method of obtaining economic data based on web site visitor data
US7010107B1 (en) 2002-12-20 2006-03-07 Yong Lee Internet conference call bridge management system
US7483972B2 (en) 2003-01-08 2009-01-27 Cisco Technology, Inc. Network security monitoring system
JP4248529B2 (ja) * 2003-02-25 2009-04-02 パナソニック株式会社 移動体端末
US20050216844A1 (en) 2004-03-03 2005-09-29 Error Brett M Delayed transmission of website usage data
US7474645B2 (en) 2003-04-11 2009-01-06 Nokia Siemens Networks Oy Charging method
US7562367B1 (en) 2003-04-11 2009-07-14 Marvell Israel (M.I.S.L.) Ltd. Sorted-tree-based event queue for discrete event simulators
US7119716B2 (en) 2003-05-28 2006-10-10 Legalview Assets, Limited Response systems and methods for notification systems for modifying future notifications
US7177877B2 (en) 2003-05-29 2007-02-13 Electronic Data Systems Corporation Method and system for externalizing conditional logic for collecting multi-purpose objects
US20040260470A1 (en) 2003-06-14 2004-12-23 Rast Rodger H. Conveyance scheduling and logistics system
US20040267694A1 (en) 2003-06-30 2004-12-30 Satoshi Sakai Machine-readable medium & data management system and method for tracking real-world objects
CA2543017C (en) 2003-10-17 2013-11-26 Nielsen Media Research, Inc. Portable multi-purpose audience measurement system
US7561069B2 (en) 2003-11-12 2009-07-14 Legalview Assets, Limited Notification systems and methods enabling a response to change particulars of delivery or pickup
JP2005148289A (ja) * 2003-11-13 2005-06-09 Nec Fielding Ltd 広告配信システム,方法およびプログラム
US7072640B2 (en) 2003-11-18 2006-07-04 Nokia Corporation Terminal, method and computer program product for producing a user perceptible output upon reaching a predefined threshold
US20050136903A1 (en) 2003-12-18 2005-06-23 Nokia Corporation Context dependent alert in a portable electronic device
US7526757B2 (en) 2004-01-14 2009-04-28 International Business Machines Corporation Method and apparatus for maintaining performance monitoring structures in a page table for use in monitoring performance of a computer program
US7441246B2 (en) 2004-03-19 2008-10-21 Microsoft Corporation Configurable collection of computer related metric data
US7483975B2 (en) 2004-03-26 2009-01-27 Arbitron, Inc. Systems and methods for gathering data concerning usage of media data
US20060019723A1 (en) 2004-06-29 2006-01-26 Pieter Vorenkamp Automatic control of power save operation in a portable communication device utilizing historical usage information
US20060004627A1 (en) 2004-06-30 2006-01-05 Shumeet Baluja Advertisements for devices with call functionality, such as mobile phones
US7609650B2 (en) 2004-07-08 2009-10-27 Carrier Iq, Inc. Collection of data at target wireless devices using data collection profiles
US7551922B2 (en) 2004-07-08 2009-06-23 Carrier Iq, Inc. Rule based data collection and management in a wireless communications network
KR20070037649A (ko) 2004-07-23 2007-04-05 사이트릭스 시스템스, 인크. 게이트웨이에서 종단으로 패킷을 라우팅하기 위한 방법 및시스템
US7751385B2 (en) 2004-08-25 2010-07-06 Jds Uniphase Corporation Systems and methods for collecting and disbursing participant identifying data
US7623823B2 (en) 2004-08-31 2009-11-24 Integrated Media Measurement, Inc. Detecting and measuring exposure to media content items
US20060129972A1 (en) 2004-11-30 2006-06-15 Tyburski John C Application developer and method for generating platform independent code
US20060184625A1 (en) 2005-01-31 2006-08-17 Nordvik Markus A Short query-based system and method for content searching
US7158817B2 (en) 2005-03-17 2007-01-02 Masaharu Kubo Portable terminal
US7788644B2 (en) 2005-03-24 2010-08-31 Sap Ag Method and system for monitoring performance on a mobile device
FI118751B (fi) 2005-03-24 2008-02-29 First Hop Ltd Tiedon poimiminen liikennevirrasta kommunikaatioverkossa
US7861225B2 (en) 2005-05-31 2010-12-28 Qualcomm Incorporated System and method to combine debugging messages from diverse applications or operating systems executed within a mobile device
US7849154B2 (en) 2005-06-27 2010-12-07 M:Metrics, Inc. Acquiring, storing, and correlating profile data of cellular mobile communications system's users to events
US7693817B2 (en) 2005-06-29 2010-04-06 Microsoft Corporation Sensing, storing, indexing, and retrieving data leveraging measures of user activity, attention, and interest
US7356590B2 (en) 2005-07-12 2008-04-08 Visible Measures Corp. Distributed capture and aggregation of dynamic application usage information
US20070112739A1 (en) 2005-07-19 2007-05-17 4Info, Inc. Intelligent mobile search client
US20070038516A1 (en) 2005-08-13 2007-02-15 Jeff Apple Systems, methods, and computer program products for enabling an advertiser to measure user viewing of and response to an advertisement
US7548915B2 (en) 2005-09-14 2009-06-16 Jorey Ramer Contextual mobile content placement on a mobile communication facility
US20070294132A1 (en) 2005-12-20 2007-12-20 Zhang Jack K Methods and systems for recruiting panelists for a research operation
US20070150599A1 (en) 2005-12-22 2007-06-28 International Business Machines Corporation Generation of resource-usage profiles for application sessions of a number of client computing devices
US20070174429A1 (en) 2006-01-24 2007-07-26 Citrix Systems, Inc. Methods and servers for establishing a connection between a client system and a virtual machine hosting a requested computing environment
JP2007249306A (ja) * 2006-03-13 2007-09-27 Fuzzy Logic Systems 情報配信システム、情報配信方法及びプログラム
CA3074180C (en) 2006-03-27 2023-03-21 The Nielsen Company (Us), Llc Methods and systems to meter media content presented on a wireless communication device
US7756829B2 (en) 2006-04-18 2010-07-13 Sandeep Bhanote Method and apparatus for mobile data collection and management
US7478099B1 (en) 2006-06-28 2009-01-13 Emc Corporation Methods and apparatus for collecting database transactions
CN101467171A (zh) 2006-06-29 2009-06-24 尼尔逊媒介研究股份有限公司 监测与基于位置的网络服务相关联的消费者行为的方法和装置
US8717911B2 (en) 2006-06-30 2014-05-06 Centurylink Intellectual Property Llc System and method for collecting network performance information
AU2007272434B2 (en) 2006-07-12 2014-05-22 Arbitron Inc. Methods and systems for compliance confirmation and incentives
WO2008021496A2 (en) 2006-08-17 2008-02-21 Philip Chidel Interactive television framework utilizing program-synchronous trigers and standard messaging and presence-detection protocols
US8014726B1 (en) 2006-10-02 2011-09-06 The Nielsen Company (U.S.), Llc Method and system for collecting wireless information transparently and non-intrusively
US8260252B2 (en) 2006-10-02 2012-09-04 The Nielsen Company (Us), Llc Method and apparatus for collecting information about portable device usage
US8531995B2 (en) 2006-11-01 2013-09-10 At&T Intellectual Property I, L.P. Systems and methods for location management and emergency support for a voice over internet protocol device
US7742762B1 (en) 2006-11-03 2010-06-22 Sprint Communications Company L.P. Systems and methods for remote notification, diagnostics and remedy management
US9282446B2 (en) 2009-08-06 2016-03-08 Golba Llc Location-aware content and location-based advertising with a mobile device
WO2008082441A1 (en) 2006-12-29 2008-07-10 Prodea Systems, Inc. Display inserts, overlays, and graphical user interfaces for multimedia systems
WO2008118119A1 (en) 2007-03-26 2008-10-02 Center'd Corporation Mobile content creation, sharing, and commerce in a geo-spatial environment
US8024454B2 (en) 2007-03-28 2011-09-20 Yahoo! Inc. System and method for associating a geographic location with an internet protocol address
US8321556B1 (en) 2007-07-09 2012-11-27 The Nielsen Company (Us), Llc Method and system for collecting data on a wireless device
US7958228B2 (en) 2007-07-11 2011-06-07 Yahoo! Inc. Behavioral predictions based on network activity locations
US9071859B2 (en) 2007-09-26 2015-06-30 Time Warner Cable Enterprises Llc Methods and apparatus for user-based targeted content delivery
US20090132559A1 (en) 2007-11-19 2009-05-21 Simon Chamberlain Behavioral segmentation using isp-collected behavioral data
US8195661B2 (en) 2007-11-27 2012-06-05 Umber Systems Method and apparatus for storing data on application-level activity and other user information to enable real-time multi-dimensional reporting about user of a mobile data network
WO2009094397A2 (en) 2008-01-21 2009-07-30 Omnitrail Real world behavior measurement using mobile device specific identifiers
JP5022969B2 (ja) * 2008-03-28 2012-09-12 株式会社エヌ・ティ・ティ・データ 情報システム、情報サービスプログラム、及び情報サーバ装置
JP5074988B2 (ja) * 2008-04-02 2012-11-14 株式会社エヌ・ティ・ティ・ドコモ 情報配信システム、サーバ装置、情報配信プログラム
US10163113B2 (en) 2008-05-27 2018-12-25 Qualcomm Incorporated Methods and apparatus for generating user profile based on periodic location fixes
US20090307263A1 (en) 2008-06-06 2009-12-10 Sense Networks, Inc. System And Method Of Performing Location Analytics
US8224766B2 (en) 2008-09-30 2012-07-17 Sense Networks, Inc. Comparing spatial-temporal trails in location analytics
US8620624B2 (en) 2008-09-30 2013-12-31 Sense Networks, Inc. Event identification in sensor analytics
US9002729B2 (en) * 2008-10-21 2015-04-07 Accenture Global Services Limited System and method for determining sets of online advertisement treatments using confidences
US8713157B2 (en) 2008-11-14 2014-04-29 Interpret, Llc System for collecting computer application usage data of targeted application programs executed on a plurality of client devices
US8812012B2 (en) 2008-12-16 2014-08-19 The Nielsen Company (Us), Llc Methods and apparatus for associating media devices with a demographic composition of a geographic area
US8407179B2 (en) 2009-01-06 2013-03-26 TRUEANTHEM Corporation Method of determining influence of a member within a dataset
US8433296B2 (en) 2009-05-01 2013-04-30 Ryan Hardin Exclusive delivery of content within geographic areas
EP2267919B1 (en) 2009-06-23 2012-11-07 Imec EHF wireless communication receiver using beamforming with scalable number of antenna paths
US20110087975A1 (en) 2009-10-13 2011-04-14 Sony Ericsson Mobile Communications Ab Method and arrangement in a data
US9002924B2 (en) 2010-06-17 2015-04-07 Microsoft Technology Licensing, Llc Contextual based information aggregation system
CA3020551C (en) 2010-06-24 2022-06-07 Arbitron Mobile Oy Network server arrangement for processing non-parametric, multi-dimensional, spatial and temporal human behavior or technical observations measured pervasively, and related method for the same
US8340685B2 (en) 2010-08-25 2012-12-25 The Nielsen Company (Us), Llc Methods, systems and apparatus to generate market segmentation data with anonymous location data
US9491187B2 (en) 2013-02-15 2016-11-08 Qualcomm Incorporated APIs for obtaining device-specific behavior classifier models from the cloud

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101040242A (zh) * 2004-10-15 2007-09-19 皇家飞利浦电子股份有限公司 用于使用手的3d呈现应用的系统
CN101124578A (zh) * 2005-01-14 2008-02-13 国际商业机器公司 包括增值和请求式数据传送的可共享多租户参考数据实用工具和储存库以及运行方法
CN1776694A (zh) * 2005-12-15 2006-05-24 上海交通大学 用于整车运输仿真系统的商品车参数化建模方法
US20090187463A1 (en) * 2008-01-18 2009-07-23 Sony Corporation Personalized Location-Based Advertisements
US20090262919A1 (en) * 2008-04-18 2009-10-22 American Well Inc. Establishment of a Telephone Based Engagement
WO2010019925A1 (en) * 2008-08-15 2010-02-18 Brown Technology Partnerships Method and apparatus for estimating body shape

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105683942A (zh) * 2013-07-24 2016-06-15 微软技术许可有限责任公司 性能数据的事件可视化
US10346292B2 (en) 2013-11-13 2019-07-09 Microsoft Technology Licensing, Llc Software component recommendation based on multiple trace runs
CN106663258A (zh) * 2014-02-26 2017-05-10 威图数据研究公司 通过混合的基于统计和用户测量方法测量多屏幕互联网用户概况、交易行为和用户群体结构
CN107873099A (zh) * 2015-06-17 2018-04-03 谷歌有限责任公司 使用聚合的呼叫日志数据来测量广告的呼叫转化
CN107873099B (zh) * 2015-06-17 2022-03-01 谷歌有限责任公司 使用聚合的呼叫日志数据来测量广告的呼叫转化
CN106413082B (zh) * 2015-07-31 2020-04-21 北京奇宝科技有限公司 地理位置监测方法及设备
CN106413082A (zh) * 2015-07-31 2017-02-15 北京奇宝科技有限公司 地理位置监测方法及设备
CN108475381A (zh) * 2015-11-19 2018-08-31 真实眼私人有限公司 用于媒体内容的表现的直接预测的方法和设备
US11481791B2 (en) 2015-11-19 2022-10-25 Realeyes Oü Method and apparatus for immediate prediction of performance of media content
CN108475532A (zh) * 2015-12-30 2018-08-31 皇家飞利浦有限公司 医学报告装置
CN108475532B (zh) * 2015-12-30 2022-12-27 皇家飞利浦有限公司 医学报告装置
CN107306283A (zh) * 2016-04-20 2017-10-31 中兴通讯股份有限公司 一种数据同步方法和装置
CN107306283B (zh) * 2016-04-20 2020-01-07 中兴通讯股份有限公司 一种数据同步方法和装置
WO2017181520A1 (zh) * 2016-04-20 2017-10-26 中兴通讯股份有限公司 一种数据同步方法和装置
CN110622196B (zh) * 2017-09-18 2023-11-28 谷歌有限责任公司 评估依赖于聚合历史数据的模型
CN110622196A (zh) * 2017-09-18 2019-12-27 谷歌有限责任公司 评估依赖于聚合历史数据的模型
CN108399267B (zh) * 2018-03-27 2020-04-14 东北大学 一种基于簇语义特征分析的反馈式聚类方法
CN108399267A (zh) * 2018-03-27 2018-08-14 东北大学 一种基于簇语义特征分析的反馈式聚类方法
CN110309434B (zh) * 2018-10-10 2023-10-13 腾讯大地通途(北京)科技有限公司 一种轨迹数据处理方法、装置以及相关设备
CN110309434A (zh) * 2018-10-10 2019-10-08 腾讯大地通途(北京)科技有限公司 一种轨迹数据处理方法、装置以及相关设备
CN110659320A (zh) * 2019-09-02 2020-01-07 恩亿科(北京)数据科技有限公司 一种职住地分布的解析方法、解析装置及可读存储介质
CN111859573A (zh) * 2020-07-22 2020-10-30 重庆大学 一种工艺过程的结构化表征方法
CN111859573B (zh) * 2020-07-22 2023-11-03 重庆大学 一种工艺过程的结构化表征方法

Also Published As

Publication number Publication date
AU2010355789B2 (en) 2016-05-12
US9148458B2 (en) 2015-09-29
CA3020551C (en) 2022-06-07
JP5896382B2 (ja) 2016-03-30
US20130103764A1 (en) 2013-04-25
US20160004971A1 (en) 2016-01-07
KR20140131249A (ko) 2014-11-12
EP2585941A1 (en) 2013-05-01
EP2585941A4 (en) 2016-06-29
CA2803661A1 (en) 2011-12-29
CA3020551A1 (en) 2011-12-29
KR101650993B1 (ko) 2016-08-24
US9449279B2 (en) 2016-09-20
CA2803661C (en) 2018-11-27
JP2013536488A (ja) 2013-09-19
CN103154928B (zh) 2016-08-03
AU2010355789A1 (en) 2013-01-17
WO2011161303A1 (en) 2011-12-29

Similar Documents

Publication Publication Date Title
CN103154928B (zh) 网络服务器系统及其相关方法
US20230071831A1 (en) Systems and methods for behavioural and contextual data analytics
Trasarti et al. Myway: Location prediction via mobility profiling
JP2013536488A5 (zh)
Ghaemi et al. A visual segmentation method for temporal smart card data
Moreira-Matias et al. On predicting the taxi-passenger demand: A real-time approach
US20200057918A1 (en) Systems and methods for training artificial intelligence to predict utilization of resources
CN108885723A (zh) 用于基于位置数据预测用户行为的系统和方法
CN104520881A (zh) 基于访问可能性对附近目的地排名以及从位置历史来预测对地点的未来访问
CN102591911A (zh) 位置相关实体的实时个性化推荐
de Araujo et al. End-to-end prediction of parcel delivery time with deep learning for smart-city applications
KR20130092272A (ko) 스마트 단말을 이용한 사용자의 이동 경로 실시간 예측 방법 및 그 시스템
Wong et al. Long-term user location prediction using deep learning and periodic pattern mining
Cerqueira et al. On how to incorporate public sources of situational context in descriptive and predictive models of traffic data
Maiti et al. Optimization of garbage collector tracking and monitoring system analysis
Salomón et al. Daily routines inference based on location history
Deb Analytical ideas to improve daily demand forecasts: A case study
CN112866482B (zh) 一种对象行为习惯预测的方法和终端
Frank et al. Adaptive and tractable Bayesian context inference for resource constrained devices
Fuhao et al. Medical information Recommendation based on Scenario Model and User Preference in Mobile Internet Era
Tianyi et al. MOBANA: A distributed stream-based information system for public transit
GERONTIN Geospatial Analysison Mobile Application Usage
Thomason Predicting context and locations from geospatial trajectories
Anton Yogarajah et al. An ORM Based Context Model for Context-Aware Computing
Cho A Predictive Surveillance System Using Context-Aware Data of u-City

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1186544

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1186544

Country of ref document: HK