CN103902549A

CN103902549A - 搜索数据排序的方法和装置，数据搜索的方法和装置

Info

Publication number: CN103902549A
Application number: CN201210572391.5A
Authority: CN
Inventors: 宋华青
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2012-12-25
Filing date: 2012-12-25
Publication date: 2014-07-02
Anticipated expiration: 2032-12-25
Also published as: CN103902549B; TW201426357A; WO2014105571A1; EP2939147A1; US20140181067A1

Abstract

本申请提供了一种搜索数据排序的方法和装置，数据搜索的方法和装置，其中，所述搜索数据排序的方法包括：生成中庸需求点的数据；所述中庸需求点的数据包括搜索目标的参考属性值；根据所述中庸需求点的数据，对相应搜索目标的数据集合进行排序，具体包括：获取所述搜索目标的数据集合，并获取所述数据集合中一个或多个搜索目标的当前属性值；计算所述一个或多个搜索目标的当前属性值与参考属性值的距离；按照所述距离对所述数据集合中的一个或多个搜索目标进行排序。本申请实施例可以在充分满足用户的个性化需求，简化用户操作，降低客户端与服务器资源耗费的基础上，提高搜索效率。

Description

搜索数据排序的方法和装置,数据搜索的方法和装置

技术领域

本申请涉及网络数据搜索的技术领域，特别是涉及一种搜索数据排序的方法，一种搜索数据排序的装置，一种数据搜索的方法，以及，一种数据搜索的装置。

背景技术

现有技术中，对于网络数据的搜索通常基于搜索引擎实现。

搜索引擎指自动从因特网搜集信息，经过一定整理以后，提供给用户进行查询的系统。因特网上的信息浩瀚万千，而且毫无秩序，所有的信息像汪洋上的一个个小岛，网页链接是这些小岛之间纵横交错的桥梁，而搜索引擎，则为用户绘制一幅一目了然的信息地图，供用户随时查阅。

搜索引擎的工作原理大致可以分为：

(1)搜集信息：搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(Spider)的自动搜索机器人程序根据网页中的超链接，从少数几个网页开始，连到数据库上所有到其他网页的链接。理论上，若网页上有适当的超链接，机器人便可以遍历绝大部分网页。

(2)整理信息：搜索引擎整理信息的过程称为“创建索引”。搜索引擎不仅要保存搜集起来的信息，还要将它们按照一定的规则进行编排。这样，搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。

(3)接受查询：用户向搜索引擎发起查询，搜索引擎接受查询并向用户返回搜索结果。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发起的查询，它按照每个用户的要求检查自己的索引，在极短时间内找到用户需要的搜索结果，并返回给用户。目前，搜索引擎返回结果主要是以网页链接的形式提供的，这样通过这些链接，用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。

现有技术中的搜索引擎往往需要用户首先提交搜索条件发起查询，如输入关键词，设定搜索范围等，而搜索引擎所返回的搜索结果仅仅是网络蜘蛛抓取到的数据库中的网页链接，完全无法兼顾用户的个性化需求。

目前，某些站内搜索引擎提供了一些个性化搜索的功能，如某些电子商务网站的产品搜索引擎或商品搜索引擎，会根据用户行为，商品，销量等多维度的信息，在用户不提交搜索条件的情况下，自动推荐可能适合用户需求的搜索结果。然而，这种现有方案中各种维度设置得比较多，而且不透明，多种维度间的权重设置也无法调整，往往不能实实在在满足用户的真实需求。在这种情况下，用户不得不重新提交搜索条件触发搜索引擎重新发起搜索，才能获得其想要的搜索结果。

显然，采用现有的搜索技术不仅无法充分满足用户的个性化需求，而且使用户操作繁琐，并且耗费了过多的客户端与服务器的资源，搜索效率低下。

因此，本领域技术人员迫切需要解决的问题是：提供一种搜索数据排序以及数据搜索的机制，用以在充分满足用户的个性化需求，简化用户操作，降低客户端与服务器资源耗费的基础上，提高搜索效率。

发明内容

本申请所要解决的技术问题是提供一种搜索数据排序以及数据搜索的方法，用以在简化用户操作，降低客户端与服务器资源耗费的基础上，提高搜索效率。

相应的，本申请还提供了一种搜索数据排序以及数据搜索的装置，用以保证上述方法在实际中的应用。

为了解决上述问题，本申请公开了一种搜索数据排序的方法，包括：

生成中庸需求点的数据；所述中庸需求点的数据包括搜索目标的参考属性值；

根据所述中庸需求点的数据，对相应搜索目标的数据集合进行排序，具体包括：

获取所述搜索目标的数据集合，并获取所述数据集合中一个或多个搜索目标的当前属性值；

计算所述一个或多个搜索目标的当前属性值与参考属性值的距离；

按照所述距离对所述数据集合中的一个或多个搜索目标进行排序。

优选地，所述生成中庸需求点的数据的步骤包括：

获得包含一个或多个所述搜索目标的历史搜索结果，提取所述一个或多个搜索目标的历史属性值及历史搜索排序权值；

依据所述一个或多个搜索目标的历史属性值及历史搜索排序权值计算质心，将所述质心作为搜索目标的参考属性值。

优选地，采用如下公式计算质心：

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

其中，k为搜索目标的个数，m为搜索目标的历史搜索排序权值，X_i为搜索目标的历史属性值。

优选地，所述包含一个或多个所述搜索目标的历史搜索结果包括，多个用户发起搜索获得的包含一个或多个所述搜索目标的历史搜索结果；

所述依据一个或多个搜索目标的历史属性值及历史搜索排序权值计算质心，将所述质心作为搜索目标的参考属性值的子步骤进一步包括：

1)分别采用如下公式计算s个用户的质心，其中，s为大于1的正整数：

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

其中，k为搜索目标的个数，m为搜索目标的历史搜索排序权值，Xi为搜索目标的历史属性值；

2)获得s个用户的质心{Y₁，Y₂，...，Y_s}；

3)采用如下公式在所述s个用户的质心中进一步求取质心作为搜索目标的参考属性值：

Y_{new} = \frac{Σ_{i = 1}^{s} Y_{i}^{'}}{s};

其中，Y_i为从Y₁～Y_s。

优选地，所述多个用户为多个近邻用户，所述近邻用户包括用户行为相似度大于第一预设阈值的用户集合。

优选地，所述搜索目标的参考属性值，历史属性值，当前属性值均表示为一个n维的向量X＝{x₁，x₂，…，x_n}，其中，所述n为正整数。

优选地，所述根据中庸需求点的数据对相应的搜索目标数据集合进行排序的步骤还包括：

在所述搜索目标的数据集合中去除特定搜索目标，所述特定搜索目标为其当前属性值与参考属性值的距离大于第二预设阈值的搜索目标。

本申请实施例还公开了一种数据搜索的方法，包括：

获取发起搜索用户的行为信息；

根据所述发起搜索用户的行为信息提取适配的中庸需求点的数据；

根据所述适配的中庸需求点的数据获取对应的搜索目标的数据集合返回给所述发起搜索用户；其中，所述搜索目标的数据集合中的一个或多个搜索目标具有当前属性值，所述一个或多个搜索目标按照其当前属性值与搜索目标的参考属性值的距离进行排序。

优选地，所述生成中庸需求点的数据的步骤包括：

优选地，采用如下公式计算质心：

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

2)获得s个用户的质心{Y₁，Y₂，...，Y_s}；

Y_{new} = \frac{Σ_{i = 1}^{s} Y_{i}^{'}}{s};

其中，Y_i为从Y₁～Y_s。

优选地，所述根据发起搜索用户的行为信息提取适配的中庸需求点的数据的步骤包括：

计算所述发起搜索用户的行为信息与近邻用户集合的行为相似度；

若大于第一预设阈值，则判定所述发起搜索用户的行为信息属于该近邻用户集合；

提取所述发起搜索用户所属的近邻用户集合对应的搜索目标的参考属性值，将所述搜索目标的参考属性值作为所述发起搜索用户适配的中庸需求点的数据。

优选地，所述根据适配的中庸需求点的数据获取对应的搜索目标的数据集合返回给所述发起搜索用户的步骤包括：

获取包含一个或多个所述搜索目标的当前搜索结果，提取所述一个或多个搜索目标的当前属性值；

分别计算所述一个或多个搜索目标的当前属性值与所述属性参考值的距离；

按照所述距离对所述一个或多个搜索目标进行排序；

将所述排序后的搜索目标数据集合返回给用户。

优选地，所述根据适配的中庸需求点的数据获取对应的搜索目标的数据集合返回给所述发起搜索用户的步骤还包括：

本申请实施例还公开了一种搜索数据排序的装置，包括：

中庸需求点生成模块，用于生成中庸需求点的数据；所述中庸需求点的数据包括搜索目标的参考属性值；

中庸需求点排序模块，用于根据所述中庸需求点的数据，对相应搜索目标的数据集合进行排序，具体包括：

搜索结果获取子模块，用于获取所述搜索目标的数据集合，并获得所述数据集合中一个或多个搜索目标的当前属性值；

距离计算子模块，用于计算所述一个或多个搜索目标的当前属性值与参考属性值的距离；

排序子模块，用于按照所述距离对所述数据集合中的一个或多个搜索目标进行排序。

优选地，所述中庸需求点生成模块包括：

历史搜索结果分析子模块，用于获得包含一个或多个所述搜索目标的历史搜索结果，提取所述一个或多个搜索目标的历史属性值及历史搜索排序权值；

中庸需求点计算子模块，用于依据所述一个或多个搜索目标的历史属性值及历史搜索排序权值计算质心，将所述质心作为搜索目标的参考属性值。

优选地，采用如下公式计算质心：

Y - \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

所述中庸需求点计算子模块进一步包括：

单用户质心计算单元，用于分别采用如下公式计算s个用户的质心，其中，s为大于1的正整数：

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

质心数据组织单元，用于获得s个用户的质心{Y₁，Y₂，...，Y_s}；

多用户质心计算单元，用于采用如下公式在所述s个用户的质心中进一步求取质心作为搜索目标的参考属性值：

Y_{new} = \frac{Σ_{i = 1}^{s} Y_{i}^{'}}{s};

其中，Y_i为从Y₁～Y_s。

优选地，所述中庸需求点排序模块还包括：

筛选子模块，用于在所述搜索目标的数据集合中去除特定搜索目标，所述特定搜索目标为其当前属性值与参考属性值的距离大于第二预设阈值的搜索目标。

本申请实施例还公开了一种数据搜索的装置，包括：

用户行为获取模块，用于获取发起搜索用户的行为信息；

适配需求点提取模块，用于根据所述发起搜索用户的行为信息提取适配的中庸需求点的数据；

搜索结果返回模块，用于根据所述适配的中庸需求点的数据获取对应的搜索目标的数据集合返回给所述发起搜索用户；其中，所述搜索目标的数据集合中的一个或多个搜索目标具有当前属性值，所述一个或多个搜索目标按照其当前属性值与搜索目标的参考属性值的距离进行排序。

优选地，所述中庸需求点生成模块包括：

优选地，采用如下公式计算质心：

Y - \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

所述中庸需求点计算子模块进一步包括：

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

Y_{new} = \frac{Σ_{i = 1}^{s} Y_{i}^{'}}{s};

其中，Y_i为从Y₁～Y_s。

优选地，所述适配需求点提取模块包括：

行为相似度计算子模块，用于计算所述发起搜索用户的行为信息与近邻用户集合的行为相似度；

判定子模块，用于在所述行为相似度大于第一预设阈值时，判定所述发起搜索用户的行为信息属于该近邻用户集合；

适配点获取子模块，用于提取所述发起搜索用户所属的近邻用户集合对应的搜索目标的参考属性值，将所述搜索目标的参考属性值作为所述发起搜索用户适配的中庸需求点的数据。

优选地，所述搜索结果返回模块包括：

搜索结果获取子模块，用于获取包含一个或多个所述搜索目标的当前搜索结果，提取所述一个或多个搜索目标的当前属性值；

距离计算子模块，用于分别计算所述一个或多个搜索目标的当前属性值与所述属性参考值的距离；

排序子模块，用于按照所述距离对所述一个或多个搜索目标进行排序；

反馈子模块，用于将所述排序后的搜索目标数据集合返回给用户。

优选地，所述搜索结果返回模块还包括：

与现有技术相比，本申请具有以下优点：

本申请通过设置中庸需求点，通过这个中庸需求点来建立一种新的排序方式，并可以可持续地改进这个中庸需求点以满足用户变化的需求。应用本实施例，用户无需自己提交搜索条件，即可获得满足其个性化需求的搜索结果数据，从而大大简化了用户操作；并且，各个网站服务器也无需反复处理客户端请求，从而节约了客户端与服务器的资源，有效提高了搜索效率。

在本申请的一种优选实施例中，所述中庸需求点的数据可以作为搜索条件提交给相应的搜索引擎，由搜索引擎依据自身的搜索机制抓取相应的搜索结果(搜索目标的数据集合)。即基于所述中庸需求点的数据发起在线搜索。采用这种实现方式，可以只在服务器端保存中庸需求点的数据，可以有效节约服务器资源。

在本申请的另一种优选实施例中，可以将所述中庸需求点的数据对应的搜索目标的数据集合保存在服务器端，并记录所述中庸需求点的数据对应的搜索目标的数据集合的对应关系，本实施例适用于较小型的站内搜索引擎。在这种情况下，由于网站访问量小，站内用户行为信息较少，所述中庸需求点的数据可以定期更新，而无需实时更新，在每次更新中庸需求点的数据时，即可将对应的搜索目标的数据集合进行保存。当用户发起搜索时，直接依据其适配的中庸需求点的数据提取服务器中对应的搜索目标的数据集合进行反馈即可。本实施例可以有效减少客户端与服务器通信交互的资源，也能让用户获得较快的反馈。

附图说明

图1是本申请的一种搜索数据排序的方法实施例的步骤流程图；

图2是本申请的一种示例中将商品数据和中庸需求点的数据放到价格-销量的二维空间中的示意图；

图3是本申请的一种数据搜索的方法实施例的步骤流程图；

图4是本申请的一种搜索数据排序的装置实施例的结构框图；

图5是本申请的一种数据搜索的装置实施例的结构框图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本申请作进一步详细的说明。

本申请实施例的核心构思之一在于，结合中国人的中庸之道，不求最好，也不要最差。如在电子商务网站选购商品时，针对产品的质量和价格，购买人不求价格最便宜的，也不要质量最好的，折中就好。本申请通过技术手段来满足这种大众心理。通过收集近邻用户针对搜索目标的搜索行为信息，计算出该类用户的中庸需求点，通过这个中庸需求点来建立一种新的排序方式，并可以可持续地改进这个中庸需求点以满足用户变化的需求。

参考图1，示出了本申请的一种搜索数据排序的方法实施例的步骤流程图，具体可以包括如下步骤：

步骤101，生成中庸需求点的数据；

其中，所述中庸需求点的数据可以包括搜索目标的参考属性值。

“中庸”一词取自于儒家的一种主张，是指待人接物采取不偏不倚，调和折中的态度。在本申请实施例中，中庸需求点即指在中庸思想的作用下用户的需求点。需要说明的是，本申请实施例中的用户可指单个用户，也可以为多个用户，群体用户，还可以包括所有网络用户。一般而言，在中庸思想的作用下用户的需求点，是指大多数用户在中庸思想的作用下的需求点，例如，针对某商品这个搜索目标时，大多数用户在中庸思想的作用下的需求点往往是，销量最大的并且价格相对来说最低的，或者，好评率最高并且价格最低的(即性价比最优)。

中庸需求点的数据即可以理解为，在中庸思想的作用下用户的需求点所对应的搜索目标的属性值(即本申请实施例中所指的“搜索目标的参考属性值”)。其中，所述搜索目标可以依据所适应的搜索引擎确定，例如，当在全网搜索引擎中应用本申请实施例时，所述搜索目标可以为任一种网络资源，如图片，视频，网页等等；当在某个电子商务网站的站内搜索引擎中应用本申请实施例时，所述搜索目标可以为产品，商品或服务等等。从用户角度而言，所述搜索目标也可以理解为用户希望搜索得到的目标物品，目标信息或目标数据等。

以在电子商务平台中对某个商品的搜索为例，该商品即可理解为本申请实施例中所指的“搜索目标”，在电子商务平台中，可能有成千上万条该商品的信息(即搜索目标的数据集合)。商品在电子商务平台中一般具有多个属性，如价格，销量，好评率等等。需要说明的是，在本申请实施例中，所述属性值(包括参考属性值，当前属性值，历史属性值)所对应的属性，可以为搜索目标的所有属性，也可以为用户所关注的搜索目标的部分属性或特定属性。例如，对于商品这个搜索目标而言，用户需求仅在价格、销量这两个属性上时，则只采用价格，销量这两个属性的属性值进行相关运算。并且，所述参考属性值，当前属性值，历史属性值具有一致性，即例如，某个商品(搜索目标)的参考属性值是价格，销量这两个属性的参考属性值，则其当前属性值会是价格，销量这两个属性的当前属性值，而不会是好评率、发布时间等其它属性的当前属性值；其历史属性值会是价格、销量这两个属性的历史属性值，而不会是好评率，发布时间等其它属性的历史属性值。

一般而言，在中庸思想的作用下，用户往往希望搜索到性价比最优的产品，例如：销量最大的并且价格相对来说最低的，或者，好评率最高并且价格最低的，则满足这种用户需求所对应的搜索目标的参考属性值可能是价格为0.2，销量为0.8，或者，好评率为0.9，价格为0.2。当然，所述参考属性值只是为增进本领域技术人员直观理解的示例，在实际中并不一定是这种独立的小数值，可以是数组，百分比之类，并且，可以不仅仅采用这种直接赋值的方法，而采用多种计算的方式来生成搜索目标的参考属性值，本申请对此不作限制。作为本申请实施例具体应用的一种示例，所述搜索目标的参考属性值可以表示为一个n维的向量X＝{x₁，x₂，…，x_n}，其中，所述n为正整数。

在本申请的一种优选实施例中，所述参考属性值可以通过从一个或多个系统中获取搜索目标的历史搜索信息后计算获得，即用来计算所述参考属性值的源数据可以从同一个平台中获取，如均从电子商务平台中获取，也可以从不同的多个平台中获取，比如说从商品系统平台，销售系统平台和运营系统平台分别获取，本申请对此不作限制。所述参考属性值所采用的数值表征形式及计算方式本申请均不作限制，作为一种示例，所述步骤101具体可以包括如下子步骤：

子步骤S11，获得包含一个或多个所述搜索目标的历史搜索结果，提取所述一个或多个搜索目标的历史属性值及历史搜索排序权值；

子步骤S12，依据所述一个或多个搜索目标的历史属性值及历史搜索排序权值计算质心，将所述质心作为搜索目标的参考属性值。

在实际中，所述历史搜索结果可以为用户针对搜索目标在先发起过搜索获得的搜索结果，例如，当前搜索目标为“iphone手机”，则历史搜索结果可以为用户在先提交过“iphone手机”搜索而获得的搜索结果。所述历史搜索结果还可以为用户不是针对搜索目标发起的搜索，但搜索结果中包含此搜索目标的搜索结果。例如，当前搜索目标为“iphone手机”，用户在先提交过“手机”搜索，但其获得的搜索结果中包含多条“iphone手机”的搜索结果，则本申请实施例中的历史搜索结果也可以包括这种情形。在具体应用中，所述历史搜索结果可以从日志或历史数据库中获得。

所述搜索目标的历史属性值是相应于搜索目标的当前属性值而言的，即为搜索目标的属性值的历史记录，可以表示为一个n维的向量X＝{x₁，x₂，…，x_n}，其中，所述n为正整数。在具体实现中，所述搜索目标的属性值可以为经过归一化处理的数值，如0＜x＜1，以搜索目标为iphone手机为例，假设iphone手机包括两个属性值，价格和销量，即：X＝{x₁，x₂}，在在先的某次搜索结果中，iphone手机的销售总量为10台，其中，A卖家iphone手机(搜索目标1)的销量是1，B卖家iphone手机(搜索目标2)的销量是9，采用销售总量进行归一化处理，获得搜索目标1的销量属性值为1/(1+9)＝0.1(此处销量属性值为搜索目标1占销售总量的比例)，同理，搜索目标2的销量属性值为0.9。

当然，上述搜索目标属性值的计算方式仅仅用作示例，本领域技术人员依据实际情况采用任一种方式计算搜索目标的属性值均是可行的，本申请对此不作限制。

在具体实现中，所述历史搜索排序权值可以为搜索引擎(包括全网搜索引擎和站内搜索引擎)用于对匹配的搜索记录进行排序的权重参数。例如，电子商务平台采用商品的质量打分(具体可以为参考多种因素给出的打分方法，本申请对此不作限制)为搜索排序权值，全网搜索引擎采用Page Rank(Google推出的网页等级，通常被称为PR值)为搜索排序权值，所述搜索排序权值也可以为进行人工干预的分值等，本申请对此无需加以限制。

在实际中，所述搜索目标的属性值及搜索排序权值可以在搜索结果生成时，计算并存储在指定的数据库中，以进一步提高搜索目标的参考属性值的生成效率。

作为本申请实施例具体应用的一种示例，可以采用如下公式计算质心：

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

更为优选的是，所述包含一个或多个所述搜索目标的历史搜索结果可以为，多个用户针对相同搜索目标或不同搜索目标发起搜索获得的，包含一个或多个所述搜索目标的历史搜索结果；在这种情况下，所述子步骤S12可以进一步包括如下子步骤：

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

2)获得s个用户的质心{Y₁，Y₂，...，Y_s}；

Y_{new} = \frac{Σ_{i = 1}^{s} Y_{i}^{'}}{s};

其中，Y_i为从Y₁～Y_s。

需要说明的是，上述公式是质心公式的简化版，表达的是搜索目标的搜索排序权值都为1的情况，在实际中，本领域技术人员采用任一种公式求取质心均是可行的，本申请对此无需加以限制。

在具体应用中，还可以实时或定时地根据新增的包含一个或多个所述搜索目标的搜索结果更新中庸需求点的数据。以在电子商务平台中的商品数据搜索排序为例，在初始未收集过多个用户的包含搜索目标的搜索结果时，可以通过采集用户一次包含搜索目标的搜索结果来计算商品数据分布在多维空间上的质心，即搜索目标的参考属性值。例如，用户发起一次MP3的商品搜索(如：搜索MP3)，商品搜索系统会返回一个MP3商品数据的集合，假设MP3商品的个数为k，一个或多个MP3商品有不同的搜索排序权值(商品质量分数，页面上的表现就是排序不同，质量好的在前面，质量差的在后面)，用数学公式可以表示为：M＝{m₁，m₂，…，m_k}，其中，k为商品个数，m值来自于搜索系统，如果没有搜索系统，也可以假设m＝1，所有的商品质量分数都一样，则计算质心可以采用如下公式：

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}} .

当有s个用户搜索过MP3时，每个包含所述MP3商品的搜索结果就会有对应不同的参考属性值(即采用上述公式求到的质心)，例如，A用户与B用户的参考属性值相比，价格较低，销量较高，在这种情况下，所获得的s个用户的参考属性值即可以表示为{Y₁’，Y₂’，…，Y_n’}；

采用如下公式在所述s个用户的质心中进一步求取质心作为搜索目标的参考属性值，以作为中庸需求点的数据：

Y_{new} = \frac{Σ_{i = 1}^{s} Y_{i}^{'}}{s};

其中，Y_i为从Y₁～Y_s。

当获得新增的s+1个用户的包含搜索目标的搜索结果时，采用上述公式进行计算即可获得更新的中庸需求点的数据。

为提高中庸需求点的数据的用户倾向性，所述多个用户可以为多个近邻用户，具体而言，近邻用户是协同过滤算法中提出来的概念，其指与目标用户具有相同或相似兴趣偏好的用户，近邻用户即这些具有相同或相似兴趣偏好用户的集合。传统的近邻用户算法是基于用户-项目的评分矩阵寻找目标用户的最近邻集合。关于近邻用户的计算方式，本领域技术人员采用现有的任一种方法均是可行的，如基于矩阵降维的协同过滤，基于神经网络的协同过滤等方法，本申请对此不作限制。在本申请实施例具体应用的一种示例中，所述近邻用户可以包括用户行为相似度大于第一预设阈值的用户集合。

当然，上述生成中庸需求点数据的方法仅仅用作示例，例如，对于一维的搜索目标的属性值则采用计算均值的方法等，本领域技术人员根据实际情况采用任一种生成中庸需求点数据的方法均是可行的，本申请对此无需加以限制。

在具体实现中，所述中庸需求点的数据可以在服务器端生成，可以离线完成，比如由搜索服务器生成并保存，同时还可以实时或定期更新。也可由服务器生成所述中庸需求点的数据后，发送至客户端保存，或由服务器定期更新所述中庸需求点的数据后，再将更新的数据发送至客户端保存。由客户端完成后续的排序操作，以节省服务器的资源，提高用户请求的响应速度。

步骤102，根据所述中庸需求点的数据，对相应搜索目标的数据集合进行排序。

在本申请实施例中，所述排序可以为以中庸需求点数据为中心由近及远产生的排序。具体而言，所述步骤102可以包括如下子步骤：

子步骤S21，获取所述搜索目标的数据集合，并获取所述数据集合中一个或多个搜索目标的当前属性值；

所述搜索目标的数据集合即包含一个或多个搜索目标形成的数据集合，例如，用户搜索“Iphone手机”获得的多个卖家的Iphone手机的商品数据。

子步骤S22，计算所述一个或多个搜索目标的当前属性值与参考属性值的距离；

例如，可以采用如下公式计算一个或多个搜索目标的当前属性值Xi与所述搜索目标的参考属性值Yi的距离：

dis \tan ce (X, Y) = \sqrt{Σ_{i = 1}^{n} {(x_{i} - y_{i})}^{2}} .

子步骤S23，按照所述距离对所述数据集合中的一个或多个搜索目标进行排序。

应用本申请实施例，针对用户发起搜索获得的包含一个或多个所述搜索目标对象的当前搜索结果，将分别获取所述一个或多个搜索目标的当前属性值，然后分别计算所述一个或多个搜索目标的当前属性值与属性参考值的距离；最后按照所述距离从小到大对所述数据集合中的一个或多个搜索目标进行排序，使用户获得经过所述排序后的搜索目标的搜索结果。在这种情况下，用户无需自己提交搜索条件，即可获得满足其个性化需求的搜索结果数据，从而大大简化了用户操作，不需用户一再改变搜索条件以获得自己想要的搜索结果，从而使各个网站服务器也无需反复处理客户端请求，故本申请实施例节约了客户端与服务器的资源，有效提高了搜索效率。

为便于本领域技术人员直观理解，可以参考图2，其示出了将商品数据的当前属性值和中庸需求点的数据放到价格-销量的二维空间(即属性值的两个维度)中的示意图，当获得一个或多个商品数据在该二维空间中的当前属性值，以及，该商品数据的参考属性值时，按所述一个或多个商品数据点到参考属性值的距离由近及远进行排序。

参考图3，示出了一种数据搜索的方法实施例的步骤流程图，具体可以包括以下步骤：

步骤301，生成中庸需求点的数据；所述中庸需求点的数据包括针对搜索目标的参考属性值；

在本申请的一种优选实施例中，所述步骤301可以包括如下子步骤：

子步骤S31，获得包含一个或多个所述搜索目标的历史搜索结果，提取所述一个或多个搜索目标的历史属性值及历史搜索排序权值；

子步骤S32，依据所述一个或多个搜索目标的历史属性值及历史搜索排序权值计算质心，将所述质心作为搜索目标的参考属性值。

Y - \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

在具体实现中，所述包含一个或多个所述搜索目标的历史搜索结果可以包括，多个用户发起搜索获得的包含一个或多个所述搜索目标的历史搜索结果；在这种情况下，所述子步骤S32可以进一步包括如下子步骤：

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

2)获得s个用户的质心{Y₁，Y₂，...，Y_s}；

Y_{new} = \frac{Σ_{i = 1}^{s} Y_{i}^{'}}{s};

其中，Y_i为从Y₁～Y_s。

在本申请的一种优选实施例中，所述多个用户可以为多个近邻用户，所述近邻用户包括用户行为相似度大于第一预设阈值的用户集合。

步骤302，获取发起搜索用户的行为信息；

在本申请实施例中，所述发起搜索用户不仅包括直接提交搜索请求的用户，提交关键词进行搜索的用户，还包括由系统设置需要向其推荐信息的用户，例如，用户一登录或进入网站即需要向其推荐信息，此类用户也视为本申请实施例中所指发起搜索用户。简而言之，即触发搜索行为的用户均称之为发起搜索用户。

步骤303，根据所述发起搜索用户的行为信息提取适配的中庸需求点的数据；

在本申请的一种优选实施例中，所述步骤303可以包括如下子步骤：

子步骤S41，计算所述发起搜索用户的行为信息与近邻用户集合的行为相似度；

子步骤S42，若大于第一预设阈值，则判定所述发起搜索用户的行为信息属于该近邻用户集合；

子步骤S43，提取所述发起搜索用户所属的近邻用户集合对应的搜索目标的参考属性值，将所述搜索目标的参考属性值作为所述发起搜索用户适配的中庸需求点的数据。

当然，上述方法仅仅是为了满足更精准用户需求的一种优选示例，在实际中，本领域技术人员采用任一种根据发起搜索用户的行为信息提取适配的中庸需求点的数据的方法都是可行的，例如，从用户提交的搜索关键词或搜索条件中获得搜索目标的信息，然后基于该搜索目标的信息直接在数据库中提取该搜索目标对应的中庸需求点的数据，即本领域技术人员可以在数据库存储多个搜索目标及对应参考属性值的对应关系，当从用户的搜索行为信息中(如用户提交的搜索关键词，输入或触发的搜索条件等)获得搜索目标信息时，直接提取对应搜索目标的参考属性值即可，本申请对此不作限制。

步骤304，根据所述中庸需求点的数据获取对应的搜索目标的数据集合返回给所述发起搜索用户。

具体而言，所述步骤304可以包括如下子步骤：

子步骤S51，获取包含一个或多个所述搜索目标的当前搜索结果，提取所述一个或多个搜索目标的当前属性值；

子步骤S52，分别计算所述一个或多个搜索目标的当前属性值与所述属性参考值的距离；

子步骤S53，按照所述距离对所述一个或多个搜索目标进行排序；

子步骤S54，将所述排序后的搜索目标数据集合返回给用户。

在具体实现中，所述步骤304还可以包括如下子步骤：

子步骤S55，在所述搜索目标的数据集合中去除特定搜索目标，所述特定搜索目标为其当前属性值与参考属性值的距离大于第二预设阈值的搜索目标。

在本申请实施例中，所述第一预设阈值，第二预设阈值可以由本领域技术人员依据实际情况任意设置，本申请对此无需加以限制。

在具体实现中，所述用户行为信息可以从用户操作日志，本地历史记录或从预设软件中获取，例如，用户历史调整所需的商品价格，商品销量后发起的商品数据搜索等。需要说明的是，在本申请实施例中，随着所述用户的行为信息不断更新，所述中庸需求点的数据也将不断更新。即基于更多的用户行为信息可以训练出近邻用户更为适配的中庸需求点的数据，从而更满足用户的实际需求。

在实际中，用户可以通过调节不同维度的需求，如将价格需求调低，销量需求调高，从而定位到不同的中庸需求点的数据上，获得不同的搜索目标排序。所述用户调节的接口可以以接口的方式设置在前端，或在前端页面采用滑动条等交互方式，本申请对此不作限制。

在本申请的一种优选实施例中，所述中庸需求点的数据可以作为搜索条件提交给相当的搜索引擎，由搜索引擎依据自身的搜索机制抓取相应的搜索结果(搜索目标的数据集合)。即基于所述中庸需求点的数据发起在线搜索。采用这种实现方式，仅需在服务器端保存中庸需求点的数据，可以有效节约服务器资源。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本申请所必须的。

参照图4，示出了一种数据搜索的装置实施例的结构框图，具体可以包括如下模块：

中庸需求点生成模块41，用于生成中庸需求点的数据；所述中庸需求点的数据包括搜索目标的参考属性值；

中庸需求点排序模块42，用于根据所述中庸需求点的数据，对相应搜索目标的数据集合进行排序，具体可以包括如下子模块：

搜索结果获取子模块421，用于获取所述搜索目标的数据集合，并获得所述数据集合中一个或多个搜索目标的当前属性值；

距离计算子模块422，用于计算一个或多个搜索目标的属性值与参考属性值的距离；

排序子模块423，用于按照所述距离对所述数据集合中的一个或多个搜索目标进行排序。

在本申请的一种优选实施例中，所述中庸需求点生成模块41可以包括如下子模块：

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

在本申请的一种优选实施例中，所述包含一个或多个所述搜索目标的历史搜索结果可以包括，多个用户发起搜索获得的包含一个或多个所述搜索目标的历史搜索结果；在这种情况下，所述中庸需求点计算子模块进一步包括：

Y = \frac{Σ_{i - 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

Y_{new} = \frac{Σ_{i = 1}^{s} Y_{i}^{'}}{s};

其中，Y_i为从Y₁～Y_s。

在具体实现中，所述多个用户可以为多个近邻用户，所述近邻用户可以包括用户行为相似度大于第一预设阈值的用户集合。

在本申请实施例中，所述搜索目标的参考属性值，历史属性值，当前属性值均可以表示为一个n维的向量X＝{x₁，x₂，…，x_n}，其中，所述n为正整数。

在具体实现中，所述中庸需求点排序模块42还可以包括如下子模块：

由于所述装置实施例基本相应于前述图1所示的方法实施例，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此就不赘述了。

参考图5，示出了本申请的一种数据搜索的装置实施例的结构框图，具体可以包括如下模块：

中庸需求点生成模块501，用于生成中庸需求点的数据；所述中庸需求点的数据包括搜索目标的参考属性值；

用户行为获取模块502，用于获取发起搜索用户的行为信息；

适配需求点提取模块503，用于根据所述发起搜索用户的行为信息提取适配的中庸需求点的数据；

搜索结果返回模块504，用于根据所述适配的中庸需求点的数据获取对应的搜索目标的数据集合返回给所述发起搜索用户；其中，所述搜索目标的数据集合中的一个或多个搜索目标具有当前属性值，所述一个或多个搜索目标按照其属性值与搜索目标的参考属性值的距离从小到大进行排序。

在本申请的一种优选实施例中，所述中庸需求点生成模块501可以包括如下子模块：

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

在本申请的一种优选实施例中，所述包含一个或多个所述搜索目标的历史搜索结果可以包括，多个用户发起搜索获得的包含一个或多个所述搜索目标的历史搜索结果；在这种情况下，所述中庸需求点计算子模块可以进一步包括如下单元：

单用户质心计算单元，用于分别采用如下公式计算s个用户的质心，其中

正整数：

Y_{new} = \frac{Σ_{i = 1}^{s} Y_{i}^{'}}{s};

其中，Y_i为从Y₁～Y_s。

更为优选的是，所述多个用户为多个近邻用户，所述近邻用户包括用户行为相似度大于第一预设阈值的用户集合。

在本申请的一种优选实施例中，所述适配需求点提取模块503可以包括如下子模块：

在具体实现中，所述搜索结果返回模块504可以进一步包括如下子模块：

更为优选的是，所述搜索结果返回模块504还可以包括如下子模块：

由于所述装置实施例基本相应于前述图3所示的方法实施例，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此就不赘述了。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

最后，还需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个......”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本申请所提供的一种搜索数据排序的方法，一种搜索数据排序的装置，一种数据搜索的方法，以及，一种数据搜索的装置进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种搜索数据排序的方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述生成中庸需求点的数据的步骤包括：

3.如权利要求2所述的方法，其特征在于，采用如下公式计算质心：

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

4.如权利要求2所述的方法，其特征在于，所述包含一个或多个所述搜索目标的历史搜索结果包括，多个用户发起搜索获得的包含一个或多个所述搜索目标的历史搜索结果；

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

2)获得s个用户的质心{Y₁，Y₂，...，Y_s}；

Y_{new} = \frac{Σ_{i = 1}^{s} Y_{i}^{'}}{s};

其中，Y_i为从Y₁～Y_s。

5.如权利要求4所述的方法，其特征在于，所述多个用户为多个近邻用户，所述近邻用户包括用户行为相似度大于第一预设阈值的用户集合。

6.如权利要求2或3或4或5所述的方法，其特征在于，所述搜索目标的参考属性值，历史属性值，当前属性值均表示为一个n维的向量X＝{x₁，x₂，…，x_n}，其中，所述n为正整数。

7.如权利要求1或2或3或4或5所述的方法，其特征在于，所述根据中庸需求点的数据对相应的搜索目标数据集合进行排序的步骤还包括：

8.一种数据搜索的方法，其特征在于，包括：

获取发起搜索用户的行为信息；

9.如权利要求8所述的方法，其特征在于，所述生成中庸需求点的数据的步骤包括：

10.如权利要求9所述的方法，其特征在于，采用如下公式计算质心：

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

11.如权利要求9所述的方法，其特征在于，所述包含一个或多个所述搜索目标的历史搜索结果包括，多个用户发起搜索获得的包含一个或多个所述搜索目标的历史搜索结果；

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

2)获得s个用户的质心{Y₁，Y₂，...，Y_s}；

Y_{new} = \frac{Σ_{i = 1}^{s} Y_{i}^{'}}{s};

其中，Y_i为从Y₁～Y_s。

12.如权利要求11所述的方法，其特征在于，所述多个用户为多个近邻用户，所述近邻用户包括用户行为相似度大于第一预设阈值的用户集合。

13.如权利要求9或10或11或12所述的方法，其特征在于，所述搜索目标的参考属性值，历史属性值，当前属性值均表示为一个n维的向量X＝{x₁，x₂，…，x_n}，其中，所述n为正整数。

14.如权利要求12所述的方法，其特征在于，所述根据发起搜索用户的行为信息提取适配的中庸需求点的数据的步骤包括：

15.如权利要求8或9或10或11或12或14所述的方法，其特征在于，所述根据适配的中庸需求点的数据获取对应的搜索目标的数据集合返回给所述发起搜索用户的步骤包括：

按照所述距离对所述一个或多个搜索目标进行排序；

将所述排序后的搜索目标数据集合返回给用户。

16.如权利要求15所述的方法，其特征在于，所述根据适配的中庸需求点的数据获取对应的搜索目标的数据集合返回给所述发起搜索用户的步骤还包括：

17.一种搜索数据排序的装置，其特征在于，包括：

18.如权利要求17所述的装置，其特征在于，所述中庸需求点生成模块包括：

19.如权利要求18所述的装置，其特征在于，采用如下公式计算质心：

Y - \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

20.如权利要求18所述的装置，其特征在于，所述包含一个或多个所述搜索目标的历史搜索结果包括，多个用户发起搜索获得的包含一个或多个所述搜索目标的历史搜索结果；

所述中庸需求点计算子模块进一步包括：

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

Y_{new} = \frac{Σ_{i = 1}^{s} Y_{i}^{'}}{s};

其中，Y_i为从Y₁～Y_s。

21.如权利要求20所述的装置，其特征在于，所述多个用户为多个近邻用户，所述近邻用户包括用户行为相似度大于第一预设阈值的用户集合。

22.如权利要求17或18或19或20或21所述的装置，其特征在于，所述中庸需求点排序模块还包括：

23.一种数据搜索的装置，其特征在于，包括：

用户行为获取模块，用于获取发起搜索用户的行为信息；

24.如权利要求23所述的装置，其特征在于，所述中庸需求点生成模块包括：

25.如权利要求24所述的装置，其特征在于，采用如下公式计算质心：

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

26.如权利要求24所述的装置，其特征在于，所述包含一个或多个所述搜索目标的历史搜索结果包括，多个用户发起搜索获得的包含一个或多个所述搜索目标的历史搜索结果；

所述中庸需求点计算子模块进一步包括：

Y = \frac{Σ_{i = 1}^{k} m_{i} X_{i}}{Σ_{i = 1}^{k} m_{i}}

Y_{new} = \frac{Σ_{i = 1}^{s} Y_{i}^{'}}{s};

其中，Y_i为从Y₁～Y_s。

27.如权利要求26所述的装置，其特征在于，所述多个用户为多个近邻用户，所述近邻用户包括用户行为相似度大于第一预设阈值的用户集合。

28.如权利要求27所述的装置，其特征在于，所述适配需求点提取模块包括：

29.如权利要求23或24或25或26或27或28所述的装置，其特征在于，所述搜索结果返回模块包括：

30.如权利要求29所述的装置，其特征在于，所述搜索结果返回模块还包括：