`
eksliang
  • 浏览: 592296 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

solr StatsComponent(聚合统计)

    博客分类:
  • solr
阅读更多

StatsComponent

转载请出自出处:http://eksliang.iteye.com/blog/2169134

http://eksliang.iteye.com/

一、概述

       Solr可以利用StatsComponent 实现数据库的聚合统计查询,也就是min、max、avg、count、sum的功能

 

二、参数

参数 含义
stats 是否开启stats(true/false)
stats.field 添加一个字段来统计,可以有多个
stats.facet  在给定的面返回值的子结果。

 

三、参考实例

参考实例一:查询参数

 

q=*:* 
&stats=true
&stats.field=price
&stats.field=popularity
&rows=0

 返回结果如下:

 

 

<lst name="stats">
 <lst name="stats_fields">
  <lst name="price">
    <double name="min">0.0</double>        --最小值
    <double name="max">2199.0</double>     --最大值
    <double name="sum">5251.2699999999995</double> --总和
    <long name="count">15</long>                   --记录数,也就是多少行记录
    <long name="missing">11</long>                 --结果集中,有多少条记录是空值
    <double name="sumOfSquares">6038619.160300001</double> --平方和(x1^2 + x2^2+xn^2)
    <double name="mean">350.08466666666664</double>        --平均数(x1+x2+xn)/n
    <double name="stddev">547.737557906113</double>        --标准差
  </lst>
  <lst name="popularity">
    <double name="min">0.0</double>
    <double name="max">10.0</double>
    <double name="sum">90.0</double>
    <long name="count">26</long>
    <long name="missing">0</long>
    <double name="sumOfSquares">628.0</double>
    <double name="mean">3.4615384615384617</double>
    <double name="stddev">3.5578731762756157</double>
  </lst>
 </lst>
</lst>

 参数含义如下:

返回字段 字段含义
min 最小值
max 最大值
sum 总和
count 记录数,也就是多少行记录
missing 结果集中,有多少条记录是空值
sumOfSquares 平方和(x1^2 + x2^2+xn^2)
mean  平均数(x1+x2+xn)/n
stddev 标准差

 

 

参考实例二:查询参数如下

 

q=*:* 
&stats=true
&stats.field=price
&stats.field=popularity
&stats.facet=inStock
&rows=0

返回结果如下所示:

 

 

<lst name="stats">
 <lst name="stats_fields">
  <lst name="price">
  <double name="min">0.0</double>
  <double name="max">2199.0</double>
  <double name="sum">5251.2699999999995</double>
  <long name="count">15</long>
  <long name="missing">11</long>
  <double name="sumOfSquares">6038619.160300001</double>
  <double name="mean">350.08466666666664</double>
  <double name="stddev">547.737557906113</double>
  <lst name="facets">
   <lst name="inStock">
    <lst name="false">  --统计的是:在返回结果中inStock等于false部分,price的统计
      <double name="min">11.5</double>   --在inStock等于false的记录中pirce的最小值
      <double name="max">649.99</double> --在inStock等于false的记录中pirce的最大值
      <double name="sum">1161.39</double>--在inStock等于false的记录中pirce的总和
      <long name="count">4</long>        --inStock等于false的记录数
      <long name="missing">0</long>      --在inStock等于false的记录中pirce等于空的记录
      <double name="sumOfSquares">653369.2551</double>--在inStock等于false的记录中pirce的平方和
      <double name="mean">290.3475</double>--在inStock等于false的记录中pirce的平均值
      <double name="stddev">324.63444676281654</double>--在inStock等于false的记录中pirce的标准差
    </lst>
    <lst name="true">
      <double name="min">0.0</double>
      <double name="max">2199.0</double>
      <double name="sum">4089.879999999999</double>
      <long name="count">11</long>
      <long name="missing">0</long>
      <double name="sumOfSquares">5385249.905200001</double>
      <double name="mean">371.8072727272727</double>
      <double name="stddev">621.6592938755265</double>
    </lst>
   </lst>
  </lst>
 </lst>
</lst>

  

 

温馨提示:如果统计的列不是数字类型。而是字符串,那么统计的结果中只有如下列

参考实例如下:查询参数

q=*:*
&stats=true
&stats.field=CAR_NUM
&rows=0

 返回结果如下所示:

 

<lst name="stats">
  <lst name="stats_fields">
	<lst name="CAR_NUM">
		<str name="min">08449</str>
		<str name="max">黑ZZ6T8警</str>
		<long name="count">9999999</long>
		<long name="missing">0</long>
		<lst name="facets"/>
	</lst>
   </lst>
</lst>

 

 官方API地址:http://wiki.apache.org/solr/StatsComponent

 

分享到:
评论
4 楼 cgl616165946 2017-03-14  
290434409 写道
请教下,/select??q=*:*&stats=true&stats.field=recoinfoLength&rows=0&indent=true进行了这个查询,返回的结果却是这样的,
-<response>


-<lst name="responseHeader">

<int name="status">0</int>

<int name="QTime">15</int>


-<lst name="params">

<str name="?q">*:*</str>

<str name="indent">true</str>

<str name="stats.field">recoinfoLength</str>

<str name="stats">true</str>

<str name="rows">0</str>

</lst>

</lst>

<result name="response" maxScore="0.0" start="0" numFound="0"> </result>


-<lst name="stats">


-<lst name="stats_fields">


-<lst name="recoinfoLength">

<null name="min"/>

<null name="max"/>

<long name="count">0</long>

<long name="missing">0</long>

<double name="sum">0.0</double>

<double name="sumOfSquares">0.0</double>

<double name="mean">NaN</double>

<double name="stddev">0.0</double>

</lst>

</lst>

</lst>

</response>

这个字段定义:
<field name="silenceLength" type="long" indexed="true" stored="true" required="true" multiValued="false" docValues="true"/>
请问为何统计不出结果


你的http请求有两个问号
<str name="?q">*:*</str>
所以查不出数据
3 楼 290434409 2016-01-14  
请教下,/select??q=*:*&stats=true&stats.field=recoinfoLength&rows=0&indent=true进行了这个查询,返回的结果却是这样的,
-<response>


-<lst name="responseHeader">

<int name="status">0</int>

<int name="QTime">15</int>


-<lst name="params">

<str name="?q">*:*</str>

<str name="indent">true</str>

<str name="stats.field">recoinfoLength</str>

<str name="stats">true</str>

<str name="rows">0</str>

</lst>

</lst>

<result name="response" maxScore="0.0" start="0" numFound="0"> </result>


-<lst name="stats">


-<lst name="stats_fields">


-<lst name="recoinfoLength">

<null name="min"/>

<null name="max"/>

<long name="count">0</long>

<long name="missing">0</long>

<double name="sum">0.0</double>

<double name="sumOfSquares">0.0</double>

<double name="mean">NaN</double>

<double name="stddev">0.0</double>

</lst>

</lst>

</lst>

</response>

这个字段定义:
<field name="silenceLength" type="long" indexed="true" stored="true" required="true" multiValued="false" docValues="true"/>
请问为何统计不出结果
2 楼 290434409 2016-01-14  
-<response>


-<lst name="responseHeader">

<int name="status">0</int>

<int name="QTime">15</int>


-<lst name="params">

<str name="?q">*:*</str>

<str name="indent">true</str>

<str name="stats.field">recoinfoLength</str>

<str name="stats">true</str>

<str name="rows">0</str>

</lst>

</lst>

<result name="response" maxScore="0.0" start="0" numFound="0"> </result>


-<lst name="stats">


-<lst name="stats_fields">


-<lst name="recoinfoLength">

<null name="min"/>

<null name="max"/>

<long name="count">0</long>

<long name="missing">0</long>

<double name="sum">0.0</double>

<double name="sumOfSquares">0.0</double>

<double name="mean">NaN</double>

<double name="stddev">0.0</double>

</lst>

</lst>

</lst>

</response>
1 楼 290434409 2016-01-14  
请教下,/select??q=*:*&stats=true&stats.field=recoinfoLength&rows=0&indent=true进行了这个查询,返回的结果却是这样的,
-<response>


-<lst name="responseHeader">

<int name="status">0</int>

<int name="QTime">15</int>


-<lst name="params">

<str name="?q">*:*</str>

<str name="indent">true</str>

<str name="stats.field">recoinfoLength</str>

<str name="stats">true</str>

<str name="rows">0</str>

</lst>

</lst>

<result name="response" maxScore="0.0" start="0" numFound="0"> </result>


-<lst name="stats">


-<lst name="stats_fields">


-<lst name="recoinfoLength">

<null name="min"/>

<null name="max"/>

<long name="count">0</long>

<long name="missing">0</long>

<double name="sum">0.0</double>

<double name="sumOfSquares">0.0</double>

<double name="mean">NaN</double>

<double name="stddev">0.0</double>

</lst>

</lst>

</lst>

</response>

这个字段定义:
<field name="silenceLength" type="long" indexed="true" stored="true" required="true" multiValued="false" docValues="true"/>
请问为何统计不出结果

相关推荐

Global site tag (gtag.js) - Google Analytics