pig:group by之后的其它统计方法一
复制代码
1 --测试Top N后的其它统计
2 A = LOAD '/TraceParser/blackcore/' USING PigStorage() as (lk_id:chararray,host:chararray);
3 --DUMP A;
4
5 B = GROUP A BY lk_id;
6 B = FOREACH B GENERATE group as lk_id,COUNT($1) as amount;
7 --DUMP B;
8
9 --TOP N的数据集
10 C = ORDER B BY amount DESC;
11 C = LIMIT C 5;
12 --DUMP C;
13
14 --除TOP N后的数据集归并为其它
15 D = JOIN B BY lk_id LEFT OUTER,C BY lk_id;
16 --DESCRIBE D;
17 --DUMP D;
18 E = FILTER D BY C::lk_id is null OR C::lk_id == '';
19 --DUMP E;
20 E = FOREACH E GENERATE B::lk_id,B::amount;
21 --DESCRIBE E;
22 --SUM的用法?
23
24 --DUMP E;
25 --DUMP A;
26 H = JOIN E BY B::lk_id,A BY lk_id;
27 DESCRIBE H;
28 --H: {E::B::lk_id: chararray,E::B::amount: long,A::lk_id: chararray,A::host: chararray}
29 --DUMP H;
30 I = GROUP H all;
31 I = FOREACH I GENERATE '其它',COUNT($1) as amount;
32 DUMP I;
复制代码
分享到:
相关推荐
Beginning Apache Pig: Big Data Processing Made Easy English | 29 Dec. 2016 | ISBN: 1484223365 | 300 Pages | PDF | 4.9 MB Learn to use Apache Pig to develop lightweight big data applications easily ...
Programming Pig by Alan Gates English | 30 Nov. 2016 | ISBN: 1491937092 | 390 Pages | MOBI/EPUB/PDF | 11.54 MB For many organizations, Hadoop is the first step for dealing with massive amounts of ...
分享嘉宾:李尤(智联招聘 高级工程师) 分享内容:天讲的主要题目就是Hadoop的应用。我们有两块,一块是日志分析。还有一块是简单的应用。
如何使用Pig语言基于Hadoop架构进行数据处理!非常详细的描述,200多页。
pig:开源工程https
波苏 :pig: 一个用于小型随行库。特点和目标基于Promise的API,旨在减少常见样板使用标记的模板字符串编写原始SQL查询防止大多数类型的意外SQL注入漏洞事务和保存点处理,包括在序列化失败和死锁的情况下重试。 一流...
Pig Latin: A Not-So-Foreign Language for Data Processing
猪Pig 代码片段使用 pig 参数文件 pig -x local -param_file pig/script/empdept.properties pig/script/proptest.pig
NM4PIG 该存储库包含一个课程,用于“照片级逼真的图像生成的数值方法”课程2021年3月至6月,米兰米兰大学研究大学
IntelliJ - Pig 插件Pig 插件为添加了语言支持。特征查找 UDF 和 Pig 变量的用法和重构支持数据类型自动完成关键字突出显示代码注释/取消注释大括号匹配语法和错误突出显示自定义颜色设置页面安装从 IntelliJ 插件...
第8讲:Pig应用开发
追踪你的 :dollar_banknote: , :nine_o’clock: , :pig: , :cow: , :clinking_beer_mugs: 在您的命令行上。功能/待办事项清单 以交易为模型,而不是借记/贷记帐户=>支持由多个转账组成的复杂交易 专用付款人...
一个有效的 JPMML-Pig 设置由一个库 JAR 文件和许多模型 JAR 文件组成。 库 JAR 以实用程序类org.jpmml.pig.PMMLUtil为中心,它提供了符合 Pig 的实用程序方法来处理最常见的 PMML 评估场景。 一个模型 JAR 文件包含...
首先将uap-core、uap-java和uap-pig的源码下载到同一个目录下 mkdir ua-parser git clone https://github.com/ua-parser/uap-core git clone https://github.com/ua-parser/uap-java git clone ...
pig:Vanilla JS中对猪游戏的快速又肮脏的重制
杰基尔猪这是一个插件,可轻松在Jekyll网站中包含渐进式图库。 和使Jekyll-pig成为可能。如何使用1.安装2.在网站的_config.yml的插件列表中添加- jekyll-pig3.安装jekyll-pig 将gem jekyll-pig添加到站点的Gemfile并...
gedit-pig 该项目将语法高亮显示添加到使用GtkSourceView的任何编辑器中。 在master分支中支持Pig 0.15。 对于Pig 0.11-0.14,请按照以下说明进行操作,但是请从相应的发行版中获取文件。Gedit的安装说明将适当的pig...
PIG(国内微服务热度最高的一个社区)
猪用和构建的一种简单语言的解释器。用法使用stack exec pig开始解释器stack exec pig -- -l|--load 与开始解释加载。 stack exec pig -- --help帮助查看更多信息。语言在PiG中,一切都是表达: 文字值: null true ...
Learn to use Apache Pig to develop lightweight big data applications easily and quickly. This book shows you many optimization techniques and covers every context where Pig is used in big data ...