`
文章列表

英语链接

magic school bus字幕文件下载 第1集、第2集  http://www.ebama.net/thread-61871-1-1.html  
参考: http://blog.csdn.net/defonds/article/details/43233131mvn assembly:assembly <build> <plugins> <plugin> <artifactId>maven-assembly-plugin</artifactId> <configuration> <appendAssemblyId>false</ap ...

Spark 博文

VentLam大数据 https://www.jianshu.com/u/xyZroM   大数据时代 基于用户画像的精准营销http://www.cbdio.com/BigData/2016-08/23/content_5207015.htm 基于用户画像的实时异步化视频推荐系统 http://www.jianshu.com/p/83af9502acb6   一个电子商务网站商品推荐系统的设计与实现 https://wenku.baidu.com/view/e514ef99b8f67c1cfbd6b874.html   http://hacker.duanshishi. ...

Spark Sql

Spark入门实战系列--6.SparkSQL(下)--Spark实战应用 http://www.cnblogs.com/shishanyuan/p/4723713.html   Flume+Spark+Hive+Spark SQL离线分析系统 http://blog.csdn.net/ymh198816/article/details/52014315   sparkSQL实战详解  http://9269309.blog.51cto.com/9259309/1851673   Spark SQL快速上手 http://www.itcast.cn/news/201512 ...

Yarn命令

  查看日志:yarn logs -applicationId xxx 查看状态:yarn applicaiton -status xxx  

Hive 优化

    博客分类:
  • hive
Hive中跑MapReduce Job出现OOM问题分析及解决 https://blog.csdn.net/oopsoom/article/details/41356251   ======================================================================================================================================================================================================   hive ...

java常用网址

    博客分类:
  • java
findJar http://www.findjar.com   download jar http://maven.ibiblio.org/maven2/org/json/json/20160212/

hive函数

    博客分类:
  • hive
  http://www.kuqin.com/shuoit/20131030/335990.html SELECT id, CONCAT_WS(',', COLLECT_SET(pic)) FROM tbl GROUP BY id 在这里CONCAT_WS是UDF,COLLECT_SET是UDAF,它将group后的pic去重,并转换为了array,方便udf是用。 PS:如果不需要去重,可以使用COLLECT_LIST。   数据<Struct> select collect_list(named_struct('tid', tid, 'name', name)) ...
安装Splinter: D:\Program Files\Python36\Scripts>pip install splinter   http://www.cnblogs.com/mealrice/p/5495544.html 使用 Selenium with Python 进行 web 自动化测试   https://www.zybuluo.com/mwumli/note/222253 Install pip, setuptools, and wheel   python -m pip install -U pip setuptools   Python自动 ...

Zookeeper 命令

递归删除: rmr /path

Kafka命令

 启动: /bin/kafka-server-start.sh -daemon config/server.properties &  关闭:  ./kafka-server-stop.sh   启动所有的broker命令: bin/kafka-server-start.sh config/server.properties &  创建 bin/kafka-topics.sh --create --zookeeper u13:2181 --replication-factor 1 --partitions 1 --topic test   通过list命令查看 ...
storm1.0.2版本集群搭建完整步骤 http://blog.csdn.net/xu470438000/article/details/54090429   nimbus:nohup bin/storm nimbus >/dev/null 2>&1 &  ui:nohup bin/storm ui >/dev/null 2>&1 & logviewer:nohup bin/storm logviewer >/dev/null 2>&1 &  supervisor:nohup bin/storm ...
idea maven打包jar的多种方式 http://www.cnblogs.com/qifengshi/p/6036870.html  
Oozie4.0.1详细安装教程 http://www.linuxidc.com/Linux/2014-12/110456.htm  http://www.tuicool.com/articles/n2MJ3mn   azkaban安装 http://blog.csdn.net/levy_cui/article/details/51594965  

Spark机器学习

基于隐式反馈的音乐推荐技术研究 http://www.doc88.com/p-3691241178446.html   一个电子商务网站商品推荐系统的设计与实现 https://wenku.baidu.com/view/e514ef99b8f67c1cfbd6b874.html   机器学习入门好文,强烈推荐 http://blog.csdn.net/ritterliu/article/details/54821300 如何学习推荐系统? https://www.zhihu.com/question/21251105   《推荐系统》基于标签的用户推荐系统  http ...
Global site tag (gtag.js) - Google Analytics