`
hyz301
  • 浏览: 371023 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

【转】Hadoop学习路线图

阅读更多

 按照这个路线图来学习即可。
    1、M. Tim Jones的三篇文章:
    用Hadoop进行分布式数据处理第1部分(入门):http://www.ibm.com/developerworks/cn/linux/l-hadoop-1/index.html
    用Hadoop进行分布式数据处理第2部分(进阶):http://www.ibm.com/developerworks/cn/linux/l-hadoop-2/index.html
    用Hadoop进行分布式数据处理第3部分(应用程序开发):http://www.ibm.com/developerworks/cn/linux/l-hadoop-3/index.html

    2、“银河里的星星”的博客,其中的Google论文系列(就包括开创性论文“MapReduce:简化大集群上的数据处理”)、搜索与分布式方面的介绍
    [google论文三]MapReduce简化大集群上的数据处理:http://duanple.blog.163.com/blog/static/709717672010923203501/
    词频统计的Map/Reduce程序可以从这里找到:http://blog.csdn.net/shijinupc/article/details/7522446
    Google论文系列:http://duanple.blog.163.com/blog/#m=0&t=3&c=google
    按照Hadoop各组件来串联:http://duanple.blog.163.com/blog/static/7097176720119791920962/
    
    3、IBM developerWorks上的其他Hadoop文章,在dw上用Hadoop关键字进行搜索,可以找到大量Hadoop的文章
    下面一些需要看:
    Hadoop Distributed File System简介:http://www.ibm.com/developerworks/cn/web/wa-introhdfs/index.html
    使用Apache Pig处理数据:http://www.ibm.com/developerworks/cn/bigdata/basic.html
        
    4、《开源软件架构》中的介绍
    (卷1第8章)HDFS--Hadoop分布式文件系统:http://www.ituring.com.cn/article/4299
    英文原文:http://www.aosabook.org/en/index.html (其中的卷1第8章)
    
    5、阿里集团数据平台的官方博客,包含大量Hadoop研究和应用经验
    http://www.alidata.org/archives
    
    6、百度搜索研发部的官方博客,主要包含分布式系统(Hadoop)、搜索技术、数据挖掘、大型网站架构等方面的经验

    http://baidu-tech.com/

 

    7、董的博客,关于Hadoop、分布式系统的研究

    http://dongxicheng.org/recommend/


    8、官方文档当然更不能少了,主要包括Hadoop集群的搭建,MapReduce的使用,HDFS架构方面的介绍
    优先看稳定版:http://hadoop.apache.org/docs/stable/
    最新版(包括下一代MapReduce即YARN的介绍):http://hadoop.apache.org/docs/current/
        
    9、caibinbupt的博客,Hadoop源代码分析系列
    http://caibinbupt.iteye.com/?page=6
    千与的专栏,Hadoop-0.20.0源码分析
    http://blog.csdn.net/shirdrn/article/category/595039/3
    
    10、spork的博客,其中关于Hadoop的系列
    http://www.cnblogs.com/spork/category/226077.html
    
    11、chinacloud的博客,其中的Hadoop架构、分布式系统设计方面的一些经验
    http://www.cnblogs.com/chinacloud/archive/2010/12/03/1895369.html
    
    12、beanmoon的博客,其中的Hadoop系列
    http://www.cnblogs.com/beanmoon/

转自:http://blog.csdn.net/zhoudaxia/article/details/8801769

分享到:
评论
1 楼 smartleon 2015-04-04  
确实不错

相关推荐

    Hadoop学习路线图

    有计划的安排大数据的学习之路,可以在对Hadoop的学习规划上有一个更清晰的目标!

    Hadoop学习必看路线图2.pdf

    Hadoop学习必看路线图,

    hadoop学习路线

    1、对hadoop、zookeeper、hbase、hive、sqoop、flume、pig的理论体系有个系统掌握,对核心知识能够掌握;阅读市面上的各种图书和各种文章不再有困难; 2、能够在linux环境搭建hadoop、hbase等的伪分布和分布模式,...

    大数据学习路线图

    大数据学习路线图权威指导,立马收藏吧,一图就够了,

    小白快速掌握Hadoop集成Kerberos安全技术频教程

    从零学习Kerberos安全认证机制,并和Hadoop、YARN、HIVE进行集成,通过知识点 + 案例教学法帮助小白快速掌握Hadoop集成Kerberos安全技术。 课程亮点 1,专项攻破Hadoop安全配置。 2,生动形象,化繁为简,讲解通俗...

    Hadoop-2.6.4

    Hadoop的环境搭建所需版本,Hadoop的学习方法很多,网上也有很多学习路线图。本资源的思路是:以安装部署Apache Hadoop-2.6.4本为主线,来介绍Hadoop-2.6.4的架构组成、各模块协同工作原理、技术细节。安装不是目的...

    Java及大数据学习路线.pdf

    Java及⼤数据学习路线 1.Java学习路线 1.1JavaSE Java基础 Java8新特性 数据库MySQL与SQL语⾔ JDBC 1.2JavaWeb HTML基础与CSS JavaScript DOM 与 jQuery XML与Tomcat HTTP协议 服务器端组件Servlet JSP EL表达式 ...

    零基础(Cloudera_CDH)入门线路指导

    cloudera(CDH) 官网介绍:安装包、离线包该 如何下载、官方文档等介绍 问题导读: 1. 如何进入 cloudera 官网? 2. 如何下载 CM 、CDH 离线包? 3. 如何找到 CM 的在线安装包? 4.cloudera 在哪可以找到?...

    SparkStreaming:Spark Streaming + Flume + Kafka + HBase + Hadoop + Zookeeper实现实时日志分析统计; SpringBoot + Echarts实现数据可视化展示

    生成的数据主要是模拟某学习网站学习视频课程的访问量(其中*以“ / class”开头的表示实战课程,然后通过流水线Flume + Kafka + SparkStreaming进行实时日志的收集,HBase来存储数据)*注意事项(使用的软件工具及...

    大数据的应用.pptx

    "大数据的应用"学习路线图 深入 认知 初识 大数据算法与理论 大数据系统与实践 NoSQL Hadoop 大数据带来的思维变化 大数据带来的价值链 大数据发展现状与未来 大数据 vs 人类 什么是大数据 大数据的特性 大数据与...

    【白雪红叶】JAVA学习技术栈梳理思维导图.xmind

    关于java程序员发展需要学习的路线整理集合 技术 应用技术 计算机基础知识 cpu mem disk net 线程,进程 第三方库 poi Jsoup zxing Gson 数据结构 树 栈 链表 队列 图 操作系统 linux 代码控制...

    matlab导入excel代码-adfasdf2:adfasdf2

    matlab导入excel代码大卫的学习数据科学的个人路线图 基于KDnuggets的文章。 进行了一些补充。 我是数据科学和编程的新手。 该路线图的某些研究领域可能会进行冗余研究,而其他主题的材料可能会严重缺乏。 在学习...

    基于大数据平台数据分析技术选型调研.pdf

    技术选型调研 ⼤⽅向任务 分布式平台 选出⼏个可⾏的⽅案 分析优缺点 任务细分: 数据源存储的问题 ⽀持分布式的深度学习组件 业内端到端的解决⽅案有哪些——可借鉴的架构⽅案 ⽅案路线 1. hdfs -> mapreduce -> ...

Global site tag (gtag.js) - Google Analytics