最新文章列表

后Hadoop时代的大数据架构

全文连接http://click.aliyun.com/m/22902/ 0?wx_fmt=jpeg 提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多东西发生了变化,版本也从0.x进化到目前的2.6版本。我把2012年后定义成后Hadoop平台时代,这不是说不用Hadoop,而是像NoSQL (Not Only SQL)那样,有其他的选型补充。我在知乎上也写 ...
liangyan9966 评论(0) 有389人浏览 2017-06-09 14:16

内存计算

阿里云数据事业部强琦为大家带来内存计算方面的内容,本文主要从软硬件趋势、分布式计算简史与内存计算开始谈起,包括HIVE、ADS的介绍,接着分析 ...
liangyan9966 评论(0) 有378人浏览 2017-06-06 14:16

颠覆大数据分析之结论

随着Hadoop2.0到来——被称作YARN的Hadoop新版本——超越Map-Reduce的思想已经稳固下来。就像本章要解释的,Hadoop YARN将资源调度从MR范式分离出来。需要注意的是在Hadoop1.0,Hadoop第一代,调度功能是与Map-Reduce范式绑定在一起的——这意味着在HDFS上惟一的处理方式就是Map-Reduce或它的业务流程。这一点已在YARN得到解决,它使得HDF ...
yunqishequ 评论(0) 有13人浏览 2017-05-25 14:35

大数据处理之荷兰三剑客

大数据现在是业内炙手可热的话题,随着技术的发展,大数据存储技术已经不再是难点,但是对大数据如何做好存储后的下一步处理将是未来竞争的焦点 ...
sharong 评论(0) 有1321人浏览 2017-04-25 20:16

Hadoop配置文档

在这一节中,笔者主要向大家介绍了该配置文档中,所用到的Linux命令和Linux的帮助。注:配置文档详细截图请下载附件查看。终端提示信息在Linux中, ...
于佳磊 评论(0) 有838人浏览 2017-04-21 06:05

hadoop安装笔记

1.准备Linux环境 1.0点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ip 设置网段:192.168.1.0 子网掩码:255.255.255.0 -> apply -> ok 回到windows --> 打开网络和共享中心 -> 更改适配器设置 ...
nishaodong 评论(0) 有377人浏览 2017-02-16 15:38

大数据学习笔记(一)【原创】

新年,公司开始建设大数据中心项目,因此架构组需要对相关技术进行研究。原先对大数据相关技术已有耳闻,但是实际项目没用,很少去深入关注。这 ...
zhenggm 评论(0) 有612人浏览 2017-02-10 17:26

hadoop环境搭建

192.168.23.231 server1 192.168.23.234 server2 192.168.23.239 server3 http://mirrors.163.com/centos/6/isos/ 关闭防火墙 service iptables stop chkconfig iptables off 停闭selinux vim /etc/sysconfig/selinux SE ...
h_1_y_m 评论(0) 有313人浏览 2017-01-23 17:31

Hadoop-MapReduce气象站分析示例

ttt.txt文件 内容: 0043011990999991950051518004+68750+023550FM-12+038299999V0203201N00261220001CN9999999N9-00111+99999999999 使用MapReduce把年份和温度数据提取出来 编写:TemperatureMapper.java 1 2 3 4 5 6 ...
somkens 评论(0) 有593人浏览 2017-01-08 14:18

配置MapReduce内存

1. Container内存使用的监控        NodeManager作为Yarn运行中的一个守护进程,其中一个职责是监控运行在节点上的container,通常包含每个容器的内存使用。         为监控容器的内存使用情况,在Yarn的配置文件yarn-site.xml中配置yarn.nodemanager.container-monitor.interval-ms属性遍历当前正在运 ...
amazon10 评论(0) 有1666人浏览 2016-12-29 16:55

YARN中自己总结的几个关键点

以前在Hadoop 1.0中JobTracker主要完成两项功能:资源的管理和作业控制。在集群规模过大的场景下,JobTracker 存在以下不足: 1)JobTracker 单点故障。 2)JobTr ...
yo8237233 评论(0) 有720人浏览 2016-12-11 15:43

mapreduce流程中的几个关键点

MapReduce中数据流动    (1)最简单的过程:  map - reduce    (2)定制了partitioner以将map的结果送往指定reducer的过程: map - partition - reduce    (3)增加了在本地先进性一次reduce(优化)过程: map - combin(本地reduce) - partition -reduce map函数的处理结果放在内存 ...
yo8237233 评论(0) 有595人浏览 2016-11-12 20:46

hadoop 学习笔记:mapreduce框架详解

开始聊mapreduce,mapreduce是hadoop的计算框架,我学hadoop是从hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密。这个可能是我做技术研究的思路有关,我开始学习某一套技术总是想着这套技术到底能干什么,只有当我真正理解了这套技术解决了什么问题时候,我后续的学习就能逐步的加快,而学习hdfs时候我就发现,要理解hadoop框架 ...
沙特小王子 评论(1) 有380人浏览 2016-11-10 14:37

MapReduce工作原理图文详解

前言: 前段时间我们云计算团队一起学习了hadoop相关的知识,大家都积极地做了、学了很多东西,收获颇丰。可是开学后,大家都忙各自的事情,云计 ...
沙特小王子 评论(0) 有817人浏览 2016-11-07 11:16

Hadoop2.5.2 HA高可靠性集群搭建(Hadoop+Zookeeper)

转载自:http://eksliang.iteye.com/blog/2226986 一.概述 1.1 hadoop1.0的单点问题 Hadoop中的NameNode好比是人的心脏,非常重要,绝对不可以停止工作。在hadoop1时代,只有一个NameNode。如果该NameNode数据丢失或者不能工作,那么整个集群就不能恢复了。这是hadoop1中的单点问题,也是hadoop1不可靠的表现。如 ...
ymq267 评论(0) 有715人浏览 2016-11-05 02:19

YARNRunner的运行原理总结

之前看了那么些源码, 大致对整个Yarn的运行过程有了一个了解, 总结一下 首先每个Yarn集群都有一个Resource Manager 以及若干个NodeManager Resource Manager主要有两个对象, 一个就是Scheduler, 还有一个就是Applications Manager ASM Scheduler有FIFO和Fair等, 主要作用就是根据Node Manage ...
humingminghz 评论(0) 有1082人浏览 2016-10-25 17:52

MapReduce

MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",是它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。 当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成 ...
weitao1026 评论(0) 有534人浏览 2016-10-12 10:33

Hadoop中Yarnrunner里面submit Job以及AM生成 至Job处理过程源码解析(下)

中间隔了国庆, 好不容易才看明白了MRAppMaster如何启动其他container以及如何在NodeManager上面运行Task的。 上回写到了AM启动到最后其实是运行的MRAppMaster的main方法, 那么我们就从这里开始看他是如何启动其他container的, 首先看一下main方法: public static void main(String[] args) { ...
humingminghz 评论(0) 有2351人浏览 2016-10-11 13:53

最近博客热门TAG

浏览器(34332) Blog(32213) Google(26471) 网络应用(23512) IE(21696) 互联网(13882) QQ(11035) Firefox(9275) 网络协议(9099) 搜索引擎(8705) 百度(7940) BBS(4716) Gmail(3793) 防火墙(3687) Chrome(3205) 360(3012) 云计算(2849) 腾讯(2715) Yahoo(2236) WordPress(2094)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics