Hadoop是什么?
答:是google的核心算法MapReduce的一个开源实现。用于海量数据的并行处理。
hadoop的核心主要包含:HDFS和MapReduce
HDFS是分布式文件系统,用于分布式存储海量数据。
MapReduce是分布式数据处理模型,本质是并行处理。
二、多少数据算海量数据?
答:个人认为,TB(1024GB)级别往上就可以算海量数据。
三、谁在使用hadoop?
N多大型互联网公司,这里列的比较全:
http://wiki.apache.org/hadoop/PoweredBy
在国内,包括中国移动、百度、网易、淘宝、腾讯、金山和华为等众多公司都在研究和使用它
四、用它来做什么?
答:海量数据处理。。。似乎有点虚呵呵,我能想到的用hadoop的地方:
1、最简单的,做个数据备份/文件归档的地方,这利用了hadoop海量数据的存储能力
2、数据仓库/数据挖掘:分析web日志,分析用户的行为(如:用户使用搜索时,在搜索结果中点击第2页的概率有多大)
3、搜索引擎:设计hadoop的初衷,就是为了快速建立索引。
4、云计算:据说,中国移动的大云,就是基于hadoop的
5、研究:hadoop的本质就是分布式计算,又是开源的。有很多思想值得借鉴。
分享到:
相关推荐
Hadoop基础讲解
很不错的hadoop基础教程,就是书有点老了,可以作为基础拿来看
hadoop基础入门,便于初学者及高级程序员快速学习hadoop
hadoop基础理论,包含hdfs、MapReduce、yarn基础介绍;通过文档可以详细的了解大数据基础架构
Hadoop基础
Hadoop基础,专门介绍Hadoop开发的方方面,值得下载一看
大数据hadoop基础知识扫盲,初步了解什么是hadoop
Hadoop基础命令
大数据Hadoop基础软件包,一些详细的组件安装文档和其他常用的大数据组件软件包
Hadoop基础面试题(附答案)
│ └── Hadoop基础 -01简介及架构.ppt ├── 第2章 │ ├── 1. 安装配置虚拟机.ppt │ ├── 2. 安装Java.ppt │ └── 3. 搭建Hadoop完全分布式集群.ppt ├── 第3章 │ └── Hadoop基础操作.ppt ├──...
Hadoop基础篇之搭建Hadoop2.2
Hadoop技术-Hadoop基础环境配置.pptx
Hadoop基础知识面试题大汇总.docx Hadoop基础知识面试题大汇总.docx Hadoop基础知识面试题大汇总.docx Hadoop基础知识面试题大汇总.docx Hadoop基础知识面试题大汇总.docx Hadoop基础知识面试题大汇总.docx
《大数据基础与应用》教学课件02Hadoop基础.pdf《大数据基础与应用》教学课件02Hadoop基础.pdf《大数据基础与应用》教学课件02Hadoop基础.pdf《大数据基础与应用》教学课件02Hadoop基础.pdf《大数据基础与应用》教学...
【IT十八掌徐培成】Hadoop第02天-01.Hadoop基础回顾-进程初识-webui.zip
hadoop基础知识学习与总结