Hadoop赢得1TB排序基准评估第一名 - gqf2008 - ITeye博客

`

gqf2008

浏览: 74784 次
性别:
来自: 上海

最近访客更多访客>>

zihai367

tanghui

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

qswdit：哥们话说文中CAS 提供扩展认证是怎么进行的啊！！求详 ...
单点登陆（SSO）CAS介绍
liuxuejin：这样的资料是在是太少了
lame+ffmpeg+flvtool2+mencoder
kfc_davy： NICE ~ 有点少了http://hi.baidu.com ...
ubuntu下安装Tokyo Tyrant（ttserver）
kkppccdd：请问付费怎么付的?大陆的信用卡申请不了google check ...
搜搜工作网正式迁移到Google App Engine
gqf2008： CLASSPATH=$CLASSPATH:/usr/local ...
Tokyo Tyrant（ttserver） java api的安装

Hadoop赢得1TB排序基准评估第一名

博客分类：

网站

Hadoop Rack Linux 配置管理 Facebook

阅读更多

强烈祝贺Hadoop赢得1TB排序基准评估第一名。Yadoo的一个集群最近用209秒时间排序1TB的数据，比上一年的的纪录保持者保持的297秒快乐将近90秒。1998年Jim Gray创建了排序基准评估的方法，建立100亿条100个字节的纪录，评估对这100亿条纪录完全排序和把纪录写入磁盘的时间。评估是建立在未发布的版本0.18上的。排序所用的源码在这个地址。

评测集群的配置：

910 nodes
4 dual core Xeons @ 2.0ghz per a node
4 SATA disks per a node
8G RAM per a node
1 gigabit ethernet on each node
40 nodes per a rack
8 gigabit ethernet uplinks from each rack to the core
Red Hat Enterprise Linux Server Release 5.1 (kernel 2.6.18)
Sun Java JDK 1.6.0_05-b13

大家可能非常想知道如何配置Hadoop集群以提高集群处理效率。过些日子我会和大家探讨如何设置Hadoop的集群问题，包括configuration的配置，集群的监控，集群的资源管理等等，和一些来自Facebook Dhruba Borthakur 的经验。

分享到：

CloudStore分布式文件系统 | Hadoop分布式计算、存储系统

2009-08-14 11:07
浏览 1294
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

hadoop分区二次排序示例.zip: hadoop分区二次排序示例，对基站数据，按电话号码升序、到达时间降序进行排序

hadoop 二次排序原理: Hadoop 大数据方向 mapreduce计算中的二次排序，讲解透彻

Hadoop 分布式部署配置及基准性能测试: Hadoop V3.3.3 分布式部署步骤，DFSIO和Tersort基准测试

hadoop实现分区二次排序代码示例.zip: hadoop分区二次排序代码示例，包含基站数据集，对基站数据，按电话号码升序、到达时间降序进行排序，只需打包成jar，即可在hadoop集群中运行

论文研究-基于Hadoop的多关键字排序方法研究.pdf: 在单机环境下按多关键字对大数据排序需要较长的执行时间，为了提高按多关键字对大数据排序的效率，根据Hadoop的MapReduce模型，给出了两种基于Hadoop的多关键字排序方法。方法一在Reduce函数中使用链式基数排序算法...

Hadoop集群（1-11期）: Hadoop集群·CentOS安装配置（第1期） Hadoop集群·机器信息分布表（第2期） Hadoop集群·VSFTP安装配置（第3期） Hadoop集群·SecureCRT使用（第4期） Hadoop集群·Hadoop安装配置（第5期） Hadoop集群·JDK和SSH无...

Hadoop权威指南第二版(中文版): 第1章初识Hadoop 　数据！数据！　数据存储与分析　与其他系统相比　关系型数据库管理系统　网格计算　志愿计算　1.3.4 Hadoop 发展简史　Apache Hadoop和Hadoop生态圈第2章关于MapReduce 　一个气象数据...

Hadoop权威指南第四版和第二版: 关于Hadoop权威指南第四版和第二版，Hadoop电子版资料

hadoop shuffle和排序1: hadoop学习笔记-shuffle和排序 shuffle是指将map输出作为输入传给reduce的过程。

hadoop2.7.3 hadoop.dll: 在windows环境下开发hadoop时，需要配置HADOOP_HOME环境变量，变量值D:\hadoop-common-2.7.3-bin-master，并在Path追加%HADOOP_HOME%\bin，有可能出现如下错误： org.apache.hadoop.io.nativeio.NativeIO$Windows....

Hadoop集群pdf文档: Hadoop_Hadoop集群（第1期）_CentOS安装配置 Hadoop_Hadoop集群（第2期）_机器信息分布表 Hadoop_Hadoop集群（第4期）_SecureCRT使用 Hadoop_Hadoop集群（第5期）_Hadoop安装配置 Hadoop_Hadoop集群（第5期副刊）_...

hadoop详细视频教程: 01_hadoop_hdfs1分布式文件系统01 02_hadoop_hdfs1分布式文件系统02 03_hadoop_hdfs1分布式文件系统03 04_hadoop_hdfs1分布式文件系统04 05_hadoop_hdfs1分布式文件系统05 06_hadoop_hdfs1分布式文件系统06 07_...

Hadoop权威指南中文版第一版: 本书从Hadoop的缘起开始，由浅入深，结合理论和实践，全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。全书共14章，3个附录，涉及的主题包括：Haddoop简介；MapReduce简介；Hadoop分布式文件系统；Hadoop的I...

细品味Hadoop_Hadoop集群（第1期）_CentOS安装配置: 细品味Hadoop_Hadoop集群（第1期）_CentOS安装配置

hadoop1升级hadoop2步骤: hadoop1升级到hadoop2具体步骤及方法

新版Hadoop视频教程段海涛老师Hadoop八天完全攻克Hadoop视频教程 Hadoop开发: 第一天 hadoop的基本概念伪分布式hadoop集群安装 hdfs mapreduce 演示 01-hadoop职位需求状况.avi 02-hadoop课程安排.avi 03-hadoop应用场景.avi 04-hadoop对海量数据处理的解决思路.avi 05-hadoop版本选择和...

Hadoop大作业排序.zip: Hadoop大作业排序代码由于 MapReduce 中对 key 进行比较和排序，而 key 可以是任何实现了 Writable 接口的类。在 java 中，要实现类的大小比较可以实现 Comparable 接口并通过重写 compareTo 方法来实现。在 ...

HADOOP实验一1: HADOOP实验一1

Hadoop云计算2.0笔记第一课Hadoop介绍: Hadoop云计算2.0笔记第一课Hadoop介绍

hadoop1.x与hadoop2.x配置异同: 英文的,讲解hadoop1.x与hadoop2.x配置异同

Global site tag (gtag.js) - Google Analytics