Hadoop读书笔记----（四）序列化 - 平衡 trade-off - ITeye博客

`

yjhexy

浏览: 327544 次
性别:
来自: 火星

最近访客更多访客>>

gao_xianglong

Janne

hellohank

awei

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

zhanggang807：这个ibatis 还真是不好用啊。楼主解决了我看文档也没解决的 ...
IBATIS Iterate用法初探
lijunwyf41：不错 SqlMapClientTemplate sqlMa ...
IBATIS batch用法探究
huyuancai1010： .
struts2 常量配置详解
jd2bs： 2楼肯定是people.xsd格式错了
spring schema 扩展
xiaokang1582830：遇到同样的问题,请教如何解决的java.io.NotSeria ...
ibatis 延迟加载探究

Hadoop读书笔记----（四）序列化

博客分类：

hadoop

阅读更多

Hadoop 分布式计算，序列化是Hadoop通过RPC调用，使得每个节点之间有效沟通的方法。

于是序列化就成为了分布式计算的一个重要课题。

序列化之后，对于分布式计算还需要排序。因此排序也相当重要：

Hadoop要求对象在序列化之后的字节也能够支持排序，以提高计算速度，还不必产生很多无谓的数据。

下面两张图记录了JAVA原生类型转化成序列化以后所占的字节数

Hadoop里关于Writeable 相关类的继承树：

A，Text类相当于 java.lang.String，不同的是Text用的是UTF-8的编码来解析的。

也就是说在Indexing的时候会和String有不一样地方：

举例：

System.out.println(s.length())

输出为5

System.out.println(s.getLength())

输出为10

联系：

String 的charAt返回 char所在的第几个为止========== Text的find()方法与之效果一样

String 的 codePointAt 返回unicode地址 ========== Text 的charAt()返回 unicode 地址

举例：

String s = "\u0041\u00DF\u6771\uD801\uDC00";

assertThat(s.codePointAt(3), is(0x10400));

输出： true

Text s = "\u0041\u00DF\u6771\uD801\uDC00";

assertThat(t.charAt(6), is(0x10400));

输出： true (此输出与 String.codePointAt()效果一样)

B，NullWritable 单例

查看图片附件

分享到：

JAVA 机密机制初探（JCA）—— 概览 | Hadoop读书笔记----（三）压缩与解压缩

2010-01-09 11:26
浏览 2010
评论(0)
分类:非技术
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

hadoop-mapreduce-client-jobclient-2.6.5-API文档-中文版.zip: 赠送jar包：hadoop-mapreduce-client-jobclient-2.6.5.jar；赠送原API文档：hadoop-mapreduce-client-jobclient-2.6.5-javadoc.jar；赠送源代码：hadoop-mapreduce-client-jobclient-2.6.5-sources.jar；赠送...

hadoop-eclipse-plugin-2.10.0.jar: Eclipse集成Hadoop2.10.0的插件,使用`ant`对hadoop的jar包进行打包并适应Eclipse加载,所以参数里有hadoop和eclipse的目录. 必须注意对于不同的hadoop版本,` HADDOP_INSTALL_PATH/share/hadoop/common/lib`下的jar包...

hadoop-yarn-client-2.6.5-API文档-中文版.zip: 赠送jar包：hadoop-yarn-client-2.6.5.jar；赠送原API文档：hadoop-yarn-client-2.6.5-javadoc.jar；赠送源代码：hadoop-yarn-client-2.6.5-sources.jar；赠送Maven依赖信息文件：hadoop-yarn-client-2.6.5.pom；...

hadoop-yarn-common-2.6.5-API文档-中文版.zip: 赠送jar包：hadoop-yarn-common-2.6.5.jar 赠送原API文档：hadoop-yarn-common-2.6.5-javadoc.jar 赠送源代码：hadoop-yarn-common-2.6.5-sources.jar 包含翻译后的API文档：hadoop-yarn-common-2.6.5-javadoc-...

Hadoop 3.x（MapReduce）----【Hadoop 序列化】---- 代码: Hadoop 3.x（MapReduce）----【Hadoop 序列化】---- 代码 Hadoop 3.x（MapReduce）----【Hadoop 序列化】---- 代码 Hadoop 3.x（MapReduce）----【Hadoop 序列化】---- 代码 Hadoop 3.x（MapReduce）----【Hadoop ...

hadoop-mapreduce-client-common-2.6.5-API文档-中英对照版.zip: 赠送jar包：hadoop-mapreduce-client-common-2.6.5.jar；赠送原API文档：hadoop-mapreduce-client-common-2.6.5-javadoc.jar；赠送源代码：hadoop-mapreduce-client-common-2.6.5-sources.jar；赠送Maven依赖信息...

hadoop-eclipse-plugin-2.7.3和2.7.7: hadoop-eclipse-plugin-2.7.3和2.7.7的jar包 hadoop-eclipse-plugin-2.7.3和2.7.7的jar包 hadoop-eclipse-plugin-2.7.3和2.7.7的jar包 hadoop-eclipse-plugin-2.7.3和2.7.7的jar包

Hadoop权威指南----读书笔记.pdf: Hadoop权威指南----读书笔记

hadoop最新版本3.1.1全量jar包: hadoop-annotations-3.1.1.jar hadoop-common-3.1.1.jar hadoop-mapreduce-client-core-3.1.1.jar hadoop-yarn-api-3.1.1.jar hadoop-auth-3.1.1.jar hadoop-hdfs-3.1.1.jar hadoop-mapreduce-client-hs-3.1.1.jar ...

hadoop-yarn-server-resourcemanager-2.6.0-API文档-中文版.zip: 赠送jar包：hadoop-yarn-server-resourcemanager-2.6.0.jar；赠送原API文档：hadoop-yarn-server-resourcemanager-2.6.0-javadoc.jar；赠送源代码：hadoop-yarn-server-resourcemanager-2.6.0-sources.jar；赠送...

hadoop-mapreduce-client-core-2.5.1-API文档-中文版.zip: 赠送jar包：hadoop-mapreduce-client-core-2.5.1.jar；赠送原API文档：hadoop-mapreduce-client-core-2.5.1-javadoc.jar；赠送源代码：hadoop-mapreduce-client-core-2.5.1-sources.jar；赠送Maven依赖信息文件：...

好用hadoop-eclipse-plugin-1.2.1: hadoop-eclipse-plugin-1.2.1hadoop-eclipse-plugin-1.2.1hadoop-eclipse-plugin-1.2.1hadoop-eclipse-plugin-1.2.1

hadoop-yarn-api-2.5.1-API文档-中文版.zip: 赠送jar包：hadoop-yarn-api-2.5.1.jar；赠送原API文档：hadoop-yarn-api-2.5.1-javadoc.jar；赠送源代码：hadoop-yarn-api-2.5.1-sources.jar；赠送Maven依赖信息文件：hadoop-yarn-api-2.5.1.pom；包含翻译后...

hadoop-eclipse-plugin三个版本的插件都在这里了。: hadoop-eclipse-plugin-2.7.4.jar和hadoop-eclipse-plugin-2.7.3.jar还有hadoop-eclipse-plugin-2.6.0.jar的插件都在这打包了，都可以用。

hadoop-eclipse-plugin-3.1.1.tar.gz: hadoop-eclipse-plugin-3.1.1, hadoop eclipse 插件 3.1.1

hadoop-hdfs-client-2.9.1-API文档-中文版.zip: 赠送jar包：hadoop-hdfs-client-2.9.1.jar 赠送原API文档：hadoop-hdfs-client-2.9.1-javadoc.jar 赠送源代码：hadoop-hdfs-client-2.9.1-sources.jar 包含翻译后的API文档：hadoop-hdfs-client-2.9.1-javadoc-...

hadoop-mapreduce-examples-2.7.1.jar: hadoop-mapreduce-examples-2.7.1.jar

hadoop-hdfs-client-2.9.1-API文档-中英对照版.zip: 赠送jar包：hadoop-hdfs-client-2.9.1.jar；赠送原API文档：hadoop-hdfs-client-2.9.1-javadoc.jar；赠送源代码：hadoop-hdfs-client-2.9.1-sources.jar；赠送Maven依赖信息文件：hadoop-hdfs-client-2.9.1.pom；...

hadoop-auth-2.5.1-API文档-中文版.zip: 赠送jar包：hadoop-auth-2.5.1.jar；赠送原API文档：hadoop-auth-2.5.1-javadoc.jar；赠送源代码：hadoop-auth-2.5.1-sources.jar；赠送Maven依赖信息文件：hadoop-auth-2.5.1.pom；包含翻译后的API文档：hadoop...

flink-shaded-hadoop-2-uber-2.7.5-10.0.jar: flink-shaded-hadoop-2-uber-2.7.5-10.0.jar

Global site tag (gtag.js) - Google Analytics