`
文章列表
引言HBase提供了Java Api的访问接口,掌握这个就跟Java应用使用RDBMS时需要JDBC一样重要,本文将继续前两篇文章中blog表的示例,介绍常用的Api。练习前的准备工作 创建一个Maven工程,加入以下依赖: <dependency><groupId>org.apache.hbase</groupId><artifactId>hbase</artifactId><version>0.90.2</version></dependency>如果你的Maven库里还没有hbase,还需要 ...
引言跟Hadoop的无缝集成使得使用MapReduce对HBase的数据进行分布式计算非常方便,本文将以前面的blog示例,介绍HBase下MapReduce开发要点。很好理解本文前提是你对Hadoop MapReduce有一定的了解,如果你是初次接触Hadoop MapReduce编程,可以参考http://qa.taobao.com/?p=10523 这篇文章来建立基本概念。HBase MapReduce核心类介绍首先一起来回顾下MapReduce的基本编程模型,可以看到最基本的是通过Mapper和Reducer来处理KV对,Mapper的输出经Shuffle及Sort后变为Reducer的 ...
引言在上篇文章中介绍了如何利用MapReduce来分析HBase中的数据,并通过代码示例来演示。老实说,当我写完那段代码时我一点信心都没有,我非常想知道这个job能否正常执行,结果是否符合预期,怎么办呢?一个常见的流程可能是 ...
hadoop fs -rmr /user 会把所有user目录下的所有目录和文件全都删除 这个命令运用的时候要慎重,他不会给你任何提示的。。。。 但是在hadoop中其实给了一个补救的措施,但是缺省情况下是不会开启的,这个其实就是trash机制,所以不需要提示   在core-site.xml中增加如下配置,表明rm后会在trash中保留多少分钟: <property>  <name>fs.trash.interval</name>  <value>10080</value>  <description>      ...
(转自高飞鸟) hadoop中默认的mapred.tasktracker.map.tasks.maximum设置是2 也即:每一个tasktracker同时运行的map任务数为2  某公司经过测试,发现将mapred.tasktracker.map.tasks.maximum设置为节点的cpu cores数目或者数目减1比较合适此时的运行效率最高。 如果机器是8核的,所以最终配置如下: <property>    <name>mapred.tasktracker.map.tasks.maximum</name>    <value> ...
Hadoop集群的NameNode的备份Posted by admin in Hadoop Hadoop集群中,NameNode节点存储着HDFS上所有文件和目录的元数据信息 如果NameNode挂了,也就意味着整个Hadoop集群也就完了 所以,NameNode节点的备份很重要,可以从以下2个方面来备份NameNode节点 1. 在hdfs-site.xml中,配置多个name的dir到不同的磁盘分区上: <property>    <name>dfs.name.dir</name>    <value>/pvdata/hado ...
我们现有的Hadoop集群已经运行了一段时间了 (转自高飞鸟博客) 由于集群中的服务器分布在2个不同的机房,受跨机房带宽的限制 集群中在2个机房之间的数据传输很慢 所以想把另一个机房的3台服务器从Hadoop集群中去掉 Hadoop提供了Decommission的特性,可以按照以下步骤来操作: 1. 在hadoop的conf目录下生成一个excludes的文件,写上需要remove的节点ip     一个节点一行,注意要写ip,不能写Hostname,如: 10.15.10.4110.15.10.4210.15.10.43 2. 在hdfs-site.xml中增加配置 ...
向一个正在运行的Hadoop集群中增加几个新的Nodes (转自高飞鸟的博客  www.tech126.com) 1. 新节点上部署java/hadoop程序,配置相应的环境变量 2. 新节点上增加用户,从master上拷贝id_rsa.pub并配置authorized_keys 3. 新节点上设置host,需要有集群中各节点的host对应 4. 新节点上建立相关的目录,并修改属主 5. master的slaves文件中增加上相的节点,master上增加相应的host 6. 在新节点上启动datanode和tasktracker /opt/sohuhadoop/hadoo ...
前一段时间发了一个控制台版的练练看小游戏,后来同学说做一个有界面的出来,大家都玩,于是就花了两天功夫,把以前的给加了界面,进行了改进。算法的思想还没有变,详情请看我的上一篇博客,地址为 http://zc0604.iteye.com/blog/1166242,下面给出我的程序源代码,用的素材图片是腾讯的表情,如果你想换成别的图片也可以,不过大小也要做更改,更改res/qqface下的图片就可以啦。程序可以通过双击run.bat就可会议运行(当然前提是装了JDK了,并配置了PATH和classpath)。 下边附件有源代码和程序运行效果图,程序缺陷还是没有做死局的判定。  
最近登录校内在搜索一个大学老乡的时候,点击搜索时弹出一个框,这里边有世界各地的大学名称信息。于是便想要是能把这些数据给采集到,存起来,以后说不定能用到。于是有了下边的废话。 首先准备工具: 用到的jar包有: json-lib-2.4.jar(解析json数据用) json-lib-2.4.jar依赖的包有(commons-beanutils.jar,commons-collections-3.1.jar,commons-lang-2.3.jar,ezmorph-1.0.6.jar,morph-1.1.1.zip) 本来我想存到文件里的,后来想想还是存到数据库吧,于是又把以前常用到的工 ...
最近在看新水浒,被108好汉的英雄气概所折服了,这里面的些许台词不仅是当时人民生活的写照,和当今也类似之处。“我爸是李刚”是鲜活的小衙内的翻版,强人欺压百姓,官员相互勾结。。。。。,莫谈国事,哈哈。看了之后就是想把108个好汉的剧照给下载下来,后来找了一找,有一个网站收录了(可怜不全,只有五十四个)。问题来了,我可不想一个一个图片的下载,然后再去和名字一个一个对应。可能你也想到了,对,用程序解析这个网站的html,然后去下载图片,岂不很省力。以前接触过htmlparser,下面分享一下我是怎么做的啦。希望对你有帮助。   通过这个程序,我想你以后如果要下载很多琐碎的东西,如果还是一个个的去点 ...
记得有一句很有名的话:No reflection ,no frameworks 这一句短短的话道出了java 反射机制的强大。 java关于反射机制的包主要在java.lang.reflect中,structs,hibernate,spring等框架都是基于java的反射机制。 下面是一个关于利用java的反射机制,实现了对私有属性和私有方法的访问的简单例子,希望能对你有所帮助。     package test.reflection; import java.lang.reflect.Field; import java.lang.reflect.Method; pu ...
      看到师兄在玩连连看的游戏,于是乎突然想写一个自己的连连看游戏。我写的这个没有界面,只是一个控制台演示版,当然在这个基础上,用SWING或者Android的GridView扩充界面我想应该很容易吧。不再啰嗦赘述。      连连看游戏关键还是算法问题,任何两个棋子之多经过两个直角的折角连通就可以消去。能消去的两个棋子分以下三种情况:      1 可以用一条直线直接相连      2  经过一个折角相连      3  经过两个折角相连      在设计可以考虑,采用递归的思想,3-->2,2--->1 ,我的程序仅仅使用了3--->2而对于2,我没用递归。 ...
状态转换图强调一个对象在不同事件触发时,其内部状态的转变过程。 活动图类似与程序设计中的流程图。

协作图

协作图用于表现一定范围内对象之间协作的信息,强调参与信息交流的对象之间的组织结构。 可见下图所示:
Global site tag (gtag.js) - Google Analytics