`
josephgao
  • 浏览: 14686 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论
文章列表

kafka issues

0.8.1 Release 1. 需要将slf4j的jar包拷贝到kafka的lib目录下,否则运行producer和consumer的shell test会报错 2. 使用java的api,props.put("metadata.broker.list", "xxx.xxx.xxx.xxx:9092");如果brokerlist在server端kafka的配置是使用的hostname比如master,slave1,slave2,则需要java的client端知道这些hostname的路由,所有的broker
转自http://grepalex.com/2014/02/09/flume-and-hadoop-2.2/ flume1.4.0 使用的是protobuf 2.4.1 hadoop 2.2使用的是2.5,所以会出现verifyError的问题 解决办法:进入flume文件夹 rm -f lib/protobuf-java-2.4.1.jar lib/guava-10.0.1.jar 重新启动即刻
插入性能比:    lzotest表采用lzo压缩格式,nolzo无压缩, 分别启动20个线程,每个线程一条一条插入1w条数据    lzo耗时 54273ms, nolzo耗时53146 scan性能比:    逐条scan两张表, 20w条数据    lzo耗时 6509ms, nolzo耗时7593ms 压缩比:    60w条数据压缩前nolzo 205m    修改压缩格式为lzo后 数据为111m,压缩比为54.146% 综上所述,插入上开启lzo稍差但对比不明显,scan时lzo性能略有优势,压缩比还算比较可观
转自http://wiki.apache.org/hadoop/NameNodeFailover 一. 在dfs.name.dir上添加nfs目录, <property> <name>dfs.name.dir</name> <value>/export/hadoop/namedir,/remote/export/hadoop/namedir</value> </property> 如何挂在nfs参见http://server.zdnet.com.cn/server/2007/0831/482007.shtml http:/ ...
一. BufferStore BufferStore,它包含两个Store, 笔者这里primaryStore是hdfsFileStore,secondaryStore是stdFileStore。 整个BufferStore工作的时候是一个有限状态自动机,有以下几个状态: DISCONNECTED, SENDING_BUFFER, STREAMING,  三个状态的含义是主store挂 ...
1. master启动报out of memory, 修改/etc/security/limits.d/90-nproc.conf /etc/security/limits.conf增加hbase用户的资源分配
1. 安装 easy install pip pip install scrapy 2. Items, spider, itempipline 基本概念 scrapy startproject tutorial vim items.py class DmozItem(Item): # define the fields for your item here like: name = Field() title = Field() link = Field() desc = Field() class Torr ...

vim 快捷键

    博客分类:
  • vim
1. 插入模式      i 光标左边      I  行首      a 光标右边      A 行尾      o 向下一行插入      O向上一行插入 2. h j k l分别← ↑ ↓ → 3. w  下一个词, b上一个词 0 到行首,^到第一个字母, $到行尾 4. ctrl + f向下移动一屏, ctrl + b向上移动一屏 5. * 向下查找, #向上查找 6. ctrl + n自动补全 7.
1. maven dependency <dependency> <groupId>org.kubek2k</groupId> <artifactId>springockito-annotations</artifactId> <version>1.0.8</version> <scope>test</scope> </dependency> 2. 用法: ...
1. 下载firebird http://www.firebirdsql.org/en/server-packages/笔者选的是2.5.2 2.  解压,进入bin目录,install_super.bat 3.  我的电脑右键->管理->服务,将firebird的服务置成手动 4.  可选,下载一个firebird的client,笔者选的是FlameRobin还挺好用的 至此,可以试试firebird了,可以使用firebird/bin/isql, CREATE DATABASE 'firstdb.gdb' USER 'sysdba' PASSWORD 'masterkey'; ...
1. 去 https://pypi.python.org/pypi/xlrd/0.9.2下载xlrd-0.9.2.tar.gz 2. 解压安装,笔者用的macos,直接python setup.py install 3. 使用样例:     import xlrd book = xlrd.open_workbook(fn) #多少个sheet print "The number of worksheets is", book.nsheets #每个sheet的名字 print "Worksheet name(s):", book.sheet_ ...
一. hadoop rpc用到的jdk java包       1. java.lang.reflect  反射和动态代理           反射能做的事情:                   a. 通过类的名字实例化某类                   b. 通过类名和方法名调用某个方法(或类的静态方法)                   c. 通过类名和属性名获取类(或对象)的某个属性           动态代理能做的事:                    将某个接口的方法调用交给代理类,这样在调用这个方法之前被代理类截获,可做一些操作,有些注入和AOP的赶脚         ...
import com.vividsolutions.jts.io.WKTReader; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.Mapper; import o ...
scribe安装与配置 1. 依赖软件: a. autoconf:   wget http://ftp.gnu.org/gnu/autoconf/autoconf-2.69.tar.gz tar xvf autoconf-2.69.tar.gz cd autoconf-2.69 ./configure --bindir=/usr/bin make && make install        b. 依赖库: yum install libevent libevent-develpython-devel yum install gcc-c++ yum in ...
一. 需求      一处产生消息,两处消费,故采取Topic模式的activemq. 二.  下载及安装 http://activemq.apache.org/下载最新版本。 解压, 进入安装目录 bin/activemq start xbean:conf/activemq.xml http://localhost:8161/admin查看mq状态,用户名和密码在conf/jetty-realm.properties,默认是admin, admin 至此server已启动。 三. server配置 conf/activemq.xml     1. message cursors, 引用htt ...
Global site tag (gtag.js) - Google Analytics