`
davidxiaozhi
  • 浏览: 236675 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论
文章列表
在ubuntu里如果改了登录密码,那么在使用svn是会要求GNOME keyring [(null)] 的密码: 去掉这个只需:rm -f ~/.gnome2/keyrings/login.keyring
我们先看一看map中对reduce个数产生影响的两个参数 hive.exec.reducers.bytes.per.reducer(每个reduce任务处理的数据量,默认为1000^3=1G) hive.exec.reducers.max(每个任务最大的reduce数,默认为999) hive计算reducer数的公式很简单N=min(参数2,总输入数据量/参数1) ,即如果reduce的输入(map的输出)总大小不超过1G,那么只会有一个reduce任务.。 针对有些hql,由于我们的产生的计算中间数据量很庞大,那么必然到导致我们的reduce数目过大,甚至超过我们现有集群的全部red ...
(为了确认是您本人在申请搬家,请在原博客发表一 篇标题为《将博客搬至CSDN》的文章,并将文章地址填写在上方的"搬家通知博文地址"中。)
       当我们的python源文件中出现中文的问题是,我们便需要指定源文件中的编码,这样解释器就会使用指定编码去解释源文件,python默认编码如果我们木有制定的话默认是ASCII 通过python官方文档,如果我们对python源文件指定编码的话我们必须如下图一样声明注释在第一行或者第二行 例如 # coding=<encoding name> 例如 # -*- coding: UTF-8 -*-或者通过流行的编辑器 使用 公认的格式   #!/usr/bin/python # -*- coding: <encoding name> ...
  欢迎喜欢深入了解推荐系统和mahout的兄弟加入群     推荐系统之Mahout  135918911   一直在学习mahout,工作中使用的是0.7跑算法,进行测试,但是在使用maven导入eclipse中构建的时候出现了问题, 首先由于m2e的lifeStyle覆盖问题,两个插件不能使用,如下图   m2e插件现在已经被eclipse托管,在看eclipse官方网站看过文档后终于找到解决方案, http://wiki.eclipse.org/M2E_plugin_execution_not_covered
欢迎喜欢深入了解推荐系统和mahout的兄弟加入群     推荐系统之Mahout  135918911   mahout入口类MahoutDriver   如果我们想要研究MahoutDriver的源码,没有什么比测试类更好的了,下面我们看一下测试类   public final class MahoutDriverTe ...
欢迎喜欢深入了解推荐系统和mahout的兄弟加入群     推荐系统之Mahout  135918911   在讲解皮尔逊相关性之前我们先讲解一下z分数   z分数(z-score),也叫标准分数(standard score)是一个分数与平均数的差再除以标准差的过程。z ...
欢迎喜欢深入了解推荐系统和mahout的兄弟加入群     推荐系统之Mahout  135918911   剖析mahout脚本   mahout 位于$MAHOUT_HOME/bin目录下,是所有mahout调用的入口。 主要会做各类环境变量的设置。 MAHOUT_JAVA_HOME:指定java的执行路劲, ...
1)首先还是分区,在计算机上右键--管理--磁盘管理 装Ubuntu分配的硬盘大小最好是(20G以上)不要太小,这里请注意,ubuntu和windows文件系统完全不同,所以我们划好要给ubuntu的分区后,删除卷。到时候,安装好的ubuntu的分区,在windows下是看不到的,但是进入ubuntu是可以访问windows的磁盘的。这才叫双系统的吧,和wubi那种不一样哦。 2)准备两个东西EasyBCD软件和iso镜像(我用的easybcd是2.1版,就下载1.7之后版就行,要那种安装版的,不要绿色版) 3) 下面打开EasyBCD软件,可以看到现在我们的计算机只有一 ...
Memcache是什么Memcache是danga.com的一个项目,最早是为 LiveJournal 服务的,目前全世界不少人使用这个缓存项目来构建自己大负载的网站,来分担数据库的压力。它可以应对任意多个连接,使用非阻塞的网络IO。由于它的工作机制是在内存中开辟一块空间,然后建立一个 HashTable,Memcached自管理这些HashTable。Memcache官方网站:http://www.danga.com/memcached,更多详细的信息可以来这里了解
 shell脚本程序我们有那些获得随机数方法呢? 一、通过时间获得随机数(date) 这个也是我们经常用到的,可以说时间是唯一的,也不会重复的,从这个里面获得同一时间的唯一值。适应所有程序里面了。            
  虽然我不是运维工程师,但是由于学习linux和shell脚本也遇到过了一些有趣的问题,例如我们常常把window环境下的文本文件上传到linux上,由于2者结束符的不同,有时候会出现配置问题 因为linux并不认识原有window环境结束符,从而在原有结束符下重新添加结束符,我们使用 cat -v -E  test.txt 查看数据 -v 是隐藏字符 -E是 结束符显示,数据如下 395439881^M$   ^M 是window文件的结束字符在linux一种显示,$是linux文件的结束字符 395423434^M$395468635^M$395436444^M$39546362 ...
今天拜读了数学之美的第一章,例举的例子感觉真是浅显易懂,这里不禁要对吴军老师的写作功底拜服,下面谈谈对信息模型的理解,数字、文字和语言作为信息的载体,他们的目的都是记录和传播信息,就像我们的老祖先一样乌拉乌拉几句,对方就明白了,你丫的骂我,拿起石头就扔过去了,其实他们的这种交流可以概括为 信息1--编码(也就是怪叫)---信息2(听到的声音)-----解码----信息1(得到原始信息),其实这就是一个简单的信息模型 信息1刚开始也就是我们的信息源 -- 信息2也就是声音可以看做信道,看到没我们的老祖先也懂得合理利用信息模型。       当我们祖先的叫声种类和形式越来越多时,事情也越来越 ...
      目前各大互联网公司都如火如荼的在研发者自己的推荐业务,因此机械学习、人工智能,数据统计分析建模变成了一个当下很热门的研究方向,那么计算机如何智能的处理自然语言呢,比如最近流行的小黄鸡应用,你的一问一答,他都会憨态可掬的作出很黄很暴力的回答。那么他是怎么处理和分析语言的呢,其实任何一种语言都是一种编码方式,人说话其实就是把想表达的意思进行编码, 编码形式 可以使声音 也可以是电流也可以是手语,接受者在对应相应的解码便得到 信息 ,这其实就是语言的数学本质。 其实在早期针对计算机如何对语言处理,我们的先人也是这么认为,就是计算机如果想处理自然语言就必须想人脑一样去处理事情,看过西游记 ...
网上得知GT-P7300可以刷打电话功能,于是网上寻找各种教程,中文的,英文的,各种亲身尝试,经历过成为板砖的痛苦,不过最终还是rom成功升级为4.0.4,成功刷出拨打电话和收发短信功能,并且可以利用移动数据流量上网,看着美美的主题,流畅的操作,心里那叫一个美啊,为了帮助菜鸟们成功刷机现在把我刷机的过程和所用工具全部奉上(好多论坛恶心的要下载积分),成功刷机请多多留言,赞一个哈 下载一下几个工具包 Odin3 v1.85.zip  必备工具,成搬砖后可以用这个工具刷高版本CWM的解决 Overcome_CWM_Recovery_v5.1.2.6_P73xx.tar  Clockw ...
Global site tag (gtag.js) - Google Analytics