`
文章列表
按照 http://blog.csdn.net/Angelababy_huan/article/details/52179727  配置好后 修改core-site.xml,将local改成master <configuration> <property>   <name>hadoop.tmp.dir</name>   <value>file:/home/hadoop/hadoop/tmp</value>   <description>Abase for other temporary di ...
使用的xml文档如下     [html] view plain copy   <?xml 
现在做Heritrix抓取,由于java版本之类的,我选择用了3.1,可是大部分的资料都是介绍1.14的,太让人生气,尤其一个最简单的功能:让保留的文件是和这个域名下有关的文件,不要被js那些抽取的链接又访问到其他站点抓取。在1.14版本,已经非常多的扩展代码等,可是完全和3.1不同。   在这个前提下,我感觉是可以写个扩展替换的,我这里直接再源码中修改了,所改动的文件是 org.archive.crawler.postprocessor.CandidatesProcessor   写道 protected boolean shouldProcess(CrawlURI puri) { ...
安装环境 linux SUSE python 2.6.8 compiler ifort 11.1 hdf5 1.8.12 numpy 1.10.1 h5py 2.0.1   其他的请参照对应文件的gz readme   安装好后,有事出现 cannot import name ****什么的错误,可能是版本的问题,在保证以上的版本的话,那就要重新打开终端,python import一下看看,基本没有问题
 pure-pw useradd ftp用户 -u 系统用户 -d 用户目录 pure-pw mkdb  /etc/init.d/pure-ftpd restart   最好执行的时候要都加上sudo,尤其最后重启的时候

linux 下的指令

1.   find       find pathname -options [-print -exec -ok]       让我们来看看该命令的参数:       pathname find命令所查找的目录路径。例如用.来表示当前目录,用/来表示系统根目录。       -print find命令将匹配的文件输出到标 ...
这里使用的是Spring2.5,需要的jar包:spring.jar(spring2.5的完全包);quartz-all-1.6.0.jar;还需commons-*.jar。   方法一: 任务调度工作类代码: Java代码  
grep grep 工具的工作方式是对文件的每一行搜索给定字符串的首次出现。如果找到了这个字符串,就打印该行的内容;否则就不对该行进行打印。下面这个文件我称之为 “memo”,阐述了 grep 的用法和结果。 To: All EmployeesFrom: Human ResourcesIn order to better serve the needs of our mass market customers, ABC Publishing is integrating the groups selling to this channel for ABC General Reference ...
很久了,想看看正则表达式的具体规范,还好最近,有幸找到并收集了一下,如下 在最简单的形式中,正则表达式(regular expression)是用来在文件中定位文本的一些搜索标准。例如,要查找所有包含单词 “admin” 的行,我们就可以对 “admin” 进行搜索。因此,“admin” 就构成了一个正则表达式。如果我们不但希望查找 “admin”,而且还想将其替换成 “root”,那么我们就可以在一个工具中使用适当的命令将 “admin” 替换成 “root”。它们都构成了正则表达式。 正则表达式所采用的一些基本规则如下: 任何单个字符或一串字符都可以匹配字符本身,例如上面的 “ad ...
第一步 最好是在root下,运气好不在也行 方法一:1. 打开Terminal2. jonesduan-MacBook-Pro:~ user$ sudo -i3. 输入root密码即可。方法二:和方法一中1和3步相同,只是第二步输入的命令不是sudo -i 而是sudo su或是su。区别:方法一和方法二的区别是获取root权限后终端显示的不一样。
转 :  升级 YUSEMITE后,MAMP PRO Apache 不能启动?提示:Apache couldn't be started. Please check the log file for more       软件:MAMP PRO 原因:系统升级到OSX 10.10 YUSEMITE(优胜美地) 错误提示:Apache couldn't be started. Please check the log fil ...
见附件墙报 所谓的利用matlab,c++,php,基于windows ,mac,qt平台
上次总结了下,jQuery包装集,今天主要总结一下jQuery操作元素属性的一些知识。 先看一个例子: <aid="easy"href="#">http://www.jquery001.com</a> 现在要得到a标签的属性id。有如下方法: jQuery("#easy").click(function()
jQuery选择器使得获得页面元素变得更加容易、更加灵活,从而大大减轻了开发人员的压力。如同盖楼一样,没有砖瓦,就盖不起楼房。得不到元素谈何其他各种操作呢?可见,jQuery选择器的重要性。当然想一下子掌握所有选择器也是很困难的,这个得靠实践和积累。 现在我们正式进入jQuery选择器的学习。我们将jQuery选择器进行分类学习,将jQuery选择器分为以下几种: 1、基本选择器 id                              根据元素ID选择 elementname       根据元素名称选择 classname            根据元素css ...
代码在网上可以找到,savemodel.c与loadmodel.c 我把网上的引用放在下面   最近一直在用matlab和libsvm,发现libsvm库用起来还是很方便的,就是没有模型直接保存到文件和读取模型的matlab接口(C++的接口有)。由于有会用的Opencv等C/C++库,所以数据交换比较麻烦。看了一下libsvm的svm.h、svm.cpp文件,发现有svm_save_model(),svm_load_model()等函数。于是乎用mex小做封装,写了两个matlab可以直接调用的接口。   保存svm model到文件:(savemodel.c)   [ ...
Global site tag (gtag.js) - Google Analytics