`
thebigforest
  • 浏览: 21669 次
最近访客 更多访客>>
社区版块
存档分类
最新评论
文章列表
我想解析Rss,想用一个开源的程序,我选择了informa:http://informa.sourceforge.net/ 这个东西挺好的,但是为什么就是无法解析百度新闻的rss,这个郁闷死我了,我主要是想获取百度的新闻! 代码在这里: import java.io.File; import java.io.IOException; import java.util.Iterator; import java.net.MalformedURLException; import java.net.URL; import de.nava.informa.core.Channel ...
网上有好多的Nutch使用的文章,但其实只是几篇文章翻来覆去的拷贝而已! 1.Nutch 初体验 很经典,讲了nutch与lucene 以及其他一些爬虫的比较。和建立一个抓取企业内部网(Intranet crawling)实例。但是可能是版本的问题。其中少了关键的一步。 nutch是一个完整的搜索引擎,但是它只是一个搜索引擎他可以订制的东西太少!例如加中文分词好像要改动源文件,这样做对以后的升级维护都是麻烦。 <img src ="aggbug/1835336.aspx" width = "1" height = "1" /&g ...
平时总是在桌面上新建一个.txt文件来及一些琐碎的东西!每次都用Notepad。今天发现了一个有趣的应用。 那就是在文本的第一行写下“.LOG”,Notepad就会把它当作日志文件,每次打开的时候都会新建一行然后插入当前日期。 <img src ="aggbug/1823712.aspx" width = "1" height = "1" />
其实,这跟在跟在windows里设置没什么区别,在windows里面,我们运行startup.cmd,在ubuntu里面,我们运行startup.sh。就这么简单。下面,我说一下具体的步骤: 安装jdk <img src ="aggbug/1798870.aspx" width = "1" height = "1" />
看了自己动手做搜索引擎那本书,上面写的运行heritrix的方法挺麻烦的!后来发现bin文件夹里面本来就有一个heritrix.cmd的文件,我想着一定就是windows下的运行文件,运行了一下,提示输入用户名密码!查了一些资料原来是默认的配置文件有问题,将 %HERITRIX_HOME%\heritrix-1.12.1.jar 解压到临时目录,拷贝其中的profiles目录到 %HERITRIX_HOME%\conf\目录下。<img src ="aggbug/1797732.aspx" width = "1" height = "1&q ...
Eclipse作为一个开放的IDE有很多优秀的插件,用一个好的插件可以大大的提高我们的工作效率,插件的安装方法大体有以下几种:把插件文件直接覆盖到eclipse目录里是最直接也是最愚蠢的一种方法!使用link文件,就是把插件存放到任一的地方(例如/eclipse/MyPuls),然后。<img src ="aggbug/1787303.aspx" width = "1" height = "1" />
网上有很多类似“百度狗” 的元搜索引擎,他们抓取百度和google的搜索结果,然后合并在一个网页里。 且不说这样做有什么意义,但是这的确是一件好玩的事,自己想了一下原理,写了这样一个类,可以抓取百度里的搜索结果。 原理很简单: 通过搜索关键和页码字进入百度,例如“http://www.baidu.com/s?wd=搜索关键字&pn=页码(这里的页码计算公式是:10*(页码-1)) 找到真正有用的那一行,把信息读出来, 按照每一个项的特点把他们切开,例如URL前面都有“class=f”…… 然后存起来 下面是代码: <img src ="aggbug/1650 ...
  l .bash_history :记录了您以前输入的命令,   l .bash_logout :当您退出 shell 时,要执行的命令,   l .bash_profile :当您登入 shell 时,要执行的命令,   l .bashrc :每次打开新的 shell 时,要执行的命令。 <img src ="aggbug/1601192.aspx" width = "1" height = "1" />
l ll :将执行‘ls -l -k‘(以长格式列出目录内容,包括一些文件属性,并以 KB 而不是 byte 为单位显示文件大小)l ls :将执行‘ls -F --color=auto‘(列出目录内容,加上文件类型标识,并使用颜色)第三篇:命令的排列/命令的任务调度/命令的替换。将先在屏幕上列出目录中的所有内容,然后列出所有目录及其子目录所占磁盘大小。<img src ="aggbug/1601189.aspx" width = "1" height = "1" />
这些机器的操作系统由汇编语言、机器语言写成,所以运行起来效率很高,但都无法移植(unportable)。每家计算机公司都给自己的机器配上独有的操作系统,然后再销售。(Thompson 曾经参加了一个项目:MULTICS,Unix 是与这有关的一个玩笑词)其实,Dennis Ritchie 为这个新的操作系统设计了一种新的编程语言-- C 语言后,事情才真正开始。虽然 Unix 的效率不及原来的操作系统,但有三个突出的优点:可以任意移植到其他机器,其中的 C 语言大大简化了编程,而且这些都 free 。很快,全美国的大学都忙着开始为机器安装 Unix 。<img src ="agg ...
这里写的方法都是在 http://forum.ubuntu.org.cn 里面搜到的方法!安装传说中的livecd真不是吹得,光盘就像是 “深山红叶” 可以自动启动一个操作系统,但是神奇的是他还能在这个操 作系统里把自己安装了。安装方法其实真的是特别简单,只要记住选择手动分区,然后分两个区,一个是swap格式的,大小是512,如果是1G内存,那就设置成1G的。<img src ="aggbug/1598240.aspx" width = "1" height = "1" />
sudo pppoeconf 然后按照提示一步一步操作即可。 注意它会提示你是不是开机自动连接上网,选择是,每次开机就会自动拨号。 二、修改为国内源 我这里使用 cn99 的源比较快,使用哪个根据自己实际情况决定。 我这里只列出了使用得比较多的 lupaworld 源(http://mirror.lupaworld.com/)和 cn99 源(http://ubuntu.cn99.com/)。 <img src ="aggbug/1598037.aspx" width = "1" height = "1" />
ubuntu6.10 edgy已经发布许久了,edgy已经把xorg升级到了7.1,已经带有AIGLX了,对于安装compiz或者是Brtyl提供了极大的方便。其次 edgy把i686和K7/K8的核心整合在Generic一起了(据说有可能支持32/64位混合环境运算),nvidia-kernel- common是restricted模块的依赖(如果删除会导致一些硬件功能无法使用)。 NVIDIA 1.0-9631正式版驱动已经发布,增加了对于 GLX_EXT_texture_from_pixmap 的支持,可以直接使用Beryl了。 而且Beryl已经进入了亚洲官方和CN99的源,现在的版本 ...
在ubuntu下基本上只要apt-get 就可以了,但是有时候要尝鲜就得去另外下了,这时就要了解一些linux下安软件的知识了,所以在网上找了这篇文章 摘自:CnXHacker.Net 在Windows下安装软件时,只需用鼠标双击软件的安装程序,或者用Zip等解压缩软件解压缩即可安装。在Linux下安装软件对初学者来说,难度高于Windows下软件安装。下面我就详细讲解Linux下如何安装软件。 <img src ="aggbug/1597250.aspx" width = "1" height = "1" />
最简单的破解星空极速的方法 本人 在江西地区,其他地方不知道是不是也可以。 原版http://forum.ubuntu.org.cn/weblog_entry.php?e=1579&sid=0d7a5844b9ff9e4786ffe93f267b4c9c(红色地方有改动) 现看看具体的步骤吧 一:Windows XP 下的工作 1.安装星空极速2.5版本,记住版本好为2.5.0016V4(不要升级,升级以后就不好用了): <img src ="aggbug/1597247.aspx" width = "1" height = &quo ...
Global site tag (gtag.js) - Google Analytics