`
icenows
  • 浏览: 56046 次
  • 性别: Icon_minigender_1
  • 来自: 上海
最近访客 更多访客>>
社区版块
存档分类
文章列表
现在有一个项目的计算量比较大,最后决定放到系里的集群上去运行。林老师说使用ssh会遇到一个问题,就是如果ssh连接断开了,那么程序也就终止了,——所以应该使用screen来管理。参照man手册和网上的一些资料实践了一下,现把这个过程记录如下。 ——实践的内容是,远程连接到服务器,使用wget开始下载,接着关闭终端。然后重新连接到服务器上去,看进程是否被终止。   1、ssh远程登录 $ssh xu@222.204.***.*** ssh xu@222.204.***.***'s password:******   2、启动一个开始就处于断开模式的会话 $screen -d -m ...
转载自:http://dahua.spaces.live.com/blog/cns!28AF4251DF30CA42!2496.entry 前面几篇谈了一些对数学的粗浅看法。其实,如果对某门数学有兴趣,最好的方法就是走进那个世界去学习和体验。 这里说说几本我看过后觉得不错的数学教科书。 1. 线性代数 (Linear Algebra): 我想国内的大学生都会学过这门课程,但是,未必每一位老师都能贯彻它的精要。这门学科对于Learning是必备的基础,对它的透彻掌握是必不可少的。我在科大一年级的时候就学习了这门课,后来到了香港后,又重新把线性代数读了一遍,所读的是 Intro ...
基本算法思路:WORDNET相似度计算算法 1、使用关系: 同义关系,is-a关系,part-of关系 2、概念之间以同义集关系进行跳转。 如果两概念之间为同义集关系,则直接计算, 否则同义集之间的关系跳转使用is-a关系和part-of关系 3、概念深度的计算考虑单关系(is-a关系)单向(从根结点到待测节点)开始扫描; 4、两个词语的相似度最终可以表示为:f(最短路径的路径权重,起止点深度对应的深度权重),具体的计算公式还需要再确认一下。 注意事项: 待测试的概念对可以指定所属同义集,也可不指定,此时用所有包含该概念的同义集集合作为待测概念;
为了不被wordnet的API所限制,为了不用每次都拿着文档一个一个单位的比对,为了某某某的相似度计算不再计算的头昏眼花,为了我自己之后可能会用到wordnet。In a word,在如此强大的需求之下,我终于决定把wordnet的数据库文件解 ...
运行~$ sudo gedit /etc/vmware/config 在最后加上 xkeymap.nokeycodeMap = true 然后重启vmware ~$ sudo /etc/init.d/vmware restart 即可解决
这里写一下整个数据库的备份和导入方法,具体的操作细节以及相关参数解析参见man mysqldump 1、备份 ~$ mysqldump database > destination -u user -p 示例: ~$ mysqldump PaperXuOne > /home/xu/me.sql -u root -p 2、导入 假设我们要将刚才备份的数据库保存到新的数据库me中,则按照下面的操作: ~$ mysql -u root -p Enter password:****** mysql>use me; mysql>s ...
1、从光盘制作光盘镜像文件。将光盘放入光驱,执行下面的命令: #cp /dev/cdrom /home/xu/cd.iso 或 #dd if=/dev/cdrom of=/home/xu/cd.iso 2、将文件和目录制作成光盘镜像文件,执行下面的命令: # mkisofs -r -J -V paper -o /home/xu/paper.iso /home/xu/paper 其中,paper为卷标,/home/xu/paper.iso为镜像目标位置,/home/xu/paper为需要放到镜像中的文件夹,-r参数表述递归包括文件夹中的所有文件。 3、光 ...
作为备份,免得每次都去 google。对gnome比较熟悉,所以以此为例。 1、安装 X 窗口系统:sudo apt-get install x-window-system-core 2、安装登录管理器:sudo apt-get install gdm 3、 安装桌面环境或窗口管理器,仅安装最基本的组件:sudo apt-get install gnome-core
抱怨了很久的分词问题,后来发现Stanford的一个中文分词软件非常不错,就想拿来看看效果怎么样。 由于这个软件实在是太强大了,我也来不及去仔细分析,只是把DEMO研究了一下,看了下相关的3,4个类,利用API写了一段批量处理的示例代码。 ——这个分词软件有一个学习的过程,使用条件随机场方法,所以不把这一部分剥离处理恐怕处理大规模数据的时候就太慢了。 直接上代码吧。 package Test; import java.util.List; import java.util.Properties; import java.util.zip.GZIPInputStrea ...
I’ve listened for several times,but I cannot ensure to be the same,but the main meaning . See follows: This regiment was formed last summer in Maine. There was 1000 of us then There are less than 300 of us now All of us volunteered to fight for the Union,just as you did Some came mainly ...
分析新浪新闻时候出现的诡异问题,用IE/FF都能正常解析,可是我不知道这东西是怎么解析出来的。 待测URL:http://news.sina.com.cn/w/p/2009-03-24/013217465583.shtml 使用JAVA中的URL类,读取出来的源代码 <HTML> <HEAD> <META HTTP-EQUIV=”Refresh” CONTENT=”0;URL=http://news.sina.com.cn/w/p/2009-03-24/013217465583.shtml”> </HEAD> &l ...
转载自:http://klqingshui.blog.163.com/blog/static/149118222008102292455456/ 对AI领域的会议的评点 The First Class: tier-1的conferences, 其实基本上就是AI里面大家比较公认的top conference. 下面同分的按字母序排列. IJCAI (1+): AI最好的综合性会议, 1969年开始, 每两年开一次, 奇数年开. 因为AI实在太大, 所以虽然每届基本上能录100多篇(现在已经到200多篇了),但分到每个领域就没几篇了,象machine learning、comp ...
关于如何评价关键词算法的效率,师姐建议采用借用搜索引擎的召回率和准确率来统计,——人工选择N个关键词,再自动抽取N个关键词进行比较。但是在最后的实现过程中发现,这种N:N的方法是不太恰当的,最明显的结果是召回率=准确率。 另一方面,手动关键词的选取也值得商榷,限定提取N个关键词的办法似乎不是很好,问题在于究竟应该选取一个多大的N?——我在做测试集的时候就有这一困惑,有的新闻实在提取不出10个关键词,有的似乎还不止这个数目。 基于此,我想对这种方法作一些调整。通过调整相关参数,最终的目的是要在召回率和准确率之间获得一个比较好的结果。 一方面,手工提取关键词的过程中,可以自由选择关键词的数量。 ...
摘抄自《软件工程(第八版)》Page83 —— ISBN 978-7-111-20459-6 1、引言 1.1 需求文档的目的 1.2 产品范围 1.3 定义、首字母缩写词和缩略词 1.4 参考文献 1.5 文档的其余部分概览2、一般描述 2.1 产品透视 2.2 产品功能 2.3 用户特征 2.4 一般约束 2.5 假设和依赖性3、专门需求 覆盖功能,非功能和接口需求 ——显然,这是文档中最实质性的部分,但是因为在组织的实践中存在极大的变数,对这一节定义标准的结构是不适当的。需求 ...
无聊的五一天天在实验室呆着,也好,总算把drupal的入门教程看完了。——看着小师妹一天到晚得忙着毕业论文,心里也平衡一点。 我在自己的电脑上搭建了一个测试系统,主要来说,还是以熟悉drupal的一些基本概念,基本功能为主。 参照另一篇文章提到的drupal架构,所有模块的功能都建立在对基本节点的控制上。drupal用node作为系统的基本单元,表现所有内容的特征。同时,系统允许对节点属性进行设置,以及自定义node类型。 系统的核心模块可以满足我们的大部分需求。包括blog,forum,rss,serach,contact&message,books. 其中特别说明一下bo ...
Global site tag (gtag.js) - Google Analytics