- 浏览: 679500 次
- 性别:
- 来自: 北京
文章分类
- 全部博客 (181)
- Matlab (16)
- Java (26)
- autoHotkey (4)
- openCV (1)
- C++ (50)
- PDF-XChange Viewer (2)
- 学术 (11)
- javascript (4)
- linux (11)
- SWT (9)
- latex (7)
- GAE (2)
- windows (6)
- C# (3)
- PS (20)
- JNI (4)
- latex,批处理 (0)
- 批处理 (4)
- Android (5)
- 矩阵论 (1)
- SVM (1)
- 概率图模型 (0)
- Python (12)
- Eigen (5)
- 编程题 (1)
- MKL (1)
- 神经网络 (9)
- 最优化 (2)
- 摄影 (1)
- PPT (0)
- After Effects (3)
- CUDA (3)
- caffe (0)
- MXNet (2)
- svn (1)
- R (0)
- 虚拟机 (0)
- tensorflow (7)
- theano (1)
- Keras (1)
- vim (1)
- xgboost (1)
- spark (6)
- eclipse (2)
- word2vec (0)
- hadoop (1)
- dmlc (1)
- git (0)
最新评论
-
jeffersonz:
请问大神,这个插件记录下来的脚本为什么不能再Extendscr ...
PhotoShop - 记录PS的所有操作为JavaScript代码 -
cherishLC:
Andy__Zou 写道cherishLC 写道Andy__Z ...
Eigen的编译选项;MKL的使用 -
Andy__Zou:
cherishLC 写道Andy__Zou 写道cherish ...
Eigen的编译选项;MKL的使用 -
cherishLC:
Andy__Zou 写道cherishLC 写道Andy__Z ...
Eigen的编译选项;MKL的使用 -
Andy__Zou:
cherishLC 写道Andy__Zou 写道 您好,您的工 ...
Eigen的编译选项;MKL的使用
在使用Citeulikehttp://citeulike.org/导出bib文件时,发现导出的文件在WinEdt中无法被识别。。。也就是\cite{}后不弹出提示
后来发现是有中文文献的缘故。。。。干脆写了个小程序去除中文字符。
顺带去除citeulike开头的行。
程序功能:
编译好的Jar文件见附件
后来发现是有中文文献的缘故。。。。干脆写了个小程序去除中文字符。
顺带去除citeulike开头的行。
程序功能:
- 删除当前文件夹下的bib文件中以"citeulike" 开头(不含空格)的行
- 非ASCII字符的行。
- 原文件名称加.origin
- 生成的文件与原文件同名
编译好的Jar文件见附件
package lc.bibtex; import java.io.*; import javax.swing.JOptionPane; public class DealWithCiteulikeBibFile { //删除当前文件夹下的bib文件中以"citeulike" 开头(不含空格)的行,以及非ASCII字符的行。 //原文件名称加.origin;生成的文件与原文件同名 public static void main(String[] args) throws IOException { //找到.bib文件 File[] bibFiles = new File(".").listFiles(new FileFilter() { @Override public boolean accept(File pathname) { return pathname.isFile() && pathname.getName().endsWith(".bib"); } }); String[] toDelete = { "citeulike" };//删除以 "citeulike" 开头的行 boolean deleteNotASCII = true;//删除含非ASCII字符的行,否则ctex读取错误。。。。 boolean deleteOriginFileIfNoChange = true;//如果生成的文件与原文件相同,则删除原文件 for (File f : bibFiles) { File bak = new File(f.getCanonicalPath() + ".origin"); if (bak.exists()) bak.delete(); boolean b = f.renameTo(bak);//现在备份文件为原文件了!! if (!b) { JOptionPane.showMessageDialog(null, "文件 " + f.getName() + " 或文件 " + bak.getName() + "可能正被其他程序访问!"); continue; } deleteLinesNotASCII_or_StartWith(bak, f, toDelete, deleteNotASCII, deleteOriginFileIfNoChange); } } /** * 删除除空格外以toDelete中字符串开头的单词(可选),以及含有非ASCII字符的行(可选) * * @param originFile * 原文件 * @param newFileName * 输出文件 * @param toDelete * 删除除空格外以toDelete中字符串开头的单词,toDelete可为null,视为不选该项 * @param deleteNotASCII * 是否删除含非ASCII字符的行 * @param deleteOriginFileIfNoChange * 当新文件和原文件相同时,是否删除原文件 * @throws IOException */ public static void deleteLinesNotASCII_or_StartWith(File originFile, File newFile, String[] toDelete, boolean deleteNotASCII, boolean deleteOriginFileIfNoChange) throws IOException { BufferedReader bf = new BufferedReader(new FileReader(originFile)); PrintWriter writer = new PrintWriter(newFile); boolean hasChanged = false; loop: while (bf.ready()) { String line = bf.readLine(); String lineTrim = line.trim(); if (toDelete != null) for (int i = 0; i < toDelete.length; i++) {//删除除空格外以toDelete中字符串开头的单词 if (lineTrim.startsWith(toDelete[i])) { hasChanged = true; continue loop; } } for (int i = 0; i < lineTrim.length(); i++) {//删除该行中含有非ASCII字符的行 if (lineTrim.charAt(i) > 127) { hasChanged = true; continue loop; } } writer.println(line); } bf.close(); writer.close(); if (!hasChanged && deleteOriginFileIfNoChange) originFile.delete(); } }
- bibFileRewriter.jar (10.1 KB)
- 下载次数: 0
发表评论
-
thuthesis编译心得
2016-04-13 21:45 1823本人使用CTex编译,, 1、升级CTex CTex2012 ... -
lambda表达式
2014-08-20 21:47 1875仅作备忘,要学习还是看给的链接吧 1、C++ 中文介绍:htt ... -
利用Doxygen生成C++、Java文档
2013-04-08 16:15 4383示例程序、配置文件及doxygen常见参数文字版参见本文附件 ... -
Latex 公式符号等
2012-12-20 12:08 0必然都是要在数学环境中才能使用的,偶尔忘了很悲催。。。。 1 ... -
使用jsoup分析网页
2012-12-05 16:12 2648之前用过HTMLParser,许久不更新的东西了,印象中也没那 ... -
将Excel表格转化为Latex表格——采用Excel2LaTeX
2012-11-29 11:07 26751用latex写表格很麻烦,发现可以自动从Excel生成late ... -
Latex模板,分文件夹存放图片,含转换png、jpg为eps的批处理文件;含删除中间文件的批处理
2012-11-19 10:53 2820模板功能: 1、图片文件分文件夹存放 2、自动转换png、jp ... -
JNI中基本类型数组的传递方法(无需拷贝数据!!!)
2012-10-23 17:11 182420、先来看一下主要用到哪些函数: GetIntArrayEle ... -
swig--在java、C#中调用c++写的DLL(以vs2012配置为例)
2012-10-02 22:06 70521、下载、安装: 到http://www.swig.org/d ... -
GAE学习笔记——静态文件、资源文件;GAE中使用velocity模板
2012-07-13 21:49 1409参考资料:https://developers.google. ... -
Google application engine 的Eclipse配置方法
2012-07-11 19:52 15161、安装google的eclipse插件 到https://d ... -
winEdt快捷键设置、自定义快捷键
2012-07-10 21:18 6900在ctex2.9下测试通过 1、自定义WinEdt快捷键 1 ... -
Latex技巧及资料
2012-06-07 19:05 2804一、技巧 1、winedt拷贝到别的程序出现乱码: 在wine ... -
自用的Latex模板,含算法包的使用
2012-06-07 18:49 5147其实就是拿来IEEETrans的模板,删了注释,方便使用而已, ... -
javadoc命令
2012-04-06 14:54 1358以下内容引用自(原文更全):http://hi.baidu.c ... -
java7文件夹监控
2012-04-04 11:23 2926java7的文件夹监控真是太烂了,折腾了一天,封装的差不多了, ... -
SWT学习笔记——JFace中TableViewer的使用及注意事项
2012-04-01 15:26 3377问题: 1、使用CellEditor ... -
SWT学习笔记——JFace中TableViewer的使用及注意事项
2012-04-01 14:52 0问题: 1、使用CellEditor时出现org.eclips ... -
SWT学习笔记——SWT、JFace的配置(含源代码、javadoc的获取)
2012-04-01 14:08 2436具体的可以看官方的http://wiki.eclipse.or ... -
SWT学习笔记7——组件背景图片,鼠标事件,鼠标样式
2012-03-31 11:00 3653import org.eclipse.swt.grap ...
相关推荐
python库。 资源全名:citeulike_api-0.1.3dev.tar.gz
资源来自pypi官网。 资源全名:citeulike_api-0.1.1dev.tar.gz
NULL 博文链接:https://blackproof.iteye.com/blog/2117469
近些年,科研社交网站中的科技论文数量呈现出爆炸式增长的趋势,用户很难发现符合自己要求的科技论文,而科技论文推荐正是解决这个问题的有效方法之一 。但是现有科技论文推荐方法大多专注于评分预测的准确性,忽视...
针对现存的基于标签的社会化推荐系统在构建用户兴趣模型...通过在CiteULike数据集上进行实验, 并与传统的基于标注的推荐方法进行比较, 实验结果表明, TTRR模型能够更好地反映出用户的偏好, 能够显著地提高推荐准确度。
现有的标签推荐方法大多根据标签在对象中出现的次数来表示用户,标签与资源之间的关系。这种方法对标签信息的利用过于简单,导致最终的推荐结果的准确度和召回率不高。基于这个问题,提出一种采用图模型的个性化标签...
在Matlab下运行lib / mainEvaluate.m 其他材质 有关该作品的更多详细信息和一些直接扩展,请参见。 完整CDL的Matlab版本:。 简化CDL的MXNet版本:。 数据: 。 幻灯片:和。 其他实现(第三方): 经过 。 经过 。 ...
应用潜在因子模型和矩阵分解方法对原始网络用户行为数据补充缺失值,根据网络用户行为数据的属性特征进行用户行为聚类并在聚类过程中增加行为特征,同时利用行为特征信息产生簇标签以提高网络用户行为的聚类准确性。...
针对现存的基于标签的社会化推荐系统在构建用户兴趣模型时存在的缺陷, 提出一种综合标签及其时间信息的资源推荐(TTRR)模型。...通过在CiteULike数据集上进行实验, 并与传统的基于标注的推荐方法进行比较, 实验结果表
citeulike180.tar.gz - 从CiteULike抓取的 180 个出版物,以及保存这些出版物的不同 CiteULike 用户分配的关键字 SemEval2010-Maui.zip - Maui 格式的关键数据 keyphrextr.tar.gz - 使用 SemEval-
基于标签的文献组织和浏览方式,黄燕京,张铭,随着web2.0技术的发展,出现了越来越多的社会标注系统(如Del.icio.us、Flickr、YouTube、CiteULike)。这些系统帮助用户管理和共享资源,并且
项目中推荐系统的主要部分 TagRec 是多个推荐系统框架或课程列表的一部分,例如 、 和 描述 (请)的目的是为社区提供一个简单易用的通用标签推荐器框架,用 Java 编写,以评估具有一组众所周知的标准的新颖标签推荐...