`
songxiangchao
  • 浏览: 25051 次
  • 来自: 北京
最近访客 更多访客>>
社区版块
存档分类
最新评论

Java统计文档中英文单词个数

    博客分类:
  • Java
阅读更多
public class CountWords {
	public static void main(String[] args) {
		BufferedReader br = null;
		try {
			br = new BufferedReader(new FileReader("english.txt"));
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		}
		StringBuffer sb = new StringBuffer();
		String line = null;
		try {
			while((line = br.readLine()) != null) {
				sb = sb.append(line);
			}
		} catch (IOException e) {
			e.printStackTrace();
		}
		try {
			br.close();
		} catch (IOException e1) {
			e1.printStackTrace();
		}
		
		Pattern pattern = Pattern.compile("[a-zA-Z']+");
		Matcher matcher = pattern.matcher(sb);
		Map<String, Integer> map = new HashMap<String, Integer>();
		String word = "";
		Integer num = null;
		int total = 0;
		
		while(matcher.find()) {
			word = matcher.group();
			total ++;
			if(map.containsKey(word)) {
				num = map.get(word);
				num += 1;
			} else {
				num = 1;
			}
			map.put(word, num);
		}
		
		PrintWriter pw = null;
		try {
			pw = new PrintWriter(new FileWriter("result.txt"), true);
		} catch (IOException e) {
			e.printStackTrace();
		}
		Iterator<String> iterator = map.keySet().iterator();
		while(iterator.hasNext()) {
			String tmp = iterator.next();
			pw.println(tmp  + " : " + map.get(tmp));
		}
		pw.println("total words : " + total);
		pw.println("different words : " + map.size());
		pw.close();

	}
}
分享到:
评论

相关推荐

    文本英文单词统计

    可以用简单的图形界面显示文本所有英文单词的数目,并可以查询固定单词的个数

    统计一篇文档中每个单词出现的次数,频率

    从一片文档中提取出所有的单词(word),然后计算每个单词出现的频率(次数),按照一定的次序将排序好的单词以“word(频率)”的形式打印出来。 可以按照频率高低,或者单词顺序打印所有出现的单词。

    java学习之英文词汇

    文档中记录了Java基础常见英语词汇,方便童鞋们学习java

    java词频统计

    1. 读取文档并分词。要求给定一篇.txt英文文档,计算机读入并统计该篇文章由哪些词组成,按字母顺序输出出现过的词已经每个词的出现频率。

    JAVA编程中常用的英文单词词汇汇总.doc

    JAVA编程中常用的英文单词词汇汇总.doc

    Java词频统计程序

    统计文本文档中汉字、字母、数字等的频次,并输入到新的文本文档中去。

    java代码-用正则去除文本中的英文字母,去除英文句子, 去除代码

    java代码-用正则去除文本中的英文字母,去除英文句子, 去除代码

    文本文件上传分析英文单词

    1、安装jdk(java运行环境) 双击:jdk-7u79-windows-x64.exe 默认安装即可 ...注意,例如,选择“单数转复数”,结果有tool、tools,会将tool的统计结果加到tools上,结果显示一个tools项,若没有tools,则tool项不处理

    使用Java实现一个基于内存的英文全文检索搜索引擎【100012394】

    与关系必须返回同时包含这二个单词的文档集合,或关系返回包含这二个单词中的任何一个的文档集合; 可以计算每个命中的文档的得分,并根据文档得分对结果集排序; 在控制台显示命中的文档的详细信息,如文档的路径、...

    java读写文件

    NULL 博文链接:https://yuhang-java.iteye.com/blog/777625

    java环境搭建.docx

    2.java中标识符由26个英文字符大小写,数字0-9,符号_$。注意:数字不能开头。 3.java中是严格区分大小写。 4.在实际写程序的过程中定义标识符遵守“见名之意”。   类名和接口的规范: 每个单词的首字母大写...

    Java面试宝典2010版

    1、编写一个程序,将a.txt文件中的单词与b.txt文件中的单词交替合并到c.txt文件中,a.txt文件中的单词用回车符分隔,b.txt文件中用回车或空格进行分隔。 2、编写一个程序,将d:\java目录下的所有.java文件复制到d:\...

    百度翻译源码java-pocketTranslator:自动识别英文或日文单词并实时翻译成中文的程序

    一个自动识别英文或日文单词并实时翻译成中文的程序。 背景 我在工作和学习中都必须阅读大量英文或日文文件。 当我遇到一些不熟悉的词时,我不得不去百度(中文谷歌)进行翻译。 我发现复制粘贴单词,打开浏览器,在...

    Java程序员常用英语单词800+

    高频词就是出现频率很高的单词,它们是我用软件从Java API中常用的5个包(lang, util, io, net, sql)整理的,涉及的文档有1702个。单词的意思大多不是通用的,已经选取了计算机软件开发语境下的含义。

    Java面试宝典-经典

    1、编写一个程序,将a.txt文件中的单词与b.txt文件中的单词交替合并到c.txt文件中,a.txt文件中的单词用回车符分隔,b.txt文件中用回车或空格进行分隔。 61 2、编写一个程序,将d:\java目录下的所有.java文件复制到d...

    java面试题大全(2012版)

    1、编写一个程序,将a.txt文件中的单词与b.txt文件中的单词交替合并到c.txt文件中,a.txt文件中的单词用回车符分隔,b.txt文件中用回车或空格进行分隔。 61 2、编写一个程序,将d:\java目录下的所有.java文件复制到d...

    Java 2实用教程(第三版)实验指导与习题解答

    实验2 统计英文单词字 53 实验2 读取Zip文件 56 上机实践10 Java 中的网络编程 57 实验1 读取服务器端文件 57 实验2 使用套接字读取服务器端对象 59 实验3 基于UDP的图像传输 62 上机实践11 数据结构 66 实验1 扫雷...

    最新Java面试宝典pdf版

    1、编写一个程序,将a.txt文件中的单词与b.txt文件中的单词交替合并到c.txt文件中,a.txt文件中的单词用回车符分隔,b.txt文件中用回车或空格进行分隔。 61 2、编写一个程序,将d:\java目录下的所有.java文件复制到d...

    Java面试笔试资料大全

    1、编写一个程序,将a.txt文件中的单词与b.txt文件中的单词交替合并到c.txt文件中,a.txt文件中的单词用回车符分隔,b.txt文件中用回车或空格进行分隔。 61 2、编写一个程序,将d:\java目录下的所有.java文件复制到d...

Global site tag (gtag.js) - Google Analytics