直接看代码:
String str = "Do as I say , not as I do";
str = str.toLowerCase();
str = str.replaceAll("[^A-Za-z]", " ");
str = str.replaceAll("\\s+", " ");
String [] s = str.split("\\s+");
Map<String,Integer> hashmap = new HashMap<String ,Integer>();
for(String s1 : s){
String key = s1;
if(hashmap.get(key)!=null){
int value = ((Integer)hashmap.get(key)).intValue();
value ++ ;
hashmap.put(s1, value);
}else{
hashmap.put(s1, 1);
}
}
for(Map.Entry entry : hashmap.entrySet()){
System.out.println(entry.getKey()+": "+entry.getValue());
}
分享到:
相关推荐
实现统计一段文章的每个单词的个数 其中CountDemo使用STL中的Map来实现的 CountDemo2是用一般语言实现,没有用到STL实现的; MapCount是用STL中的Vector和Map共同实现的 此题目是学习STL中的Map和Vector必练的经典...
为了统计词汇出现频率,最简单直接的做法是另外建一个Map:key是单词,value是次数。将文章从头读到尾,读到一个单词就到Map里查一下,如果查到了则次数加一,没查到则往Map里一扔。这样做虽然代码写起来简单,但...
5、 利用Set统计某字符串(可直接设定, 单词间用空格隔开)有多少单词,利用map统计该字符串中每个单词都出现几次。
单词统计的MapReduce源码,统计多个文本数据集,最终输出每个单词的出现次数,可帮功能扩展修改 Map阶段 采集数据 Combiner阶段 合并数据 Reduce阶段 最终处理,进行排序等自定义操作 每个阶段都会打印对应的数据...
用c++中的关联容器map来统计一个文件文件中,各单词出现的次数(c++),其中各单词义空格分开。
统计文本单词频率,使用了STL里的map。
用c++完成文本单词查询使用vector map set完成查询
本程序用c++标准库中的快速排序算法以及容器map和multimap实现了对文件中出现频率靠前的单词进行了统计,至于文件大小取决于你机器所剩的内存数,如果文件数据时海量的(上亿)则本程序可能不适合,需要按照海量数据...
给定一篇英语文章,要求统计出所有单词的个数,并按一定次序输出。思路是利用go语言的map类型,以每个单词作为关键字存储数量信息,代码实现如下: package main import ( "fmt" "sort" ) func wordCounterV1(str...
下面是具体的实现代码,实现了从importthis.txt文件读取单词,并统计出现次数最多的5个单词。 # -*- coding:utf-8 -*- import io import re class Counter: def __init__(self, path): """ :param path: 文件...
输入n个单词,统计各个单词出现的个数 #include #include <map> #include using namespace std; int main() { map<string> k; string word; while(cin>>word) ++k[word]; for(map<string>::iterator i=k...
HashMap的应用实例 Map中元素存放是无序的 HashMap注意事项: 1,HashMap底层维护一个数组,我们向HashMap中所放置的对象实际上是存储在该数组...HashMap应用举例:控制台输入一句英语,简单统计各个单词出现的次数
map传输数据,自己构造的排序函数,自己写的读文件,写文件函数
WordCount单词统计 1 代码实现 2 目 录 一个非常经典的MapReduce案例——WordCount单词统计。 什么是MapReduce 一、WordCount单词统计 二、代码实现 对于map函数的方法。 Mapper的实现 public void map(Object key, ...
主要给大家介绍了关于如何巧用HashMap一行代码统计单词出现次数的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
3. mapping : 并行将每一行按照空格进行拆分,拆分得到的 `List(K2,V2)`,其中 `K2` 代表每一个单词,由于是做词频统计,所以 `V2` 的值为 1,代表出现 1 次; 4. shuffling:由于 `Mapping` 操作可能是在不同的机器...
下面以一个统计单词次数简单案例为例: 数据源 Map类 import java.io.IOException; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper; //...
接下来在 combiner 中,我们统计每个单词的 value 并加起来为 sum,并把原来 key 中的文件名剥离出来与sum 合并为新的 value(text),把单词设为 key(text)。 最后在 reduce 中,我们对每个词的 value 用“:”...
MR对很大的数据统计所有单词出现的次数的过程 分为四个步骤 splitting mapping(java线程执行分析数据片段,并发的同时执行)(根据写的代码执行)(将split中的每个单词都取出来,单词的本身作为键,1作为值