`

Java正则表达式实例

    博客分类:
  • java
阅读更多
题目

    有两个文件context.txt和words.conf,请尝试将他们合并成为一段文字,并打印出来。

文件内容

context.txt

“并不是每个人都需要$(qunar)自己的粮食,$(flight.1)每个人都需要做自己穿的$(flight.2),我们说着别人发明的$(hotel),使用别人发明的数学......我们一直在$(tuan)别人的成果。使用人类的已有经验和知识$(travel.1)来进行,是一件$(travel.2)的事情”


words.conf

flight=也不是:衣服

qunar=种植

hotel=语言

tuan=使用

travel=发明创造:很了不起


分析

    context.txt包含占位符(键)的文本,words.conf为键和值的映射,需要将占位符(键)替换为实际值。

context.txt

占位符都是以$开头,一对圆括号包围,$和()在正则表达式里有特殊含义,需要用反斜杠转义;里面的键虽然不同,但都是字符串(.序号)形式,可以使用\\w+(.\\d+)?

words.conf

值用冒号分开的,需要作为多个键值对处理,如flight=也不是:衣服,需要解析成flight.1=也不是,flight.2=衣服

方案

java.util.regex.Pattern

调用Pattern的compile方法,传入匹配占位符的正则表达式,返回一个Pattern实例。

java.util.regex.Matcher

调用Pattern实例的matcher方法,传入需要匹配的文本,返回Matcher实例。

接着就可以使用find()遍历所有匹配项,group()返回每个匹配文本,appendReplacement()追加从上一个匹配后开始,到该匹配之间的文本,并替换当前匹配部分,appendTrail()追加从最后一个匹配后开始,到文本结束之间的内容。


代码

public class CombineTwoFiles {
	public static void main(String[] args) throws IOException {
		Map<String, String> words = fetchWords(); // 读取键值对

		Pattern p = Pattern.compile("\\$\\((\\w+(.\\d)?)\\)"); // 匹配$(qunar)或$(flight.1)

		try (BufferedReader reader = new BufferedReader(new InputStreamReader(
				CombineTwoFiles.class.getResourceAsStream("context.txt")))) { // JDK7自动资源管理

			StringBuffer sb = new StringBuffer();

			String line = reader.readLine();
			while (line != null) {
				Matcher m = p.matcher(line);
				while (m.find()) { // 遍历匹配项
					String anchor = m.group(1); // group(0)返回整个文本,group(1)返回匹配正则表达式的文本,如果表达式中有括号,返回匹配第一对括号之间表达式的文本
					String value = words.get(anchor); //获取键对应的值
					if (value == null) { // 值不存在
						value = ""; // 赋值为空字符串,防止出现空指针异常
					}
					m.appendReplacement(sb, value); // 往sb追加自上个匹配后到此次匹配的文本,并将匹配项替换为对应值的文本
				}

				m.appendTail(sb); // 往sb追加自最后一个匹配后至末尾的文本
				line = reader.readLine();
			}

			System.out.println(sb.toString());
		} catch (Throwable t) {
			t.printStackTrace();
		}
	}

	private static Map<String, String> fetchWords() throws IOException {
		BufferedReader reader = null;
		Map<String, String> words = new HashMap<String, String>();

		try {
			reader = new BufferedReader(new InputStreamReader(CombineTwoFiles.class.getResourceAsStream("word.conf")));
			String line = reader.readLine();
			while (line != null) {
				String[] kv = line.split("=");
				if (kv.length == 2) {
					String[] vals = kv[1].split(":");
					if (vals.length > 1) { // 多个值
						int i = 1;
						for (String val : vals) {
							// 构造形如flight.1的键
							words.put(kv[0].concat(".").concat(String.valueOf(i++)), val); 
						}
					} else { // 单个值
						words.put(kv[0], kv[1]);
					}
				}
				line = reader.readLine();
			}
		} finally { // JDK7之前版本,释放资源的方式
			if (reader != null) {
				reader.close();
			}
		}
		return words;
	}
}
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics