用java实现"awk -d"功能(保留多行重复)

macrochen

浏览: 2444702 次
性别:
来自: 杭州

最近访客更多访客>>

beifengbei08

teaklee

吴志新

u012363178

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Java

Java Ruby 脚本 Linux F#

一般用过linux脚本的都知道"awk -d"的用法: 只显示有重复数据行，每种重复行只显示其中一行.

而我的需求是希望显示所有的重复行, 而不是只是一行. 因为目前对shell脚本不是很熟练, 下面是java代码的实现,感觉比想象的复杂, 备忘一下:

public class ReadCardCode {
    public static void main(String[] args) throws Exception {
        BufferedReader reader =
                new BufferedReader(new FileReader("sort.log"));
        BufferedWriter writer1 =
                new BufferedWriter(new FileWriter("result.log"));
        BufferedWriter writer2 =
                new BufferedWriter(new FileWriter("result-2.log"));
        int count = 6;
        int i = 0;
        String current = null;
        String curItemId = null;
        // 将同一商品的所有记录取出放到一边, 如果这些记录大于1则说明有重复, 输出. 否则抛弃
        List<String> lineList = new ArrayList<String>(10);
        try {
            while ((current = reader.readLine()) != null) {
                String[] curArray = current.split(" ");
                if (curItemId == null) { // 首行
                    lineList.add(current);
                } else { // 下一行
                    if (curArray[2].equals(curItemId)) { // 相同行加入列表
                        lineList.add(current);
                    } else {
                        writeLineList(writer1, writer2, lineList);
                        // 下一轮首行
                        lineList.clear();
                        lineList.add(current);
                    }
                }

                curItemId = curArray[2];

                // if (i++ > 6) {
                // break;
                // }
            }
            writeLineList(writer1, writer2, lineList);
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            try {
                writer2.close();
                writer1.close();
            } catch (Exception ee) {
                ee.printStackTrace();
            }
        }
    }

    private static void writeLineList(BufferedWriter writer, BufferedWriter writer2, List<String> lineList)
            throws IOException {
        if (lineList.size() > 1) { // 输出前面相同行
            for (String line : lineList) {
                write(writer, writer2, line);
            }
        }
    }

    private static void write(BufferedWriter writer, BufferedWriter writer2, String str) throws IOException {
        BufferedWriter w = writer;
        // String[] curArray = str.split(" ");
        // String itemId = curArray[2].replace("itemId=", "");
        // long route = Long.valueOf(itemId) % 2;
        // if (route == 1) {
        // w = writer;
        // } else {
        // w = writer2;
        // }
        w.write(str);
        w.newLine();
        w.flush();
    }
}

分享到：

关于sonar | 《java并发编程实践》读书笔记(3)

2010-06-07 21:48
浏览 3021
评论(2)
分类:编程语言
查看更多

2 楼 night_stalker 2010-06-08

用 stdio 更通用

gets("\0").lines.group_by{|l|l[/:.+/]}.each{|_,v|puts v if v[1]}

调用：

ruby p.rb < sort.log > result.log

1 楼 RednaxelaFX 2010-06-07

也就是说Ruby脚本的话：

open('result.log', 'w') {|f| File.readlines('sort.log').group_by {|l| l.split[2]}.each {|_, v| f << v if v.size > 1} }

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

用java实现"awk -d"功能(保留多行重复)

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

用java实现"awk -d"功能(保留多行重复)

评论

发表评论

相关推荐

使用Externalization更高效的实现java对象序列化

关于java的检查异常和非检查异常

使用ThreadLocal保证DateFormat线程安全

使用枚举实现一个状态机

一个同步队列例子

一个读写锁的例子

如何计算一个合适的线程池大小参数

正确使用日志的10个技巧

Java编程最差实践

利用jOOR简化Java 反射使用

《Java Performance》书评

《细说Java》读书笔记

《Java开发超级工具集》读书笔记

《effective java》 读书笔记

关于方法返回值的两种处理模式

JVM调优汇总

log4j的输出转换模式

java正则表达式用法举例

Ibatis TypeHandler使用总结

ibatis参数传递小技巧

最近访客更多访客>>

《effective java》读书笔记