`
RednaxelaFX
  • 浏览: 3019408 次
  • 性别: Icon_minigender_1
  • 来自: 海外
社区版块
存档分类
最新评论

将Comiket物的文件名格式统一化的脚本

    博客分类:
  • Ruby
阅读更多
又到了Comiket大潮,抓下来的文件的名字总是格式不统一,按照文件名排序来查看很不方便。于是又到了出动Ruby的时间~
(每次到批量重命名文件的时候我的第一反应就是打开irb……)
这次的脚本在好几个类别的目录下都能用,所以顺便记下来。

脚本作用:将类似"(Cxx)(item_type)[circle_name] item_name"的文件名中开头部分的空格调整到:前缀标签间不包括空格,标签整体与后面的文件名之间留一个空格。普通文件和目录都是重命名的目标。不符合这种带有两组圆括号和一组方括号为前缀标签的文件则不在重命名目标范围内。我一般是用另外的脚本来把顺序都倒到这个顺序上然后再一起抽掉空格。
限制:如果文件名中出现了在当前系统locale下无法显示出来的字符,那么那个文件的重命名会失败;重命名失败不会影响后续循环,失败的文件名会显示到stderr。反正有特殊字符的文件/目录不会很多,暂时就手工修改算了 OTL
Ruby 1.8自身的编码是有点问题,而Ruby 1.9的字符串虽然能用UNICODE,但在执行这种操作的时候似乎还是处理不了。怪哉,可能我没写对还是怎样。回头再试试看。

#!/usr/bin/env ruby

def reformat_comiket_folder(dir='.')
  Dir.entries(dir).each do |p|
    begin
      if p =~ /^\(([^)]+)\)\s*\(([^)]+)\)\s*\[([^\]]+)\]\s*(.+)$/
        File.rename p, "(#{$1})(#{$2})[#{$3}] #{$4}"
      end
    rescue SystemCallError
      $stderr.puts 'IO failed: ' + $!
    end
  end
end

if __FILE__ == $0
  reformat_comiket_folder ARGV[0] || '.'
end


其实用这脚本心里有点痒……又想起之前在写的重命名工具了。找个时间把它写完就好了 T T

========================================================================

当然咯,用C#来写这个程序就不会出现编码问题。采用跟上面相似的逻辑,重写为:

using System;
using System.IO;
using System.Linq;
using System.Text.RegularExpressions;

sealed class ReformatComiketFiles {
    static bool TryGetRenameName(
        Regex pattern,
        string input,
        string format, // format items in this param correspond to match.Groups[1..$]
        out string result ) {

        var match = pattern.Match( input );
        if ( match.Success ) {
            var str = string.Format( format,
                                     match.Groups
                                         .Cast<Group>( )
                                         .Skip( 1 )
                                         .Select( g => g.Value )
                                         .ToArray( ) );
            result = str;
            return str != src; // using a local variable here saves an indirect read
        } else {
            result = input;
            return false;
        }
    }

    static void Main( string[ ] args ) {
        DirectoryInfo root;
        if ( 0 < args.Length ) {
            root = new DirectoryInfo( args[ 0 ] );
        } else {
            root = new DirectoryInfo( Environment.CurrentDirectory );
        }
        var pattern = new Regex( @"^\(([^)]+)\)\s*\(([^)]+)\)\s*\[([^\]]+)\]\s*(.+)$" );

        foreach ( var dir in root.GetDirectories( ) ) {
            string dest = null;
            if ( TryGetRenameName(
                    pattern,
                    dir.Name,
                    "({0})({1})[{2}] {3}",
                    out dest ) ) {
                Console.WriteLine(dest);
                dir.MoveTo( Path.Combine( dir.Parent.FullName, dest ) );
            }
        }

        foreach ( var file in root.GetFiles( ) ) {
            string dest = null;
            if ( TryGetRenameName(
                    pattern,
                    file.Name,
                    "({0})({1})[{2}] {3}",
                    out dest ) ) {
                Console.WriteLine( dest );
                file.MoveTo( Path.Combine( file.DirectoryName, dest ) );
            }
        }
    }
}


试了下,似乎都能行。运行环境是.NET Framework 3.5 SP1。
于是把编译出来的exe发到附件里。有需要的拿~
分享到:
评论
3 楼 RednaxelaFX 2009-01-07  
CloudiDust 写道
好想法……去用Groovy或者F#写一个……

觉得值得对比一下,用F#也写了一个版本:http://rednaxelafx.iteye.com/blog/311741
有兴趣的话讨论一下~~我写F#代码还不是特别顺手……

2 楼 RednaxelaFX 2009-01-07  
CloudiDust 写道
好想法……去用Groovy或者F#写一个……
其实我没有收Comiket物的习惯啊似乎……我真是没有娱乐的人啊……(望天)

呃呵呵,这次已经没有很积极的去收了,但资源不断的涌入这也就收下了 OTL

用Groovy来写这样的脚本是不错,出来的代码跟Ruby的也差不了多少。
但是用F#/OCaml来写我看不出有什么优势,因为整个脚本并没有多少纯计算的,几乎都是需要产生副作用的一些操作。除非不用正则表达式来匹配,但是手工匹配要多写那么多代码,就失去脚本快捷方便的意义了。不过如果有什么我没想到的办法来通过F#完成这功能,我很有兴趣知道~~
1 楼 CloudiDust 2009-01-07  
好想法……去用Groovy或者F#写一个……

其实我没有收Comiket物的习惯啊似乎……我真是没有娱乐的人啊……(望天)

相关推荐

    Doujin-Release-Tracker:已弃用

    同人发布追踪器最初以跟踪我在Comiket上期待的内容的方式开始,但现在... 希望他们将是适当的文档,但是通常端点是: /[comiket, vocamas, m3] -显示我们记录的所有活动的数据,其ID,日期和论坛链接/[comiket, vocama

    Search Extension For Comike Web Catalog-crx插件

    函数中添加右键单击菜单以搜索在浏览器上选择的字符串Comiket Web目录它是一个扩展名。 圆形名称,yomigana和作者姓名是针对性的。 如果有1个搜索结果,请自动移动到圆圈详细信息页面。 Comiket Web目录帐户并登录是...

    基于Springboot + Mybatis框架实现的一个简易的商场购物系统.zip

    基于springboot的java毕业&课程设计

    用于 CNO 实验的 MATLAB 脚本.zip

    1.版本:matlab2014/2019a/2021a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

    基于卷积神经网络的垃圾分类.zip

    卷积神经网络(Convolutional Neural Networks, CNNs 或 ConvNets)是一类深度神经网络,特别擅长处理图像相关的机器学习和深度学习任务。它们的名称来源于网络中使用了一种叫做卷积的数学运算。以下是卷积神经网络的一些关键组件和特性: 卷积层(Convolutional Layer): 卷积层是CNN的核心组件。它们通过一组可学习的滤波器(或称为卷积核、卷积器)在输入图像(或上一层的输出特征图)上滑动来工作。 滤波器和图像之间的卷积操作生成输出特征图,该特征图反映了滤波器所捕捉的局部图像特性(如边缘、角点等)。 通过使用多个滤波器,卷积层可以提取输入图像中的多种特征。 激活函数(Activation Function): 在卷积操作之后,通常会应用一个激活函数(如ReLU、Sigmoid或tanh)来增加网络的非线性。 池化层(Pooling Layer): 池化层通常位于卷积层之后,用于降低特征图的维度(空间尺寸),减少计算量和参数数量,同时保持特征的空间层次结构。 常见的池化操作包括最大池化(Max Pooling)和平均池化(Average Pooling)。 全连接层(Fully Connected Layer): 在CNN的末端,通常会有几层全连接层(也称为密集层或线性层)。这些层中的每个神经元都与前一层的所有神经元连接。 全连接层通常用于对提取的特征进行分类或回归。 训练过程: CNN的训练过程与其他深度学习模型类似,通过反向传播算法和梯度下降(或其变种)来优化网络参数(如滤波器权重和偏置)。 训练数据通常被分为多个批次(mini-batches),并在每个批次上迭代更新网络参数。 应用: CNN在计算机视觉领域有着广泛的应用,包括图像分类、目标检测、图像分割、人脸识别等。 它们也已被扩展到处理其他类型的数据,如文本(通过卷积一维序列)和音频(通过卷积时间序列)。 随着深度学习技术的发展,卷积神经网络的结构和设计也在不断演变,出现了许多新的变体和改进,如残差网络(ResNet)、深度卷积生成对抗网络(DCGAN)等。

    基于 Yolov5的检测模型

    运行程序 1、测试.pt模型文件 1.在pycharm里打开下载的yolov5环境,在根目录打开runs文件,找到trains文件中的best_1.pt即为训练最优模型。 2.在根目录找到 detect.py 文件,修改代码221行默认路径至模型路径,222行路径更改至所需测试图片路径,点击运行。 2、测试.onnx模型文件 1.在pycharm里打开下载的yolov5环境,在根目录打开 export.py 文件,修改默认输出模型类型为onnx,选择best_1.pt输入模型,点击运行。 2.在根目录找到detect_onnx.py文件,修改代码221行默认路径至模型路径,222行路径更改至所需测试图片路径,点击运行。

    郁郁苍苍---基于SpringBoot的多人社区项目.zip

    基于springboot的java毕业&课程设计

    华为FusionAccess桌面云解决方案基于华为FsionCompute云平台的一款虚拟化桌面应用

    华为桌面云解决方案 桌面云架构VDI和IDV VDI:虚拟桌面架构。特点是计算和数据都在云端,集中管理,集中运行。 IDV:智能桌面虚拟化。特点是镜像集中管理,计算和数据还是在终端,集中管理,分散运行。 (从方案的主推厂商看, 业界华为、思杰、Vmware(IDC国内桌面云市场份额排名前三)都主推VDI,目前推IDV架构的只有锐捷、噢易等少数国内厂商)

    一个基于SpringBoot+Editor.md的 API接口文档.zip

    基于springboot的java毕业&课程设计

    基于OpenCV的交通路口红绿灯控制系统设计 python毕业设计-源码+全部数据+使用文档(高分项目).zip

    基于OpenCV的交通路口红绿灯控制系统设计 python毕业设计-源码+全部数据+使用文档(高分项目).zip本资源中的源码都是经过本地编译过可运行的,评审分达到95分以上。资源项目的难度比较适中,内容都是经过助教老师审定过的能够满足学习、使用需求,如果有需要的话可以放心下载使用。 【备注】 1、该项目是个人高分毕业设计项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 3、本项目适合计算机相关专业(如软件工程、计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 4、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 基于OpenCV的交通路口红绿灯控制系统设计 python毕业设计-源码+全部数据+使用文档(高分项目).zip基于OpenCV的交通路口红绿灯控制系统设计 python毕业设计-源码+全部数据+使用文档(高分项目).zip基于Op

    课设毕设基于SSM的知识产权管理系统源码可运行.zip

    课设毕设基于SSM的知识产权管理系统源码可运行.zip

    基于卷积神经网络的人脸识别.zip

    卷积神经网络(Convolutional Neural Networks, CNNs 或 ConvNets)是一类深度神经网络,特别擅长处理图像相关的机器学习和深度学习任务。它们的名称来源于网络中使用了一种叫做卷积的数学运算。以下是卷积神经网络的一些关键组件和特性: 卷积层(Convolutional Layer): 卷积层是CNN的核心组件。它们通过一组可学习的滤波器(或称为卷积核、卷积器)在输入图像(或上一层的输出特征图)上滑动来工作。 滤波器和图像之间的卷积操作生成输出特征图,该特征图反映了滤波器所捕捉的局部图像特性(如边缘、角点等)。 通过使用多个滤波器,卷积层可以提取输入图像中的多种特征。 激活函数(Activation Function): 在卷积操作之后,通常会应用一个激活函数(如ReLU、Sigmoid或tanh)来增加网络的非线性。 池化层(Pooling Layer): 池化层通常位于卷积层之后,用于降低特征图的维度(空间尺寸),减少计算量和参数数量,同时保持特征的空间层次结构。 常见的池化操作包括最大池化(Max Pooling)和平均池化(Average Pooling)。 全连接层(Fully Connected Layer): 在CNN的末端,通常会有几层全连接层(也称为密集层或线性层)。这些层中的每个神经元都与前一层的所有神经元连接。 全连接层通常用于对提取的特征进行分类或回归。 训练过程: CNN的训练过程与其他深度学习模型类似,通过反向传播算法和梯度下降(或其变种)来优化网络参数(如滤波器权重和偏置)。 训练数据通常被分为多个批次(mini-batches),并在每个批次上迭代更新网络参数。 应用: CNN在计算机视觉领域有着广泛的应用,包括图像分类、目标检测、图像分割、人脸识别等。 它们也已被扩展到处理其他类型的数据,如文本(通过卷积一维序列)和音频(通过卷积时间序列)。 随着深度学习技术的发展,卷积神经网络的结构和设计也在不断演变,出现了许多新的变体和改进,如残差网络(ResNet)、深度卷积生成对抗网络(DCGAN)等。

    基于springboot-mqtt的温度、湿度、六氟化硫浓度实时监控系统.zip

    基于springboot的java毕业&课程设计

    房地产企业财务风险的成因与防范对策-以万科集团为例.docx

    房地产企业财务风险的成因与防范对策-以万科集团为例.docx

    基于SpringBoot框架的中小企业完全开源的ERP.zip

    基于springboot的java毕业&课程设计

    基于springboot的动漫弹幕网站.zip

    基于springboot的java毕业&课程设计

    基于SpringBoot + Vue的电影售票及影院管理系统.zip

    基于springboot的java毕业&课程设计

    基于Python+定向爬虫的商品比价系统的实现的设计与实现+详细文档+全部资料(高分毕业设计).zip

    基于Python+定向爬虫的商品比价系统的实现的设计与实现+详细文档+全部资料(高分毕业设计).zip本资源中的源码都是经过本地编译过可运行的,评审分达到95分以上。资源项目的难度比较适中,内容都是经过助教老师审定过的能够满足学习、使用需求,如果有需要的话可以放心下载使用。 【备注】 1、该项目是个人高分毕业设计项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 3、本项目适合计算机相关专业(如软件工程、计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 4、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。基于Python+定向爬虫的商品比价系统的实现的设计与实现+详细文档+全部资料(高分毕业设计).zip本资源中的源码都是经过本地编译过可运行的,评审分达到95分以上。资源项目的难度比较适中,内容都是经过助教老师审定过的能够满足学习、使用需求。

    MySQL8.4.0 LTS(mysql-8.4.0-solaris11-sparc-64bit.tar)

    MySQL8.4.0 LTS(mysql-8.4.0-solaris11-sparc-64bit.tar)适用于Oracle Solaris 11 (SPARC)

Global site tag (gtag.js) - Google Analytics