`

删除一个目录下内容相同的文件

阅读更多
# -*- coding: utf-8 -*- 

''' 删除一个目录下内容相同的文件 '''

import shutil
import md5
import os
from time import clock as now

#得到字符串的md5
def getmd5(content):
	return md5.new(content).hexdigest();
def main():
	path=raw_input("path:")
	all_md5={};
	all_size={};
	#遍历文件夹
	for file in os.listdir(path):
		real_path = os.path.join(path,file);
		#文件判断
		if os.path.isfile(real_path) == True:
			#文件大小
			size = os.stat(real_path).st_size
			#文件大小已存在,可能存在一样的文件
			if size in all_size.keys():
				#文件MD5
				filemd5 = getmd5(open(real_path,'rb').read());
				if all_size[size][1]='':
					all_size[size][1] = filemd5;
				#判断是否存在当前MD5的文件大小
				if filemd5 in all_size[size]:
					#删除
					print "delete file:",file;
				else:
					#设置size位置为最新的md5值
					all_size[size] = filemd5;
			else:	
				#第一次出现size的情况
				all_size[size] = [real_path,''];

if __name__=='__main__':	
	main()
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics