`

python学习与实战

阅读更多

       恬好这几天有空,下去学习了python 脚本语言,给我的感觉是:超级shell脚本语言.

       如果你已经有java/javascript语言基础,下去参考<python简明教程> ,估计三两天就可以熟识语法了.当然 python 还包含了许多的模块,包括 面向过程开发/面向对象开发/多线程/web开发/文件处理等等,这些相关模拟当然需要根据实际情况再进行深入学习了.

       根据不同的需求以及不同的情况,不同的公司对其有不同的用法.大的可以用其做一些服务端主程/管理后台/web开发,小的可以用其进行日常运维工具.

 

       关于python的语法学习就不多说了,可以根据下述这两个电子书进行自学,三五天快速阅读(记性不好的,可以中途多搞一下文档上面的例子)

          <python简明教程> http://sebug.net/paper/python/index.html

          <python 手册> http://man.chinaunix.net/develop/python/python2.3tut/tut

 

        通过两天的python语法学习,再加个小项目以加固对python的理解.

        要求:替换文件夹中所有xls文件的内容 .

        输入:文件夹路径/需替换的key&value

 

 

  • 技术预研

     python编辑 xls 文件,其中一种方式是通过xlrd/xlwt/xlutils.

     Python中一般使用xlrdexcel read)来读取Excel文件,使用xlwtexcel write)来生成Excel文件(可以控制Excel中单元格的格式),需要注意的是,用xlrd读 取excel是不能对其进行操作的:xlrd.open_workbook()方法返回xlrd.Book类型,是只读的,不能对其进行操作。而 xlwt.Workbook()返回的xlwt.Workbook类型的save(filepath)方法可以保存excel文件。

因此对于读取和生成Excel文件都非常容易处理,但是对于已经存在的Excel文件进行修改就比较麻烦了。不过,还有一个xlutils(依赖于xlrdxlwt)提供复制excel文件内容和修改文件的功能。其实际也只是在xlrd.Bookxlwt.Workbook之间建立了一个管道而已,如下图:

 
   

        但如果要对一个文件进行编辑,这个就有点扯蛋了.按目前我的理解是:

      所谓的编辑 xls 文件,就是copy一个副本出来,并对副本进行业务编辑处理,处理结束后再进行另存为保存结果(又或者直接保存到原文件进行覆盖,而并非是直接编辑原文件. )

      另外,目前遇到个问题,且未能解决:这里copy出来的副本,没办法把原文件中所包含的脚本/图片等资源,也一并复制过来.因此这样的结果是:如果文件中包含有一张图片,这样编辑过后的结果文件里面是没有插图的.

 

     xlrd/xlwt/xlutils各模块,可以到官网下载本地进行安装 .

 

  • 下载

下载地址:http://www.python-excel.org/

官网地址:http://www.python-excel.org/

文档地址:https://secure.simplistix.co.uk/svn/xlrd/trunk/xlrd/doc/xlrd.html

文档pdf下载:http://www.simplistix.co.uk/presentations/python-excel.pdf

 

  • 安装

1.linux体系:(其他各模块安装与 下述xlrd模块安装一样)

 

$> cd xlrd-0.7.1
$> python setup.py install

 

  • 操作

python操作excel除了读就是写。

xlrd (主要负责读取xls内容,不能更改内容 )

http://pypi.python.org/pypi/xlrd

 

导入

import xlrd

 

打开excel

file = xlrd.open_workbook('demo.xls')

 

查看文件中包含sheet的名称

file.sheet_names()

 

得到第一个工作表,或者通过索引顺序 或 工作表名称

sheet = file.sheets()[0]

sheet = file.sheet_by_index(0)

sheet = file.sheet_by_name(u'Sheet1')

 

获取行数和列数

nrows = sheet.nrows

ncols = sheet.ncols

 

循环行,得到索引的列表

for rownum in range(sheet.nrows):

print sheet.row_values(rownum)

 

获取整行和整列的值(数组)

sheet.row_values(i)

sheet.col_values(i)

 

单元格(索引获取)

cell_A1 = sheet.cell(0,0).value

cell_C4 = sheet.cell(2,3).value

 

分别使用行列索引

cell_A1 = sheet.row(0)[0].value

cell_A2 = sheet.col(1)[0].value

 

 

 

 

xlwt (主要负责写xls内容 )

http://pypi.python.org/pypi/xlrd

 

导入xlwt

import xlwt

 

新建一个excel文件

file = xlwt.Workbook() #注意这里的Workbook首字母是大写,无语吧

 

新建一个sheet

sheet = file.add_sheet('sheet name')

 

通过索引获取一个已存在的sheet

sheet = file.get_sheet('sheet name')

 

写入数据sheet.write(,,value)

sheet.write(0,0,'test')

 

如果对一个单元格重复操作,会引发

returns error:

# Exception: Attempt to overwrite cell:

# sheetname=u'sheet 1' rowx=0 colx=0

 

所以在打开时加cell_overwrite_ok=True解决

sheet = file.add_sheet('sheet name',cell_overwrite_ok=True)

 

保存文件

file.save('demo.xls')

 

 

 

  • 项目实战

 

        要求:替换文件夹中所有xls文件的内容 .

        输入:文件夹路径/需替换的key&value

 

          源码注释已经较为清晰了,可复制本地直接运行.另该脚本只是简单处理,只作功能实现,未对其他异常进行处理,如 文件夹中包含有 txt 等文件时的情况处理.

#!/usr/local/python
#filename:replaceFile.py
# -*- coding:utf-8 -*-
import os
import os.path
import xdrlib ,sys
import xlrd
import xlwt
import xlutils
from xlutils.copy import copy

#
# 方法:根据keyValue字典数据,对文件 ffile 进行内容替换处理
#
def parseFile(ffile,keyValue):
	print "Begin parse file:",ffile
	# 1 字符串替换需在同一编码下进行,保存的数据需以unicode编码保存字符串
	#
	#strobj.decode("cp936") -------->将s解码成unicode,参数指定的是s本来的编码方式。这个和unicode(s,encodename)是一样的。
	#strobj.encode("utf-8")-------->将unicode编码成str对象,参数指定使用的编码方式
	#
	#
	##formatting_info=True保存之前数据的格式,表示一并把样式也打开,以便下述进行copy时把样式也复制过去
	wb = xlrd.open_workbook(ffile,formatting_info=True)
	#这个太扯蛋了,所谓的编辑 xls 文件,就是copy一个复本出来,并对复本进行编辑过后,再进行另存为(或者直接保存到原文件进行覆盖).而没法直接编辑原文件.
	#但这样的copy,却没法把原文件里面的脚本 / 图片 等一并拿出来,导致没法把这些资源转到目标文件中.
	t_wb = copy(wb)
	for sheetid in range(wb.nsheets):
		sh = wb.sheet_by_index(sheetid)
		for rownum in range(sh.nrows):
			for colnum in range(sh.ncols):
				cellvalue = sh.cell(rownum,colnum).value
				try:
					#从xls读取下来的字符串,有str unicode  两种编码串.因此需转换成同一编码(本demo是统一转成utf-8)再进行 find replace 操作.
					cellvalue = getValue(cellvalue)
					for keytemp,valuetemp in keyValue.items():
						if isinstance(cellvalue,str) and cellvalue.find(keytemp) != -1:
							cellvalue = cellvalue.replace(keytemp,valuetemp)
							#写入数据时,str需转换成 unicode编码格式
							t_wb.get_sheet(sheetid).write(rownum,colnum,unicode(cellvalue,"utf-8"))
				except EOFError:
					print "error"
				except Exception,x:
					print "数据类型转换失败.type:",type(value),",value:",value
					print x
					print "Fail parse file."
					return 

	t_wb.save(ffile)
	print "End parse file!\n\n"


def getValue(value):
	if isinstance(value,unicode):
		return value.encode("utf-8")
	elif isinstance(value,int):
		return float(value)
	else:
		return value


#程序从这里开始运行
if __name__== "__main__" :
	#数据目录
	dataDir = ""
	#文件列表
	fileArray = []
	#替换字符串
	keyValue = {}

	dataDir = raw_input("Please input the datadir:")
	while(True):
		key = raw_input("Please input the key:")
		value = raw_input("Please input the value:")
		keyValue[key] = value
		quit = raw_input("Please input 'quit' to quit,or other to continue:")
		if quit == 'quit':
			break
	
	print "\n\n######## Message ########"
	print "dataDir:",dataDir
	print "keyValue",keyValue
	print "\n\n#########################"

	print "\n\n#########################"
	print "Begin search the Dir of all file "
	#parent 是指dataDir各层子目录 
	#dirnames 是指  parent 当层下的所有子目录
	#filenames 是指 parent 当层下的所有文件
	for parent,dirnames,filenames in os.walk(dataDir):
		for filename in filenames:
			fileArray.append(os.path.join(parent,filename))
	print "There are",len(fileArray)," files.";
	print "##########################\n\n"


	for filename in fileArray:
		parseFile(filename,keyValue)

 

 

  • 大小: 57.3 KB
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics