正则表达式的一些常用元字符和语法: http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html
正则表达式匹配html问题,经常会出现正则写对了,但匹配就是不成功,用notepad++查看html代码。
原因是:查看的html代码中,各html标签间可能有换行符,tab符等不可见字符,所以要在各html间增加【\s*】来匹配,同时python的使用中也要打开re.S 来 dot match all(包括换行)
for each in re.findall(person,page,re.S): print each
对于utf-8编码的网页,用urllib2下载网页时,正确处理中文的方法是:decode('utf-8)
page = urllib2.urlopen(url).read().decode('utf-8')
中文写到文件的方法:(在windows下,文件默认是ansii编码)
file = open(r'e:\\Chow\\result.txt','w') ... print >>file,each.encode('gbk'),'\n'
或者用codecs模块,以utf-8打开文件:
file = codecs.open(r'e:\\Chow\\result.txt','w','utf-8') ... print >>file,each,'\n'
1.写文件中文问题
在windows写中文txt文件时,遇到问题:
UnicodeDecodeError: 'ascii' codec can't decode byte 0xd1 in position 0: ordinal not in range(128)
解决:
import codecs file = codecs.open('filepath', 'w', 'utf-8') str = '中文输入' file.write(str.decode('gbk')) fiile.close()
或者:
在python的安装目录下的Lib目录,找到site.py,修改def setencoding()方法 def setencoding(): ..... .... if 0: # Enable to support locale aware default string encodings. 把那个if 0改为if 1:
.py文件的第一行加入:
#-*- encoding:UTF-8 -*-
相关推荐
使用python记录按键信息,简单版本的监控
Python学习记录 自从上个月更新博客,已经很久...目前看完了董国付版的python可以这样学,整体体验不错,各方面都兼顾到了,层层递进,不会给初学者以不适感,还有一些python常用的库,经典程序样例,值得初学者学习。
分享自己学习记录,针对初学者,当然希望各位大牛给与指导意见
Python学习资源 python学习记录网新python学习之路
python实现的键盘记录器小功能代码 博客记录: https://lexsaints.blog.csdn.net/article/details/113736987
分享自己学习的笔记记录,希望能够对初学者有些帮助。
分享自己的一些自学python的学习记录,希望能够对初学者有些帮助
python学习记录
Loguru 是一个让Python日志记录变得超级简单
python-elasticsearch-logger, 标准 python 日志记录框架的python Elasticsearch处理程序 CMRESHandler.py python Elasticsearch日志处理程序这个库提供了一个与标准日志库兼容的Elasticsearch日志附加组件。...
分享自己学习python的笔记记录,希望能够对初学者有些帮助
Python百行代码实现抽奖系统 Python百行代码实现点赞系统 python百行制作查询工具 python百行制作登录系统 Python操作Excel自动化开发 Python法拍网数据 Python合成女神图片 Python获取NBA数据 Python获取...
在python开发的时候,有些时候我们需要将日志信息存储下来用以程序的排查。那么就需要定义一个写日志的函数。而且这个函数最好能够满足在控制台打印出来的同时,将信息存储到本地文件中。 该方法有以下功能: 1. ...
年Python学习记录
分享一下我自己学习python的记录,希望各位大牛进行指导提出宝贵意见
Python项目事件记录系统 内部项目较多,但管理较为混乱。各个干系人之间也不了解其余项目干系人对项目的推进情况。 功能设计 有人员管理,能够新增人员 能够修改人员 有权限管理,控制谁能新增项目,谁能管理项目,...
记录Python爬虫一些项目
在了解了一些python特点和应用方向后,我们接下来就需要学习python的基础知识 在python中,我们通过标识符对变量、常量、函数、类等对象命名,而标识符是需要遵守一些命名规范的。 1、标识符的第一个字符必须是...
console-logging 更好,漂亮的Python的命令行日志记录
钉钉API考勤打卡记录获取并存入数据库(python),免去人数限制