[python]简单获取网页文件指定内容方法 - 卖口粥-湛蓝的天空 - ITeye博客

`

joei4cm

浏览: 11578 次
性别:
来自: 上海

最近访客更多访客>>

vim_senye

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

2011-08 ( 8)
更多存档...

最新评论

[python]简单获取网页文件指定内容方法

博客分类：

python

python htmlparser meego html

阅读更多

#!/usr/bin/python

import urllib,HTMLParser

page_url = 'http://lists.meego.com/pipermail/meego-commits/2011-June/027331.html'

#get the url raw content
page_src_content = urllib.urlopen(page_url)
page_list = list(page_src_content)

def page_find(LST_NAME, LST_KEYWD, STRT_ELEMT = 0):
    POS_ELEMT = -1
    for i in range(STRT_ELEMT,len(LST_NAME)):
        if LST_NAME[i].find(LST_KEYWD) >= 0:
        POS_ELEMT = i
        break
        return POS_ELEMT

#get the line number matchs keywords
keywd_line = page_find(page_list, 'changes files:\n')
#print keywd_line

#get the end line number of the match keywords
end_line = page_list[keywd_line:].index('\n')
#print end_line

for i in range (keywd_line, keywd_line + end_line - 1):
    print page_list[i]

0
顶

3
踩

分享到：

[转]shell 字符串操作（长度，查找，替换 ... | ubuntu11.04安装vnc server

2011-08-06 07:01
浏览 1953
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

python获取SVN日志: 指定区间时间获取SVN日志指定区间时间获取SVN日志指定区间时间获取SVN日志指定区间时间获取SVN日志指定区间时间获取SVN日志指定区间时间获取SVN日志指定区间时间获取SVN日志指定区间时间获取SVN日志指定区间...

python 获取指定文件夹下的所有文件，包括子文件夹下的文件: python 获取指定文件夹下的所有文件，包括子文件夹下的文件，路径需要自行更改。 python 获取指定文件夹下的所有文件，包括子文件夹下的文件，路径需要自行更改。 python 获取指定文件夹下的所有文件，包括子文件夹...

python 获取指定目录下文件名称: 运用python简单语句获取指定目录下文件名称，并存放在相关文件中

一文讲清Python PyQt5的控件如何实现拖放获取文件路径(markdown): 一文讲清Python PyQt5的控件如何实现拖放获取文件路径内部以QLineEdit为例子，从新类创建，代码理解，到融入项目均详细讲解。

Python获取指定文件夹下的文件名的方法: 本文采用os.walk()和os.listdir()两种方法，获取指定文件夹下的文件名。一、os.walk() 模块os中的walk()函数可以遍历文件夹下所有的文件。 os.walk(top, topdown=Ture, onerror=None, followlinks=False) 该函数...

python 批量读取word文件中指定表名的表写入exel: doc文件转docx文件根目录文件自动读取批量处理word文件中指定关键词后的表格导入excel

python 获取文件夹中指定格式文件，并按照创建时间排序: python 获取指定文件夹中的指定格式文件，例如.txt,然后按照创建时间（也可以是其他排序规则），按顺序输出文件名。

python windows系统日志文件evtx解析，过滤指定事件，根据IP地址解析出实际物理地址: python windows系统日志文件evtx解析，过滤指定事件，根据IP地址解析出实际物理地址

python获取指定路径下所有指定后缀文件的方法: 本文实例讲述了python获取指定路径下所有指定后缀文件的方法。分享给大家供大家参考。具体实现方法如下： # 获取指定路径下所有指定后缀的文件 # dir 指定路径 # ext 指定后缀，链表&不需要带点或者不指定。例子：...

Python 获取指定文件夹下的目录和文件的实现: os.listdir() 方法用于返回指定的目录下包含的文件或子目录的名字的列表。这个列表以字母顺序。其得到的是仅当前路径下的文件名，不包括子目录中的文件，如果需要得到所有文件需要递归。它也不包括 ‘.’ 和 ‘..’...

Python如何获取文件指定行的内容: linecache, 可以用它方便地获取某一文件某一行的内容。而且它也被 traceback 模块用来获取相关源码信息来展示。用法很简单: >>> import linecache >>> linecache.getline('/etc/passwd', 4) 'sys:x:3:3:sys:/dev:/...

python 获取指定路径中文件及文件夹写入到excel表格中: 运用python语言，由用户输入文件所在路径，获取该指定路径中文件及文件夹，并写入到excel表格中

python-获取目录下的所有文件名并输出到txt文件: 获取目录下的特定格式的所有文件名，比如png。非递归，文件名称带绝对路径。指定多个目录，将所有结果输出到txt文件中。可以继续优化，比如递归查找、截掉路径，输出到csv或其他格式。。。

python批量读取txt文件（读取指定行内容/统计关键词数量/读取指定关键词之间的内容/创建空白txt/统计行数和字符串数量）: 编写读取指定行内容的函数 # 2.编写统计关键词数量的函数 # 3.编写读取指定关键词之间内容的函数 # 4.编写创建空白txt的函数 # 5.编写统计行数和字符串数量的函数 # 6.创建界面窗口 # 6.1获取多选按钮状态 # 6.2创建...

python识别提取图片jpg中指定位置的文字，并修改文件名为改文字: python识别提取图片中指定位置的文字，并修改文件名为改文字，方便批量操修改文件名，其中使用了pyqt5作为程序的界面，识别图片使用了Tesseract-OCR技术，压缩包附带源代码，方便大家学习。

python实现获取客户机上指定文件并传输到服务器的方法: 本文实例讲述了python实现获取客户机上指定文件并传输到服务器的方法。分享给大家供大家参考。具体分析如下：该程序实现了，把目标机器的某个目录（可控）的所有的某种类型文件（可控）全部获取并传到己方的机器上...

Python发送微信消息（文字、图片、文件）给指定好友和微信群（调用Win32 API模拟人的手动操作来发送消息）.pdf: Python发送微信消息（文字、图片、文件）给指定好友和微信群（调用Win32 API模拟人的手动操作来发送消息）

python文件操作seek()偏移量,读取指正到指定位置操作: python 文件操作seek() 和 telll() 自我解释 file.seek()方法格式： seek(offset,whence=0) ...tell() : 文科文件的当前位置，即tell是获取文件指针位置。 readline(n):读入若干行，n代表读入的最长字节数。 readlines

Global site tag (gtag.js) - Google Analytics