urllib 下载解析 - 点点滴滴 - ITeye博客

`

wang_peng1

浏览: 3900943 次
性别:
来自: 北京

最近访客更多访客>>

lobin

ponce

jessic1024

bbrb

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

hinuliba： ...
字体背景颜色的高度修改
KANGOD：最后的 -createDialog() 私有方法是怎么回事，没 ...
简单的实现listView中item多个控件以及点击事件
sswangqiao：呵呵，呵呵
onActivityResult传值的使用
yumeiqiao：感觉你所的不清楚 lstView.setOnTouchLi ...
listview中viewflipper的问题
lizhou828：果然是大神啊！！！
Animation动画效果的实现

urllib 下载解析

博客分类：

Tensorflow

阅读更多

import argparse
import os
import sys
import tarfile

from six.moves import urllib
import tensorflow as tf

DATA_URL = 'https://www.cs.toronto.edu/~kriz/cifar-10-binary.tar.gz'

parser = argparse.ArgumentParser()

parser.add_argument(
    '--data_dir', type=str, default='/tmp/cifar10_data',
    help='Directory to download data and extract the tarball')


def main(unused_argv):
  """Download and extract the tarball from Alex's website."""
  if not os.path.exists(FLAGS.data_dir):
    os.makedirs(FLAGS.data_dir)

  filename = DATA_URL.split('/')[-1]
  filepath = os.path.join(FLAGS.data_dir, filename)

  if not os.path.exists(filepath):
    def _progress(count, block_size, total_size):
      sys.stdout.write('\r>> Downloading %s %.1f%%' % (
          filename, 100.0 * count * block_size / total_size))
      sys.stdout.flush()

    filepath, _ = urllib.request.urlretrieve(DATA_URL, filepath, _progress)
    print()
    statinfo = os.stat(filepath)
    print('Successfully downloaded', filename, statinfo.st_size, 'bytes.')

  tarfile.open(filepath, 'r:gz').extractall(FLAGS.data_dir)


if __name__ == '__main__':
  FLAGS, unparsed = parser.parse_known_args()
  tf.app.run(argv=[sys.argv[0]] + unparsed)

分享到：

download and clean file | TFRecordWriter

2017-11-27 10:45
浏览 4991
评论(0)
分类:移动开发
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

urllib2 官方文档解析1: urllib2 官方文档解析1

python入门基础教程：python的urllib2 模块解析.pptx: python入门基础教程：python的urllib2 模块解析.pptx

Python urllib.request对象案例解析: 刚刚接触爬虫，基础的东西得时时回顾才行，这么全面的帖子无论如何也得厚着脸皮转过来啊！...4. urllib.robotparser robots.txt 解析模块 Urllib 库下的几种模块基本使用如下： urllib.request 关于 urlli

Python爬虫基础教程-Urllib详解.pdf: Python3中将python2.7的urllib和urllib2两个包合并成了⼀个urllib库，其主要包括⼀下模块： urllib.request 请求模块 urllib.error 异常处理模块 urllib.parse url解析模块 urllib.robotparser robots.txt解析模块 ...

Python 网络爬虫开发 Python爬虫入门基础教程：Python的urllib2 模块解析共6页.pptx: Python 网络爬虫开发 Python爬虫入门基础教程：Python的urllib2 模块解析共6页.pptx

深入解析Python中的urllib2模块: 这里总结了一些 urllib2 的使用细节。 Proxy 的设置 Timeout 设置在 HTTP Request 中加入特定的 Header Redirect Cookie 使用 HTTP 的 PUT 和 DELETE 方法得到 HTTP 的返回码 Debug Log Proxy 的设置 ...

基于urllib爬取苏州公交线路信息: 【写在前面】本文将基于python的urllib模块，爬取北京公交线路的信息，最后将数据保存在csv文件和mysql数据库中。...学会使用urllib基本库和BeautifulSoup解析库进行苏州公交线路相关信息的爬取。

Python urllib2运行过程原理解析: urllib2.urlopen(url[, data[, timeout[, cafile[, capath[, cadefault[, context]]]]]) 注： url表示目标网页地址，可以是字符串，也可以是请求对象Request req= urllib2.Request(url, data,headers) response =...

【图文】python入门基础教程：python的urllib2 模块解析.doc: Python

python爬虫 urllib模块发起post请求过程解析: 主要介绍了python爬虫 urllib模块发起post请求过程解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

python通过urllib2爬网页上种子下载示例: 4.循环访问所有帖子url，从帖子页面代码中取种子下载地址（通过正则表达式或第三方页面解析库） 5.访问种子页面下载种子复制代码代码如下:import urllibimport urllib2import cookielibimport reimport sysimport ...

urllib方法获取静态页面数据方法: urllib方法获取静态页面数据方法 class BaiduSpider(object): def __init__(self): ... self.headers = {"User-... #解析页面 def parsePage(self): pass #保存数据 def writePage(self,filename,html): with open

python urllib爬虫模块使用解析: 主要介绍了python urllib爬虫模块使用解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

【Python爬虫】基于 urllib 抓取指定贴吧的指定页的数据，保存到本地文件: 此资源是一个基于Python的爬虫脚本，利用urllib库抓取指定贴吧的指定页数据，并将抓取到的内容保存到本地文件中。该脚本可以帮助用户快速获取贴吧中的帖子标题、内容、发布时间等信息，并可以用于数据分析、内容提取...

零基础Python爬虫从入门到精通-视频教程网盘链接提取码下载 .txt: 本套视频教程适合想掌握爬虫技术的学习者，以企业主流版本Python 3.7来讲解，内容包括：Python基础、Urllib、解析（xpath、jsonpath、beautiful）、requests、selenium、Scrapy框架等。针对零基础的同学可以从头学起...

对python3 urllib包与http包的使用详解: urllib包和http包都是面向HTTP协议的。其中urllib主要用于处理 URL，使用urllib操作URL可以像使用和打开本地文件一样地操作。...3.urllib.parse———用于解析 URL；具体方法： urllib.request.urlop

python爬虫之urllib3的使用示例: Urllib3提供了很多python标准库urllib里所没有的重要特性：线程安全连接池客户端SSL/TLS验证文件分部编码上传协助处理重复请求和HTTP重定位支持压缩编码支持HTTP和SOCKS代理一、get请求 urllib3主要...

Global site tag (gtag.js) - Google Analytics