Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误 - 努力，让生活变得更美好 - ITeye博客

`

酷的飞上天空

浏览: 517788 次
性别:
来自: 无锡

最近访客更多访客>>

yuanliangding

北极光之吻

gggfff39

932835425

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

鬼一天：代码有问题，没有考虑负数的情况。
根据经纬度和半径计算经纬度范围
Tair： ...
通过反射把map中的属性赋值到实体类bean对象中
springmvc_springjpa： spring mvc demo教程源代码下载，地址：http: ...
Spring3.0 MVC的初次尝试
酷的飞上天空： haiyinlong 写道private File value ...
使用HttpUrlConnection进行post请求上传文件
lliiqiang：分析很难,好的规则持久，靠某个方法条件局限不能证明长久
ruby的基本类型

Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误

博客分类：

python

阅读更多

Scrapy版本0.14.4

出现问题现象：

ERROR: Error downloading <GET http://xxxxx CRC check failed

解决方法

1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0'

明确表示不支持任何形式的压缩格式，避免程序的解压缩操作

这个方法不一定有效，具体根据服务器的返回情况。如果服务器忽略此属性则此方法无效。

2.重新安装scrpay,下载当前版本的一个分支。

参考https://github.com/scrapy/scrapy/pull/109

分支地址：https://github.com/redapple/scrapy/tree/http11/scrapy

其实就是扩展了http1.1的DOWNLOAD_HANDLERS

注：此扩展需要Twisted-12.1.0的版本 Twisted-12.0.0的版本会提示找不到HTTPConnectionPool

分享到：

获取Android设备屏幕的相关参数 | linux下为程序创建启动和关闭的的sh文件， ...

2012-06-19 19:40
浏览 5233
评论(0)
分类:互联网
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Python-scrapy抓取糗事百科热门: scrapy抓取糗事百科热门

Python-Scrapy练习项目利用Scrapy抓取古诗: Scrapy练习项目，利用Scrapy抓取古诗（唐诗三百首，宋词三百首等），并保存为json格式

scrapy 抓取多级页面的某子二手车: 练习使用scrapy 框架爬取数据，爬取，解析，持久化，日志

Python-使用pythonscrapy抓取拉钩java招聘信息并制作成词云: 使用python scrapy抓取拉钩java招聘信息并制作成词云

Scrapy抓取资源Mysql异步存储: 利用Scrapy抓取读书网资源，并通过PipeLines异步存储到Mysql数据库中，附件中有建表语句，下载立刻就能运行

使用Scrapy抓取职位招聘数据-爬虫python代码: 基于Python和Echarts职位画像系统，使用Scrapy抓取职位招聘数据，使用Django+echarts完成数据可视化。环境安装配置建议直接安装anconda，然后git clone后进入项目目录，执行pip install -r requirements.txt ...

使用scrapy抓取google app store 信息写入mysql - 2018.6: 使用scrapy 抓取 google app store中的app信息写入mysql 代码可直接运行

Python-scrapy抓取链家网二手房成交数据: scrapy抓取链家网二手房成交数据

Scrapy 抓取网易严选、小米有品产品数据.zip: Scrapy 抓取网易严选、小米有品产品数据.zip

Scrapy抓取美女图片并且保存: 通过Scrapy框架下载保存美女图片，进而学习下Spider中间件（Spider Middlewares）相关知识

基于Python和Echarts职位画像系统，用Scrapy抓取招聘数据，使用Django+echarts完成数据可视化.zip: 基于Python和Echarts职位画像系统，用Scrapy抓取招聘数据，使用Django+echarts完成数据可视化

scrapy 循环抓取url实例: 自己亲自测试保证可以用，需要安装python2.7 还有scrapy，测试是在centos7下完成的

通过Scrapy抓取和讯论坛关键字搜索的结果: 通过Scrapy框架构建工程来实现关键字搜索和讯论坛正文后结果中所有的的帖子内容，发帖人，以及发帖的时间。

python 基于Scrapy框架抓取图片: python 基于Scrapy框架抓取图片，实现用制定名字明文文件。

scrapy抓取数据存储至本地mysql数据库-大众点评爬虫.zip: 爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。爬虫的工作流程包括以下几个关键步骤： URL收集：爬虫从一个或多个初始URL开始，递归或迭代地发现新的URL，构建一个URL队列。这些URL...

通过django创建搜网网站，通过elasticsearch实现动态搜索scrapy抓取的数据.zip: 通过django创建搜网网站，通过elasticsearch实现动态搜索scrapy抓取的数据.zip

Python-基于pythonscrapy框架抓取豆瓣影视资料: 基于python scrapy框架抓取豆瓣影视资料

毕设项目-基于python的爬虫框架scrapy抓取招聘网站的招聘信息，基于Hadoop处理数据+源码+文档说明: 使用python的爬虫框架scrapy抓取51job网站的招聘信息并存入文件 (DataSpider) 二、大数据存储编写java脚本使用HDFS API把数据上传到HDFS文件系统三、大数据处理使用Hadoop处理大数据 (BigDataHandler) - 不懂运行...

scrapy抓取图片: Scrapy用ImagesPipeline类提供一种方便的方式来下载和存储图片。需要PIL库支持。将下载图片转换成通用的JPG和RGB格式避免重复下载缩略图生成图片大小过滤

毕设项目：scrapy抓取数据存储至本地mysql数据库-大众点评爬虫后面制作数据分析，难度中等: scrapy抓取数据存储至本地mysql数据库基于python开发，采用scrapy，数据存储至本地数据库（或excel表格）程序的主要目的是完成抓取和分析的任务同时学习爬虫相关知识，所以在细节处理上略有不足，但考虑到最终的...

Global site tag (gtag.js) - Google Analytics