python之scrapy(一)

李明码农

浏览: 72905 次
性别:
来自: 郑州

最近访客更多访客>>

qq54903099

zllhit

solzzzzz

ynn547

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

python

scrapy

通过workon进入后创建的虚拟环境article_spider
虚拟环境只是用来关联项目的环境的例如，pip加载的一些插件也会直接放入你的虚拟环境中
在e盘创建一个scrapy 项目：
```
pip install scrapy 
```
window10的环境下可能会报错，因为一个需要安装一个window10的本地环境，需要去
http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
下载：Twisted‑17.9.0‑cp36‑cp36m‑win_amd64.whl

根据你的版本来的我的python3.6的环境下是window10的64位然后安装这个，还在这个虚拟环境里面安装啊可不要跳出来

pip install D:\Python\Scripts\Twisted-17.1.0-cp36-cp36m-win_amd64.whl

开始安装框架项目

scrapy startproject ArticleSpider

会提示：

New Scrapy project 'ArticleSpider', using template directory 'e:\\evns\\articel_spider\\lib\\site-packages\\scrapy\\templates\\project', created in:

E:\pythonShare\ArticleSpider

然后按照提示添加要爬取的网站一定要到这个你新建的项目目录下例如你创建的项目是：

E:\pythonShare\ArticleSpider 在这个目录下

输入命令

scrapy genspider 项目名称 blog.jobbole.com

项目创建完成

通过pycharm启动项目后创建main.py

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File  : main.py
# @Author: 李明
# @Date  : 2017/12/10
# @Desc  :

from scrapy.cmdline import execute
import sys
import os
print(os.path.dirname(os.path.abspath(__file__)))
sys.path.append(os.path.dirname(os.path.abspath(__file__)))
execute(["scrapy","crawl","jobbole"])

其实就是在cmd命令行中输入：scrapy crawl jobbole

会爆一个错误No module named 'win32api'
安装这个通过命令
```
pip install pypiwin32
```
返回的是个数组extract()，通过strip()去掉空格回城换行等，replace("原来的","替换的")

re_selector.extract()

print(re_selector.extract()[0].strip())

分享到：

python之scrapy(二) | python虚拟环境搭建

2017-12-10 13:35
浏览 546
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

python之scrapy(一)

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

python之scrapy(一)

评论

发表评论

相关推荐

用Python处理HTML转义字符的5种方式

查找python项目依赖并生成requirements.txt

python后台运行一个命令美滋滋

阿里云python2.6.6 升级到python3.5

requests爬取猫眼电影top100

requests爬虎牙频道和主播信息

tesseract ai百度 github的代码 发现还是收费的好用

python-selenium

scrapy架构及原理

Scrapy之crawSpider和BaseSpider的区别

postman完成教程-自动生成代码获取代码信息

python之scrapy(二)

python虚拟环境搭建

python基本数据类型

python运算符

mac下的python3自动化安装pycharm

最近访客更多访客>>

tesseract ai百度 github的代码发现还是收费的好用