eclipse创建scrapy项目 -

st4024589553

浏览: 360483 次
性别:
来自: 四川

最近访客更多访客>>

chenjingbo

zpfpublic

joy_gb

WangJiaX

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

eclipse创建scrapy项目

博客分类：

python编程以及安装和配置

python scrapy eclipse

1.
您必须创建一个新的Scrapy项目。进入您打算存储代码的目录中（比如否F:/demo），运行下列命令:

scrapy startproject tutorial
2.在eclipse中创建一个python项目，在F:/demo目录下把刚创建的项目 tutorial 和scrapy.cfg配置文件拷入 eclipse下的python项目中

3.在python项目下tutorial/spiders下创建一个py文件（例如：myblog.py）
代码：

# -*- coding: utf-8 -*-
import scrapy
from tutorial.items import IteyeItem     #导入item
from scrapy.selector import HtmlXPathSelector

class MyblogSpider(scrapy.Spider):
    name = "myblog"
    allowed_domains = ["886.iteye.com"]   #服务器       post
    start_urls = (
        'http://886.iteye.com/',
        'http://st4024589553.iteye.com/'
    )

    def parse(self, response):
        lis = response.xpath("//div[@class='blog_main']/div[1]/h3") #增加xpath
        item = IteyeItem()
        for li in lis:

            title= li.xpath('a/text()').extract()[0]
            print li.xpath('a/text()').extract()[0]
            item['title']=title
            item['link']=li.xpath('a/@href').extract()
            yield item
4.在tutorial下创建 cmdline.py 文件
代码：
# coding=utf-8
'''
Created on 2017年2月5日

@author: chenkai
'''
import scrapy.cmdline

'''
cmdline.py用于启动scrapy项目，其中argv第三个参数为启动爬虫的名字。如下图
'''
if __name__ == '__main__':
    scrapy.cmdline.execute(argv=['scrapy','crawl','myblog']) #myblog myblog.py中name

5.
代码编辑好后，右键cmdline.py -->Debug As -->Run config.... -->右键Python Run-->new
-->project 选择你创建的python项目 --》Main Module 选择项目下的cmdline.py文件即可
apply一下

6.编辑tutorial/items.py 文件
代码：
# -*- coding: utf-8 -*-

import scrapy

class IteyeItem(scrapy.Item):
    title = scrapy.Field()
    link = scrapy.Field()


7.
（1）现在可以直接运行cmdline.py文件 run 输出信息
（2）也可以在提示符窗口里运行，cmd -->scrapy crawl myblog 同样可以启动

分享到：

Python多线程爬取网站image的src属性实例 | windows安装scrapy框架步骤

2017-05-12 17:23
浏览 1015
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

99-智慧园区数据平台方案.pptx: 99-智慧园区数据平台方案.pptx

node-v12.11.1-x86.msi: Node.js，简称Node，是一个开源且跨平台的JavaScript运行时环境，它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立，旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎，可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型，这使得它非常适合处理大量并发连接，从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外，Node.js使用了模块化的架构，通过npm（Node package manager，Node包管理器）,社区成员可以共享和复用代码，极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展，它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等，因此，开发者可以用JavaScript编写全栈应用程序，这一点大大提高了开发效率和便捷性。在实践中，许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台，如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能，简化了开发流程，并且能更快地响应市场需求。

基于Springboot+Vue华强北商城二手手机管理系统-毕业源码案例设计.zip: 网络技术和计算机技术发展至今，已经拥有了深厚的理论基础，并在现实中进行了充分运用，尤其是基于计算机运行的软件更是受到各界的关注。加上现在人们已经步入信息时代，所以对于信息的宣传和管理就很关键。系统化是必要的，设计网上系统不仅会节约人力和管理成本，还会安全保存庞大的数据量，对于信息的维护和检索也不需要花费很多时间，非常的便利。网上系统是在MySQL中建立数据表保存信息，运用SpringBoot框架和Java语言编写。并按照软件设计开发流程进行设计实现。系统具备友好性且功能完善。网上系统在让售信息规范化的同时，也能及时通过数据输入的有效性规则检测出错误数据，让数据的录入达到准确性的目的，进而提升数据的可靠性，让系统数据的错误率降至最低。关键词：vue；MySQL；SpringBoot框架【引流】 Java、Python、Node.js、Spring Boot、Django、Express、MySQL、PostgreSQL、MongoDB、React、Angular、Vue、Bootstrap、Material-UI、Redis、Docker、Kubernetes

Excel模版：工资条模板: Excel工资条模板是一种预先设计好的电子表格文件，主要用于生成和打印员工的工资单，让员工清楚了解自己的工资组成和扣款详情。模板通常包含了以下几个关键部分： 1. **员工信息区**： - 姓名 - 员工编号/工号 - 部门 - 职位 2. **工资构成区**： - 基本工资 - 岗位工资 - 绩效奖金 - 加班工资 - 其他补贴（如交通补贴、餐补、全勤奖等） - 各项津贴（如高温补贴、取暖费等） - 其他应发收入（如年终奖、提成、福利等） 3. **扣款项目区**： - 社保扣款（养老保险、医疗保险、失业保险、工伤保险、生育保险） - 住房公积金 - 个人所得税 - 其他扣款（如迟到、旷工、违规罚款等） - 预借还款（如有） 4. **工资结算区**： - 应发工资总额 - 扣款总额 - 实发工资 5. **备注栏**： - 用于标注本月工资的特殊情况说明，如请假、调休、加班等情况。 6. **签名栏**： - 供员工确认工资数额无误后签名，也可以

29-【智慧城市与政府治理分会场】10亿大数据助推都市治理-30页.pdf: 29-【智慧城市与政府治理分会场】10亿大数据助推都市治理-30页.pdf

基于Springboot+Vue的租房管理系统-毕业源码案例设计.zip: 网络技术和计算机技术发展至今，已经拥有了深厚的理论基础，并在现实中进行了充分运用，尤其是基于计算机运行的软件更是受到各界的关注。加上现在人们已经步入信息时代，所以对于信息的宣传和管理就很关键。系统化是必要的，设计网上系统不仅会节约人力和管理成本，还会安全保存庞大的数据量，对于信息的维护和检索也不需要花费很多时间，非常的便利。网上系统是在MySQL中建立数据表保存信息，运用SpringBoot框架和Java语言编写。并按照软件设计开发流程进行设计实现。系统具备友好性且功能完善。网上系统在让售信息规范化的同时，也能及时通过数据输入的有效性规则检测出错误数据，让数据的录入达到准确性的目的，进而提升数据的可靠性，让系统数据的错误率降至最低。关键词：vue；MySQL；SpringBoot框架【引流】 Java、Python、Node.js、Spring Boot、Django、Express、MySQL、PostgreSQL、MongoDB、React、Angular、Vue、Bootstrap、Material-UI、Redis、Docker、Kubernetes

线路工区光缆中断抢险预案.docx: 5G通信行业、网络优化、通信工程建设资料。

299-教育数据资产管理平台及配套解决方案.pptx: 299-教育数据资产管理平台及配套解决方案.pptx

太戈编程第345题答案: abababababababab

基于STM32F103C8单片机设计-旋转编码器数码管显示程序KEIL工程源码.zip: STM32学习软件编程资料，STM32F103C8单片机经典外设应用设计实例软件源代码，KEIL工程文件，可供学习参考。

5GKPI指标定义.pptx: 5G通信行业、网络优化、通信工程建设资料。

全业务端到端-L2题库.xlsx: 5G通信行业、网络优化、通信工程建设资料

3M 轨道砂光机精英系列说明书: 3M 轨道砂光机精英系列说明书

基于Springboot+Vue教师工作量管理系统-毕业源码案例设计.zip: 网络技术和计算机技术发展至今，已经拥有了深厚的理论基础，并在现实中进行了充分运用，尤其是基于计算机运行的软件更是受到各界的关注。加上现在人们已经步入信息时代，所以对于信息的宣传和管理就很关键。系统化是必要的，设计网上系统不仅会节约人力和管理成本，还会安全保存庞大的数据量，对于信息的维护和检索也不需要花费很多时间，非常的便利。网上系统是在MySQL中建立数据表保存信息，运用SpringBoot框架和Java语言编写。并按照软件设计开发流程进行设计实现。系统具备友好性且功能完善。网上系统在让售信息规范化的同时，也能及时通过数据输入的有效性规则检测出错误数据，让数据的录入达到准确性的目的，进而提升数据的可靠性，让系统数据的错误率降至最低。关键词：vue；MySQL；SpringBoot框架【引流】 Java、Python、Node.js、Spring Boot、Django、Express、MySQL、PostgreSQL、MongoDB、React、Angular、Vue、Bootstrap、Material-UI、Redis、Docker、Kubernetes

2023年亚太杯A题附件一，苹果图像数据集: 2023年亚太杯A题附件一，苹果图像数据集

移动代维发电系统考试L2.xlsx: 5G通信、网络优化与通信建设

59-《煤矿测量规程(1989版)》150.pdf: 59-《煤矿测量规程(1989版)》150.pdf

施工现场安全技术交底模板.doc: 5G通信行业、网络优化、通信工程建设资料。

基于YOLOv7的植物虫害识别＆防治系统: 由于当今全球气候变化异常,农作物病虫害频发,而且农作物病种类多,成因复杂,其预防和识别难度较大,且传统病虫害识别方法大多靠人目视手查,需要一定的专家经验,具有主观性强、识别准确率低等缺点.而信息技术作为解决农作物病虫害智能、快速识别的新技术、新方法,我们计划利用农业信息大数据智能决策分析系统,建立完善一体化的智能农业信息监测系统等.本文便是基于深度学习将计算机视觉、图像识别等技术运用于农作物病虫害检测中,开发智能病虫害检测系统,以提高病虫害检测准确率,减少病虫害对农业生产的危害

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

eclipse创建scrapy项目

评论

发表评论

相关推荐

python中将unicode(u'\u7684') 转中文字符

python中的开放运算

Python多线程爬取网站image的src属性实例

windows安装scrapy框架步骤

python操作mongoDB

windows下安装Scrapy框架（python）

python "\xc5\xc0\xb3\xe6" 转汉字

python_GUI应用程序代码

python读写excel

python标准异常分类

python在linux、windows下执行命令的方法

python中selenium 滚动条下拉 操作

python+BeautifulSoup+selenium+mysqldb完成数据抓取

python+selenium浏览器调用（chrome、ie、firefox）

windows下安装beautifulsoup

windows下casperjs安装以及配置

wingdows下安装phantomjs

python下安装beautifulsoup4-4.3.1

python中的正则表达式,python

python时间格式

最近访客更多访客>>

python中selenium 滚动条下拉操作