【重磅推荐】在Pycharm中调试scrapy爬虫的两种方法（有坑，务必注意）-白红宇

【重磅推荐】在Pycharm中调试scrapy爬虫的两种方法（有坑，务必注意）

阅读量：669 次

发布时间：2019-03-15

本文共 826 字，大约阅读时间需要 2 分钟。

第二种方式：参考链接：

pycharm调试scrapy常用的命令配置：

scrapy crawl <scrapy_name> （scrapy_name不是文件名，而是Spider的属性name的值）

scrapy runspider scrapy_first/spider/book.py

第一种模式（常用模式）.使用scrapy.cmdline的execute方法

首先，在项目文件scrapy.cfg的同级建立main.py文件（注意，必须是同级建立），在其中键入如下代码：

在其余爬虫文件中设置断点后，运行main.py,即可实现在pycharm中的调试。

from scrapy.cmdline import executeimport sysimport ossys.path.append(os.path.dirname(os.path.abspath(__file__)))单文件调试模式一：runspider+需要执行的spider的name.py文件execute(['scrapy', 'runspider', 'scrapy_first/spiders/book.py'])单文件调试模式二：crawl+需要执行的spider_name！！这里的spider_name不是文件名,而是继承scrapy.spiders.Spider子类的name属性名字(必须是唯一的)# execute(['scrapy', 'crawl', "spider_name"])execute(['scrapy', 'crawl', 'test'])

class Test1Spider(Spider):    name属性就是spider_name,【scrapy crawl spider_name】执行的文件名(必须是唯一)    name = 'test'     def parse(self, response):        pass

转载地址：http://pimmz.baihongyu.com/

你可能感兴趣的文章

Mysql报错：too many connections

Mysql插入数据从指定选项中随机选择、插入时间从指定范围随机生成、Navicat使用存储过程模拟插入测试数据

查看>>

MYSQL搜索引擎

查看>>

mysql操作数据表的命令_MySQL数据表操作命令

查看>>

MySQL支持的事务隔离级别，以及悲观锁和乐观锁的原理和应用场景？

查看>>

mysql支持表情

查看>>

MySQL支撑百万级流量高并发的网站部署详解

查看>>

MySQL改动rootpassword的多种方法

查看>>

mysql数据分组索引_MYSQL之索引配置方法分类

查看>>

mysql数据取差，mysql屏蔽主外键关联关系

查看>>

MySQL数据和Redis缓存一致性方案详解

查看>>

MySQL数据和Redis缓存一致性方案详解

查看>>

Mysql数据库 InnoDB存储引擎中Master Thread的执行流程

mysql数据库io空闲_mysql数据库磁盘io高的排查

查看>>

mysql数据库root密码忘记,查看或修改的解决方法

查看>>

MySQL数据库SQL注入靶场sqli通关实战（附靶场安装包）

查看>>