scrapy操作

创建工程

scrapy startproject (projectname)

scrapy genspider (spidename) (url)

parse 中的 response 解析想要使用数据,必须使用 extract()提取数据 extract():返回列表 extract_first():返回一个数据
创建项目对象,将数据放入项目
用 yield 将项目传入管道

1
class 类名():
2
    def process_item(self, item, spider):
3
        item #数据
4
        spider #爬虫
5
        return item #如果不return下一个管道收不到数据

scrapy crawl (spidename)
默认会输出工程的默认信息

‍