2026年春江苏开放大学数据采集与预处理060749第二次形考作业

使用Scrapy爬虫框架爬取网页一、实验目的1. 理解Scrapy爬虫框架的架构和工作流程；2. 掌握使用Scrapy爬虫框架进行爬虫项目开发。二、实验内容创建一个Scrapy项目SunHot，用于爬取阳光热线问政平台的部分信息，主要包括投诉帖子的编号、帖子的URL、帖子的标题及帖子的内容，其网址为：https://wz.sun0769.com/politi

温馨提示! 升级 VIP 1 免费下载，你当前未登录

升级VIP 1

温馨提示! 你需要支付 ￥10.00 元后才可以下载

微信支付支付宝支付余额支付

文档介绍

注意：因为学习平台题目是随机，选择题选项也是随机，一定注意答案对应的选项，同学们在本页按“Ctrl+F”快捷搜索题目中“关键字”就可以快速定位题目!!!

同专业其他作业点击右侧标签查看

使用Scrapy爬虫框架爬取网页

一、实验目的

1. 理解Scrapy爬虫框架的架构和工作流程；

2. 掌握使用Scrapy爬虫框架进行爬虫项目开发。

二、实验内容

创建一个Scrapy项目SunHot，用于爬取阳光热线问政平台的部分信息，主要包括投诉帖子的编号、帖子的URL、帖子的标题及帖子的内容，其网址为：https://wz.sun0769.com/political/index/supervise，具体要求如下：

1. 在项目的/spiders目录下，新建用作爬虫的文件sun.py。

2. 在sun.py文件中，使用parse方法取出每个页面中帖子的链接列表，再从中迭代获取每个帖子，并交给回调函数parse_item处理。

3. 在parse_item方法中，提取上述提到的这些信息。

4. 将爬取到的数据以JSON文档的形式进行输出。

5. 将项目改为使用CrawlSpider类自动爬取。

三、作业提交要求

完成实验报告（见附件模板），将源代码和实验报告一起压缩打包提交至学习平台。

（需要定制联系客服）

转载请注明出处：形易网 » 2026年春江苏开放大学数据采集与预处理060749第二次形考作业

点赞(0) 打赏

2026年春江苏开放大学数据采集与预处理060749第二次形考作业

文档介绍

相关下载

评论列表共有 0 条评论

发表评论取消回复

2026年春江苏开放大学数据采集与预处理060749第二次形考作业

文档介绍

相关下载

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复