-
【数据采集】第一次实验
1. 作业① 1.1 题目 用urllib和re库方法定向爬取给定网址的数据 1.2 思路 1.2.1 发送请求 引入库并且编写请求头 请求头是为了把爬虫包装成浏览器的正常访问。 import urllib.request import re header = { 'user-agent': 'Mo -
数据采集第一次作业(2022)
作业1: 题目:要求用urllib和re库方法定向爬取给定网址2020中国最好学科排名的数据。输出信息如下: 2020排名 全部层次 学校类型 总分 1 前2% 中国人民大学 1069.0 2 ... ... ... 解题: url="https://www.shanghairanking.cn/r