数据采集与融合技术2021 (福州大学)

  • 【数据采集】第一次实验

    1. 作业① 1.1 题目 用urllib和re库方法定向爬取给定网址的数据 1.2 思路 1.2.1 发送请求 引入库并且编写请求头 请求头是为了把爬虫包装成浏览器的正常访问。 import urllib.request import re header = { 'user-agent': 'Mo
    FanOne   2021-09-29 14:00   0   153
  • 数据采集第一次作业(2022)

    作业1: 题目:要求用urllib和re库方法定向爬取给定网址2020中国最好学科排名的数据。输出信息如下: 2020排名 全部层次 学校类型 总分 1 前2% 中国人民大学 1069.0 2 ... ... ... 解题: url="https://www.shanghairanking.cn/r
    ハレハレヤ   2020-10-03 10:33   0   71