数据采集与融合技术2021 (福州大学)

  • 第一次大作业

    1.作业①: 要求:用urllib和re库方法定向爬取给定网址(https://www.shanghairanking.cn/rankings/bcsr/2020/0812 )的数据。 输出信息: 2020排名 全部层次 学校类型 总分 1 前2% 中国人民大学 1069.0 2...... 1)代
    王老大要去吃香喝辣   2021-09-29 22:42   0   36
  • 数据采集技术第一次作业

    作业①: 题目:要求用urllib和re库方法定向爬取给定网址2020中国最好学科排名的数据。输出信息如下: 2020排名 全部层次 学校类型 总分 1 前2% 中国人民大学 1069.0 2 …… …… …… 1.解题过程: 1.1:获取网页 url="https://www.shanghaira
    R-zhang   2021-09-29 22:22   0   39
  • 数据挖掘第一次作业

    作业① 1) – 要求:用urllib和re库方法定向爬取给定网址(https://www.shanghairanking.cn/rankings/bcsr/2020/0812 )的数据。 – 输出信息: 2020排名 2019排名 全部层次 学校类型 总分 1 2 前2% 中国人民大学 1069.
    好的了解了啊!   2021-09-29 22:04   0   64
  • 【数据采集与融合】第一次实验

    一、作业一 要求:使用用urllib和re库方法定向爬取给定网址中国最好学科排名(计算机科学与技术)的数据。 输出形式: 2020排名全部层次学校类型总分 1 前2% 中国人民大学 1069.0 2 .... ........... ...... 作业一实现如下: 1.1 使用urllib.requ
    cowhorse   2021-09-29 21:39   0   41
  • 【数据采集与融合技术】 第一次大作业

    一、作业① 要求:用urllib和re库方法定向爬取给定网址(https://www.shanghairanking.cn/rankings/bcsr/2020/0812 )的数据。 输出信息: 2020排名 全部层次 大学 总分 1 前2% 清华大学 1661.0 2 ... 1、思路、代码和实验
    暴走大可可   2021-09-29 21:10   0   82
  • 第一次实践

    #作业① ##1)要求: ###用urllib和re库方法定向爬取给定网址(https://www.shanghairanking.cn/rankings/bcsr/2020/0812 )的数据。 ###输出信息: 2020排名|全部层次|学校类型|总分 : :|: :|: :|: : 1|前2%|
    Flyme10086   2021-09-29 20:48   0   43
  • 「数据采集」实验一

    ##一、作业① **要求:**用urllib和re库方法定向爬取给定网址中国最好学科排名(计算机科学与技术)的数据。 输出形式: 2020排名 全部层次 学校类型 总分 1 前2% 中国人民大学 1069.0 2 .... ........... ...... ###1.获取网页源码:getHTML
    Sevennnn   2021-09-29 15:56   0   155
  • 【数据采集】第一次实验

    1. 作业① 1.1 题目 用urllib和re库方法定向爬取给定网址的数据 1.2 思路 1.2.1 发送请求 引入库并且编写请求头 请求头是为了把爬虫包装成浏览器的正常访问。 import urllib.request import re header = { 'user-agent': 'Mo
    FanOne   2021-09-29 14:00   0   128
  • Markdown入门使用指南

    Typora有两种模式 一种是实时预览模式,还有一种是源代码模式 可以通过 ctrl + / 来进行切换 下面开始演示快捷键 开始写作 标题 ​ 标题有两种形式,一种是用 多个 # + 空格 来构成多级标题 就像这样: 一级标题 二级标题 三级标题 四级标题 五级标题 六级标题 还有一种方式是用标签
    KingOfTetris   2021-09-29 09:39   0   0