数据采集与融合技术2020 (福州大学 - 数学与计算机科学学院)

  • 数据采集第六次作业

    ##作业① ###(1)、要求: 用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据。 每部电影的图片,采用多线程的方法爬取,图片名字为电影名 了解正则的使用方法 ####编写爬虫程序 import re from bs4 import BeautifulSoup fr
    呱506   2020-12-01 17:20   0   82
  • 数据采集——第六次作业

    #作业一: 要求: 用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据。 每部电影的图片,采用多线程的方法爬取,图片名字为电影名 了解正则的使用方法 候选网站:豆瓣电影:https://movie.douban.com/top250 输出信息: ##1)作业结果 ###
    DanspG   2020-12-01 11:40   0   305
  • 第六次作业

    作业①: 要求: 用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据。 每部电影的图片,采用多线程的方法爬取,图片名字为电影名 了解正则的使用方法 **候选网站:**豆瓣电影:https://movie.douban.com/top250 输出信息: 排名 电影名称 导
    wlululu   2020-11-30 22:03   0   111
  • 爬虫第六次作业

    作业①: (1)DoubanMoviesTop250 要求: 用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据。 每部电影的图片,采用多线程的方法爬取,图片名字为电影名 了解正则的使用方法 候选网站:豆瓣电影:https://movie.douban.com/top2
    爱死酷普斯   2020-11-30 18:48   0   133
  • 数据采集第六次作业

    #作业①: ##要求 用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据。 每部电影的图片,采用多线程的方法爬取,图片名字为电影名 了解正则的使用方法 ##思路 (1)ol下的每个li元素对应着每个电影,再通过find li下的元素来获取信息 (2)主演、导演以及评价人
    lumos1   2020-11-30 17:28   0   119
  • 数据采集与融合-第六次作业

    ##作业①: ###1)爬取豆瓣电影Top250数据 要求: 用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据。 每部电影的图片,采用多线程的方法爬取,图片名字为电影名 了解正则的使用方法 ####代码 import os import re import threa
    muyu-sg   2020-11-30 13:07   0   185
  • 数据采集第六次作业

    ##作业①: 作业①: 要求: 用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据。 每部电影的图片,采用多线程的方法爬取,图片名字为电影名 了解正则的使用方法 候选网站:豆瓣电影:https://movie.douban.com/top250 作业②: ###(1)代
    朝南烟   2020-11-27 22:33   0   163
  • 第六次作业

    作业① 1)、用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据实验 主函数: import os import urllib import urllib.request import re from bs4 import UnicodeDammit, Beautifu
    二末三初   2020-11-26 09:58   0   117
  • 数据采集与融合综合作业

    写在前面 这么快就到最后一次作业了,我不应该就此放下心爱的 bs4 re selenium 和不心爱的 scrapy,后面我想应该得重拾为了帮好朋友爬网易云做词云而去学 selenium 的学习热情继续加深爬虫技能吧! 学习历程主要就是作业的三大部分:从 bs4 + re > scrapy + xp
    King_James23   2020-11-25 23:15   0   220
  • 第六次作业

    果然我已经把bs4全忘了并且scrapy只记得一半 因为selenium真的方便好玩且功能齐全 所以第一第二题就只能用很丑陋的代码把他勉强实现出来,害。 #作业一 ##1)、爬取豆瓣top250 代码如下: from bs4 import BeautifulSoup from bs4 import
    durrican   2020-11-25 16:21   0   164