-
数据采集第六次作业
##作业① ###(1)、要求: 用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据。 每部电影的图片,采用多线程的方法爬取,图片名字为电影名 了解正则的使用方法 ####编写爬虫程序 import re from bs4 import BeautifulSoup fr -
数据采集——第六次作业
#作业一: 要求: 用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据。 每部电影的图片,采用多线程的方法爬取,图片名字为电影名 了解正则的使用方法 候选网站:豆瓣电影:https://movie.douban.com/top250 输出信息: ##1)作业结果 ### -
第六次作业
作业①: 要求: 用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据。 每部电影的图片,采用多线程的方法爬取,图片名字为电影名 了解正则的使用方法 **候选网站:**豆瓣电影:https://movie.douban.com/top250 输出信息: 排名 电影名称 导 -
爬虫第六次作业
作业①: (1)DoubanMoviesTop250 要求: 用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据。 每部电影的图片,采用多线程的方法爬取,图片名字为电影名 了解正则的使用方法 候选网站:豆瓣电影:https://movie.douban.com/top2 -
数据采集第六次作业
#作业①: ##要求 用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据。 每部电影的图片,采用多线程的方法爬取,图片名字为电影名 了解正则的使用方法 ##思路 (1)ol下的每个li元素对应着每个电影,再通过find li下的元素来获取信息 (2)主演、导演以及评价人 -
数据采集与融合-第六次作业
##作业①: ###1)爬取豆瓣电影Top250数据 要求: 用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据。 每部电影的图片,采用多线程的方法爬取,图片名字为电影名 了解正则的使用方法 ####代码 import os import re import threa -
数据采集第六次作业
##作业①: 作业①: 要求: 用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据。 每部电影的图片,采用多线程的方法爬取,图片名字为电影名 了解正则的使用方法 候选网站:豆瓣电影:https://movie.douban.com/top250 作业②: ###(1)代 -
第六次作业
作业① 1)、用requests和BeautifulSoup库方法爬取豆瓣电影Top250数据实验 主函数: import os import urllib import urllib.request import re from bs4 import UnicodeDammit, Beautifu -
数据采集与融合综合作业
写在前面 这么快就到最后一次作业了,我不应该就此放下心爱的 bs4 re selenium 和不心爱的 scrapy,后面我想应该得重拾为了帮好朋友爬网易云做词云而去学 selenium 的学习热情继续加深爬虫技能吧! 学习历程主要就是作业的三大部分:从 bs4 + re > scrapy + xp -
第六次作业
果然我已经把bs4全忘了并且scrapy只记得一半 因为selenium真的方便好玩且功能齐全 所以第一第二题就只能用很丑陋的代码把他勉强实现出来,害。 #作业一 ##1)、爬取豆瓣top250 代码如下: from bs4 import BeautifulSoup from bs4 import