软件工程2019级2班 (泉州信息工程学院 - 软件工程学院)

  • 班级所有博文发布时间分布(24小时制):
  • 爬取芒果TV电视剧排行榜

    一、主题式网络爬虫设计方案 1.主题式网络爬虫名称:爬取软件之家软件下载排行榜 2.主题式网络爬虫爬取的内容:爬取软件下载排名、下载次数 3.主题式网络爬虫设计方案概述 实现思路:访问目标网页的源代码,使用get请求和BeautifulSoup解析工具爬取数据并采集保留,然后进行数据清洗和处理,数据
    蔡晶晶   2020-04-24 22:55   0   976
  • 爬取拉勾网关于python职位并进行数据分析和可视化

    一、主题式网络爬虫设计方案 1、主题式网络爬虫名称:抓取拉勾网关于python职位相关的数据信息 2、主题式网络爬虫爬取的内容:关于python职位相关信息 3、主题式网络爬虫设计方案概述:找到网站地址,分析网站源代码,找到所需要的数据所在位置并进行提取、整理和数据可视化操作。 二、主题页面的结构特
    王信捷   2020-04-24 22:41   0   1076
  • 爬取人口数据

    一、主题式网络爬虫设计方案(15分)1.主题式网络爬虫名称:爬取人口数据及数据可视化2.主题式网络爬虫爬取的内容与数据特征分析:爬取国家统计局人口数据3.主题式网络爬虫设计方案概述(包括实现思路与技术难点):首先找到爬取页面的源代码,找到所需要爬取的数据在源代码中的位置,接下来进行数据爬取,并将数据
    M20   2020-04-24 22:09   0   1427
  • 爬取B站番剧每周排行并对数据进行分析

    一、主题式网络爬虫设计方案 1.主题式网络爬虫名称:BILIBILI番剧热度及排行 2.主题式网络爬虫爬取的内容与数据特征分析:内容为番剧名称,视频总播放量以及综合得分 3.主题式网络爬虫设计方案概述:通过对BILIBILI网页源代码的分析获得所需数据,并进行爬取和整理,从而得出所需结论 二、主题页
    M_google   2020-04-24 20:27   0   1572
  • 爬起腾讯视频数据的处理与分析

    爬取腾讯视频热播榜并处理分析 一:网络爬虫设计方案 爬虫名称:爬取腾讯视频热播榜并处理分析 爬取内容:热播榜的影视剧名称与对应的热度 设计方案概述: 1.需要找到要爬取的网页,使用F12查看源代码,找到要爬取的数据 2.然后使用get请求和beautifulsoup 3.使用pandas进行数据可视
    林仁满   2020-04-24 18:09   0   1102
  • 爬取微博热搜

    1.主题式网络爬虫名称 爬取微博热搜2.主题式网络爬虫爬取的内容与数据特征分析 爬取新浪网热搜排行榜、热度3.主题式网络爬虫设计方案概述(包括实现思路与技术难点) 通过requests,beautifulsoup, pandas,matplotlib.pyplot等等进行网页爬取,数据提取分析,数据
    念旧1601460587   2020-04-24 15:58   0   192
  • 爬取百度贴吧热议榜

    一.主题式网络主题式网络爬虫设计方案 1、主题式网络爬虫名称:爬取百度贴吧数据并数据分析及可视化 2.爬取的内容:贴吧热议榜的标题、排行、热度 3.网络爬虫设计方案概述:首先找到爬取页面的源代码,找到所需要爬取的数据在源代码中的位置,接下来进行数据爬取,并将数据持久化,接下来对数据进行清洗处理,并进
    罗文飞   2020-04-24 15:01   0   524
  • Python爬取百度热搜和数据处理

    一、主题式网络爬虫设计方案1.主题式网络爬虫名称:爬取百度热搜2.主题式网络爬虫爬取的内容与数据特征分析:百度热搜排行,标题,热度3.主题式网络爬虫设计方案概述:先搜索网站,查找数据并比对然后再输入代码进行爬取。难点在于文件的生成和读取。 二、主题页面的结构特征分析1.主题页面的结构与特征分析 2.
    南方&   2020-04-24 02:13   0   2411
  • 爬取前程无忧职位信息

    一主题网络爬虫设计方案 1.主题式网络爬虫名称:爬取前程无忧职位信息 2.主题式网络爬虫爬取的内容 本爬虫就要爬取公司名称,工作地点,薪资,学历,工作经验,招聘人数,公司规模,公司类型,公司福利和发布时间。 3.主题式网络爬虫设计方案概述 实验思路:爬取数据,数据清洗,数据可视化。 二.主题页面结构
    郑炜平   2020-04-23 22:32   0   1023
  • 爬取百度热搜榜及数据分析与可视化处理

    一.主题式网络爬虫设计方案 1.主题式 网络爬虫名称:爬取百度热搜排行榜及数据分析与可视化处理 2.主题式网络爬虫爬取的内容:爬取百度热搜排名,标题,热度值 3.方案设计:访问分析百度热搜网页,得到网页源代码,写出查找所需标签的代码,对数据进行相应的分析。提取标签保存到csv文件中,读取文件进行数据
    钟丽娟   2020-04-23 21:53   0   1447