- 班级所有博文发布时间分布(24小时制):
-
全球新冠病毒疫情分析
一、选题的背景 新型冠状病毒肺炎(Corona Virus Disease 2019,COVID-19),简称"新冠肺炎",世界卫生组织命名为"2019冠状病毒病" ,是指2019新型冠状病毒感染导致的肺炎。2019年12月以来,湖北省武汉市部分医院陆续发现了多例有华南海鲜市场暴露史的不明原因肺炎病 -
爬取网易云研究评论与排名的联系
一.选题背景 随着物质生活的不断提高,人们对于精神生活的需求与日剧增,而音乐就是一类门槛较低,且能够满足大部分人的需求的精神食粮,同时也能在一定程度上缓和人们的心情,是比较廉价的发泄途径,所以我想通过爬虫爬取当下的音乐热门软件网易云来了解歌曲的火热程度与评论的人数是否有关。 (二)、主题式网络爬虫设 -
基于爬虫技术爬取拉勾网招聘信息分析软件开发行业走向
一、选题背景 近年来,越来越多的大学生选择计算机行业作为自己的研究方向,但是大学生们对该行业所需要的技 术,以及一线、二线城市的薪资水准等可能不清楚。因此,我们通过爬取拉钩网,获取软件开发行业的 相关技术栈以及薪资标准,为大学生的就业以及方向选择进行导向。 二、设计方案 1.爬虫名称:拉勾网招聘信息 -
网络爬虫——爬取手机厚度排行
一、选题的背景 手机这个产品本身就不是标准,所以终究会出现各种厚度不一的产品,而厚度又成为了手机产品中一个及其重要的参数,就是这个参数,各种厂家为了降低他绞尽脑汁。首先从营销来看,从定位角度上来看,手机比人薄小数点后两位可能就是一个抢占用户第一心智的关键点,在信息如此爆炸的现在,一个心智的第一是无比 -
Python-爬取LOL战队战力值排行榜
一、选题背景 电子竞技是指使用电子游戏来比赛的体育项目,进行人与人之间智力与反应的对抗。通过电子竞技,可以锻炼和提高参与者的思维能力、反应能力、四肢协调能力和意志力,培养团队精神。随着游戏对经济、社会不断加强的影响,电子竞技被正式列入体育运动项目,并且成为一种职业。2020年12月16日,在亚奥理事 -
爬取新浪新闻国际新闻分享数的排名
(一)、选题的背景 新浪新闻是新浪集团旗下的智能信息平台,致力于利用大数据和人工智能技术,为用户提供更丰富、场景化和个性化的内容阅读体验。新浪新闻与微博打通了双平台的内容、数据和账号体系,为用户提供全网资讯、热点要闻、深度精选、精彩视频、高清图集等精彩内容。 截至2021年8月,数据显示,新浪新闻M -
Python网络爬虫——爬取哔哩哔哩网站原创视频以及其动漫视频
一、选题的背景 为什么要选择此选题?要达到的数据分析的预期目标是什么?(10 分)从社会、经济、技术、数据来源等方面进行描述(200 字以内) 选题原因:爬虫是指一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息。选择此题正是因为随着信息化的发展,大数据时代对信息的采需求和集量越来越大 -
基于Python网络爬虫的美国GDP数据分析
一、选题的背景 从社会层面来说,分析美国的GDP数据,能够为我国的经济发展提供指导意义,达到趋利避害,学习美国的经验,以美国为鉴的目的。 从技术方面来说,爬虫是新时代新兴的技术,掌握爬虫,能不被社会所淘汰,紧跟时代的潮流, 从数据来源来说,GDP数据是比较好爬取的数据,不会出现因为恶意爬取而被封ip -
全国疫情可视化分析
一、 选题的背景 为什么要选择此选题?要达到的数据分析的预期目标是什么?(10分) 针对国家新冠疫情有感而发,分析的目标是展示所有省份的疫情数据达到可以可视化观察 二、主题式网络爬虫设计方案(10分) 1.主题式网络爬虫名称 Python网络爬虫——全国各省份疫情 2.主题式网络爬虫爬取的内容与数据 -
爬取B站动画排行榜
一、 选题的背景 为什么要选择此选题?要达到的数据分析的预期目标是什么?(10分) 我对B站动画感兴趣,想探寻一下几部动画收藏量观看次数等的关系。 二、主题式网络爬虫设计方案(10分) 1.主题式网络爬虫名称 Python网络爬虫——爬取B站动画排行榜 2.主题式网络爬虫爬取的内容与数据特征分析 爬