-
10 期末大作业
一、.选择使用什么数据,有哪些字段,多大数据量。 us-counties美新冠数据;字段有日期(date),县(county), 国家、州(state),确诊情况(cases),死亡人数(deaths); 二、准备分析哪些问题?(8个以上) 1、统计美国每天的累计确诊病例和累计死亡病例 2、统计确诊 -
10 期末大作业
09 spark连接mysql数据库:(写好已经不能提交了) 1.选择使用什么数据,有哪些字段,多大数据量。 2.准备分析哪些问题?(8个以上) 美国每日的累计确诊病例数和死亡数 美国每日的新增确诊病例数 美国每日的新增死亡病例数 死亡人数最多的县 死亡病例为0的县有哪些 2020年3月14日的确诊 -
10 期末大作业
大作业: 1.选择使用什么数据,有哪些字段,多大数据量。 选择使用美国疫情数据;有日期、县、州、确诊人数、死亡人数 2.准备分析哪些问题?(8个以上) 某个县每天有多少确诊病例和死亡病例 每个县最多确证病例是哪一天有多少 每个县最多死亡病例是哪一天有多少 5.19确证病例前十的州 5.19死亡病例前 -
10 期末大作业
06 Spark SQL 及其DataFrame的基本操作(忘了交 1.Spark SQL出现的 原因是什么? Spark SQL的前身是 Shark,Shark最初是美国加州大学伯克利分校的实验室开发的Spark生态系统的组件之一,它运行在Spark系统之上,Shark重用了Hive的工作机制,并 -
10 期末大作业
补交作业 01 Spark架构与运行流程,https://www.cnblogs.com/0311Chrome/p/14856587.html(第一次作业) 原因:当时忘记这次作业了 Spark RDD编程,https://www.cnblogs.com/0311Chrome/p/14856591. -
10 期末大作业
大作业: 1.选择使用数据,有什么字段,数据量。 选择使用美国疫情数据;有日期、县、州、确诊人数、死亡人数 2.准备分析哪些问题?(8个以上) 每天有多少确诊病例和死亡病例 每个县有多少确诊病例和死亡病例 确诊人数最多的县 死亡人数最多的县 死亡病例为0的县有哪些 2020年3月14日的确诊人数 确 -
10 期末大作业
1.选择使用什么数据,有哪些字段,多大数据量。 答:us-counties美新冠数据;字段:date,county,state,cases,deaths;数据量:158981条 2.准备分析哪些问题?(8个以上) (1). 统计美国截止每日的累计确诊人数和累计死亡人数。做法是以date作为分组字段, -
10 期末大作业
大作业: 1.选择使用什么数据,有哪些字段,多大数据量。 美国新冠肺炎疫情数据集,字段:累计确诊人数、累计死亡人数、新增确诊人数、新增死亡人数、各州累计确诊人数、各州累计死亡人数和美国各州 2.准备分析哪些问题?(8个以上) 美国每日的累计确诊病例数和死亡数 美国每日的新增确诊病例数 美国每日的新增 -
10 期末大作业
大作业: 1.选择使用什么数据,有哪些字段,多大数据量。 选择使用2020/1/21到2020/5/19这段时间的美新冠数据进行分析,字段有date(日期)、county(县)、state(州)、cases(案例)、deaths(死亡人数),数据量为158981条数据。 2.准备分析哪些问题?(8个 -
10 期末大作业
大作业: 1.选择使用什么数据,有哪些字段,多大数据量。 选择使用美国疫情数据;有日期、县、州、确诊人数、死亡人数 2.准备分析哪些问题?(8个以上) 每天有多少确诊病例和死亡病例 每个县有多少确诊病例和死亡病例 确诊人数最多的县 死亡人数最多的县 死亡病例为0的县有哪些 2020年3月14日的确诊