-
10 期末大作业
1.选择使用什么数据,有哪些字段,多大数据量。 选用美国新冠数据集,变量有日期(date),县(county), 国家、州(state),确诊情况(cases),死亡人数(deaths),共158981条数据。 2.准备分析哪些问题?(8个以上) (1) 统计美国截止每日的累计确诊人数和累计死亡人数 -
10 期末大作业
1.选择使用什么数据,有哪些字段,多大数据量。 选用美国新冠数据集,变量有日期(date),县(county), 国家、州(state),确诊情况(cases),死亡人数(deaths),共158981条数据。 2.准备分析哪些问题?(8个以上) (1) 统计美国截止每日的累计确诊人数和累计死亡人数 -
10 期末大作业
1.选择使用什么数据,有哪些字段,多大数据量。 选用美国新冠数据集,变量有日期(date),县(county), 国家、州(state),确诊情况(cases),死亡人数(deaths),共158981条数据。 2.准备分析哪些问题?(8个以上) (1) 每日新增确认人数趋势,以拆线图形式呈现。 ( -
第十次作业:期末大作业
补: 第六次作业:Spark SQL 及其DataFrame的基本操作 第七次作业:从RDD创建DataFrame 大作业: 1.选择使用什么数据,有哪些字段,多大数据量。 2020年美国新冠疫情数据。字段有日期,区县,州,截止该日期该区县的累计确诊人数,截止该日期该区县的累计死亡人数。数据量为15 -
大数据(二)作业十: 期末大作业
大作业: 1.选择使用什么数据,有哪些字段,多大数据量。 基于YELP数据集的商业分析 字段名称 含义 数据格式 例子 business_id 商家ID string “business_id”: “tnhfDv5Il8EaGSXZGiuQGg” name 商家名称 string “name”: “ -
10 期末大作业
第七次 作业 补交(时间原因) https://www.cnblogs.com/lzf1234/p/14875051.html -
第十次期末作业
期末作业: 一、.选择使用什么数据,有哪些字段,多大数据量。 地震数据 累计死亡人数 不同类型的地震数量 各个省份的地震次数 二、准备分析哪些问题?(8个以上) 1.中国境内每个省份(海域)发生重大地震的次数 2.不同类型地震的数量 3.震级前500的地震 4.震源深度前500的地震 5. 震级与震 -
10 期末大作业
1.选择使用什么数据,有哪些字段,多大数据量。 本次实验数据集来自和鲸社区的信用卡评分模型构建数据 ,以数据集cs-training.csv为分析主体,其中共有15万条记录,11列属性。 SeriousDlqin2yrs: 是否逾期。RevolvingUtilizationOfUnsecuredLi -
10 期末大作业
大作业: 1.选择使用什么数据,有哪些字段,多大数据量。 选择美国新冠疫情统计数据。 字段结构为(以前两行为例) date, county, state, cases, deaths2020/1/21,Snohomish,Washington, 1, 0 数据大小5MB 2.准备分析哪些问题?(8个 -
10 期末大作业
1.选择使用什么数据,有哪些字段,多大数据量。 选用美国新冠数据集,变量有日期(date),县(county), 国家、州(state),确诊情况(cases),死亡人数(deaths),共158981条数据。 2.准备分析哪些问题?(8个以上) (1) 统计美国截止每日的累计确诊人数和累计死亡人数