软件1801 (广州商学院)

  • 第十次作业:期末大作业

    补: 第六次作业:Spark SQL 及其DataFrame的基本操作 第七次作业:从RDD创建DataFrame 大作业: 1.选择使用什么数据,有哪些字段,多大数据量。 2020年美国新冠疫情数据。字段有日期,区县,州,截止该日期该区县的累计确诊人数,截止该日期该区县的累计死亡人数。数据量为15
    桉叶   2021-06-11 14:54   0   44
  • 大数据(二)作业十: 期末大作业

    大作业: 1.选择使用什么数据,有哪些字段,多大数据量。 基于YELP数据集的商业分析 字段名称 含义 数据格式 例子 business_id 商家ID string “business_id”: “tnhfDv5Il8EaGSXZGiuQGg” name 商家名称 string “name”: “
    阿丹biu   2021-06-11 14:53   0   204
  • 10 期末大作业

    第七次 作业 补交(时间原因) https://www.cnblogs.com/lzf1234/p/14875051.html
    赖泽梵   2021-06-11 14:47   0   24
  • 07 从RDD创建DataFrame

    1.pandas df 与 spark df的相互转换 3.1 利用反射机制推断RDD模式 sc创建RDD 转换成Row元素,列名=值 spark.createDataFrame生成df df.show(), df.printSchema() 3.2 使用编程方式定义RDD模式 生成“表头” fie
    赖泽梵   2021-06-11 14:45   0   31
  • 第十次期末作业

    期末作业: 一、.选择使用什么数据,有哪些字段,多大数据量。 地震数据 累计死亡人数 不同类型的地震数量 各个省份的地震次数 二、准备分析哪些问题?(8个以上) 1.中国境内每个省份(海域)发生重大地震的次数 2.不同类型地震的数量 3.震级前500的地震 4.震源深度前500的地震 5. 震级与震
    wwxtl   2021-06-11 14:45   0   24
  • 10 期末大作业

    1.选择使用什么数据,有哪些字段,多大数据量。 本次实验数据集来自和鲸社区的信用卡评分模型构建数据 ,以数据集cs-training.csv为分析主体,其中共有15万条记录,11列属性。 SeriousDlqin2yrs: 是否逾期。RevolvingUtilizationOfUnsecuredLi
    Ling3   2021-06-11 14:44   0   83
  • 10 期末大作业

    大作业: 1.选择使用什么数据,有哪些字段,多大数据量。 选择美国新冠疫情统计数据。 字段结构为(以前两行为例) date, county, state, cases, deaths2020/1/21,Snohomish,Washington, 1, 0 数据大小5MB 2.准备分析哪些问题?(8个
    写那么快干嘛啊?   2021-06-10 10:30   0   62
  • 10 期末大作业

    1.选择使用什么数据,有哪些字段,多大数据量。 选用美国新冠数据集,变量有日期(date),县(county), 国家、州(state),确诊情况(cases),死亡人数(deaths),共158981条数据。 2.准备分析哪些问题?(8个以上) (1) 统计美国截止每日的累计确诊人数和累计死亡人数
    庄玉峰   2021-06-09 21:04   0   29
  • 10 期末大作业

    1.选用美国新冠数据集,变量有日期(date),县(county), 国家、州(state),确诊情况(cases),死亡人数(deaths); 2. 美国确诊人数最多的县,统计死亡人数最多州,美国确诊人数最少的州,5.19日为止死亡人数最少的前十个州,5.19美国确诊人数最多的前十个州,美国一个县
    儒雅随和的t君   2021-06-07 21:59   0   28
  • 10 期末大作业

    1.选择使用什么数据,有哪些字段,多大数据量。 us-counties美新冠数据;字段有日期(date),县(county), 国家、州(state),确诊情况(cases),死亡人数(deaths);共158981条数据。 2.准备分析哪些问题?(8个以上) 1.统计美国某个县每天的确诊病例和死亡
    赶作业的YI点   2021-06-07 21:56   0   22