-
10 期末大作业
1.选择使用什么数据,有哪些字段,多大数据量。 答:us-counties美新冠数据;字段:date,county,state,cases,deaths;数据量:158981条 2.准备分析哪些问题?(8个以上) (1). 统计美国截止每日的累计确诊人数和累计死亡人数。做法是以date作为分组字段, -
10 期末大作业
大作业: 1.选择使用什么数据,有哪些字段,多大数据量。 美国新冠肺炎疫情数据集,字段:累计确诊人数、累计死亡人数、新增确诊人数、新增死亡人数、各州累计确诊人数、各州累计死亡人数和美国各州 2.准备分析哪些问题?(8个以上) 美国每日的累计确诊病例数和死亡数 美国每日的新增确诊病例数 美国每日的新增 -
10 期末大作业
大作业: 1.选择使用什么数据,有哪些字段,多大数据量。 选择使用2020/1/21到2020/5/19这段时间的美新冠数据进行分析,字段有date(日期)、county(县)、state(州)、cases(案例)、deaths(死亡人数),数据量为158981条数据。 2.准备分析哪些问题?(8个 -
10 期末大作业
大作业: 1.选择使用什么数据,有哪些字段,多大数据量。 选择使用美国疫情数据;有日期、县、州、确诊人数、死亡人数 2.准备分析哪些问题?(8个以上) 每天有多少确诊病例和死亡病例 每个县有多少确诊病例和死亡病例 确诊人数最多的县 死亡人数最多的县 死亡病例为0的县有哪些 2020年3月14日的确诊 -
10 期末大作业
大作业: 1.选择使用什么数据,有哪些字段,多大数据量。 us-counties美新冠数据 2.准备分析哪些问题?(8个以上) (1). 统计美国截止每日的累计确诊人数和累计死亡人数。做法是以date作为分组字段,对cases和deaths字段进行汇总统计。 (2). 统计美国每日的新增确诊人数和新 -
10 期末大作业
数据集:美新冠数据集 字段: date county state cases deaths 数据量:158981 准备分析哪些问题? 1) 统计美国截止每日的累计确诊人数和累计死亡人数。 2) 统计美国每日的新增确诊人数和新增死亡人数。 3) 统计截止5.18日,美国各州的累计确诊人数和死亡人数。 -
9.spark连接mysql数据库
spark连接mysql数据库 1.安装启动检查Mysql服务。netstat -tunlp (3306) 2.spark 连接mysql驱动程序。–cp /usr/local/hive/lib/mysql-connector-java-5.1.40-bin.jar /usr/local/spark -
09 spark连接mysql数据库
1.安装启动检查Mysql服务。 netstat -tunlp (3306) 2.spark 连接mysql驱动程序。–cp /usr/local/hive/lib/mysql-connector-java-5.1.40-bin.jar /usr/local/spark/jars 3.启动 Mysq -
09 spark连接mysql数据库
安装启动检查Mysql服务。netstat -tunlp (3306) spark 连接mysql驱动程序。–cp /usr/local/hive/lib/mysql-connector-java-5.1.40-bin.jar /usr/local/spark/jars 启动 Mysql shell -
09 spark连接mysql数据库
spark连接mysql数据库: 1.安装启动检查Mysql服务。 2.spark 连接mysql驱动程序。 –cp /usr/local/hive/lib/mysql-connector-java-5.1.40-bin.jar /usr/local/spark/jars netstat -tunl