-
09 spark连接mysql数据库
1. 安装启动检查Mysql服务。##netstat -tunlp (3306) cd /usr/local/hive/lib ls mysql* cp mysql-connector-java-5.1.40-bin.jar /usr/local/spark/jars/ cd /usr/local/ -
RDD
总共有多少学生?map(), distinct(), count() 开设了多少门课程? 每个学生选修了多少门课?map().countByValue() //map(), countByKey() 每门课程有多少个学生选?map(), countByValue() Tom选修了几门课?每门课多少分 -
我是48号 我是陈伟基 我复制我光荣
我是48号 我是陈伟基 我复制我光荣 我爱大数据!! -
第五次作业
1.本地文件系统创建一个文件,输入带姓名学号信息。 2.查看新建文件所在目录 3.查看新建文件内容 4.将此文件上传到HDFS文件系统上的用户目录 5.HDFS上查看相应目录 6.HDFS上查看文件内容 7.HDFS上查看文件大小 8.删除本地1步骤创建的文件 9.将HDFS上的文件下载到本地 10 -
第四次大数据作业hadoop的安装和HDFS体系结构
安装hadoop 安装JAVA环境并进行环境变量配置 格式化namenode 伪分布式hadoop安装完成 -
第一次作业 201806120030
第一次作业 大数据概述与学习资源 1、了解微信、微博、小视频每天产生的数据量与数据类型。 微信每天有450亿次信息发送出,有4.1亿次音视频呼叫成功。微博每天产生的微博数超过1000万。 2、选择一个你感兴趣的领域应用数据思维进行分析决策的案例。 北京市西城区长安街街道在极为有限的空间中充分发挥数字