- 班级所有博文发布时间分布(24小时制):
-
Hadoop综合大作业
开启Hadoop jps 创建文件 移动文件 启动Hive 创建数据库 结果 -
hadoop综合大作业
1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计 启动hadoop 查看文件夹 移动并查看文件 启动hive 创建、导入并查看文档 进行统计 2.用Hive对爬虫大作业产生的csv文件进行数据分析,写一篇博客描述你的分析过程和分析结果 启动Hadoop、上传 -
Hadoop综合大作业
Hadoop综合大作业 要求: 1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。 开启功能: 1、启动hadoop 2、Hdfs上创建文件夹并查看 3、上传英文词频统计文本至hdfs 4、启动Hive 5、导入文件内容到表docs并查看 6、进行词频统计 -
Hadoop综合大作业
1·开启服务,打开文件夹 2·查看目录下所有文件夹 (3)增加hdfs文件系统中文件夹里的文本文件。 4·进入LIVE,查看所有文件夹 5·创建表WORD,写HIVE QL语句 6·运行结果 2.用Hive对爬虫大作业产生的csv文件进行数据分析,写一篇博客描述你的分析过程和分析结果。 将数据以cs -
Hadoop综合大作业
1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。 (1)启动hadoop (2)查看hdfs (3)启动hive (4)进入hive,并查看所有的表 (5)创建表word,,写hiveQL命令统计 (6)运行结果 2.用Hive对爬虫大作业产生的csv文件 -
Hadoop综合大作业
1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。 在user/hadoop创建文件夹EnglishWord 上传文档到user/hadoop/EnglishWord文件夹中 在hive创建表world 导入文本world并查看 . 用SQL进行词频统计并保 -
Hadoop综合大作业
恢复内容开始 1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。 在虚拟机上网下载一个著名的《教父》的英文小说,下载到本地。 首先要启动dfs: 在hdfs上创建文件夹: 查看hdfs上的所有文件: 把下载的文件上传到hdfs: 启动hive: 创建表: 把 -
Hadoop综合大作业
1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。 载入数据 创建查表 查看表是否创建成果 2.用Hive对爬虫大作业产生的csv文件进行数据分析,写一篇博客描述你的分析过程和分析结果。 将数据以csv格式上传到hdfs 将文件上传到HDFS上 查看上传成功 -
hadoop综合大作业
用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)词频统计。 启动hadoop 用hdfs创建文件夹 上传自己找的英文文章到hdfs上 启动hive,创建novels原始文档表 导入文件内容到表docs并查看 查看统计结果 2.用Hive对爬虫大作业产生的csv文件进行数据分 -
Hadoop综合大作业
1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。 (1)开启服务,并创建文件夹 (2)查看目录下所有文件 (3)增加hdfs文件系统中文件夹里的文本文件。 (4)进入hive,并查看所有的表 (5)创建表word,,写hiveQL命令统计 (6)运行结果