软件1801 (广州商学院)

  • Hadoop演进与Hadoop生态

    1.了解对比Hadoop不同版本的特性,可以用图表的形式呈现。 Apache Hadoop版本分为两代,第一代Hadoop称为Hadoop1.0,第二代Hadoop称为Hadoop2.0。第一代Hadoop包含0.20.x、0.21.x、0.22.x三大版本,其中,0.20.x最后演化成1.0.x,
    小王子C   2020-09-18 11:15   0   164
  • 第二次作业

    1. 版本 对应特性 1.0 安全 HBase(append / hsynch / hflush和安全性) webhdfs(全面支持安全性) 性能增强了对HBase对本地文件的访问 其他性能增强,错误修复和功能 1.1 从主干向后移植HDFS的许多性能改进 使用SPNEGO而不是Kerberized
    赖泽梵   2020-09-18 11:10   0   134
  • 第二次作业 Hadoop演进与Hadoop生态

    1.对比Hadoop不同版本的特性: Apache Hadoop Apache Hadoop是apache提供的官方版本,以yarn框架的出现为标志分为Hadoop第一代和Hadoop第二代,第一代的Hadoop包含三个大版本:0.20.x 、0.21.x 、0.22.x,其中除了0.20.x(后来
    约翰克里斯朵夫   2020-09-18 11:09   0   95
  • 作业2

    一、了解对比Hadoop不同版本的特性,可以用图表的形式呈现。 答:Apache Hadoop版本分为两代,第一代Hadoop称为Hadoop1.0,第二代Hadoop称为Hadoop2.0。第一代Hadoop包含0.20.x、0.21.x、0.22.x三大版本,其中,0.20.x最后演化成1.0.
    碎觉觉   2020-09-18 11:08   0   66
  • 014作业9.18

    一. 1.DKhadoop发行版:有效的集成了整个HADOOP生态系统的全部组件,并深度优化,重新编译为一个完整的更高性能的大数据通用计算平台,实现了各部件的有机协调。因此DKH相比开源的大数据平台,在计算性能上有了高达5倍(最大)的性能提升。DKhadoop将复杂的大数据集群配置简化至三种节点(主
    今天中午恰什么   2020-09-18 11:07   0   75
  • 第二次

    1.了解对比Hadoop不同版本的特性,可以用图表的形式呈现。 2.Hadoop生态的组成、每个组件的作用、组件之间的相互关系,以图例加文字描述呈现。 组件名功能及作用优势局限应用场景相关功能组件 HDFS 分布式文件系统。存储是大数据技术的基础 (1)高吞吐量访问; (2)高容错性; (3)容量扩
    拿大刀的犬夜叉   2020-09-18 11:04   0   71
  • 大数据作业2

    1.了解对比Hadoop不同版本的特性,可以用图表的形式呈现。 Hadoop是一个能够对大量数据进行分布式处理的软件框架。 Hadoop 以一种可靠、高效、可伸缩的方式进行数据处理。 Hadoop的发行版除了有Apache hadoop外cloudera,hortonworks,mapR,华为,DK
    JestZLB   2020-09-18 11:02   0   361
  • 第二次作业

    1.Apache社区版本 优点:完全开源免费。社区活跃文档、资料详实缺点:复杂的版本管理。版本管理比较混乱的,各种版本层出不穷,让很多使用者不知所措。复杂的集群部署、安装、配置。通常按照集群需要编写大量的配置文件,分发到每一台节点上,容易出错,效率低下。复杂的集群运维。对集群的监控,运维,需要安装第
    果宝机甲,归位!!!   2020-09-18 10:52   0   130
  • Hadoop演进与Hadoop生态

    Hadoop演进: 1.Hadoop最早起源于Nutch。Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页抓取、索引、查询等功能,但随着抓取网页数量的增加,遇到了严重的可扩展性问题——如何解决数十亿网页的存储和索引问题。 2.2003年、2004年谷歌发表的两篇论文为该问题提供了可行的解决
    落幕无华   2020-09-18 10:50   0   200
  • (作业1)大数据概述与学习资源

    1、了解微信、微博、小视频每天产生的数据量与数据类型。 微信云开发数据库提供以下几种数据类型: String:字符串 Number:数字 Object:对象 Array:数组 Bool:布尔值 Date:时间 Geo:多种地理位置类型 Null 每天产生的数据量都在5亿+ 全网微博数据每日亿级实时采
    Ling3   2020-09-12 21:36   0   95