首页>>数据库>>nosql->hbase和hdfs整合,hbase与hdfs区别

hbase和hdfs整合,hbase与hdfs区别

时间:2023-12-19 本站 点击:0

Hbase与HDFS是什么关系?

具体来说,HBase使用HFile作为基本的数据存储格式,这与HDFS是类似的。但是,HBase不仅使用HDFS来存储数据,而且还通过与Hadoop生态系统中的其他组件(如MapReduce和Pig)集成,以支持高效的并行处理和分析数据的能力。

HBase系统架构如下所示,包括客户端、Zookeeper服务器、Master主服务器、Region服务器。一般而言,HBase会采用HDFS作为底层数据存储。

hbase的副本与hdfs的副本之间没有任何关系。hbase的副本是对历史数据的备份,是新旧数据,而非相同数据的copy;hdfs的副本是同一数据的copy。hbase的数据文件存放在hdfs上,但是在hdfs上具体如何存储对hbase是透明的。

Hadoop生态系统-新手快速入门(含HDFS、HBase系统架构)

1、在配置好Hadoop 集群之后,可以通过浏览器访问 http://[NameNodeIP]:9870,查询HDFS文件系统。通过该Web界面,可以查看当前文件系统中各个节点的分布信息。

2、HadoopDistributedFileSystem(HDFS)是高容错、高吞吐量、用于处理海量数据的分布式文件系统。HDFS一般由成百上千的机器组成,每个机器存储整个数据集的一部分数据,机器故障的快速发现与恢复是HDFS的核心目标。

3、fs.defaultFs hdfs://node1:9000 hadoop.tmp.dir file:/home/hduser/hadoop/tmp 这里给出了两个常用的配置属性,fs.defaultFS表示客户端连接HDFS时,默认路径前缀,9000是HDFS工作的端口。

4、Hadoop Distributed File System(HDFS)是高容错、高吞吐量、用于处理海量数据的分布式文件系统。 HDFS一般由成百上千的机器组成,每个机器存储整个数据集的一部分数据,机器故障的快速发现与恢复是HDFS的核心目标。

5、在熟悉基础组件后,可以进一步学习Hadoop生态系统中的其他组件,如Hive、Pig和HBase。持续学习 随着大数据领域的不断发展,Hadoop也在不断进化。持续学习新的知识和技能是保持竞争力的关键。

6、Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。Hadoop的核心是HDFS和Mapreduce,hadoop0还包括YARN。

有了hdfs为什么还要hbase

hdfs 是一种分布式存储技术,能够存储海量的数据,但是不对数据进行逻辑组织与管理(非结构化);hbase 是底层基于hdfs,能够存储海量数据,并且对数据进行结构化管理(类似于Oracle,mysql的表结构)。

他们的关系是:hbase是一个内存数据库,而hdfs是一个存储空间;是物品和房子的关系。hdfs只是一个存储空间,他的完整名字是分布式文件系统。从名字可知他的作用了。

因为 HBase 基于 Hadoop 的 HDFS 完成分布式存储,以及 MapReduce 完成分布式并行计算,所以它的一些特点与 Hadoop 相同,依靠横向扩展,通过不断增加性价比高的商业服务器来增加计算和存储能力。

首先,hbase可以存储非常大量的数据。在大数据时代,数据的量级往往达到了PB甚至EB级别,传统的关系型数据库已经无法满足这样的存储需求。

来增加磁盘空间,从而避免像关系数据库那样进行数据迁移。高可靠性:HBase 在 HDFS 之上,而 HDFS 本身具有备份机制,所以在 HBase 集群出现严重问题时,Replication(即副本)机制能够保证数据不会发生丢失或损坏。

HBase存储架构

1、hbase的核心数据结构为LSM树。LSM树分为内存部分和磁盘部分。内存部分是一个维护有序数据集合的数据结构。RowKey与nosql数据库们一样,RowKey是用来检索记录的主键。

2、HBase采用了类似Google Bigtable的数据模型,即一个稀疏的、分布式的、持久化的多维映射表,每个表都由行键、列族、列限定符和时间戳组成。

3、/hbase/.archive HBase 在做 Split或者 compact 操作完成之后,会将 HFile 移到.archive 目录中,然后将之前的 hfile 删除掉,该目录由 HMaster 上的一个定时任务定期去清理。

4、hbase的核心数据结构为LSM树。LSM树分为内存部分和磁盘部分。内存部分是一个维护有序数据集合的数据结构。

hbase和hdfs整合的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于hbase与hdfs区别、hbase和hdfs整合的信息别忘了在本站进行查找喔。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:/nosql/42262.html