hbase查看表的数据类型，hbase 查看表数据

时间：2024-01-12 本站点击：0

HBase支持的数据格式有哪些?

HBase 通过 Put 操作和 Result 操作支持 “byte-in / bytes-out” 接口，所以任何可以转换为字节数组的内容都可以作为一个值存储。输入可以是字符串、数字、复杂对象、甚至可以是图像，只要它们可以呈现为字节。

hbase的核心数据结构为LSM树。LSM树分为内存部分和磁盘部分。内存部分是一个维护有序数据集合的数据结构。RowKey与nosql数据库们一样，RowKey是用来检索记录的主键。

LSM-Tree是一种支持高写入吞吐量的数据结构，它把数据分成多个层，每层采用不同的策略来管理数据，包括内存中的缓存、写入磁盘的SSTable、和合并SSTable的操作。

具体来说，HBase使用HFile作为基本的数据存储格式，这与HDFS是类似的。但是，HBase不仅使用HDFS来存储数据，而且还通过与Hadoop生态系统中的其他组件（如MapReduce和Pig）集成，以支持高效的并行处理和分析数据的能力。

根据查询51cto博客信息显示，hbase模式里的逻辑实体有：表(table)：HBase用表来组织数据，表名是字符串(String)，由可以在文件系统路径里使用的字符组成。

Hbase有两种运行模式：standalone和distributed。StandaloneMode 默认的运行模式。在该模式下，Hbase不会使用HDFS，而是使用本地文件系统。它在同一个虚拟机中运行所有Hbasedaemon和本地ZooKeeper。

（2）物理模型主要从实现Hbase的角度来讨论 HBase数据模型逻辑结构逻辑上，HBase 的数据模型同关系型数据库很类似，数据存储在一张表中，有行有列。

默认，HBase 在创建表的时候，会自动为表分配一个 Region，正处于混沌时期，start-end key 无边界，所有 RowKey 都往这个 Region里分配。

首先Hbase是依赖于HDFS和zookeeper的。 Zookeeper分担了Hmaster的一部分功能，客户端进行DML语句的时候，都是先跟ZK交互。

有序集合（Sorted Set）：有序集合类型存储的是一组有序的元素，每个元素都有一个分数（score），可以根据分数进行排序。

总结：业务需求是将kafka的数据写入到hbase，开始是想用官方的sink，结果是我太天真了，官方的hbase sink的rowKey并不满足业务需求，而且kafka的数据字段是不确定的，搞了半天，白忙活。发现自己定义的比较符合业务需求。

在底层实现上，HBase使用了基于Hadoop的分布式文件系统HDFS来存储数据，并且使用了一种称为LSM-Tree（Log-Structured Merge-Tree）的数据结构来管理数据。

hbase的核心数据结构为LSM树。LSM树分为内存部分和磁盘部分。内存部分是一个维护有序数据集合的数据结构。

RowKey 与nosql数据库们一样，RowKey是用来检索记录的主键。

1、数据查询模式已经确定，且不易改变，就是说hbase使用在某种种特定的情况下，且不能变动。告诉插入，大量读取。因为分布式系统对大量数据的存取更具优势。尽量少的有数据修改。

2、用户画像比如大型的视频网站，电商平台产生的用户点击行为、浏览行为等等存储在HBase中为后续的智能推荐做数据支撑。

3、主要关注的是对数据的统计等方面。适合的场景：hbase：适合大型数据存储，其作用可以类比于传统数据库的作用，主要关注的数据的存取。hive：适合大数据的管理，统计，处理，其作用类比于传统的数据仓库，主要关注的数据的处理。

4、想象你在操作RMDB数据库，如果是全表扫描，就用Hive+Hadoop，如果是索引访问，就用HBase+Hadoop 。Hive query就是MapReduce jobs可以从5分钟到数小时不止，HBase是非常高效的，肯定比Hive高效的多。

hbase查看表的数据类型的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于hbase 查看表数据、hbase查看表的数据类型的信息别忘了在本站进行查找喔。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：/nosql/111957.html