hbase设计案例，hbaserowkey设计原则

时间：2024-01-08 本站点击：0

HBase服务高可用之路的探索

1、这里的高可用并不是指HBase本身的高可用机制。而是HBase主备双服务的高可用，线上业务依赖于主备HBase集群来提供数据支持，主集群首要的任务时负责数据的读写，备集群只是为了容灾。

2、NoSQL概念随着web0的快速发展，非关系型、分布式数据存储得到了快速的发展，它们不保证关系数据的ACID特性。NoSQL概念在2009年被提了出来。NoSQL最常见的解释是“non-relational”，“Not Only SQL”也被很多人接受。

3、目前支持：NoSQLAPI、关系PhoenixSQL、时序OpenTSDB、全文检索Solr/ES、时空GeoMesa、图HGraph、分析Spark on HBase等。随着NoSQL的高速发展，NoSQL用户群体越来越庞大，未来NoSQL及NoSQL生态也会更好的满足各种业务场景。

4、由于存储方式的不同，HBase在读取和查询大规模数据时具有较高的性能优势，而传统数据库在处理事务和复杂查询时较为擅长。此外，HBase和传统数据库在适用场景上也有所区别。

5、当系统出现分区时，HBase可以通过副本机制来保证数据的可用性。

6、HBase是一个分布式数据库，它依赖ZooKeeper来提供协调和管理功能。ZooKeeper是一个开源的分布式协调服务，它能够为HBase提供高可用性、一致性和故障恢复机制。因此，HBase必须依赖ZooKeeper来正常运行。

1、现在遇到这样的情况：关系型数据库里面（oracle）有全国用户的数据1千多亿；而且存在不同的数据库里面，每个数据库里面表有50个左右。数据存放入Hbase里面，表怎么设计比较好。怎么实现hbase表里面的关联查询。

2、格式： create table name，column family其中 table name 为表名，创建表必须指定；column family 为列族名，创建表也必须指定。

3、hbase不支持多表连接。HBase没有太多复杂的多表连接，只有简单的插入、查询、删除、更新等。对于数据操作，HBase没有多表连接操作。对于存储模式，HBase基于列，关系数据库基于行。数据维护方面，HBase没有数据覆盖的操作。

4、Bloom Filter是一种快速的数据过滤技术，可以帮助HBase快速地过滤掉无效的查询请求，提高查询效率。MemStore是一种缓存机制，可以帮助HBase加速数据写入，提高数据写入效率。

必须在设计上保证RowKey的唯一性。由于在HBase中数据存储是Key-Value形式，若向HBase中同一张表插入相同RowKey的数据，则原先存在的数据会被新的数据覆盖。设计的RowKey应均匀的分布在各个HBase节点上，避免数据热点现象。

主键设计成：现有的主键+频度+列，即h+1+hi，但是最好将每个都格式化成定长的字符串，当你需要取前5个记录时使用过滤器取出前5条记录即可。

行键(RowKey)的设计首先应该避免使用时序或单调(递减/递增)行键。

关于hbase设计案例和hbaserowkey设计原则的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：/nosql/99005.html