hbase磁盘延迟高，hbase disable时间长

时间：2023-12-24 本站点击：0

Hbase读写原理

所以hbase大多数读要走磁盘，所以读很慢。每次刷写会生成新的Hfile，Hfile很小并且数量多的时候会影响查询的速度。所以要进行合并。

Hbase是Hadoop的一个存储组件可以提供低延迟的读写操作，它一般构建在HDFS之上，可以处理海量的数据。Hbase有个很好的特性是可以自动分片，也就是意味着当表的数据量变得很大的时候，系统可以自动的分配这些数据。

为了减少flush过程对读写的影响，HBase采用了类似于两阶段提交的方式，将整个flush过程分为三个阶段：要避免“写阻塞”，貌似让Flush操作尽量的早于达到触发“写操作”的阈值为宜。

无Master过程中，数据读取仍照常进行。但是，无master过程中，region切分、负载均衡等无法进行。

这里的高可用并不是指HBase本身的高可用机制。而是HBase主备双服务的高可用，线上业务依赖于主备HBase集群来提供数据支持，主集群首要的任务时负责数据的读写，备集群只是为了容灾。

在HBase中，数据被分布在多个区域（region）中，每个区域都存储在一个区域服务器（region server）上。这种分布式架构使得HBase可以处理大规模的数据集，并且具有高可用性和容错性。

在Hbase中HMaster负责监控HRegionServer的生命周期，均衡RegionServer的负载，如果HMaster挂掉了，那个整个Hbase集群将处于不健康的状态，并且此时的工作状态不会维持太久。所以Hbase支持对HMaster的高可用配置。

可用性：HBase为了保证系统的高可用性，采用了主从复制和Region复制等多种副本机制，可以在主节点或者Region服务器宕机的情况下，快速切换到备用节点或者Region服务器，保证系统的稳定性和可用性。

HBase 是一个分布式的、面向列的开源数据库，该技术来源于 Fay Chang 所撰写的 Google 论文“Bigtable”：一个结构化数据的分布式存储系统。

1、Phoenix是构建在ApacheHBase之上的一个SQL中间层，完全使用Java编写，提供了一个客户端可嵌入的JDBC驱动。Phoenix查询引擎会将SQL查询转换为一个或多个HBasescan，并编排执行以生成标准的JDBC结果集。

2、hbase-site.xml 配置文件一定不要直接从 /etc/hbase/conf 中获取，这里的配置文件是给客户端用的。

3、提供高效、跨分布式应用程序和框架的资源隔离和共享，支持Hadoop、MPI、Hypertable、Spark 等。YARN 又被称为MapReduce 0，借鉴Mesos，YARN 提出了资源隔离解决方案Container，提供Java 虚拟机内存的隔离。

HBase数据写入通常会遇到两类问题，一类是写性能较差，另一类是数据根本写不进去。

出现这种问题的原因是因为和服务器通信超时导致的。所以需要将下面两个参数的默认值进行调整。hbase.snapshot.region.timeout hbase.snapshot.master.timeoutMillis 这两个值的默认值为60000，单位是毫秒，也即1min。

必须在设计上保证RowKey的唯一性。由于在HBase中数据存储是Key-Value形式，若向HBase中同一张表插入相同RowKey的数据，则原先存在的数据会被新的数据覆盖。设计的RowKey应均匀的分布在各个HBase节点上，避免数据热点现象。

region下的StoreFile数目越少，HBase读性能越好 Hfile可以被压缩并存放到HDFS上，这样有助于节省磁盘IO，但是读写数据时压缩和解压缩会提高CPU的利用率。

）对于读端，捕获异常后，可以采取休眠一段时间后进行重试等方式。3）当然，还可以根据实际情况合理调整hbase.client.retries.number和hbase.client.pause配置选项。

1、好啦，错误的原因已经知道了，解决方法就是增大scannerTimeout。scannerTimeout是由hbase.client.scanner.timeout.period控制的，默认值是60s，我们将上述配置增大到120s之后，问题解决，不再发生超时错误。

2、很明显的一个错误，不是nextInt()没有阻塞，是scanner把 “您输入的不是整数，请重新输入：”认为是你下次循环中所输入的内容，于是在抛错。因此就不停的抛出错误。

3、浏览每一行通过Scan可以对表中的行进行浏览，得到每一行的信息，比如列名，时间戳等，Scan相当于一个游标，通过next()来浏览下一个，通过调用HTable.getScanner(Scan)来返回一个ResultScanner对象。

hbase磁盘延迟高的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于hbase disable时间长、hbase磁盘延迟高的信息别忘了在本站进行查找喔。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：/nosql/56754.html