HBase_标签_开发者

博客(982)
视频(2)
论坛(138)
云声(0)
代码示例(0)

[技术干货] 每日分享：技术实践-HBase增量数据迁移的方法

原文地址：https://bbs.huaweicloud.com/blogs/259874 ## 概览 ● 本文主要是想谈一下如何给HBase做增量数据的迁移，也就是迁移实时数据。在之前的博文[HBase实用技巧：一种全量+增量数据的迁移方法-云社区-华为云 (huaweicloud.com)](https://bbs.huaweicloud.com/blogs/199399)中提到HBase增量数据迁移可以使用Replication的方式去做，但是在实际搬迁时，要给原集群设置Replication可能需要重启，这样会影响业务，我们需要做到不停机迁移才行。 ## WAL原理正常情况下，HBase新增的数据都是有日志记录的，数据在落盘成HFile之前，任何一个Put和Delete操作都是记录日志并存放在WALs目录中，日志中包含了所有已经写入Memstore但还未Flush到HFile的更改(edits)。默认情况下每个RegionServer只会写一个日志文件，该RS管理的所有region都在向这一个日志文件写入Put和Delete记录，直到日志文件大小达到128MB(由**hbase.regionserver.hlog.blocksize**设置)后roll出一个新的日志文件，总共可以roll出32个日志文件(由**hbase.regionserver.maxlogs**设置)。如果日志文件未写满128MB，RegionServer间隔1小时也会roll出新一个新日志文件（由**hbase.regionserver.logroll.period**设置）。当日志文件中涉及的所有region的记录都flush成HFile后，这个日志文件就会转移至oldWals目录下归档， Master没间隔10分钟（**hbase.master.cleaner.interval**）会检查oldWALs目录下的过期日志文件，当文件过期时会被Master清理掉，（日志过期时间由**hbase.master.logcleaner.ttl**控制）。 RegionServer默认间隔1小时（由**hbase.regionserver.optionalcacheflushinterval**设置）会对它管理的region做一次flush动作，所以WALs目录中一直会有新的日志文件生成，并伴随着老的日志文件移动到oldWALs目录中。 ## 迁移方式 ### 一、迁移oldWALs目录中的文件，使用WALPlayer回放由于日志文件文件最终移动到oldWALs目录下，只需要写个脚本，定时检查oldWALs目录下是否有新文件生成，如果有文件，则move至其他目录，并使用WALPlayer工具对这个目录进行回放。优点：无代码开发量，仅需脚本实现缺点：无法做到实时，因为从数据写入到最后到达oldWAL目录会间隔很长时间。 ### 二、开发独立工具，解析日志文件，写入目的集群在网上查找迁移方法的时候了解到了阿里开发了一个专门的HBase迁移工具，可以实现不停机。通过阅读其设计[BDS - HBase数据迁移同步方案的设计与实践](#)了解到阿里开发了应用去读取HBase的WAL日志文件并回放数据至目的集群。优点：可以做到实时；缺点：需要一定的代码开发量；要做出这样一个工具，需要了解上面说的WAL文件归档的原理以及日志回放工具WALPlayer，下面简单说一下可以怎么去实现。 ### 独立工具实现这里简单说明下如何去做这样一个工具，只介绍读取WAL方面，任务编排就不描述了 1. 定时扫描WALs目录获取所有的日志文件，这里按ServerName去分组获取，每个分组内根据WAL文件上的时间戳排序； ● 获取所有RS的ServerName ``` ClusterStatus clusterStatus = admin.getClusterStatus(); Collection serverNames = clusterStatus.getServers(); ``` ● 根据ServerName去组成Path获取日志 ``` Path rsWalPath = new Path(walPath, serverName.getServerName()); List hlogs = getFiles(fs, rsWalPath, Long.MIN_VALUE, Long.MAX_VALUE); ``` ● getFiles()参考HBase源码中WALInputFormat.java中的实现，可以指定时间范围去取日志文件 ``` private List getFiles(FileSystem fs, Path dir, long startTime, long endTime) throws IOException { List result = new ArrayList(); LOG.debug("Scanning " + dir.toString() + " for WAL files"); FileStatus[] files = fs.listStatus(dir); if (files == null) return Collections.emptyList(); for (FileStatus file : files) { if (file.isDirectory()) { // recurse into sub directories result.addAll(getFiles(fs, file.getPath(), startTime, endTime)); } else { String name = file.getPath().toString(); int idx = name.lastIndexOf('.'); if (idx > 0) { try { long fileStartTime = Long.parseLong(name.substring(idx+1)); if (fileStartTime

Lettle whale 发表于2021-04-20 16:58:45 2021-04-20 16:58:45 最后回复 Lettle whale 2021-04-20 16:58:45
2828 0

数据迁移 HBase
[二次开发] flink写出数据到hbase中，写不进去数据。

【功能模块】【操作步骤&问题现象】1、flink消费kafka数据输出到hbase中，写不进hbase中，报错信息如下：com.huawei.bigdata.flink.examples.outputs.HbaseSink2 (HbaseSink2.java:132) java.io.InterruptedIOException: Giving up trying to location region in meta: thread is interrupted. at org.apache.hadoop.hbase.client.ConnectionImplementation.locateRegionInMeta(ConnectionImplementation.java:973) at org.apache.hadoop.hbase.client.ConnectionImplementation.locateRegion(ConnectionImplementation.java:790) at org.apache.hadoop.hbase.client.HRegionLocator.getRegionLocation(HRegionLocator.java:64) at org.apache.hadoop.hbase.client.RegionLocator.getRegionLocation(RegionLocator.java:58) at org.apache.hadoop.hbase.client.RegionLocator.getRegionLocation(RegionLocator.java:47) at org.apache.hadoop.hbase.client.RegionServerCallable.prepare(RegionServerCallable.java:223) at org.apache.hadoop.hbase.client.RpcRetryingCallerImpl.callWithRetries(RpcRetryingCallerImpl.java:107) at org.apache.hadoop.hbase.client.HTable.put(HTable.java:540) at com.huawei.bigdata.flink.examples.outputs.HbaseSink2.invoke(HbaseSink2.java:128) at com.huawei.bigdata.flink.examples.outputs.HbaseSink2.invoke(HbaseSink2.java:29) at org.apache.flink.streaming.api.operators.StreamSink.processElement(StreamSink.java:56) at org.apache.flink.streaming.runtime.tasks.OperatorChain$CopyingChainingOutput.pushToOperator(OperatorChain.java:641) at org.apache.flink.streaming.runtime.tasks.OperatorChain$CopyingChainingOutput.collect(OperatorChain.java:616) at org.apache.flink.streaming.runtime.tasks.OperatorChain$CopyingChainingOutput.collect(OperatorChain.java:596) at org.apache.flink.streaming.api.operators.AbstractStreamOperator$CountingOutput.collect(AbstractStreamOperator.java:734) at org.apache.flink.streaming.api.operators.AbstractStreamOperator$CountingOutput.collect(AbstractStreamOperator.java:712) at org.apache.flink.streaming.api.operators.StreamSourceContexts$NonTimestampContext.collect(StreamSourceContexts.java:104) at org.apache.flink.streaming.api.operators.StreamSourceContexts$NonTimestampContext.collectWithTimestamp(StreamSourceContexts.java:111) at org.apache.flink.streaming.connectors.kafka.internals.AbstractFetcher.emitRecordWithTimestamp(AbstractFetcher.java:398) at org.apache.flink.streaming.connectors.kafka.internal.KafkaFetcher.emitRecord(KafkaFetcher.java:185) at org.apache.flink.streaming.connectors.kafka.internal.KafkaFetcher.runFetchLoop(KafkaFetcher.java:150) at org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumerBase.run(FlinkKafkaConsumerBase.java:715) at org.apache.flink.streaming.api.operators.StreamSource.run(StreamSource.java:100) at org.apache.flink.streaming.api.operators.StreamSource.run(StreamSource.java:63) at org.apache.flink.streaming.runtime.tasks.SourceStreamTask$LegacySourceFunctionThread.run(SourceStreamTask.java:196)2、【截图信息】【日志信息】（可选，上传日志内容或者附件）

beautiful idea 发表于2021-04-19 11:43:32 2021-04-19 11:43:32 最后回复晋红轻 2021-04-19 12:02:18
3076 2

Flink HBase
[二次开发] flink消费kafka数据输出到hbase中，报.ClassNotFoundException

【功能模块】【操作步骤&问题现象】1、我在原有flink连接kafka的example中写了一个sinkHbase的代码(说明：运行原来flink连接kafka样例代码没有任何问题)，之后进行测试，我将所需要的jar包都上传到flink/lib下面了，然后运行代码报：Caused by: java.lang.ClassNotFoundException: org.apache.hadoop.hbase.HBaseConfiguration，具体报错信息如下所示：2、【截图信息】【日志信息】（可选，上传日志内容或者附件）

beautiful idea 发表于2021-04-09 14:38:57 2021-04-09 14:38:57 最后回复 beautiful idea 2021-04-14 17:21:54
11082 7

Flink HBase Kafka
[二次开发] Hbase运行样例代码报Region multi split failed, splitkeys are not within

【功能模块】【操作步骤&问题现象】1、hbase 在linux上运行样例代码报错：2021-04-06 14:36:05,949 INFO [main] examples.HBaseSample: Entering testCreateTable.2021-04-06 14:36:06,575 WARN [main] examples.HBaseSample: table already exists2021-04-06 14:36:06,576 INFO [main] examples.HBaseSample: Exiting testCreateTable.2021-04-06 14:36:06,576 INFO [main] examples.HBaseSample: Entering testMultiSplit.2021-04-06 14:36:06,678 ERROR [main] client.HBaseAdmin: Splits are not inside region key range. Abort multisplit2021-04-06 14:36:06,679 ERROR [main] examples.HBaseSample: MultiSplit failedorg.apache.hadoop.hbase.DoNotRetryIOException: Region multi split failed, splitkeys are not within the region boundary. at org.apache.hadoop.hbase.client.HBaseAdmin.checkAndSortSplitKeys(HBaseAdmin.java:1984) at org.apache.hadoop.hbase.client.HBaseAdmin.multiSplit(HBaseAdmin.java:1937) at org.apache.hadoop.hbase.client.HBaseAdmin.multiSplit(HBaseAdmin.java:1904) at org.apache.hadoop.hbase.client.HBaseAdmin.multiSplitSync(HBaseAdmin.java:2100) at com.huawei.bigdata.hbase.examples.HBaseSample.testMultiSplit(HBaseSample.java:181) at com.huawei.bigdata.hbase.examples.HBaseSample.test(HBaseSample.java:78) at com.huawei.bigdata.hbase.examples.TestMain.main(TestMain.java:48)2、【截图信息】【日志信息】（可选，上传日志内容或者附件）

beautiful idea 发表于2021-04-06 14:40:26 2021-04-06 14:40:26 最后回复一枚核桃 2021-04-15 09:23:06
5005 4

HBase
[解决方案] 【C70集群】【HBASE查询功能】查询超时

【功能模块】生产 c70集群 hbase模块【操作步骤&问题现象】同样的代码生产环境1、用java客户端get请求查询hbase，首次查询等待40s秒后出现超时，但接下后续查询就很正常，几十毫秒就可以查到结果2、但如果在上次成功查询后，两分钟后再去get请求hbase，依旧等待40s后出现超时异常，后面的请求正常测试环境无超时情况，但是首次和间隔两分钟这种get请求，时间稍微久了点

pilishaige 发表于2021-03-30 15:25:49 2021-03-30 15:25:49 最后回复 zhiru 2021-03-30 17:25:50
5522 6

HBase
[其他] MRS3.X中怎么使用hbase？

使用MRS 3.0.5安装（包含了hbase组件），为何在master1上找不到hbase命令？参考文档：https://support.huaweicloud.com/cmpntguide-mrs/bakmrs_01_0368.html

tw2021 发表于2021-03-26 11:36:10 2021-03-26 11:36:10 最后回复用户 2021-04-02 17:08:58
4181 2

HBase MapReduce
[问题求助] MRS HBase 数据落盘加密

请问，华为云 MRS 集群上的HBASE存储的数据如何做到落盘加密呢？我看购买MRS 2.1版本时有整盘加密选项，到MRS 3.0 这个选项就没有了。搜华为文档，发现可以自行配置加密 https://support.huaweicloud.com/usermanual-mrs/admin_guide_000276.html，但似乎又不推荐。那么今后华为MRS HBASE 落盘加密的规划是怎样的？是以后会支持整盘加密，还是支持用户通过配置HFile WAL加密？谢谢

wayne123 发表于2021-03-24 14:21:07 2021-03-24 14:21:07 最后回复 wayne123 2021-03-25 14:43:16
2960 1

HBase MapReduce
[技术干货] 每日分享：使用Prometheus+Grafana搭建HBase监控仪表盘

当前许多用户都是自建集群，对于自建集群，需要有完善的监控才能有效的维护hbase集群，Prometheus+Grafana是当前比较成熟和有效的监控解决方案，下文介绍了如何使用Prometheus+Grafana搭建监控，https://bbs.huaweicloud.com/blogs/249325

Lettle whale 发表于2021-03-18 17:52:44 2021-03-18 17:52:44 最后回复建赟 2021-03-22 20:09:34
2323 1

HBase
[解决方案] hbase认证问题

各位老师，有没有遇到过这种问题，单独的hive可以查到数据，单独地hbase经过zk可以往hbase中put数据，但是连起来，先查hive，再把hive的结果，用hbase链接zk，往hbase中put数据，就报用户认证错误。具体保错如下图，请老师帮忙解决下，谢谢啦。 469221

王小羽 发表于2021-03-16 18:07:16 2021-03-16 18:07:16 最后回复王小羽 2021-03-19 10:21:07
4298 4

HBase
[维护宝典] HBase经典案例集锦三：异常重启（4-5）：节点上配置了DNS导致regionserver异常重启

问题分析查看regionserver的运行日志(/var/log/Bigdata/hbase/rs/hbase-omm-regionserver-xxx.log)发现报错连接主机失败，原因是主机名后多了.localhost;2. /etc/resolv.conf文件中多了一行search localhost。问题解决参考将/ect/resolv.conf文件中的search localhost注释掉重启服务恢复。

zhiru 发表于2020-12-28 19:28:44 2020-12-28 19:28:44 最后回复 zhiru 2020-12-28 19:28:44
1030 0

HBase
[维护宝典] HBase经典案例集锦三：异常重启（4-4）：ARM jdk bug导致regionserver异常重启

问题分析查看regionserver的.out(/var/log/Bigdata/hbase/rs/hbase-omm-regionserver-xxx.out)日志发现重启是由于jvm crash。查看hs_err_pid.log日志，显示异常堆栈未0xb4。问题根因ARM服务器上，openjdk已知bug。简单来说，就是CMS代码中存在逻辑：1.load oop 2.load oop->class 3.load->class.field，这三步本身是需要包再时序的，但是事实上，在arm上由于弱内存续，实际的实行顺序有可能是2/3/1或者2/1/3，这样就没办法保证每一步取到的都是正确的数据，一旦取到的数据有问题，就可能被当作一个地址去做访问二，就SIGSEGV了。问题解决参考不使用CMS算法。

zhiru 发表于2020-12-28 19:19:03 2020-12-28 19:19:03 最后回复 zhiru 2020-12-28 19:19:03
1151 0

ARM HBase
[维护宝典] HBase经典案例集锦三：异常重启（4-11）：ZooKeeper实例Full GC导致RegionServer异常重启

问题分析排查regionserver运行日志（/var/log/Bigdata/hbase/rs/hbase-omm-regionserver-xxx.log），异常重启的原因为连不上zookeeper集群。查看zookeeper GC日志与运行日志。发现zookeeper gc 日志中存在Full GC打印。问题解决参考 ZooKeeper实例Full GC导致RegionServer连不上zookeeper，需要增大ZooKeeper的GC配置。FI界面修改quorumpeer的GC配置如下，修改完后保存配置，重启zookeeper服务。

zhiru 发表于2020-12-28 19:14:09 2020-12-28 19:14:09 最后回复 zhiru 2020-12-28 19:14:09
1153 0

ZooKeeper HBase
[维护宝典] HBase经典案例集锦三：异常重启（4-3）：配置ZSTD压缩算法触发jdk bug，RegionServer异常重启

问题分析查看异常重启的regionserver的hbase.out(/var/log/Bigdata/hbase/rs/hbase-omm-regionserver-xxx.out)日志显示重启原因为jvm crash。查看对应hs_err_pid.log所有显示异常时堆栈再0x43。GC参数配置xmx 41G，表压缩算法ZSTD，两个条件共存时会导致RegionServer重启异常，其中一个不满足，不会触发该问题。问题解决参考修改GC配置在31G以下或者将表的压缩算法改成其他的。

zhiru 发表于2020-12-28 19:05:09 2020-12-28 19:05:09 最后回复 zhiru 2020-12-28 19:05:09
1161 0

JDK HBase
[维护宝典] HBase经典案例集锦三：异常重启（4-10）：协处理器jar包未放置正确位置，导致RegionServer重启

问题分析查看对应RegionServer运行日志(/var/log/Bigdata/hbase/rs/hbase-omm-regionserver-xxx.log)，报错在hdfs如下目录下找不到协处理器jar包。File does not exits:hdfs://hacluster/user/CORLU81NETMLB/bulkload/indexProcessor/Coprocessor.jarRegionServer协处理器jar包放置目录不对，导致RegionServer无法加载到协处理器异常重启。问题解决参考 disable使用这个协处理器的表，将协处理器放到对应的hdfs的目录下，重启RegionServer，重新enable表。

zhiru 发表于2020-12-28 17:12:05 2020-12-28 17:12:05 最后回复 zhiru 2020-12-28 17:12:05
1164 0

JAR HBase
[维护宝典] HBase经典案例集锦三：异常重启（4-9）： NullPointerException导致RegionServer重启

问题分析RS实例异常重启，regionserver运行日志(/var/log/Bigdata/hbase/rs/hbase-omm-regionserver-xxx.log)中报NullPointException异常： 2020-05-22 09:52:35,314 | FATAL | RpcServer.FifoWFPBQ.default.handler=208,queue=28,port=21302 | ABORTING region server fj-hadoop-hdp04,21302,1589247069521: The coprocessor org.apache.hadoop.hbase.regionserver.IndexHalfStoreFileReaderGenerator threw java.lang.NullPointerException | org.apache.hadoop.hbase.regionserver.HRegionServer.abort(HRegionServer.java:2256) java.lang.NullPointerException at java.util.ArrayList.addAll(ArrayList.java:581) at org.apache.hadoop.hbase.regionserver.IndexHalfStoreFileReaderGenerator.getLocalIndexScanners(IndexHalfStoreFileReaderGenerator.java:375) at org.apache.hadoop.hbase.regionserver.IndexHalfStoreFileReaderGenerator.access$000(IndexHalfStoreFileReaderGenerator.java:71) at org.apache.hadoop.hbase.regionserver.IndexHalfStoreFileReaderGenerator$1.getScannersNoCompaction(IndexHalfStoreFileReaderGenerator.java:321) at org.apache.hadoop.hbase.regionserver.StoreScanner.<init>(StoreScanner.java:212) at org.apache.hadoop.hbase.regionserver.IndexHalfStoreFileReaderGenerator$1.<init>(IndexHalfStoreFileReaderGenerator.java:316) at org.apache.hadoop.hbase.regionserver.IndexHalfStoreFileReaderGenerator.preStoreScannerOpen(IndexHalfStoreFileReaderGenerator.java:315) at org.apache.hadoop.hbase.regionserver.RegionCoprocessorHost$59.call(RegionCoprocessorHost.java:1424) at org.apache.hadoop.hbase.regionserver.RegionCoprocessorHost$RegionOperation.call(RegionCoprocessorHost.java:1780) at org.apache.hadoop.hbase.regionserver.RegionCoprocessorHost.execOperation(RegionCoprocessorHost.java:1856) at org.apache.hadoop.hbase.regionserver.RegionCoprocessorHost.execOperationWithResult(RegionCoprocessorHost.java:1819) at org.apache.hadoop.hbase.regionserver.RegionCoprocessorHost.preStoreScannerOpen(RegionCoprocessorHost.java:1419) at org.apache.hadoop.hbase.regionserver.HStore.getScanner(HStore.java:2154) at org.apache.hadoop.hbase.regionserver.HRegion$RegionScannerImpl.initializeScanners(HRegion.java:5980) at org.apache.hadoop.hbase.regionserver.HRegion$RegionScannerImpl.<init>(HRegion.java:5954) at org.apache.hadoop.hbase.regionserver.HRegion$RegionScannerImpl.<init>(HRegion.java:5959) at org.apache.hadoop.hbase.regionserver.HRegion.instantiateRegionScanner(HRegion.java:2768) at org.apache.hadoop.hbase.regionserver.HRegion.getScanner(HRegion.java:2748) at org.apache.hadoop.hbase.regionserver.HRegion.getScanner(HRegion.java:2730) at org.apache.hadoop.hbase.regionserver.HRegion.getScanner(HRegion.java:2724) at org.apache.hadoop.hbase.regionserver.RSRpcServices.newRegionScanner(RSRpcServices.java:2742) at org.apache.hadoop.hbase.regionserver.RSRpcServices.scan(RSRpcServices.java:3000) at org.apache.hadoop.hbase.protobuf.generated.ClientProtos$ClientService$2.callBlockingMethod(ClientProtos.java:35072) at org.apache.hadoop.hbase.ipc.RpcServer.call(RpcServer.java:2482) at org.apache.hadoop.hbase.ipc.CallRunner.run(CallRunner.java:123) at org.apache.hadoop.hbase.ipc.RpcExecutor$Handler.run(RpcExecutor.java:191) at org.apache.hadoop.hbase.ipc.RpcExecutor$Handler.run(RpcExecutor.java:168) 2. 此问题为开源问题，单号为：https://issues.apache.org/jira/browse/PHOENIX-4839 3. 原因是在PHOENIX-4885以后，any local index query will open all HFiles of every Region，所以在本地索引查询的时候会打开所有的hfile去查询，有一些storescanner在memstore中存储，所以要去内存中扫描，但是根据pt没有找到对应的storescanner，返回为null。此处将null加入到了arraylist中，报了空指针异常。问题解决参考 6.5.1.7版本已经解决，升级版本到6.5.1.7。

zhiru 发表于2020-12-28 16:33:02 2020-12-28 16:33:02 最后回复 zhiru 2020-12-28 16:33:02
1440 0

HBase

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript