云数据库 GaussDB_标签_开发者

博客(549)
视频(1)
论坛(0)
云声(99)
代码示例(0)

[技术解读] GaussDB关键技术原理：高弹性（四）

书接上文GaussDB关键技术原理：高弹性（三）从段页式技术方面对GaussDB高弹性能力进行了解读，本篇将从hashbucket扩容方面继续介绍GaussDB高弹性技术。4 hashbucket扩容基于hashbucket表的扩容整体流程主要包含三个步骤：基线数据搬迁：生成扩容搬迁计划，根据搬迁计划中对涉及的库中的bucket文件进行跨节点文件搬迁。包含库级别的数据文件和实例级别的事务日志。bucket日志流追增：识别bucket扩容过程中的增量修改，将对应的日志发送到目的节点并在目的端进行增量修改的日志回放。bucket元数据切换：当bucket日志流追增完成后，原节点和目的节点的bucket数据达到一致状态，可以对原节点的bucket进行下线删除，对目的节点的bucket进行上线操作，同时修改CN上的bucket map映射使新的业务能够路由到正确的DN节点。如下图1所示以DN节点2扩3为例描述hashbucket扩容的详细流程：图1 hashbucket扩容流程（以DN由2扩3为例）(1) CN从扩容工具测处收到MOVE BUCKETS搬迁命令；(2) CN解析后分别给DN1、DN2、DN3（目标DN）下发搬迁命令；(3) DN1/DN2将迁移bucket目录(包含数据及事务日志)拷贝到目标DN3上； (4) DN3收到命令后，进入receiver逻辑，与DN1/DN2建立连接，DN1/DN2进入sender逻辑，将相关bucket的日志解析出来发送给DN3；(5) bucket目录拷贝完成后，DN3回放收到的bucket日志，进行追增；(6) 完成最后一轮的追增后CN上切换bucket group，DN1/DN2上的旧bucket进行清除。4.1 扩容流程框架本节详细介绍hashbucket扩容流程框架，其主流程在gs_redis_bucket工具中实现，主要包括扩容迁移计划、扩容期间元数据处理、扩容状态与统计信息、扩容上线策略等部分。进入重分布流程首先做一些前置处理，从系统表读取并设置重分布参数，以便后续扩容流程使用。在内核中记录本次重分布的database信息，以便后续解析日志使用。调用CHECKPOINT进行一次刷盘，作为后续日志回放的起始点。4.1.1 获取扩容迁移计划介绍扩容迁移计划前首先介绍NodeGroup相关概念。PGXC_GROUP系统表存储节点组信息，其每一行均为一个NodeGroup相关信息，其中与扩容迁移计划相关的字段如表1所示。表1 系统表PGXC_GROUP部分字段名称类型描述oidoid行标识符（隐含字段，必须明确选择）。group_namename节点组名称。in_redistribution"char"是否需要重分布。取值包括n,y,t。n：表示NodeGroup没有再进行重分布。y：表示NodeGroup是重分布过程中的源节点组。group_membersoidvector_extend节点组的节点OID列表。group_bucketstext分布数据桶所在节点编号的集合。is_installationboolean是否安装子集群。t（true）：表示安装。f（false）：表示不安装。bucket_maptext物理bucket与逻辑bucket的映射关系。首先介绍物理bucket和逻辑bucket的概念。GaussDB中数据分布在16384个bucket中，记为逻辑bucket。为减少文件数量过多资源浪费问题，引入物理bucket概念，DN内部存储采用物理1024个bucket。如图2所示为3DN集群的物理逻辑bucket映射关系示意图，每一个方格代表一个逻辑bucket，用 ',' 分隔；每一行代表一个物理bucket，用 ';' 分隔；同一行的逻辑bucket组成一个物理bucket。图2 物理逻辑bucket映射关系示意图group_buckets为一个16384长度的数组，表示每个逻辑bucket所在节点的编号，可以表示数据在节点上的分布。工具根据当前绑定NodeGroup与目标NodeGroup中bucket分布（group_buckets）的差异，即可计算出所有需要迁移的buckets。再将这些待迁移的bucket按照扩容链路（即从哪个原DN迁移到哪个新DN）分类，即可得到迁移计划。图3为2DN扩3DN的搬迁计划与bucket分布示意图。图3 2DN扩3DN迁移计划与bucket分布示意图4.1.2 扩容主流程相关线程在获取迁移计划后，工具开始当前database的扩容主流程。扩容重分布过程涉及gs_redis_bucket工具的三个线程：主线程、监控线程、上线事务线程。图4为gs_redis_bucket工具中扩容流程相关线程示意图。图4 扩容流程工具相关线程示意图（1）主线程根据迁移计划向内核发送MOVE BUCKETS命令，其格式为：ALTER DATABASE database_name MOVE BUCKETS (bucket_list) FROM sender_dn TO receiver_dn;例如：ALTER DATABASE my_database MOVE BUCKETS (0,1,2) FROM dn_6001_6002_6003 TO dn_6010_6011_6012;MOVE BUCKETS命令是hashbucket扩容重分布的核心命令，完成了基线数据搬迁和日志追增，MOVE BUCKETS命令在内核中的实现详见“日志多流”小节。其中单次MOVE BUCKETS命令搬迁bucket的个数（即bucket_list长度）越小对业务影响越小。同时为降低扩容重分布对业务的影响，sender DN和receiver DN的并发度均为1，即sender DN同一时刻最多只能处理一条MOVE BUCKETS语句，receiver DN同一时刻最多只能处理一条MOVE BUCKETS语句。主线程根据迁移计划与内核建立连接链路并发送MOVE BUCKETS命令，当有MOVE BUCKETS执行完毕退出后，主线程会检查是否可以发送新的MOVE BUCKETS命令（优先继续发送原链路剩余的buckets；如原链路已发送完毕，则选择新链路发送），直到迁移计划中的所有bucket全部通过MOVE BUCKETS命令完成迁移。以2DN扩5DN为例，其扩容计划可以用下图来简要表示。假设当前设置单次搬迁个数为150，则主线程会首先发送【DN1àDN3, (0,1,…,149)】与【DN2àDN4, (512,513,…,614)】到内核（此时另外两条链路由于并发度限制无法发送）。假设第一条命令首先执行完毕返回，由于此时该链路上还有剩余buckets，因此会继续发送【DN1àDN3, (150,151,…,204)】。假设【DN2àDN4】命令随后执行完毕返回，由于该链路所有bucket已发送完毕，则选择新链路命令【DN2àDN5, (615,616,…,764)】发送（此时【DN1àDN4】不满足DN1并发度限制）。图5 2DN扩5DN迁移计划示意图需要注意的是，MOVE BUCKETS命令并不会自行结束返回，需要与上线事务线程配合，等待该命令中的所有BUCKETS完成迁移并上线后才会返回。（2）监控线程由主线程创建，在主线程发送MOVE BUCKETS命令后开始运行。其主要任务有二：一是通过调用扩容统计信息函数定期轮询（1s）监测每个bucket的迁移状态和业务负载等信息；二是根据上线策略判断是否有某些bucket处于可上线状态（见“扩容上线策略”部分），若是，则创建上线事务线程进完成这些bucket的新节点上线。当全部bucket均已上线时退出监控线程。（3）上线事务线程在监控线程判断某些bucket可以进行上线时由监控线程创建，用于完成上述bucket的上线步骤。首先获取这些待上线的bucket的bucket锁（详见“bucket锁”小节），阻塞相应bucket上的所有业务，确保没有增量日志产生，然后完成最后的日志追增且保证回放数据全部落盘，最后切换NodeGroup完成上述buckets上线。在上线事务线程中，可能会出现两种异常场景导致上线失败：拿锁超时与持锁超时。拿锁超时指的是在给定时间阈值内无法成功拿到bucket级锁而终止此次上线；持锁超时指的是在拿到bucket级锁之后在给定时间阈值内无法完成日志追增与私有缓冲区落盘，为避免长时间阻塞业务而终止此次上线。若出现拿锁超时或持锁超时，上线事务线程会退出，此时监控线程将对这一事件进行记录。对于这些bucket将被惩罚在一段时间内不再尝试上线（见“扩容上线策略”部分）。进一步地，当存在bucket超过最大拿锁超时次数或持锁超时次数时，gs_redis_bucket将主动退出自动重入。对于上线事务线程的LOCK BUCKET语句，如果参数enable_cancel设置为true且存在至少一个bucket的拿锁超时的次数或持锁超时的次数不小于相应最大超时次数的1/2（向下取整），则LOCK BUCKETS语句将添加CANCELABLE关键字，会尝试主动取消业务。如果参数enable_cancel设置为false，则LOCK BUCKETS语句永远不会添加CANCELABLE关键字。 4.1.3 扩容期间元数据处理(1) 更新SegmentHeaderhashbucket扩容方案中，新DN是由CN build出来的，新DN上hashbucket表元数据在新DN 大段页式1号文件中的类型是SegmentHead且没有对应小段页式1号文件SegmentHead所在的页号，无法进行对应bucket的数据管理。且新DN上hashbucket表在pg_class中的relbucket列为1而不是3，需要在日志回放前统一修改元数据支持扩容。(2) 更新反向指针hashbucket表扩容后新DN上小段页式数据文件中SegmentHead反向指针记录所属的owner可能不正确，应该修改为新DN主表的relfilenode。在扩容工具gs_redis_bucket中，某一批bucket上线前执行更新操作。更新的方式特殊处理，从新DN获取hashbucket表的relfilenode作为反向指针的owner，在源DN执行更新操作，只记录XLOG不实际更新，通过日志流的方式同步到新DN。新DN通过日志回放，完成反向指针更新。4.1.4 扩容状态与信息统计 gs_redis_bucket通过gs_redis_get_bucket_statistics（扩容统计信息）系统函数在扩容期间查询每个bucket的迁移状态与业务负载情况，系统函数返回值如下表所示。表2 扩容统计信息函数返回值名称类型描述bucket_idOIDbucket idredis_stateINT1bucket的扩容状态，0表示扩容未开始，1表示扩容基线数据已完成。xlog_countINT8bucket在当前database扩容开始后，在原DN产生的XLOG数量。sndr_latest_lsnINT8bucket在当前database扩容开始后，在原DN产生的最新LSN。parser_latest_lsnINT8bucket在当前database扩容开始后，被原DN的扩容相关线程解析到的最新LSN。parser_latest_lsn_newINT8bucket在当前database扩容开始后，被原DN的扩容相关线程解析到bucketxlog的最新LSN。rcvr_redo_latest_lsnINT8bucket在当前database扩容开始后，被新DN的扩容相关线程回放到的最新LSN。rcvr_redo_latest_lsn_newINT8bucket在当前database扩容开始后，被原DN的扩容相关线程解析到bucketxlog的最新LSN。rcvr_checkpointINT8bucket在当前database扩容开始后的CHECKPOINT点。rcvr_redo_start_lsnINT8bucket在当前database扩容开始后，回放开始的原始LSN。上述扩容相关信息在GaussDB内核中的全局变量中存储与更新。gs_redis_bucket通过在定时轮询扩容统计信息系统函数来获取各bucket的以上信息。redis_state字段可以用来指示当前bucket是否完成基线迁移；xlog_count字段的值随时间的变化可以反映当前bucket的业务负载情况；而LSN相关字段则可以反映当前bucket的日志追增情况。具体来说，bucket的日志追增剩余量由两部分组成：第一部分为sndr_latest_lsn到parser_latest_lsn的差值，该部分对应原DN的parser线程尚未解析的日志；第二部分为parser_latest_lsn_new到rcvr_redo_latest_lsn_new，该部分对应原DN的parser线程已解析但尚未被新DN回放的日志。需要说明的是，parser_latest_lsn_new与rcvr_redo_latest_lsn_new是为日志多流传输框架要传输的bucket日志流封装的一层新LSN，以过滤掉其他bucket或非bucket模式的日志。以上信息可以帮助判断bucket的上线时机并检验bucket是否完成日志追增。 4.1.5 扩容上线策略扩容上线策略主要用来在监控线程中判断哪些bucket在扩容期间进入日志追增阶段后可以准备上线。可以准备上线的buckets需要满足以下四个条件：已完成基线搬迁且已执行更新反向指针操作、处于业务低负载时间、日志追增框架剩余追增量小、bucket不在上次上线失败后的惩罚时间内。(1) bucket是否已完成基线搬迁通过扩容统计信息系统函数返回的redis_state获取，其值会在receiver端完成基线文件传输后赋值，便于判断元数据处理的时机。此外，bucket还需要在监控线程基线传输完成后完成更新反向指针的操作。(2) bucket是否处于业务低负载时间通过记录每个bucket的历史负载来判断。扩容上线策略在监控线程中定期轮询所有扩容中的buckets的统计信息（即xlog_count）并记录。因此，监控线程可以掌握每个bucket在扩容期间的历史负载情况。由于bucket上线需要对其上锁，为减小对业务的影响，扩容上线策略应当尽量选择在bucket低历史负载期间进行上线操作。(3) 日志剩余追增量通过统计信息系统函数返回的LSN相关字段来计算,即(parser_latest_lsn - sndr_latest_lsn) + (rcvr_redo_latest_lsn_new - parser_latest_lsn_ new)。当追增量小于给定阈值时，判断其满足条件。(4) 若当前bucket在此前的上线事务线程中由于拿锁超时或持锁超时而终止上线，则会为该bucket指定一段惩罚时间，在惩罚时间内不允许该bucket上线。监控线程的上线策略在上线事务线程未在运行时选择满足上述（1）-（4）条件的所有buckets，并创建上线事务线程完成这些buckets的上线，上线事务线程会完成这些buckets的上线。随后监控线程会继续选择新的满足上线策略的buckets，并再次创建上线事务线程完成新一轮的上线，重复动作直到所有buckets均上线完成。以上内容从hashbucket扩容技术方面对GaussDB高弹性能力进行了解读，下篇将从日志多流和事务相关方面继续介绍GaussDB高弹性技术，敬请期待！

Gauss松鼠会小助手2 发表于2024-09-23 14:19:55 2024-09-23 14:19:55 最后回复福州司马懿 2024-09-30 11:07:35
1120 3

云数据库 GaussDB
[技术解读] GaussDB SQL 中的BOOLEAN表达式介绍

一、前言SQL是用于访问和处理数据库的标准计算机语言。GaussDB支持的SQL标准（默认支持SQL2、SQL3和SQL4的主要特性）。本系列将以《云数据库GaussDB—SQL参考》为主线进行介绍。二、GaussDB SQL 中的BOOLEAN表达式介绍1、概念在GaussDB数据库中，BOOLEAN表达式是一种很常见的表达式类型，它用于比较两个条件，来确定其是否为真或假。BOOLEAN表达式可以用于条件判断或在循环语句中作为终止条件。其语法非常简单，只需要使用逻辑运算符对两个条件进行比较。GaussDB SQL支持AND、OR等逻辑运算符，这些运算符可以将结果组合成更复杂的布尔表达式。2、组成运算符：比较运算符（如=、<>、<、>、<=、>=）和逻辑运算符（如AND、OR、NOT等）。操作数：用于比较的字段值或常量。 3、语法示例如下截图是游标使用中的SQL部分，SQL中涉及到BOOLEA表达式用于条件判断和循环语句部分，可参考：1）条件判断，见红色方框“v_salary>=20000”，在这个例子中，当v_salary >= 20000 时，则执行THEN 后面的 UPDATE语句。2）循环语句，见蓝色方框“%NOTFOUND”，是游标的属性之一，用于控制程序流程或者了解程序的状态。当最近的DML（数据操作语言）操作（如INSERT，UPDATE，DELETE等）没有影响任何行时，该属性为真。'EXIT WHEN c1%NOTFOUND;' 就会执行。三、在GaussDB SQL中的基础应用使用布尔表达式可以根据特定条件对结果进行过滤，只返回满足条件的数据。以下是一些在SELECT列表中使用布尔表达式的示例。1、示例1，使用比较运算符 --根据工资是否大于2w判断其是否为高工资，返回TRUE或FALSESELECT * ,(salary > 20000) AS high_salary FROM company;上述SQL示例中，我们从company表中选择name、age、address、salary和一个布尔表达式(salary > 20000)，该表达式用于判断员工的工资是否高收入。结果集中的high_salary列将显示布尔值TRUE或FALSE。2、示例2，使用逻辑运算符 --根据年龄是否在18-60之间，判断其是否为有效年龄，返回TRUE或FALSESELECT * ,(age >= 18 AND age <= 60) AS valid_age FROM company;上述SQL示例中，我们从company表中选择name、age、address、salary和一个布尔表达式(age >= 18 AND age <= 60)，该表达式用于判断员工的年龄是否有效。结果集中的valid_age列将显示布尔值TRUE或FALSE。3、示例3，使用IS NOT NULL运算符 --判断地址是否为空，返回TRUE或FALSESELECT * ,(address IS NOT NULL) AS null_address FROM company;上述SQL示例中，我们从company表中选择name、age、address、salary和一个布尔表达式(address IS NOT NULL)，该表达式用于判断员工的地址是否为空值。结果集中的null_address列将显示布尔值TRUE或FALSE。4、示例4，使用like模式匹配操作符 LIKE：判断字符串是否能匹配上LIKE后的模式字符串。如果字符串与提供的模式匹配，则LIKE表达式返回为真（NOT LIKE表达式返回假），否则返回为假（NOT LIKE表达式返回真）。--判断地址是否是CN，返回TRUE或FALSESELECT * ,(address LIKE 'CN%') AS c_address FROM company;上述SQL示例中，我们从company表中选择name、age、address、salary和一个布尔表达式(address LIKE 'CN%')，该表达式用于判断员工的地址是否在CN。结果集中的c_address列将显示布尔值TRUE或FALSE。附：在GaussDB SQL中还有一个模式匹配操作符SIMILAR TO。描述：SIMILAR TO操作符根据自己的模式是否匹配给定串而返回真或者假。他和LIKE非常类似，只不过他使用SQL标准定义的正则表达式理解模式。四、小结BOOLEAN表达式在SQL中非常常用，它们允许开发人员构建逻辑语句，这些语句能够对表中的数据进行复杂的过滤和选择。通过使用布尔表达式，查询结果可以缩小到满足特定条件的行，或者可以根据这些条件对数据进行聚合和分组。总之，布尔表达式可以帮助我们进行逻辑判断和循环控制，提高代码的可读性。熟练掌握BOOLEAN表达式的使用，在GaussDB SQL等开发过程中非常重要。——结束

Gauss松鼠会小助手2 发表于2024-09-23 11:39:40 2024-09-23 11:39:40 最后回复泽宇-Li 2024-09-23 20:41:00
28 1

云数据库 GaussDB
[运维管理] max_prepared_transactions这个参数的值小于max_connections这个参数的值有什么影响吗

max_prepared_transactions这个参数的值小于max_connections这个参数的值有什么影响吗？备节点不会执行语句？还是会直接报错？可确保每个会话都有一个等待中的预备事务。什么是预备事务？

pack 发表于2024-09-20 18:05:13 2024-09-20 18:05:13 最后回复加油O幸福 2024-09-29 15:53:25
212 6

云数据仓库 GaussDB(DWS) 云数据库 GaussDB
[技术解读] GaussDB选择分布列

Hash分布表的分布列选取至关重要，需要满足以下原则：列值应比较离散，以便数据能够均匀分布到各个DN。例如，考虑选择表的主键为分布列，如在人员信息表中选择身份证号码为分布列。在满足第一条原则的情况下尽量不要选取存在常量filter的列。例如，表t1相关的部分查询中出现t1的列zqdh存在常量的约束(例如zqdh=’000001’)，那么就应当尽量不用zqdh做分布列。在满足前两条原则的情况，考虑选择查询中的连接条件为分布列，以便Join任务能够下推到DN中执行，且减少DN之间的通信数据量。对于Hash分表策略，如果分布列选择不当，可能导致数据倾斜，查询时出现部分DN的I/O短板，从而影响整体查询性能。因此在采用Hash分表策略之后需对表的数据进行数据倾斜性检查，以确保数据在各个DN上是均匀分布的。可以使用以下SQL检查数据倾斜性select xc_node_id, count(1) from tablename group by xc_node_id order by xc_node_id desc;其中xc_node_id对应DN，一般来说，不同DN的数据量相差5%以上即可视为倾斜，如果相差10%以上就必须要调整分布列。GaussDB支持多分布列特性，可以更好地满足数据分布的均匀性要求。

yd_227829597 发表于2024-09-19 11:16:59 2024-09-19 11:16:59 最后回复泽宇-Li 2024-09-19 17:36:32
54 1

云数据库 GaussDB
[技术解读] GaussDB使用分区表

分区表是把逻辑上的一张表根据某种方案分成几张物理块进行存储。这张逻辑上的表称之为分区表，物理块称之为分区。分区表是一张逻辑表，不存储数据，数据实际是存储在分区上的。分区表和普通表相比具有以下优点：改善查询性能：对分区对象的查询可以仅搜索自己关心的分区，提高检索效率。增强可用性：如果分区表的某个分区出现故障，表在其他分区的数据仍然可用。方便维护：如果分区表的某个分区出现故障，需要修复数据，只修复该分区即可。GaussDB支持的分区表为范围分区表。范围分区表：将数据基于范围映射到每一个分区。这个范围是由创建分区表时指定的分区键决定的。分区键经常采用日期，例如将销售数据按照月份进行分区。

yd_227829597 发表于2024-09-19 11:10:45 2024-09-19 11:10:45 最后回复福州司马懿 2024-09-30 11:09:57
108 2

云数据库 GaussDB
[技术解读] GaussDB产品优势

高安全GaussDB拥有TOP级的商业数据库安全特性：数据动态脱敏，TDE透明加密，行级访问控制，密态计算。能够满足政企&金融级客户的核心安全诉求。健全的工具与服务化能力GaussDB已经拥有华为云，商用服务化部署能力，同时支持DAS、DRS等生态工具。有效保障用户开发、运维、优化、监控、迁移等日常工作需要。全栈自研GaussDB基于鲲鹏生态，是当前国内唯一能够做到全栈自主可控的国产品牌。同时GaussDB能够基于硬件优势在底层不断进行优化，提升产品综合性能。开源生态GaussDB已经支持开源社区，并提供主备版版本下载。

yd_227829597 发表于2024-09-19 11:09:53 2024-09-19 11:09:53 最后回复泽宇-Li 2024-09-19 17:36:26
32 1

云数据库 GaussDB
[技术解读] GaussDB权限

默认情况下，管理员创建的IAM用户没有任何权限，需要将其加入用户组，并给用户组授予策略或角色，才能使得用户组中的用户获得对应的权限，这一过程称为授权。授权后，用户就可以基于被授予的权限对云服务进行操作。GaussDB部署时通过物理区域划分，为项目级服务。授权时，“作用范围”需要选择“区域级项目”，然后在指定区域（如华北-北京1）对应的项目（cn-north-1）中设置相关权限，并且该权限仅对此项目生效；如果在“所有项目”中设置权限，则该权限在所有区域项目中都生效。访问GaussDB时，需要先切换至授权区域。根据授权精细程度分为角色和策略。角色：IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒度，提供有限的服务相关角色用于授权。由于华为云各服务之间存在业务依赖关系，因此给用户授予角色时，可能需要一并授予依赖的其他角色，才能正确完成业务。角色并不能满足用户对精细化授权的要求，无法完全达到企业对权限最小化的安全管控要求。策略：IAM最新提供的一种细粒度授权的能力，可以精确到具体服务的操作、资源以及请求条件等。基于策略的授权是一种更加灵活的授权方式，能够满足企业对权限最小化的安全管控要求。例如：针对GaussDB服务，管理员能够控制IAM用户仅能对某一类数据库资源进行指定的管理操作。多数细粒度策略以API接口为粒度进行权限拆分。

yd_227829597 发表于2024-09-19 11:08:17 2024-09-19 11:08:17 最后回复福州司马懿 2024-09-30 11:10:02
36 2

云数据库 GaussDB
[技术干货] GaussDB模式匹配操作符详细介绍

本文作者：墨竹GaussDB模式匹配操作符详细介绍GaussDB数据库目前提供了三种独立的实现模式匹配的方法，分别为LIKE操作符、SIMILAR TO操作符和POSIX-风格的正则表达式。除了这些基本的操作符外，还有一些函数可用于提取或替换匹配子串并在匹配位置分离一个串。1、likelike应该是我们经常使用的方式，判断字符串是否能匹配上LIKE后的模式字符串，如果匹配，则LIKE表达式返回为真（NOT LIKE表达式返回假），否则返回为假（NOT LIKE表达式返回真）。如果不添加%或_，即全部字符串匹配相当于=；如果要匹配在字符串内的任何位置，该模式必须以%开头和结尾。规则说明%任意字符串的通配符_（匹配）任何单个字符\\ 、%、\_转义字符，查询的内容中需要匹配%、_、\，需要在前面添加\like大小写敏感即区分大小写ilike大小写不敏感即不区分大小写通配符openGauss=# SELECT 'abc' LIKE 'abc' AS RESULT; result -------- t (1 row) openGauss=# SELECT 'abc' LIKE 'a%' AS RESULT; result -------- t (1 row) openGauss=# SELECT 'abc' LIKE '%b%' AS RESULT; result -------- t (1 row) openGauss=# SELECT 'abc' LIKE '_b_' AS RESULT; result -------- t (1 row) openGauss=# SELECT 'abc' LIKE 'c' AS RESULT; result -------- f (1 row) 是否区分大小写openGauss=# select 'abc' like 'A%' as result; result -------- f (1 row) openGauss=# select 'abc' ilike 'A%' as result; result -------- t (1 row) ESCAPE子句指定其他逃逸字符下面案例中的模式字符串’abc$%%’，第一个%由于自定义了逃逸字符$，因此$%作为一个普通字符存在，只需要匹配查询的内容中包含有%；最后一个%则是通配符作用openGauss=# with tmp as (select 'abc%def' as result union all select 'abcdef' as result) openGauss-# select * from tmp where result like 'abc$%%' escape '$'; result --------- abc%def (1 row) 2、SIMILAR TOSIMILAR TO的用法和LIK非常类似，其结果也是根据匹配结果返回真假。另外比较特殊的就是支持使用SQL标准定义的正则表达式理解模式，支持的规则除了%和_之外，也支持下面这些从POSIX正则表达式借用的模式匹配元字符。元字符含义|表示选择（两个候选之一）*表示重复前面的项零次或更多次，可以理解为任意次+表示重复前面的项一次或更多次?表示重复前面的项零次或一次{m}表示重复前面的项刚好m次。{m,}表示重复前面的项m次或更多次{m,n}表示重复前面的项至少m次并且不超过n次()把多个项组合成一个逻辑项，就相当于把整个()内的内容作为匹配项[…]声明一个字符类，就像POSIX正则表达式一样针对上述描述重复的次数，是指元字符修饰的字符或者字符组重复多少次，不要理解为该字符或字符组可以和源字符串可以匹配多少次常见元字符使用--|元字符 openGauss=# SELECT 'abc' SIMILAR TO '%(af|bc)%' AS RESULT; result -------- t (1 row) --*元字符 --当前的*时，即使没有可匹配的内容，也返回的是true openGauss=# SELECT 'abc' SIMILAR TO '%(o)*%' AS RESULT; result -------- t (1 row) openGauss=# SELECT 'abcdefosp' SIMILAR TO '%(o)*%' AS RESULT; result -------- t (1 row) --+元字符，该示例由于一次也未匹配到，所以返回false openGauss=# SELECT 'abc' SIMILAR TO '%(o)+%' AS RESULT; result -------- f (1 row) --+元字符，该示例匹配到多次o，所以返回true openGauss=# SELECT 'abcdefooosp' SIMILAR TO '%(o)+%' AS RESULT; result -------- t (1 row) --?元字符，，该示例未匹配，返回结果也是true openGauss=# SELECT 'abc' SIMILAR TO '%(o)?%' AS RESULT; result -------- t (1 row) --{m,n}元字符，对于字符组oo，需要至少匹配2次，即为oooo，可知原字符串不符合结果，返回结果为false。 openGauss=# SELECT 'abcoodefoooosp' SIMILAR TO '%(oo){2,3}%' AS RESULT; result -------- f (1 row) SELECT 'abcoodefoooosp' SIMILAR TO '%(oo){2,3}%' AS RESULT; 3、POSIX正则表达式正则表达式是一个字符序列，它是定义一个串集合（一个正则集）的缩写。如果一个串是正则表达式描述的正则集中的一员时，我们就说这个串匹配该正则表达式。 POSIX正则表达式提供了比LIKE和SIMILAR TO操作符更强大的含义。列出了所有可用于POSIX正则表达式模式匹配的操作符。正则表达式匹配操作符操作符描述例子~匹配正则表达式，大小写敏感，等价与like‘thomas’ ~ ‘.thomas.’~*匹配正则表达式，大小写不敏感，等价与ilike‘thomas’ ~* ‘.Thomas.’！~不匹配正则表达式，大小写敏感，等价与not like‘thomas’ !~ ‘.Thomas.’！~*不匹配正则表达式，大小写不敏感，等价与not ilike‘thomas’ !~* ‘.vadim.’--匹配正则表达式，大小写敏感 openGauss=# SELECT 'abc' ~ 'Abc' AS RESULT; result -------- f (1 row) --匹配正则表达式，大小写不敏感 openGauss=# SELECT 'abc' ~* 'Abc' AS RESULT; result -------- t (1 row) --不匹配正则表达式，大小写敏感 openGauss=# SELECT 'abc' !~ 'Abc' AS RESULT; result -------- t (1 row) --不匹配正则表达式，大小写不敏感 openGauss=# SELECT 'abc'!~* 'Abc' AS RESULT; result -------- f (1 row) 匹配规则与LIKE不同，正则表达式允许匹配串里的任何位置，除非该正则表达式显式地挂接在串的开头或者结尾。除了上文提到的元字符外， POSIX正则表达式还支持下列模式匹配元字符。元字符含义\转义字符^表示串开头的匹配$表示串末尾的匹配.匹配任意单个字符(abc)把多个字符组合成一个匹配原子，就相当于把整个()内的内容作为匹配项[abc]匹配abc中的任何一个字符，内部可以嵌套(abc)，然后这个做一个原子，比如：[abc(de)][^abc]负值字符集合。匹配未包含的任意字符。例如，[^abc]可以匹配“plain”中的“plin”任一字符。|表示选择（两个候选之一）例如： a|b\d匹配任何数字，就像 [[:digit:]]\s匹配任何空白字符，就像 [[:space:]] ,包括空格、制表符和换行\w匹配任何单词字符，就像 [[:word:]]\D匹配任何非数字，就像 [^[:digit:]]\S匹配任何非空白字符，就像 [^[:space:]]\W匹配任何非单词字符，就像 [^[:word:]]\A只在串开头匹配（与^的不同）\m只在一个词的开头匹配\M只在一个词的末尾匹配\y只在一个词的开头或末尾匹配\Y只在一个词的不是开头或末尾的点上匹配\Z只在串的末尾匹配（与$的不同）\r回车常见元字符使用--()匹配规则 openGauss=# select 'abc' ~ '(ab|ac)' as result; result -------- t (1 row) --[]匹配规则，其中的任何一个字符匹配到源字符串就返回true openGauss=# select 'abc' ~ '[bef]' as result; result -------- t (1 row) --[^abc]，只要源字符串含有非限定范围的字符，就返回true openGauss=# select 'china' ~ '[^abc]' as result; result -------- t (1 row) --匹配空白字符 openGauss=# select 'china ' ~ '\s' as result; result -------- t (1 row) 匹配两个词组查询场景下面的案例主要就是查询数据库会话中使用is not null或者is null语法的场景--如果两个词组中间只包含空格，可以直接添加\s，另外还需要考虑有多个空白的时候，因此也需要添加量词来修饰，可以添加+ openGauss=# select 'select * from t1 where is not null' ~ '(is)\s+(not)' as result; result -------- t (1 row) --如果两个词组中间包含不固定的字符且至少有一个字符，可以添加 .+来指定任意字符； openGauss=# select 'select * from t1 where is not null' ~ '(is).*(null)' as result; result -------- t (1 row) --如果两个词组中间，可能存在not字符串且不存在其他字符串，可以适用((not)?\s+)修饰not字符串的匹配规则，外层的括号可以不需要。 --外层的括号只是为了方便区分匹配的分组 openGauss=# select 'select * from t1 where is not null' ~ '(is)\s+((not)?\s+)(null)' as result; result -------- t (1 row) --去掉括号后的结果和之前是一致的 openGauss=# select 'select * from t1 where is not null' ~ '(is)\s+(not)?\s+(null)' as result; result -------- t (1 row) 匹配规则，是否需要考虑换行匹配多个词组的时候，目前验证，对于空格、制表符、换行，都按照匹配任何空白字符处理即可。create table t1 (id int,context varchar(1000)); insert into t1 values(1,'select * from t1 where is not null'); insert into t1 values(2,'select * from t1 where is null'); insert into t1 values(3,'select * from t1 where 1=2'); insert into t1 values(4,'not else'); insert into t1 values(5,'ifnot else'); insert into t1 values(6,'notrr else'); insert into t1 values(7,'select * from t1 where is not null'); --查询 openGauss=> select * from t1 where regexp_like(context,'(is)\s+(not)?\s?(null)','i'); id | context ----+------------------------------------ 1 | select * from t1 \r + | where is \r + | not null 2 | select * from t1 where is \r + | null 7 | select * from t1 where is not null (3 rows) --插入 insert into t1 values(8,'where group by '); insert into t1 values(9,'where group by '); --匹配换行\r openGauss=> select * from t1 where regexp_like(context,'(group)\r+','i'); id | context ----+--------------- 8 | where group\r+ | by (1 row) --匹配任何空白字符\s，根据结果可知，\s是包含换行信息的 openGauss=> select * from t1 where regexp_like(context,'(group)\s+','i'); id | context ----+----------------- 8 | where group\r + | by 9 | where group by (2 rows) 按照词组匹配，精确查找我们在查询匹配关键字的时候，一般需要精确查找匹配，而不需要那些包含有查询关键字的数据行--通过正则表达式约束\m和\M来限定一个词的开头和结尾匹配 openGauss=> select * from t1 where regexp_like(context,'\mnot\M','i'); id | context ----+------------------------------------ 1 | select * from t1 \r + | where is \r + | not null 4 | not else 7 | select * from t1 where is not null (3 rows) --\m一个词的开头匹配 openGauss=> select * from t1 where regexp_like(context,'\mnot','i'); id | context ----+------------------------------------ 1 | select * from t1 \r + | where is \r + | not null 4 | not else 6 | notrr else 7 | select * from t1 where is not null (4 rows) --\M一个词的末尾匹配 openGauss=> select * from t1 where regexp_like(context,'not\M','i'); id | context ----+------------------------------------ 1 | select * from t1 \r + | where is \r + | not null 4 | not else 5 | ifnot else 7 | select * from t1 where is not null (4 rows) ?和*量词的区别在查询匹配场景下，我个人理解应该是一致的，但是对于一些替换场景则是有区别的--?是匹配0或1次，所以(o)?b匹配的子串为ob，替换为了foearbaz openGauss=> SELECT regexp_replace('foobarobaz', '(o)?b', 'e'); regexp_replace ---------------- foearobaz (1 row) --*是匹配0或更多次，所以(o)?b匹配的子串为oob，替换为了e，结果为fearbaz openGauss=> SELECT regexp_replace('foobarobaz', '(o)*b', 'e'); regexp_replace ---------------- fearobaz (1 row) --对于flat参数，i表示进行大小写无关的匹配，g表示替换每一个匹配的子字符串而不仅仅是第一个 openGauss=> SELECT regexp_replace('foobarobaz', '(o)*b', 'e','g'); regexp_replace ---------------- feareaz (1 row)正则表达式支持的函数对于具体的正则函数的使用，本文不做详细介绍，后续再写文章详细介绍。正则表达式支持的函数如下，substring(string from pattern) 描述：截取匹配POSIX正则表达式的子字符串。如果没有匹配它返回空值，否则返回文本中匹配模式的那部分。 regexp_count(string text, pattern text [, position int [, flags text]]) 描述：获取满足匹配的子串个数 regexp_instr(string text, pattern text [, position int [, occurrence int [, return_opt int [, flags text]]]]) 描述：获取满足匹配条件的子串位置（从1开始）。如果没有匹配的子串，则返回0。 regexp_substr(string text, pattern text [, position int [, occurrence int [, flags text]]]) 描述：正则表达式的抽取子串函数。与substr功能相似，正则表达式出现多个并列的括号时，也全部处理 regexp_replace(string, pattern, replacement [,flags ]) 描述：替换匹配POSIX正则表达式的子字符串。如果没有匹配pattern，那么返回不加修改的string串。如果有匹配，则返回的string串里面的匹配子串将被replacement串替换掉。 replacement串可以包含\n，其中\n是1到9，表明string串里匹配模式里第n个圆括号子表达式的子串应该被插入，并且它可以包含\&表示应该插入匹配整个模式的子串。可选的flags参数包含零个或多个改变函数行为的单字母标记。flags 支持的选项值及含义描述如表1 flags 支持的选项值所示。返回值类型：varchar regexp_matches(string text, pattern text [, flags text]) 描述：返回string中所有匹配POSIX正则表达式的子字符串。如果pattern不匹配，该函数不返回行。如果模式不包含圆括号子表达式，则每一个被返回的行都是一个单一元素的文本数组，其中包括匹配整个模式的子串。如果模式包含圆括号子表达式，该函数返回一个文本数组，它的第n个元素是匹配模式的第n个圆括号子表达式的子串。 flags参数为可选参数，包含零个或多个改变函数行为的单字母标记。i表示进行大小写无关的匹配，g表示替换每一个匹配的子字符串而不仅仅是第一个。 regexp_split_to_array(string text, pattern text [, flags text ]) 描述：用POSIX正则表达式作为分隔符，分隔string。和regexp_split_to_table相同，不过regexp_split_to_array会把它的结果以一个text数组的形式返回。返回值类型：text[] regexp_split_to_table(string text, pattern text [, flags text]) 描述：用POSIX正则表达式作为分隔符，分隔string。如果没有与pattern的匹配，该函数返回string。如果有至少有一个匹配，对每一个匹配它都返回从上一个匹配的末尾（或者串的开头）到这次匹配开头之间的文本。当没有更多匹配时，它返回从上一次匹配的末尾到串末尾之间的文本。 flags参数包含零个或多个改变函数行为的单字母标记。i表示进行大小写无关的匹配。返回值类型：setof text regexp_like(text,text,text) 描述：正则表达式的模式匹配函数。返回值类型：bool总结本文中整理的正则匹配规则为比较常见的规则，相对来说上手还是比较容易的，这些规则对于我们的日常运维开发应该是足够使用的。另外这三种模式匹配，其实使用场景也是稍微有所不同。1、like常用于简单的模糊匹配查询2、SIMILAR TO语法可以支持正则模式匹配，适用于大部分场景3、正则表达式相比SIMILAR TO，支持一些正则函数的使用并且支持一些其他特殊的匹配规则总之，正则表达式是一种强大的工具，它在文本处理领域具有广泛的应用，并且具有灵活性、通用性和高效性等优点。通过掌握正则表达式，开发或运维人员能够更高效地处理文本数据。上述的整理，是通过查看GaussDB的官网文档并结合PG官网资料整理常用的正则表达式。如果个别内容有误，望各位大佬多多指正。

Gauss松鼠会小助手2 发表于2024-09-19 09:41:41 2024-09-19 09:41:41 最后回复炒香菇的书呆子 2024-10-01 00:26:25
29 2

云数据库 GaussDB
[技术解读] GaussDB 导出实例基本信息

通过GRANT把角色授予用户后，用户即具有了角色的所有权限。推荐使用角色进行高效权限分配。例如，可以为设计、开发和维护人员创建不同的角色，将角色GRANT给用户后，再向每个角色中的用户授予其工作所需数据的差异权限。在角色级别授予或撤消权限时，这些更改将作用到角色下的所有成员。 GaussDB提供了一个隐式定义的拥有所有角色的组PUBLIC，所有创建的用户和角色默认拥有PUBLIC所拥有的权限。关于PUBLIC默认拥有的权限请参考GRANT。要撤销或重新授予用户和角色对PUBLIC的权限，可通过在GRANT和REVOKE指定关键字PUBLIC实现。要查看所有角色，请查询系统表PG_ROLES：创建、修改和删除角色非三权分立时，只有系统管理员和具有CREATEROLE属性的用户才能创建、修改或删除角色。三权分立下，只有初始用户和具有CREATEROLE属性的用户才能创建、修改或删除角色。要创建角色，请使用CREATE ROLE。要在现有角色中添加或删除用户，请使用ALTER ROLE。要删除角色，请使用DROP ROLE。DROP ROLE只会删除角色，并不会删除角色中的成员用户账户。内置角色提供了一组默认角色，以gs_role_开头命名。它们提供对特定的、通常需要高权限的操作的访问，可以将这些角色GRANT给数据库内的其他用户或角色，让这些用户能够使用特定的功能。在授予这些角色时应当非常小心，以确保它们被用在需要的地方。表1描述了内置角色允许的权限范围：关于内置角色的管理有如下约束：以gs_role_开头的角色名作为数据库的内置角色保留名，禁止新建以“gs_role_”开头的用户/角色/模式，也禁止将已有的用户/角色/模式重命名为以“gs_role_”开头；禁止对内置角色的ALTER和DROP操作；内置角色默认没有LOGIN权限，不设预置密码；gsql元命令\du和\dg不显示内置角色的相关信息，但若显示指定了pattern为特定内置角色则会显示。三权分立关闭时，初始用户、具有SYSADMIN权限的用户和具有内置角色ADMIN OPTION权限的用户有权对内置角色执行GRANT/REVOKE管理。三权分立打开时，初始用户和具有内置角色ADMIN OPTION权限的用户有权对内置角色执行GRANT/REVOKE管理。

yd_227829597 发表于2024-09-18 17:18:29 2024-09-18 17:18:29 最后回复福州司马懿 2024-09-30 11:09:59
34 2

云数据库 GaussDB
GaussDB的角色

通过GRANT把角色授予用户后，用户即具有了角色的所有权限。推荐使用角色进行高效权限分配。例如，可以为设计、开发和维护人员创建不同的角色，将角色GRANT给用户后，再向每个角色中的用户授予其工作所需数据的差异权限。在角色级别授予或撤消权限时，这些更改将作用到角色下的所有成员。 GaussDB提供了一个隐式定义的拥有所有角色的组PUBLIC，所有创建的用户和角色默认拥有PUBLIC所拥有的权限。关于PUBLIC默认拥有的权限请参考GRANT。要撤销或重新授予用户和角色对PUBLIC的权限，可通过在GRANT和REVOKE指定关键字PUBLIC实现。要查看所有角色，请查询系统表PG_ROLES：创建、修改和删除角色非三权分立时，只有系统管理员和具有CREATEROLE属性的用户才能创建、修改或删除角色。三权分立下，只有初始用户和具有CREATEROLE属性的用户才能创建、修改或删除角色。要创建角色，请使用CREATE ROLE。要在现有角色中添加或删除用户，请使用ALTER ROLE。要删除角色，请使用DROP ROLE。DROP ROLE只会删除角色，并不会删除角色中的成员用户账户。内置角色提供了一组默认角色，以gs_role_开头命名。它们提供对特定的、通常需要高权限的操作的访问，可以将这些角色GRANT给数据库内的其他用户或角色，让这些用户能够使用特定的功能。在授予这些角色时应当非常小心，以确保它们被用在需要的地方。表1描述了内置角色允许的权限范围：关于内置角色的管理有如下约束：以gs_role_开头的角色名作为数据库的内置角色保留名，禁止新建以“gs_role_”开头的用户/角色/模式，也禁止将已有的用户/角色/模式重命名为以“gs_role_”开头；禁止对内置角色的ALTER和DROP操作；内置角色默认没有LOGIN权限，不设预置密码；gsql元命令\du和\dg不显示内置角色的相关信息，但若显示指定了pattern为特定内置角色则会显示。三权分立关闭时，初始用户、具有SYSADMIN权限的用户和具有内置角色ADMIN OPTION权限的用户有权对内置角色执行GRANT/REVOKE管理。三权分立打开时，初始用户和具有内置角色ADMIN OPTION权限的用户有权对内置角色执行GRANT/REVOKE管理。

yd_227829597 发表于2024-09-18 17:17:51 2024-09-18 17:17:51 最后回复 yd_227829597 2024-09-18 17:17:51
20 0

云数据库 GaussDB
[问题求助] 4C4D4副本中的4C4副本代表什么？

4D是意思我知道，是代表4个DataNode。4副本的意义是有4个数据分片吗？4C的意思是4的CN节点吗？

tuge 发表于2024-09-18 11:11:16 2024-09-18 11:11:16 最后回复加油O幸福 2024-09-29 16:04:04
115 4

云数据仓库 GaussDB(DWS) 云数据库 GaussDB
[其他问题] GaussDB、DWS、GaussDB A、GaussDB T、openGauss概念理解

小白入门，在搜索文档的时候被这些概念绕晕了，这些说的都是一个东西吗?比如：我看有的地方说是GaussDB，有的地方又说是GaussDB(DWS)，有没有大佬解释一下？

yd_219235384 发表于2024-09-14 10:21:21 2024-09-14 10:21:21 最后回复马良 2025-12-25 10:11:30
1959 10

云数据库 GaussDB 云数据库 TaurusDB
[问题求助] 信创迁移，应用系统的mysql数据库业务数据迁移到高斯数据库迁移方案

各位大佬，信创迁移，应用系统的mysql数据库业务数据迁移到高斯数据库迁移方案有吗，高斯数据库数据迁移接口支持哪些mysql版本？

yd_215059159 发表于2024-09-12 16:52:15 2024-09-12 16:52:15 最后回复炒香菇的书呆子 2024-09-30 18:09:53
369 4

云数据库 GaussDB
[技术解读] GaussDB数据库高可用部署方案

GaussDB数据库主备架构的基本组件，以及基于华为云底座和轻量化部署TPOPS两种方式的典型高可用部署场景介绍。1、GaussDB数据库组件1.1 GaussDB数据库集中式主备集群基本组件CM由CM Agent、CM Server和OM monitor构成：CM Agent：管理服务组件，由OMM拉起（周期1秒），主要负责CMS、DN进程的保活及启停，仲裁指标采集、仲裁命令执行等。集群的每台主机上均有CM Agent进程。CMA故障可能会导致启停能力丢失、实例故障检测能力丢失。CM Server：管理服务组件，由CMA拉起（周期1秒），根据CM Agent上报的实例状态判定当前状态是否正常，是否需要修复，并下发指令给CM Agent执行。CM Server会将集群的拓扑信息保存在ETCD。OM Monitor：管理服务组件，由crontab定时任务控制拉起（周期1分钟），主要负责OMM、etcd、cm_agent进程的保活及启停DN节点：数据服务组件，由CMA拉起（周期1秒），负责存储业务数据、执行数据查询任务以及返回应用结果。DN主备节点之间采用Quorum复制或Paxos协议复制。ETCD节点：管理服务组件，由OMM自动拉起（周期1秒），主要协助CMS选主、持久化集群仲裁信息、保存集群的拓扑信息等。1.2 区域和可用区在高可用部署架构中区域（Region）和可用区（Available Zone）用来描述数据中心的位置。区域Region：指物理上相对独立的数据中心。每个区域完全独立，这样可以实现最大限度的容错能力和稳定性。在GaussDB数据库中资源创建成功后不能更换区域。可用区AZ：指同一区域内，电力和网络互相隔离的物理区域，比如同一个区域内的两个机房，一个AZ故障不会影响其它AZ。GaussDB数据库中在同一个Region内可以有多个AZ可用区，不同可用区之间物理隔离，但内网互通，既保障了可用区的独立性，又提供了低价、低时延的网络连接。不同Region的划分和多中心的高可用架构有关，比如生产/同城/灾备机房划分为不同的Region，然后在同一个Region内按照机房模块划分为不同的AZ域。也有可能生产和同城划分为同一个Region，灾备作为一个单独的Region，不同Region之间的RPO要求也是不同的。1.3 主备节点数据同步机制1.3.1 WAL日志机制GaussDB数据库为了保证数据在数据库发生故障时候可恢复，引入了Redo机制，也就是WAL日志，其思想是对数据文件的修改在提交之前都需要记录到日志文件中，也就是先写日志后写数据。当事务发生时，相关的操作记录会被组装并写入基于内存的RedoLogBuffer中。当RedoLogBuffer写满或事务没有更多日志记录需要写入时，这些日志记录会被提交给RedoLogHandler，并最终写入到XLog（即WAL日志）中。这样不需要在每次事务提交的时候都把数据页刷回到磁盘，因为出现崩溃的情况下可以用日志REDO来恢复数据库。WAL日志机制在数据库发生故障后可以通过xlog日志文件恢复数据、主备节点也可以通过日志文件进行数据同步、备份恢复时通过WAL日志可以实现PITR恢复。与MySQL中binlog不同之处是WAL日志主要关注于数据的物理修改记录，确保在数据文件修改之前相应的日志已经写入磁盘；而binlog日志则可能更侧重于记录数据的逻辑变化，如SQL语句的执行等。在GaussDB中可以使用逻辑复制的功能将xlog日志转换为类binlog日志格式进行逻辑回放等使用场景。1.3.2 同Region内主备节点复制在一主多备架构中，主机通过WalSender线程向备机同步日志，备机通过WalReceiver线程接受日志，并刷到本地盘，备机读取redo日志，完成主备之间的数据同步。WAL：Write-Ahead Logging，也称为XLog，预写日志系统。实现事务日志的标准方法，是指对数据文件（表和索引的载体）持久化修改之前必须先持久化相应的日志。WAL Receiver：数据库复制时备机创建的一个线程的名称。此线程用于从主机接收数据、命令，并反馈确认信息至主机。一个备机只有一个WALReceiver线程。WAL Sender：数据库复制过程中，主机接受到备机的连接请求后创建的一个线程的名称。此线程用于发送命令、数据到备机，并从备机接收信息。一个主机可能会有多个WAL Sender线程，每一个WAL Sender线程对应一个备机的一个连接请求。WAL Writer：数据库启动时创建的一个写Redo日志的线程，用于将内存中的日志写入到持久性设备中。REDO日志：记录对数据库进行操作的日志，这些日志包含重新执行这些操作所需要的信息。当数据库故障时，可以利用REDO日志将数据库恢复到故障前的状态。GaussDB数据库在同一个Region内1主多备的部署架构下，主备节点间采用Quorum或Paxos一致性复制协议，在事务提交前会进行一致性检测，满足半数以上的多数派响应后才可以提交。因此为了满足多数派选举，日志节点会部署为奇数。同时根据不同的业务可用模式，将日志同步分为不同的模式，有以下几种：最大保护模式：一主多备场景下，如果主机的一个事务必须等到该事务对应的xlog日志在多数派主机上都落盘后才能提交。如果因为网络原因或者多数的备机发生故障，此时主机的事务将无法提交。该模式下，可以保证RPO=0，参数设置synchronous_commit=on最大可用模式：当发现备机不可用时，会自动从最大保护模式切换为最大可用模式，保证在备机不可用时主机的事务能够继续执行。该模式下无法保证RPO=0，参数设置most_avaiable_sync=on最大性能模式：主机的事务在该事务对应的xlog日志在本地落盘之后就可以提交，主机的性能不受备机的影响。该模式下，在主机故障时，可能会有一定的数据丢失，参数配置synchronous_commit=off1.3.3 跨Region流式复制GaussDB跨Region之间的数据同步采用流式复制的方式，一般是在生产和灾备建立两套数据库集群，基于WAL日志建立日志复制关系。跨Region之间的复制不能保证RPO=0。流式复制是使用max_replication_slots（日志复制槽）、max_keep_log_seg（逻辑日志数）等配置来控制复制的速率，防止备机堆积过多日志影响性能。2、华为云GaussDB数据库高可用部署华为云GaussDB数据库有两种部署模式，一种是基于华为云HCS底座的，适合于本身已经建设了华为云IAAS平台，基于现有的云平台底座的运维和管理能力，减少重复建设的成本；另一种是轻量化TPOPS平台，TPOPS不依赖于华为云底座实现对GaussDB数据库实例的运维管理。本文主要介绍集中式架构下的高可用部署。2.1 基于华为云底座的高可用部署集中式主备版本的同城和异地部署的时候有不同的组合，有同Region多AZ部署、跨Region的多AZ部署。这里介绍几种典型的部署方案，其它参考官网材料。1）生产同城单Region部署左图为生产单中心1AZ3副本部署，适用于不要求站点级容灾，但是需要保证单中心故障高可用的场景。DN主备之间采用流复制进行数据同步，至少同步到一台备机，保证RPO=0。DN备节点故障，不中断业务的进行；DN主节点故障，自动进行主备切换。右图为生产同城3AZ4副本同城双活部署，由两个业务AZ和1个仲裁AZ组成，任何AZ故障能够保证RPO=0。AZ1和AZ2对等部署，AZ3作为第三方仲裁节点，不接入业务；AZ3作为仲裁AZ，在1个AZ故障状态下，保证ETCD的存活节点超过多数，从而保证数据的一致性DN主备之间采用流复制进行数据同步，跨AZ存在同步备，数据不会丢失。DN备节点故障，不中断业务的进行；DN主节点故障，自动进行主备切换。AZ1和AZ2之间可以手动切换，切换完成后业务继续运行2）生产同城跨Region部署（保证同城RPO=0）前文已经介绍到GaussDB数据库在不同Region之间划分为不同的集群进行部署，不同集群之间采用流式复制，不能保证RPO=0。基于华为云底座部署的时候，可能因为生产和同城机房在网络部署上划分为不同的网络区域Region，此时如果要保证RPO=0只能采用存储复制的方案。GaussDB数据库结合Dorado存储实现存算分离和存储级别的高可用方案，两个不同Region之间通过存储复制保证RPO=0。每个Region都有一套完整的数据库集群，并有完整的数据；集群内主备节点之间采用共享卷进行数据同步，保证RPO=0DN备节点故障，不中断业务的进行；DN主节点故障，自动进行主备切换跨region容灾需要手工切换闪存存储需要支持远程复制LUN，支持NAS文件系统并且和主机之间的连接使用IP网络连接如果没有要求生产和同城之间RPO=0，采用双Region部署，两个集群之间采用数据库跨Region流式复制的方式实现数据同步。另外有时候考虑到生产和同城的网络带宽及时延限制，主备之间的强一致同步会影响到性能，也会考虑生产同城双Region部署。但其实大多数场景下，生产和同城之间的网络时延在0.5ms左右，已经满足业务访问的时延要求了。对于灾备站点由于物理距离上的限制，网络时延会大很多，所以需要单独划分Region部署，并且不能保证RPO=0。因此，对于不想使用存储复制方案的高可用部署，推荐生产和同城一个Region、灾备站点一个Region的方案。2.2 基于轻量化TPOPS高可用部署GaussDB数据库的TPOPS轻量化部署不依赖于华为云底座，只需要部署TPOPS云数据库管理平台，然后基于TPOPS进行数据库实例的纳管和维护即可。在部署形态上也是支持多种，这里介绍几种典型的部署方案，其它参考官网材料。1）生产同城单Region部署与基于云底座的部署方式相同，DN主备复制支持Quorum和Paxos两种协议，跨AZ存在同步备，数据不会丢失。2）同城3AZ5节点+异地1AZ1节点（同城RPO=0）生产同城双活部署，由两个业务AZ和一个仲裁AZ组成。两个业务AZ之间对等部署，任何一个机房都接入业务；仲裁AZ不接入业务；任何机房故障可保证RPO=0；异地Region支持跨Region的容灾能力。同城和异地跨Region分别部署一套单独的数据库集群；单AZ故障下，保证ETCD存活节点为多数，从而保证数据一致性；DN主备节点之间采用流式复制，至少同步到2台备机，保证RPO=0；同城切换支持跨AZ切换；跨Region容灾需要手动切换相比基于华为云底座的部署，异地Region支持单节点部署，并且生产和同城不需要和云底座的Region网络域捆绑，在部署方式上更为灵活。3、总结华为云GaussDB数据库高可用架构能够保证AZ内RPO=0、同城AZ间RPO=0，异地RPO<10s。另外高可用部署上有灵活的配置满足不同的场景，同时还有以下特性：为保证一致性协议的多数派选举成功，ETCD实例或日志副本等按照奇数部署；集中式架构下管控平台和数据库实例之间解耦，每个数据库集群都有自己的元数据管理节点、故障检测节点，在故障检测、DDL变更等场景下不依赖于集中式的管理节点。而管控平台的作用就是资源的管理、性能指标数据的采集和展示等。缺点就是需要维护的节点增多了，比如每个集群都有自己的ETCD、CMS等。在部署模式上如果没有现成的华为云底座，还是轻量化部署更为合适，数据库也不需要和某一类云厂商捆绑，在实际部署方案上也会更为灵活。GaussDB数据库基于云底座和云管平台实现实例的统一管理、指标采集展示、DBMind智能化运维等功能模块，并且结合DRS等迁移工具和Oracle数据库迁移国产中的兼容性及性能上的优势，在国产数据库的引进中已经具备相当的竞争力。不过吐槽一点是GaussDB数据库在实例部署时候的资源最小限制为8C64G并且在实例纳管时候无法规避，这对于小的应用或开发测试环境来说是相当不友好的。参考资料：https://doc.hcs.huawei.com/db/zh-cn/gaussdbqlh/24.1.30/tg/gaussdb-38-0122.html作者：大唐小少

Gauss松鼠会小助手2 发表于2024-09-12 14:15:57 2024-09-12 14:15:57 最后回复泽宇-Li 2024-09-16 16:46:58
5100 1

云数据库 GaussDB
[运维管理] GaussDB轻量化管理平台升级时influxdb状态检查失败

现象：执行升级命令时，提示influxdb is not ok，升级阻塞在提示influxdb is not ok的节点上执行如下步骤步骤1执行 systemctl status influxd.service确认 influxd 状态为running步骤2执行 crontab -e注释掉 * * * * * /usr/bin/python3 /opt/cloud/monitor/monitor.py >> /dev/null 2>&1 & 这个监控进程任务步骤3执行 ps -ef | grep monitor.pykill -9 杀掉监控进程pid步骤4重新执行升级命令，正常升级步骤5升级完成后，执行 crontab -e 打开 * * * * * /usr/bin/python3 /opt/cloud/monitor/monitor.py >> /dev/null 2>&1 & 监控进程任务

yd_245358619 发表于2024-09-11 15:24:55 2024-09-11 15:24:55 最后回复炒香菇的书呆子 2024-09-30 18:10:16
41 1

云数据库 GaussDB

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript