GaussDB数据库_标签_开发者

博客(338)
视频(0)
论坛(351)
云声(0)
代码示例(0)

[运维管理] GaussDB 压缩比问题

单看产品文档的压缩比介绍，感觉在数据压缩比这块不占优势，能简单解释下吗？

pack 发表于2023-01-11 10:56:31 2023-01-11 10:56:31 最后回复
159 2

云数据仓库 GaussDB(DWS) GaussDB数据库
[问题求助] 银河麒麟V10安装GaussDB数据库失败

在3台麒麟服务器上部署GaussDB数据库集群环境及软件如下om_agent和预安装都能够成功，但是执行正式安装命令就报错python3 gaussdb_install.py --action installCluster报错截图如下：

刘贵宾 发表于2023-01-05 16:35:37 2023-01-05 16:35:37 最后回复刘贵宾 2023-01-29 16:15:53
187 5

云数据库 GaussDB GaussDB数据库
[技术干货] DTT2022年度收官圆桌π，华为云8位技术专家的年末盘点与2023年技术新规划

在2022年的年末，华为云DTSE Tech Talk迎来了年度收官圆桌π直播活动（👉 点击回看），8位DTSE技术布道师和开发者们畅谈云上创新应用，回顾盘点了今年的关键技术产品，展望2023年在新产品和技术上的新规划。作为本次圆桌π的主持人，华为云DTSE技术布道师徐毅从π的无限谈起，表达了对开发者们的新年祝福：未来有无限的可能等待着开发者探索，愿大家通过DTT与华为云在云上共成长。1、程泽：更好地支持开发者做SaaS应用构建华为云DTSE技术布道师程泽回顾总结了在前几期直播中，他是如何指导开发者选择合适的开发框架将SaaS应用系统部署在云上，并通过云上运维平台构建SaaS应用运维系统，以及企业要着重注意的SaaS应用构建安全性问题。除了SaaS架构基础设计层面的内容，程泽表示，2023年会重点关注新租户创建升级时，后端资源的平滑创建和自动化部署，比如通过指令来实现云资源的创建、更新销毁、全生命周期管理等等，为有需要的企业和开发者提供更丰富的的技术资料，支持大家做SaaS应用的构建。2、董鑫武：零代码将释放IT产能，改变软件生产关系围绕当下火热的低代码和零代码，华为云PaaS DTSE技术布道师董鑫武总结了整体的趋势：当前低代码已经进入了组装式应用交付的新范式，零代码在未来则可以让业务人员从事相关应用的构建，让IT的产能得以释放，从而改变当前的软件生产关系。董鑫武透露，在2023年，华为云的低代码平台进行了全新的品牌升级——Astro，并推出5大产品：IOC大屏Astro Canvas、工作流Astro Flow、轻应用Astro Zero、智能助手Astro Bot、复杂应用Astro Pro。“星垂平野阔，月涌大江流，华为云邀开发者一起构建给代码璀璨的星空。”3、金云飞：明年推出数字内容的四大生产线华为云媒体DTSE技术布道师金云飞表示，当前华为云会议为企业和开发者提供服务端和客户端开发能力，可以满足政企办公市场、行业应用市场以及一些跨界创新产品应用，诸如企业培训、在线教育、应急指挥等等场景。华为云低时延直播产品将时延降低到800ms以内，可满足电商直播、教育直播、赛事直播等时延敏感业务的诉求。从2022年下半年开始，云桌面API也正式对外开放，开发者可以便捷的接入和调用。围绕数字内容生产，华为云在明年将推出四大生产线：数字人生产线、虚拟直播生产线、企业3D空间生产线，虚实融合生产线，具备数字内容的建模、生产、渲染、资产管理、编辑能力，让开发者得以通过开放的SDK和API来构建数字内容。4、许炳尘：APIG支持每秒50万以上的API并发调用在数字化浪潮的大背景下，API已经成为了关键的数字化转型的推动力。API既是数据交换的通道，也是研发生产的工具，同时还是企业和开发者最核心的资产。华为云PaaS DTSE技术布道师许炳尘讲到，一个API项目是否成功，最关键的还是在于API的运行的情况，这也是整个API全生命周期管理的核心。华为云API Arts通过插件的形式集成了云原生网关APIG，来实现API的运行托管和监控运维， APIG目前单集群已经能够支持每秒50万以上的API并发调用。许炳尘表示，2023年华为云会继续完善和强化API Arts和APIG，提供更完整更丰富的API全生命周期管理能力。并且通过API Arts和APIG，进一步降低API的研发使用门槛，更加契合云原生，从而满足企业和开发者越来越丰富的API管理需求。5、杜奇：提供更多行业专用算法workflow，推动AI应用落地AI的应用落地正在改变一些传统行业，华为云EI DTSE技术布道师杜奇和大家分享了两个有趣的案例：AI养牛、AI抄水表。以AI抄水表为例，为了解决伙伴遇到的人工抄表的痛点，华为云开发了一套水表识别模型的定制化和自主训练工具，将数据导入、数据集创建、数据标注、数据处理、模型训练、模型管理、模型上线等复杂的步骤，按照业务流程封装成一个格节点，便于后续反复迭代开发，支持识别更多种类的水表。谈及明年的规划，杜奇表示华为云AI产品将会和大数据等产品服务打通，同时提供更多行业专用算法workflow，帮助开发者低门槛高效率完成AI应用开发。6、覃元元：从日志服务领域的追随者成长为领导者华为云PaaS DTSE技术布道师覃元元总结了22年日志服务方面的主要工作内容：补齐各种英文日志来源的接入场景；提供API、SDK、Android及iOS等端测的接入方式和接入场景指导；完善整体日志管理的界面，在日志搜索页面优化搜索体验；完善仪表盘及日志告警等内容。2023年，华为云LTS日志服务会进一步去完善。在日志采集方面，补齐自研的SA采集器的日志解析能力，提供更多的SDK，完善转储能力；在日志加工方面，提供端到端的控制台面；在搜索方面，将会推出百亿级秒级搜索以及千亿级的迭代搜索，为用户提供更好地搜索体验。覃元元讲到，通过在采集、搜索、日志加工等方面的持续发力，2023年华为云LTS日志服务会成为在日服领域从追随者逐渐的演变为一个领导者。7、刘坤鹏：GaussDB(DWS)让人人都可以用好数据华为云EI DTSE技术布道师刘坤鹏分析了当前各行各业在数据处理分析方面遇到的挑战，华为云GaussDB(DWS)提供的全场景一站式分析能力，让人人可以用好数据。GaussDB(DWS)是基于share-nothing的无共享分布式架构，具有极高的扩展性，刘坤鹏从技术架构、高可用、容灾、备份体系、智能运维、迁移能力等方面，为开发者一一解读了GaussDB(DWS)背后的关键技术，核心优势等。刘坤鹏表示，2023年，华为云将配合产品版本的迭代，围绕应用场景、架构、工具以及生态等，推出更多直播课程。同时，也会分享开发者关注的数据库设计原则、SQL调优技巧、业务典型故障处理案例，让大家用好GaussDB(DWS)。最后提前祝所有开发者们新年快乐！！！在新的一年心想事成，技术更上一层楼。

hahjee 发表于2023-01-03 10:45:13 2023-01-03 10:45:13 最后回复 hahjee 2023-01-03 10:45:13
70 0

云原生 EI企业智能软件开发 GaussDB数据库云计算
[开发应用] 如何查看用户的密码有效期

数据库中的dm_ods用户密码已过期，但查询 pg_authid中的rolpwdexpire 字段，值为 -1，-1不是表示没有过期时间限制么？1. rolpwdexpire=-1 表示的是什么？2. 如果想查询用户的密码有效期的具体时间，请问如何查询？3. 配置 password_effect_time 参数可以修改密码的有效期，如果多个用户的有效期限需要不同，如a用户需要限制120天，b用户要设置密码永久有效，如何操作？谢谢各位老师！

yd_262603720 发表于2022-12-30 16:55:21 2022-12-30 16:55:21 最后回复 codefulture 2023-01-10 10:13:36
173 9

云数据仓库 GaussDB(DWS) GaussDB数据库
[生态空间] 如何定时循环清理表碎片

通过存储过程查询系统表，拼接VACUUM FULL ANALYZE,执行时，提示存储过程或函数无法调用VACUUM ,请问是否有其他变通方式来实现定时全表碎片处理vacuum在存储过程中调用失败错误代码：[0]SQL错误码: = 25001 ERROR: VACUUM cannot be executed from a function or multi-command string

yd_264468546 发表于2022-12-09 15:17:11 2022-12-09 15:17:11 最后回复古月磊 2022-12-13 11:36:00
107 3

云数据库 GaussDB GaussDB数据库
[开发应用] GaussDB(DWS)用户密码如何设置永久有效

GaussDB(DWS)用户密码如何设置永久有效，需要执行的具体代码是什么？谢谢！！！

yd_262603720 发表于2022-12-08 17:07:40 2022-12-08 17:07:40 最后回复 yd_262603720 2022-12-09 16:59:49
97 5

云数据仓库 GaussDB(DWS) GaussDB数据库
[运维管理] GaussDB(dws)不同用户间执行存储过程需要哪些权限

GaussDB(dws)数据库中有多个用户，现在需要使用A用户来调用B用户的存储过程任务。B用户的存储过程创建时会默认赋EXECUTE权限给A用户。但A用户执行B用户下的存储过程时，其中分区处理的部分会报错：删除分区会报错：must be owner of relation B用户。truncate分区数据时会报错：permission denied for relation B用户。请问：1、使用A用户来调用B用户的存储过程时，存储过程中的代码执行用户不应该是B用户么？2、通过A用户来调用B用户的存储过程来对表分区进行操作时，都需要满足哪些权限？谢谢！！！B用户的存储过程中有分区处理的逻辑如下：

yd_262603720 发表于2022-12-08 17:02:55 2022-12-08 17:02:55 最后回复 yd_262603720 2022-12-09 16:59:29
95 5

云数据仓库 GaussDB(DWS) GaussDB数据库
[问题求助] Data studio打开显示同一用户不能打开多个实例

打开Data Studio就显示这个官方的手册也没有答案：求大佬解答

yd_222480658 发表于2022-12-06 22:53:24 2022-12-06 22:53:24 最后回复赫塔穆勒 2022-12-31 20:33:18
153 6

云数据库 GaussDB GaussDB数据库云数据库 TaurusDB 云数据库 RDS for PostgreSQL
[分享交流] 沃土云创计划·高校开课申报模板

加入沃土云创高校计划后，如何申请开课？1、请登录华为云账号，下载附件中的开课申请表和课程大纲模板（开课申请表有样例，可参考）2、并参考附件指导书中第五大点，在线提交开课计划(开课申请表需请二级学院盖章）3、预计3个工作日进行课程审核关于开课有任何问题可联系张女士13753491670（微信同号）

华为云生态助手 发表于2022-11-29 09:54:02 2022-11-29 09:54:02 最后回复 yd_285044089 2022-11-29 20:21:20
257 1

软件开发 GaussDB数据库人工智能 IoT 云计算
戳视频了解数据仓库开发者认证优势

戳链接了解认证详情：cid:link_0videovideovideovideovideovideo

胡辣汤 发表于2022-11-17 17:59:27 2022-11-17 17:59:27 最后回复马生 2023-03-24 10:12:36
659 10

云数据库 GaussDB GaussDB数据库开发者数据库
[技术干货] 【第五届openGauss技术文章征集】MySQL到OpenGauss的数据迁移测试

前言本文将测试利用chameleon工具从MySQL迁移数据到OpenGauss3.1.0。环境环境信息MYSQLOpenGauss版本5.7.363.1.0系统版本docker 19.03.15CentOS Linux release 7.9.2009 (Core)IP192.168.10.5192.168.10.3工具安装1、下载chameleon工具======》我只找到了源码安装包，没找到wheel的版本2、解压/安装依赖包解压：[root@opengauss01 /]# unzip openGauss-tools-chameleon-master.zip 创建python虚拟环境并激活安装 (venv) [root@opengauss01 openGauss-tools-chameleon-master]# python3 setup.py install 如果缺包就挨个安装下： (venv) [root@opengauss01 openGauss-tools-chameleon-master]# pip3 install geomet argparse daemonize mysql-replication py-opengauss PyYAML rollbar tabulate 注意需要安装： (venv) [root@opengauss01 openGauss-tools-chameleon-master]# pip3 install PyMySQL==0.10.03、创建迁移配置文件(venv) [root@opengauss01 openGauss-tools-chameleon-master]# su - omm 上一次登录：二 11月 8 22:39:38 CST 2022pts/0 上 [omm@opengauss01 ~]$ cd /openGauss-tools-chameleon-master/ [omm@opengauss01 openGauss-tools-chameleon-master]$ source venv/bin/activate (venv) [omm@opengauss01 openGauss-tools-chameleon-master]$ (venv) [omm@opengauss01 openGauss-tools-chameleon-master]$ (venv) [omm@opengauss01 openGauss-tools-chameleon-master]$ (venv) [omm@opengauss01 openGauss-tools-chameleon-master]$ (venv) [omm@opengauss01 openGauss-tools-chameleon-master]$ chameleon set_configuration_files creating directory /home/omm/.pg_chameleon creating directory /home/omm/.pg_chameleon/configuration/ creating directory /home/omm/.pg_chameleon/logs/ creating directory /home/omm/.pg_chameleon/pid/ copying configuration example in /home/omm/.pg_chameleon/configuration//config-example.yml3、修改配置文件(venv) [omm@opengauss01 configuration]$ cp config-example.yml default.yml vim default.ymlpg_conn: host: "localhost" ===========》opengauss的ip port: "15400" ===========》opengauss的端口 user: "opengauss" ========== 》open gauss的用户 password: "openGauss01" ===========》opengauss的密码 database: "mysql_test" ===========》opengauss的目标数据库 charset: "utf8" sources: mysql: readers: 4 writers: 4 db_conn: host: "192.168.10.5" ============》mysql的ip port: "33650" ===========》mysql的端口 user: "root" ============》mysql的用户 password: "root" ============》mysql的密码 charset: 'utf8' connect_timeout: 10 schema_mappings: test: sch_mysql_database ================》test是mysql中的库，sch_mysql_database====》是opengauss中的库4、初始化迁移(venv) [omm@opengauss01 configuration]$ chameleon create_replica_schema --config default (venv) [omm@opengauss01 configuration]$ chameleon add_source --config default --source mysql 5、复制存量数据(venv) [omm@opengauss01 configuration]$ chameleon init_replica --config default --source mysql Init replica process for source mysql started.=======》MySQL数据库test中的表：mysql> use test Reading table information for completion of table and column names You can turn off this feature to get a quicker startup with -A Database changed mysql> show tables; +----------------+ | Tables_in_test | +----------------+ | big_table | | checksums | | hahaha | | test | | test1 | | test2 | +----------------+ 6 rows in set (0.00 sec)======》复制启动后，test库中的表都复制到sch_mysql_database下了。 Name | Owner --------------------+----------- blockchain | omm cstore | omm db4ai | omm dbe_perf | omm dbe_pldebugger | omm dbe_pldeveloper | omm dbe_sql_util | omm loxodonta_africana | opengauss pkg_service | omm public | omm sch_chameleon | opengauss sch_mysql_database | opengauss snapshot | omm sqladvisor | omm (14 rows) mysql_test=# set current_schema to sch_mysql_database mysql_test-# ; SET mysql_test=# \d List of relations Schema | Name | Type | Owner | Storage --------------------+------------------+----------+-----------+---------------------------------- sch_mysql_database | big_table | table | opengauss | {orientation=row,compression=no} sch_mysql_database | big_table_id_seq | sequence | opengauss | sch_mysql_database | checksums | table | opengauss | {orientation=row,compression=no} sch_mysql_database | test | table | opengauss | {orientation=row,compression=no} sch_mysql_database | test1 | table | opengauss | {orientation=row,compression=no} sch_mysql_database | test1_id_seq | sequence | opengauss | sch_mysql_database | test2 | table | opengauss | {orientation=row,compression=no} sch_mysql_database | test2_id_seq | sequence | opengauss |6、开启实时复制(venv) [omm@opengauss01 configuration]$ chameleon start_replica --config default --source mysql Starting the replica process for source mysql7、在mysql中插入数据Mysql中的数据 mysql> select * from test; +----+--------+ | id | name | +----+--------+ | 2 | bbbb | | 5 | cccc | | 4 | dddd | | 3 | eeee | | 1 | hehehe | +----+--------+ 5 rows in set (0.00 sec) Opengauss中的数据 mysql_test=# select * from test; id | name ----+-------- 2 | bbbb 5 | cccc 4 | dddd 3 | eeee 1 | hehehe (5 rows)Mysql中插入一条数据： mysql> insert into test values(6,'fffff'); Query OK, 1 row affected (0.01 sec) mysql> select * from test; +----+--------+ | id | name | +----+--------+ | 2 | bbbb | | 5 | cccc | | 4 | dddd | | 3 | eeee | | 6 | fffff | | 1 | hehehe | +----+--------+ 6 rows in set (0.00 sec) Opengauss中查看数据，可以看到新插入的（6，'fffff'）已经同步到了openGauss中。 mysql_test=# select * from test; id | name ----+-------- 2 | bbbb 5 | cccc 4 | dddd 3 | eeee 1 | hehehe 6 | fffff (6 rows)

yd_240529955 发表于2022-11-09 15:22:03 2022-11-09 15:22:03 最后回复 yd_240529955 2022-11-09 15:22:03
100 0

GaussDB数据库数据迁移
[其他] 【通信】【建连失败】errno: Resource temporarily unavailable

GaussDB(DWS)通信建连失败报错： ERROR: pooler: failed to create 1 connections, Error Message: remote node dn_6045_6046, detail: wait 10.16.36.158:25334:dn_6045_6046 recv timeout expired, errno: Resource temporarily unavailable问题现象业务运行报错如下，导致业务终止，多数情况下重试业务即可成功。可能原因该报错是cn与对端建连的时候报超时，导致连接失败导致的。出现该问题的可能原因如下：1. cn与dn建连的时候要持pg_class的一级锁，如果建连时对端有在进行类似vacumm full等操作持pg_class锁，可能会导致建连失败。2. CN日志中有此类语法报错ERROR: function getdate() does not exist at character 8，这种报错太多了，会销毁CN与DN连接池中取出来的连接，导致后续CN与DN新建连接。增大建联报错的风险，可以和业务侧沟通消除此类报错。对端有pm线程压力大告警如：thread usage rate more than 80%；DN有作业残留沾满资源导致连接不上。3. 排查索引后置问题，索引后置会导致pg_internal.init文件重新生成，文件生成阶段会阻塞建连。排查过程以及解决方案步骤1. 检查报错时间是否有vacuum full操作。检查日志中报错时间段是否有vacuum full pg_class，持有八级锁超时。因为vacuum full pg_class持有8级锁，cn和dn之间新建连接的时候需要持有pg_class的一级锁，导致锁冲突超时，获取连接超时失败这种只在新建连接的时候有问题，复用老的连接没有问题步骤2. 检查是否有烂SQL 占资源，报错DN上是否有作业残留。top 查看下cpu排队是否很高。1. SELECT current_timestamp - query_start AS runtime, datname, usename, query FROM pg_stat_activity where state != 'idle' ORDER BY 1 desc; 查看执行时间长的SQL，排查是否为烂SQL，kill掉作业2. 查看DN是否有作业残留占资源；DN上执行select * from pgxc_stat_activity；找是否有执行很长时间的作业；找到可疑的作业后通过查询到的query_id去CN上执行 select * from pg_pooler_status where remote_pid=$query_id; ($query_id 为第一步查出来的DN上的query_id)，如果没有结果，则表示CN找不到这个query_id的连接，作业在DN上残留了。DN上执行 select pg_terminate_backend(pid); 杀掉残留作业，释放资源。解决方案： select pg_terminate_backend(pid); 杀掉残留作业，释放资源。步骤3. 检查是否有索引后置报错时间，去报错对端DN日志查看是否有以下标志，block后面数字很大的就是有问题索引后置会导致pg_internal.init文件重新生成，文件生成阶段会阻塞建连。解决方案：系统表做vacuum full解决上述为目前现网遇到的该报错已知场景，后续有新场景会继续补充。。。

HANSHUO 发表于2022-10-31 14:30:29 2022-10-31 14:30:29 最后回复 HANSHUO 2022-10-31 14:30:29
277 0

GaussDB数据库
[运维管理] 【实例状态】GaussDB ETCD服务异常

首先确认是否是虚拟机、网络故障虚拟机故障导致ETCD服务异常告警问题现象管控面上报etcd服务异常告警，虚拟机发生重启，热迁移、冷迁移，HA等动作。问题分析及界定在告警信息中找到实例ID、节点ID、虚拟机ID，在管控面查看虚拟机状态是否正常，能否正常登录，如果虚拟机异常无法登录，联系IaaS技术支持修复虚拟机。检查虚拟机是否发生过重启，热迁移、冷迁移、HA等动作，例如内存、网卡等问题引起热迁移。处理步骤联系IaaS技术支持修复虚拟机，确认虚拟机故障原因，例如内存、网卡等问题引起热迁移。网络故障导致ETCD服务异常告警问题现象管控面上报etcd服务异常告警，虚拟机无法登录或ping通其他节点IP, 或者监控显示网络有异常。问题分析及界定在该节点上ping其他节点IP，测试是否ping通。如果ping不通，执行步骤（1）（2），检查该节点网络、IP配置、防火墙配置等。如果ping通，执行步骤（3）确认告警时间点网络是否断开。（1）检查IP是否正常：ifconfig查看etcd使用的IP是否存在，如果不存在，排查IP配置丢失原因，常见原因是虚拟机重启后IP没有重新配置，导致丢失。（2）检查防火墙是否正常在Ruby用户下查看etcd的IP和端口： ps ux | grep etcd在root用户下iptables -L命令检查防火墙是否限制了IP和端口，如果有限制，去掉防火墙限制。(3) 查看etcd日志进入Ruby用户cd $GAUSSLOG/cm/etcd查看对应时间点的etcd_xxx.log日志，如果有如下日志，可能是etcd节点间网络断开, 或者对端的etcd进程down，导致本端etcd连接断开。排查网络原因或对端的etcd进程是否重启，网络原因可能是网络断开，网卡故障，也有可能是虚拟机故障。grpc: Server.processUnaryRPC failed to write status: connection error: desc = "transport is closing"rafthttp: lost the TCP streaming connection with peer c797ab3a61e2ea55 (stream MsgApp v2 reader)etcdserver: failed to reach the peerURL(https:// X.X.X.X:X) of member c797ab3a61e2ea55 (Get "https://X.X.X.X:X/version": dial tcp X.X.X.X:X: i/o timeout)rafthttp: health check for peer c797ab3a61e2ea55 could not connect: dial tcp X.X.X.X:X: i/o timeout (prober "ROUND_TRIPPER_RAFT_MESSAGE")处理步骤处理步骤同上，已说明。负载过重导致ETCD服务异常警告问题现象管控面上报etcd服务异常告警, 磁盘IO/CPU/内存很高.问题分析及界定进入Ruby用户cd $GAUSSLOG/cm/etcd查看对应时间点的etcd_xxx.log日志，告警时间点有如下日志，说明etcd节点负载过重, 磁盘IO、CPU等压力大。2021-04-09 10:57:40.112936 W | wal: sync duration of 2.00201804s, expected less than 1s ===通常这个表示磁盘IO压力大。2021-04-09 10:57:40.112993 W | etcdserver: failed to send out heartbeat on time (exceeded the 1s timeout for 2.124414ms, to c8eccd97bed22939)2021-04-09 10:57:40.112999 W | etcdserver: server is likely overloaded2021-04-09 10:57:43.126444 W | etcdserver: read-only range request "key:\"/Ruby/ignoreNodeNumKey\" " with result "error:context canceled" took too long (1.999877971s) to executecd $GAUSSLOG/cm/cm_agent搜索对应时间点的cm_agent-xxx.log, 如果有如下日志，表示当时磁盘io比较高， io util 100 表示磁盘io 达到100%2021-04-09 11:06:24.047 tid=15822 LOG: device vdb1, tot_ticks 889640579, cputime 1798651342, io util 100处理步骤1、在管控面查看该节点当时磁盘IO、CPU、内存监控指标是否很高，示例1：数据盘写延时在16:00左右升高，影响etcd状态。示例2： etcd故障时刻，cpu、内存、磁盘写延时都有增长，尤其是磁盘写延时很明显，需要分析磁盘写延时升高的原因。2、如果故障现场还在： iostat -mx 1 查看磁盘IO状态，top和free命令查看cpu、内存使用情况, 分析磁盘IO高、CPU高，内存高的原因。3、root用户查看该节点的系统日志, cd /var/log, 查看该时间点message日志是否有异常记录。例如：节点内存耗尽了，分析占用内存的原因，是否内存泄漏等。如果仍无法确认原因，联系华为工程师。etcd进程故障导致ETCD服务异常告警问题现象etcd进程down、重启，管控面上报etcd服务异常告警问题分析及界定登陆故障etcd节点，进入Ruby用户，执行命令ps ux | grep etcd，查看etcd进程是否在运行。如果进程在，查看etcd进程启动时间，告警时是否重启过，联系华为工程师确认重启原因。如果进程不在，查看etcd无法启动原因：（1）cd $GAUSSLOG/bin, 查看目录下是否有cluster_manual_start 和 etcd_manual_start 两个文件，如果有表示集群被停止，确认停止集群的原因，之后启动集群，定位结束。（2）cd $GAUSSHOME/bin 查看目录下是否存在etcd这个文件，文件权限是否正确，确认文件不存在或权限不正确的原因。（3）检查etcd的数据目录所在磁盘是否满了或者故障，etcd目录如下：cm_ctl query -Cvipd查看检查etcd的数据目录所在磁盘是否满了或者目录权限不正确（正确是700）或者故障，如果磁盘满，检查占用磁盘的文件并清除或者转存到其他盘，如果是etcd本身的文件占满，联系华为工程师分析原因。如果目录权限不正确，修改为正确的目录权限。如果是磁盘故障，联系IaaS技术支持分析定位。处理步骤参照上述处理，如果不是以上原因，请联系华为工程师OM接口无法正确返回结果导致ETCD服务异常告警问题现象管控面上报etcd服务异常告警，管控无法获取集群状态问题分析及界定查看管控面是否获取集群状态成功，是否获取空消息，联系华为工程师分析定位。cd $GAUSSLOG/om/查看gs_om-xxx.log，是否有如下异常日志例如： The status file does not exist. Path: /usr/local/temp/local_status_1611355718.58.dat.处理步骤参照上面描述步骤。

酷哥 发表于2022-10-28 14:36:16 2022-10-28 14:36:16 最后回复酷哥 2022-10-28 14:36:16
445 0

云数据库 GaussDB GaussDB数据库
[运维管理] 【实例状态】GaussDB CN DN为只读状态

只读原因当CN和DN的磁盘使用率达到阈值时，集群管理就会自动将相应的CN或DN分片设为只读（业务只能读不能写），执行cm_ctl query -Cv命令查询集群状态如下：设置为只读后禁止业务继续写入，避免磁盘被撑爆，同时也避免后续无法扩容（扩容需要磁盘有一定的剩余空间）。只读guc参数datastorage_threshold_value_check磁盘使用率阈值，超过该阈值，就会被设置为只读，默认85%enable_transaction_read_only 检测磁盘只读的开关，如果关闭，不再检测磁盘，即使磁盘使用率超过阈值也不会设置只读，磁盘清空后也不会消除只读，默认值为on。datastorage_threshold_check_interval 检测磁盘使用率的时间间隔，多久检测一次磁盘使用率，默认为10秒。3个参数都在CMserver数据目录下的cm_server.conf配置文件中。处理措施当CN或DN被设置为只读时，根据上图中查到的CN或DN目录，检查所在磁盘使用率是否超过阈值。1、检查对应磁盘被什么文件占用，确认文件用途，是否可以清理或转移到其他磁盘。2、可以调高磁盘使用率阈值。可以通过如下命令修改CMserver的guc参数，支持reload修改参数，无需重启CMserver进程。确认集群是否有扩容计划，若有后续扩容计划，datastorage_threshold_value_check值建议不要超过50，扩容要求，数据磁盘使用率不超过50%。gs_guc reload -Z cmserver -N all -I all -c "datastorage_threshold_value_check = 85"gs_guc reload -Z cmserver -N all -I all -c "enable_transaction_read_only = on"当磁盘使用率超阈值时，集群管理会自动把CN、DN设置为只读，对应的guc参数default_transaction_read_only被设置为on。当磁盘使用率降到阈值以下或者调高阈值后，集群管理会自动把CN、DN解除只读，对应的guc参数default_transaction_read_only被设置为off。由于集群管理默认检测磁盘的周期是10s秒，所以磁盘超阈值或者降到阈值以下，或者通过gs_guc调整阈值，CN、DN的只读状态可能最长会延迟600秒才变化，请耐心等待。如果想马上去掉只读限制，除了清理磁盘或调整阈值外，手动设置对应的CN、DN的guc参数。DN、CN设置只读和取消只读参数：gs_guc reload -Z datanode -N nodename -D dataPath -c 'default_transaction_read_only = on' 设置DN只读gs_guc reload -Z datanode -N nodename -D dataPath -c 'default_transaction_read_only = off' 取消DN只读gs_guc reload -Z coordinator -N nodename -D dataPath -c 'default_transaction_read_only = on' 设置CN只读gs_guc reload -Z coordinator -N nodename -D dataPath -c 'default_transaction_read_only = off' 取消CN只读

酷哥 发表于2022-10-28 14:33:47 2022-10-28 14:33:47 最后回复 yd_245511408 2023-11-09 11:00:24
185 1

云数据库 GaussDB GaussDB数据库
[问题求助] 【opengauss安装】failed to parsing xml.Error:syntax error:line 1,column 0.

failed to parsing xml.Error:syntax error:line 1,column 0.

yd_259352117 发表于2022-10-03 21:27:12 2022-10-03 21:27:12 最后回复加油O幸福 2022-10-20 13:59:08
108 4

GaussDB数据库

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript