- 故障现象GaussDB已经下发了容灾搭建或主从切换,工作流因备份任务一直进行中,校验任务等待超时失败。故障原因可能原因有以下:搭建容灾和主从切换操作过程中,因实例存在自动触发备份的任务,影响了搭建容灾和主从切换任务的执行,所以加了校验备份的任务,备份任务一直未结束。处理方法步骤 1 使用浏览器,登录工作流失败的实例所在Region的ManageOne运维面。登录地址:https://... 故障现象GaussDB已经下发了容灾搭建或主从切换,工作流因备份任务一直进行中,校验任务等待超时失败。故障原因可能原因有以下:搭建容灾和主从切换操作过程中,因实例存在自动触发备份的任务,影响了搭建容灾和主从切换任务的执行,所以加了校验备份的任务,备份任务一直未结束。处理方法步骤 1 使用浏览器,登录工作流失败的实例所在Region的ManageOne运维面。登录地址:https://...
- 故障现象创建容灾、主从切换大数据场景等待超时。故障原因可能原因有以下:异常场景或者大数据量场景导致容灾等待时间超时,操作失败。操作步骤步骤 1 使用浏览器,登录工作流失败的实例所在Region的ManageOne运维面。登录地址:https://ManageOne运维面主页的访问地址:31943。例如,https://oc.type.com:31943。默认帐号:admin默认密码可... 故障现象创建容灾、主从切换大数据场景等待超时。故障原因可能原因有以下:异常场景或者大数据量场景导致容灾等待时间超时,操作失败。操作步骤步骤 1 使用浏览器,登录工作流失败的实例所在Region的ManageOne运维面。登录地址:https://ManageOne运维面主页的访问地址:31943。例如,https://oc.type.com:31943。默认帐号:admin默认密码可...
- 故障现象搭建容灾关系后,灾备集群对应CN无法连接,RPO持续增长。故障原因可能原因有以下:主集群具有容灾关系的CN状态异常。网络异常。处理方法步骤 1 登录主实例节点。步骤 2 执行如下命令,导入环境变量source /home/Ruby/gauss_env_file步骤 3 执行如下指令,检查主集群状态。cm_ctl query -Cvid 步骤 4 登录灾... 故障现象搭建容灾关系后,灾备集群对应CN无法连接,RPO持续增长。故障原因可能原因有以下:主集群具有容灾关系的CN状态异常。网络异常。处理方法步骤 1 登录主实例节点。步骤 2 执行如下命令,导入环境变量source /home/Ruby/gauss_env_file步骤 3 执行如下指令,检查主集群状态。cm_ctl query -Cvid 步骤 4 登录灾...
- 目标搭建容灾关系后,主实例无法进行节点扩容、AZ强启加回、就地升级和升级自动提交等操作,需要断开容灾关系后,再对主实例进行相关操作。解决方案步骤 1 登录主实例的管理控制台。步骤 2 单击左侧导航栏的“容灾管理”,在容灾任务的“操作”列单击“结束”。步骤 3 在弹出的确认框中勾选“确认结束任务”,单击“是”,结束灾备任务。如图所示,容灾关系已经结束。步骤 4 ... 目标搭建容灾关系后,主实例无法进行节点扩容、AZ强启加回、就地升级和升级自动提交等操作,需要断开容灾关系后,再对主实例进行相关操作。解决方案步骤 1 登录主实例的管理控制台。步骤 2 单击左侧导航栏的“容灾管理”,在容灾任务的“操作”列单击“结束”。步骤 3 在弹出的确认框中勾选“确认结束任务”,单击“是”,结束灾备任务。如图所示,容灾关系已经结束。步骤 4 ...
- 目标容灾期间,节点替换后刷新集群信息。解决方案步骤 1 使用浏览器,登录节点替换实例所在Region的ManageOne运维面。登录地址:https://ManageOne运维面主页的访问地址:31943。例如,https://oc.type.com:31943。默认帐号:admin,默认密码可在《华为云Stack 帐户一览表》中“A类Portal”页签,产品名称为“ManageO... 目标容灾期间,节点替换后刷新集群信息。解决方案步骤 1 使用浏览器,登录节点替换实例所在Region的ManageOne运维面。登录地址:https://ManageOne运维面主页的访问地址:31943。例如,https://oc.type.com:31943。默认帐号:admin,默认密码可在《华为云Stack 帐户一览表》中“A类Portal”页签,产品名称为“ManageO...
- 故障现象通过《管理员指南》中“两地三中心跨Region容灾 > 基于流式复制的异地容灾解决方案 > 基本操作 > 查询主备集群容灾状态”章节的操作描述,可以获得集群级RPO数值,在业务低谷期该数值持续增长,说明容灾出现了异常。灾备集群CN显示Need repair(Disconnected)。灾备集群节点CM_AGENT故障。该节点上CN实例状态显示为Deleted;DN、GTM实例状态显示... 故障现象通过《管理员指南》中“两地三中心跨Region容灾 > 基于流式复制的异地容灾解决方案 > 基本操作 > 查询主备集群容灾状态”章节的操作描述,可以获得集群级RPO数值,在业务低谷期该数值持续增长,说明容灾出现了异常。灾备集群CN显示Need repair(Disconnected)。灾备集群节点CM_AGENT故障。该节点上CN实例状态显示为Deleted;DN、GTM实例状态显示...
- 故障现象灾备集群有故障节点未参与灾备集群升主。故障原因因服务器宕机,网络中断等原因导致节点脱离灾备集群,没有参与灾备集群升主。处理方法步骤 1 故障节点经过硬件维修、上电等操作,重新加入集群。注意:该节点加入集群后,集群状态有可能显示为Normal,该节点上实例状态也有可能显示Normal,但该节点上实例的部分配置参数不正确,仍需要完成如下修复流程。步骤 2 接入任意节点,修... 故障现象灾备集群有故障节点未参与灾备集群升主。故障原因因服务器宕机,网络中断等原因导致节点脱离灾备集群,没有参与灾备集群升主。处理方法步骤 1 故障节点经过硬件维修、上电等操作,重新加入集群。注意:该节点加入集群后,集群状态有可能显示为Normal,该节点上实例状态也有可能显示Normal,但该节点上实例的部分配置参数不正确,仍需要完成如下修复流程。步骤 2 接入任意节点,修...
- 故障现象执行容灾搭建流程出现异常,如:容灾搭建流程返回失败。容灾搭建流程超时。容灾搭建流程超出预期时间仍未结束。故障原因可能原因有以下:主备集群间网络异常,容灾使用的IP或PORT未开放。跨集群获取全量数据时因容灾用户信息异常,导致不断尝试连接无法完成容灾搭建。在主集群数据量较大,或者异地网络带宽较小时,搭建流程设置超时时间不合理,可能会出现灾备集群未完成数据拷贝,主集群就已经超时退出容灾搭... 故障现象执行容灾搭建流程出现异常,如:容灾搭建流程返回失败。容灾搭建流程超时。容灾搭建流程超出预期时间仍未结束。故障原因可能原因有以下:主备集群间网络异常,容灾使用的IP或PORT未开放。跨集群获取全量数据时因容灾用户信息异常,导致不断尝试连接无法完成容灾搭建。在主集群数据量较大,或者异地网络带宽较小时,搭建流程设置超时时间不合理,可能会出现灾备集群未完成数据拷贝,主集群就已经超时退出容灾搭...
- 故障现象查询集群状态,DN组件状态为Need repair,产生DN服务异常告警。故障原因可能原因有以下:主DN故障,备DN在redo过程中无法接收主机日志,出现Need repair状态。网络异常,备DN无法与主DN正常连接,出现Need repair状态。备DN进程故障重启,出现Need repair状态。处理方法步骤 1 登录故障DN节点,切换至Ruby用户,查询集群状态,确认... 故障现象查询集群状态,DN组件状态为Need repair,产生DN服务异常告警。故障原因可能原因有以下:主DN故障,备DN在redo过程中无法接收主机日志,出现Need repair状态。网络异常,备DN无法与主DN正常连接,出现Need repair状态。备DN进程故障重启,出现Need repair状态。处理方法步骤 1 登录故障DN节点,切换至Ruby用户,查询集群状态,确认...
- 故障现象查询集群状态,DN组件状态为ReadOnly,产生DN服务异常告警故障原因可能原因有以下:DN数据目录磁盘使用超过阈值。处理方法步骤 1 登录任一节点,查询集群状态。su - Rubycm_ctl query -Cvd如上图,DN组件全部ReadOnly。步骤 2 当前DN节点,查看磁盘空间分配情况,查看各DN节点DN数据目录所在磁盘空间使用率。gs_ssh -c "... 故障现象查询集群状态,DN组件状态为ReadOnly,产生DN服务异常告警故障原因可能原因有以下:DN数据目录磁盘使用超过阈值。处理方法步骤 1 登录任一节点,查询集群状态。su - Rubycm_ctl query -Cvd如上图,DN组件全部ReadOnly。步骤 2 当前DN节点,查看磁盘空间分配情况,查看各DN节点DN数据目录所在磁盘空间使用率。gs_ssh -c "...
- 故障现象查询集群状态,DN组件状态为Unknown,产生DN服务异常告警。故障原因可能原因有以下:cm_agent无法连接DN。处理方法步骤 1 登录故障DN节点,切换至Ruby用户,查询集群状态。su - Rubycm_ctl query -Cvd如上图,dn_6008状态为Unknown。 步骤 2 如DN长时间处于Unknown状态,如需要快速恢复,则可使用以下命令处理... 故障现象查询集群状态,DN组件状态为Unknown,产生DN服务异常告警。故障原因可能原因有以下:cm_agent无法连接DN。处理方法步骤 1 登录故障DN节点,切换至Ruby用户,查询集群状态。su - Rubycm_ctl query -Cvd如上图,dn_6008状态为Unknown。 步骤 2 如DN长时间处于Unknown状态,如需要快速恢复,则可使用以下命令处理...
- 故障现象查询集群状态,DN组件状态为Down,产生DN服务异常告警。故障原因可能原因有以下:虚拟机故障产生DN服务异常告警。磁盘故障导致DN组件Down,产生DN服务异常告警。网卡故障导致DN组件Down,产生DN服务异常告警。端口冲突导致DN组件Down,产生DN服务异常告警。主动停止DN组件,产生DN服务异常告警。处理方法步骤 1 登录故障DN节点,切换至Ruby用户,查询集群状... 故障现象查询集群状态,DN组件状态为Down,产生DN服务异常告警。故障原因可能原因有以下:虚拟机故障产生DN服务异常告警。磁盘故障导致DN组件Down,产生DN服务异常告警。网卡故障导致DN组件Down,产生DN服务异常告警。端口冲突导致DN组件Down,产生DN服务异常告警。主动停止DN组件,产生DN服务异常告警。处理方法步骤 1 登录故障DN节点,切换至Ruby用户,查询集群状...
- 故障现象查询集群状态,DN组件状态为Normal,历史产生DN服务异常告警。故障原因可能原因有以下:虚拟机重启产生DN服务异常告警。DN进程重启产生DN服务异常告警。主动重启DN产生DN服务异常告警。处理方法步骤 1 登录告警的DN节点,切换至Ruby用户,查询集群状态。su - Rubycm_ctl query -Cvd如上图,集群状态Normal,DN组件状态Normal。步骤 ... 故障现象查询集群状态,DN组件状态为Normal,历史产生DN服务异常告警。故障原因可能原因有以下:虚拟机重启产生DN服务异常告警。DN进程重启产生DN服务异常告警。主动重启DN产生DN服务异常告警。处理方法步骤 1 登录告警的DN节点,切换至Ruby用户,查询集群状态。su - Rubycm_ctl query -Cvd如上图,集群状态Normal,DN组件状态Normal。步骤 ...
- 故障现象查询集群状态,CN组件状态为Down,产生CN服务异常告警。故障原因可能原因有以下:虚拟机故障产生CN服务异常告警。磁盘故障导致CN组件Down,产生CN服务异常告警。网卡故障导致CN组件Down,产生CN服务异常告警。端口冲突导致CN组件Down,产生CN服务异常告警。主动停止CN组件,产生CN服务异常告警。处理方法步骤 1 登录故障的CN节点,切换至Ruby用户,查询集群... 故障现象查询集群状态,CN组件状态为Down,产生CN服务异常告警。故障原因可能原因有以下:虚拟机故障产生CN服务异常告警。磁盘故障导致CN组件Down,产生CN服务异常告警。网卡故障导致CN组件Down,产生CN服务异常告警。端口冲突导致CN组件Down,产生CN服务异常告警。主动停止CN组件,产生CN服务异常告警。处理方法步骤 1 登录故障的CN节点,切换至Ruby用户,查询集群...
- 故障现象查询集群状态,CN组件状态为Normal,历史产生CN服务异常告警。故障原因可能原因有以下:虚拟机重启产生CN服务异常告警。CN进程异常重启产生CN服务异常告警。主动重启CN产生CN服务异常告警。处理方法步骤 1 登录告警的CN节点,切换至Ruby用户,查询集群状态。su - Rubycm_ctl query -Cvd如上图,集群状态正常,CN组件Normal。步骤 2 ... 故障现象查询集群状态,CN组件状态为Normal,历史产生CN服务异常告警。故障原因可能原因有以下:虚拟机重启产生CN服务异常告警。CN进程异常重启产生CN服务异常告警。主动重启CN产生CN服务异常告警。处理方法步骤 1 登录告警的CN节点,切换至Ruby用户,查询集群状态。su - Rubycm_ctl query -Cvd如上图,集群状态正常,CN组件Normal。步骤 2 ...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签