- 故障现象查询集群状态,CN组件状态为Down,产生CN服务异常告警。故障原因可能原因有以下:虚拟机故障产生CN服务异常告警。磁盘故障导致CN组件Down,产生CN服务异常告警。网卡故障导致CN组件Down,产生CN服务异常告警。端口冲突导致CN组件Down,产生CN服务异常告警。主动停止CN组件,产生CN服务异常告警。处理方法步骤 1 登录故障的CN节点,切换至Ruby用户,查询集群... 故障现象查询集群状态,CN组件状态为Down,产生CN服务异常告警。故障原因可能原因有以下:虚拟机故障产生CN服务异常告警。磁盘故障导致CN组件Down,产生CN服务异常告警。网卡故障导致CN组件Down,产生CN服务异常告警。端口冲突导致CN组件Down,产生CN服务异常告警。主动停止CN组件,产生CN服务异常告警。处理方法步骤 1 登录故障的CN节点,切换至Ruby用户,查询集群...
- 故障现象查询集群状态,CN组件状态为Normal,历史产生CN服务异常告警。故障原因可能原因有以下:虚拟机重启产生CN服务异常告警。CN进程异常重启产生CN服务异常告警。主动重启CN产生CN服务异常告警。处理方法步骤 1 登录告警的CN节点,切换至Ruby用户,查询集群状态。su - Rubycm_ctl query -Cvd如上图,集群状态正常,CN组件Normal。步骤 2 ... 故障现象查询集群状态,CN组件状态为Normal,历史产生CN服务异常告警。故障原因可能原因有以下:虚拟机重启产生CN服务异常告警。CN进程异常重启产生CN服务异常告警。主动重启CN产生CN服务异常告警。处理方法步骤 1 登录告警的CN节点,切换至Ruby用户,查询集群状态。su - Rubycm_ctl query -Cvd如上图,集群状态正常,CN组件Normal。步骤 2 ...
- 故障现象安装数据库集群,安装失败,上报错误信息。故障原因可能原因有以下:OM_Agent已安装,无法检测到相关进程。OM_Agent启动失败。安装用户无crontab权限。安装用户无文件目录权限。处理方法步骤 1 执行如下命令查看om_agent日志,确认失败原因。vim /home/Ruby/log/om_agent/agent.log常见原因如下:Failed to do dec... 故障现象安装数据库集群,安装失败,上报错误信息。故障原因可能原因有以下:OM_Agent已安装,无法检测到相关进程。OM_Agent启动失败。安装用户无crontab权限。安装用户无文件目录权限。处理方法步骤 1 执行如下命令查看om_agent日志,确认失败原因。vim /home/Ruby/log/om_agent/agent.log常见原因如下:Failed to do dec...
- 故障现象安装OM_Agent,安装失败,上报错误信息。故障原因可能原因有以下:OM_Agent已安装,无法检测到相关进程。OM_Agent启动失败。安装用户无crontab权限。安装用户无文件目录权限。处理方法步骤 1 执行如下命令查看om_agent日志,确认失败原因。vim /home/Ruby/log/om_agent/agent.log常见原因如下:Failed to sta... 故障现象安装OM_Agent,安装失败,上报错误信息。故障原因可能原因有以下:OM_Agent已安装,无法检测到相关进程。OM_Agent启动失败。安装用户无crontab权限。安装用户无文件目录权限。处理方法步骤 1 执行如下命令查看om_agent日志,确认失败原因。vim /home/Ruby/log/om_agent/agent.log常见原因如下:Failed to sta...
- 故障现象云数据库 GaussDB 增量备份失败。云数据库 GaussDB 手动全量备份失败。云数据库 GaussDB 自动全量备份失败。云数据库 GaussDB 自动差分备份失败。故障原因可能原因有以下:OBS问题:OBS网络不通, OBS负载异常等。 底层硬件问题: 物理机重启等。内核问题:大集群免密超时,业务压力大触发PITR逻辑复制槽强推。误删文件导致全备持续失败。备份期间集群状态不正... 故障现象云数据库 GaussDB 增量备份失败。云数据库 GaussDB 手动全量备份失败。云数据库 GaussDB 自动全量备份失败。云数据库 GaussDB 自动差分备份失败。故障原因可能原因有以下:OBS问题:OBS网络不通, OBS负载异常等。 底层硬件问题: 物理机重启等。内核问题:大集群免密超时,业务压力大触发PITR逻辑复制槽强推。误删文件导致全备持续失败。备份期间集群状态不正...
- 故障现象在下发升级命令后,升级任务返回失败,或者内核升级日志报错,或者升级任务卡死不结束。故障原因可能原因有以下:升级om_agent失败。升级任务流失败。数据库内核升级失败。处理方法步骤 1 排查确认对业务是否有影响。查询状态是否正常,是否出现磁盘满、网络不通等问题,若存在,根据CN故障处理,DN故障处理解决故障。步骤 2 如果升级om_agent失败。1. 根据变更记录或... 故障现象在下发升级命令后,升级任务返回失败,或者内核升级日志报错,或者升级任务卡死不结束。故障原因可能原因有以下:升级om_agent失败。升级任务流失败。数据库内核升级失败。处理方法步骤 1 排查确认对业务是否有影响。查询状态是否正常,是否出现磁盘满、网络不通等问题,若存在,根据CN故障处理,DN故障处理解决故障。步骤 2 如果升级om_agent失败。1. 根据变更记录或...
- 故障现象数据库MCS部署形态的实例,在数据量过大时,节点替换时间过长。故障原因可能原因有以下:内存被缓存占用过多,影响数据处理速度。处理方法步骤 1 登录Service OM。步骤 2 进入“服务列表 > 计算资源 > 虚拟机”。根据实例名称搜索对应虚拟机所在的主机步骤 3 获取MCS主机的IP。步骤 4 登录到MCS计算主机。IP为步骤3获取的IP,账号和密... 故障现象数据库MCS部署形态的实例,在数据量过大时,节点替换时间过长。故障原因可能原因有以下:内存被缓存占用过多,影响数据处理速度。处理方法步骤 1 登录Service OM。步骤 2 进入“服务列表 > 计算资源 > 虚拟机”。根据实例名称搜索对应虚拟机所在的主机步骤 3 获取MCS主机的IP。步骤 4 登录到MCS计算主机。IP为步骤3获取的IP,账号和密...
- 故障现象GaussDB 1.0.13版本老实例恢复到新实例,在重置密码步骤失败。重置密码出现如下错误:Usage: cmd_sender.py [options] cmd_sender.py: error: Command not specified.由于1.0.13版本默认没有root用户,用户如果自己进行定义,不支持从管控进行重置,恢复到新实例时会出现reset password失败情形... 故障现象GaussDB 1.0.13版本老实例恢复到新实例,在重置密码步骤失败。重置密码出现如下错误:Usage: cmd_sender.py [options] cmd_sender.py: error: Command not specified.由于1.0.13版本默认没有root用户,用户如果自己进行定义,不支持从管控进行重置,恢复到新实例时会出现reset password失败情形...
- 故障现象GaussDB恢复到当前实例失败。故障原因可能原因有以下:工作流异常,提交工作流失败。备份服务异常。Agent报错。处理方法步骤 1 使用浏览器,通过地址“https://ManageOne运维面主页的访问地址:31943”,登录ManageOne运维面,或通过地址“https://ManageOne主门户的访问地址”,登录ManageOne主门户,选择“运维中心(OC)”,... 故障现象GaussDB恢复到当前实例失败。故障原因可能原因有以下:工作流异常,提交工作流失败。备份服务异常。Agent报错。处理方法步骤 1 使用浏览器,通过地址“https://ManageOne运维面主页的访问地址:31943”,登录ManageOne运维面,或通过地址“https://ManageOne主门户的访问地址”,登录ManageOne主门户,选择“运维中心(OC)”,...
- 故障现象GaussDB恢复到新实例失败。故障原因可能原因有以下:参数不合法,拒绝恢复新实例。工作流异常,提交工作流失败。创建虚拟机失败,或者资源管理服务报错。虚拟机上初始化节点失败。备份策略等信息错误导致的失败。处理方法步骤 1 使用浏览器,通过地址“https://ManageOne运维面主页的访问地址:31943”,登录ManageOne运维面,或通过地址“https://Man... 故障现象GaussDB恢复到新实例失败。故障原因可能原因有以下:参数不合法,拒绝恢复新实例。工作流异常,提交工作流失败。创建虚拟机失败,或者资源管理服务报错。虚拟机上初始化节点失败。备份策略等信息错误导致的失败。处理方法步骤 1 使用浏览器,通过地址“https://ManageOne运维面主页的访问地址:31943”,登录ManageOne运维面,或通过地址“https://Man...
- 故障现象GaussDB设置备份策略失败。故障原因可能原因有以下:GaussDB 备份服务异常。处理方法步骤 1 登录DBS-GaussDB节点,使用以下命令查看GaussDB backup服务进程。ps -ef | grep java | grep backup步骤 2 如上述命令有结果返回,则服务进程正常,请重试设置备份策略操作。步骤 3 若不存在,在service... 故障现象GaussDB设置备份策略失败。故障原因可能原因有以下:GaussDB 备份服务异常。处理方法步骤 1 登录DBS-GaussDB节点,使用以下命令查看GaussDB backup服务进程。ps -ef | grep java | grep backup步骤 2 如上述命令有结果返回,则服务进程正常,请重试设置备份策略操作。步骤 3 若不存在,在service...
- 故障现象GaussDB实例备份失败。故障原因可能原因有以下:AK、SK不对 或者AK、SK权限不够 。到OBS的网络异常。实例虚拟机的时间与正常时间相差10分钟以上。备份中进行了版本升级等等。处理方法步骤 1 使用浏览器,通过地址“https://ManageOne运维面主页的访问地址:31943”,登录ManageOne运维面,或通过地址“https://ManageOne主门户的... 故障现象GaussDB实例备份失败。故障原因可能原因有以下:AK、SK不对 或者AK、SK权限不够 。到OBS的网络异常。实例虚拟机的时间与正常时间相差10分钟以上。备份中进行了版本升级等等。处理方法步骤 1 使用浏览器,通过地址“https://ManageOne运维面主页的访问地址:31943”,登录ManageOne运维面,或通过地址“https://ManageOne主门户的...
- 故障现象创建BMS实例失败,在DBS运维管理平台树表中查询失败原因,失败原因中包含“No valid host was found。”字样,表示因为服务器资源不足,创建失败。故障原因可能的原因有以下:底层BMS服务器资源不足。BMS未提供感知底层环境多少资源的接口,无法做precheck与预占。处理方法步骤 1 登录DBS运维管理平台。步骤 2 根据实例ID筛选实例。步骤 3... 故障现象创建BMS实例失败,在DBS运维管理平台树表中查询失败原因,失败原因中包含“No valid host was found。”字样,表示因为服务器资源不足,创建失败。故障原因可能的原因有以下:底层BMS服务器资源不足。BMS未提供感知底层环境多少资源的接口,无法做precheck与预占。处理方法步骤 1 登录DBS运维管理平台。步骤 2 根据实例ID筛选实例。步骤 3...
- 故障现象数据库密码重置失败。故障原因可能原因有以下:GaussDBService无法通过SSH连接到实例。密码重置发生在备份之后,执行恢复的时候,恢复成旧密码。处理方法 步骤 1 通过Service OM页面,点击“服务列表 > 计算资源”,登入到计算资源管理平台。 步骤 2 可用分区选择“manage-az”,根据名称“DBS-GaussDB”查询GaussDB实例管理节点... 故障现象数据库密码重置失败。故障原因可能原因有以下:GaussDBService无法通过SSH连接到实例。密码重置发生在备份之后,执行恢复的时候,恢复成旧密码。处理方法 步骤 1 通过Service OM页面,点击“服务列表 > 计算资源”,登入到计算资源管理平台。 步骤 2 可用分区选择“manage-az”,根据名称“DBS-GaussDB”查询GaussDB实例管理节点...
- 故障现象GaussDB实例删除失败。故障原因可能原因有以下:GaussDB Service服务不正常,或者IAAS服务不正常,回收站备份失败。处理方法步骤 1 使用浏览器,通过地址“https://ManageOne运维面主页的访问地址:31943”,登录ManageOne运维面,或通过地址“https://ManageOne主门户的访问地址”,登录ManageOne主门户,选择“运... 故障现象GaussDB实例删除失败。故障原因可能原因有以下:GaussDB Service服务不正常,或者IAAS服务不正常,回收站备份失败。处理方法步骤 1 使用浏览器,通过地址“https://ManageOne运维面主页的访问地址:31943”,登录ManageOne运维面,或通过地址“https://ManageOne主门户的访问地址”,登录ManageOne主门户,选择“运...
上滑加载中
推荐直播
-
昇腾AI算法挑战赛-核心算子如何优化?专家带你深度解析2025/11/17 周一 16:00-17:00
王老师 华为算子专家
昇腾AI算法挑战赛进阶赛战鼓催征!本期直播间,我们特邀华为算子专家王老师,为你深度剖析Matmul、wholereducesum等核心算子的底层原理与优化技巧,直击赛题核心。想提升代码效率、冲击更高排名?锁定直播,带你破局!
回顾中 -
AI编码实干派,“码”力全开2026/02/26 周四 15:00-16:30
谈宗玮/于邦旭/丁俊卿/陈云亮/王一男
【中国,深圳,2026年2月26日】,以“AI编码实干派,码力全开”为主题的华为云码道(CodeArts)代码智能体新春发布会在线上成功召开。华为云码道公测版正式发布,为开发者和企业提供具备工程化能力的智能编码解决方案。
回顾中 -
华为云码道-玩转OpenClaw,开启在线养虾模式2026/03/11 周三 19:00-20:00
刘昱,华为云高级工程师/谈心,华为云技术专家/李海仑,上海圭卓智能科技有限公司CEO
OpenClaw 火爆开发者圈,华为云码道最新推出 Skill ——开发者只需输入一句口令,即可部署一个功能完整的「小龙虾」智能体。直播带你玩转华为云码道,玩转OpenClaw
回顾中
热门标签