- 故障现象创建BMS实例失败,在DBS运维管理平台树表中查询失败原因,失败原因中包含“No valid host was found。”字样,表示因为服务器资源不足,创建失败。故障原因可能的原因有以下:底层BMS服务器资源不足。BMS未提供感知底层环境多少资源的接口,无法做precheck与预占。处理方法步骤 1 登录DBS运维管理平台。步骤 2 根据实例ID筛选实例。步骤 3... 故障现象创建BMS实例失败,在DBS运维管理平台树表中查询失败原因,失败原因中包含“No valid host was found。”字样,表示因为服务器资源不足,创建失败。故障原因可能的原因有以下:底层BMS服务器资源不足。BMS未提供感知底层环境多少资源的接口,无法做precheck与预占。处理方法步骤 1 登录DBS运维管理平台。步骤 2 根据实例ID筛选实例。步骤 3...
- 故障现象数据库密码重置失败。故障原因可能原因有以下:GaussDBService无法通过SSH连接到实例。密码重置发生在备份之后,执行恢复的时候,恢复成旧密码。处理方法 步骤 1 通过Service OM页面,点击“服务列表 > 计算资源”,登入到计算资源管理平台。 步骤 2 可用分区选择“manage-az”,根据名称“DBS-GaussDB”查询GaussDB实例管理节点... 故障现象数据库密码重置失败。故障原因可能原因有以下:GaussDBService无法通过SSH连接到实例。密码重置发生在备份之后,执行恢复的时候,恢复成旧密码。处理方法 步骤 1 通过Service OM页面,点击“服务列表 > 计算资源”,登入到计算资源管理平台。 步骤 2 可用分区选择“manage-az”,根据名称“DBS-GaussDB”查询GaussDB实例管理节点...
- 故障现象GaussDB实例删除失败。故障原因可能原因有以下:GaussDB Service服务不正常,或者IAAS服务不正常,回收站备份失败。处理方法步骤 1 使用浏览器,通过地址“https://ManageOne运维面主页的访问地址:31943”,登录ManageOne运维面,或通过地址“https://ManageOne主门户的访问地址”,登录ManageOne主门户,选择“运... 故障现象GaussDB实例删除失败。故障原因可能原因有以下:GaussDB Service服务不正常,或者IAAS服务不正常,回收站备份失败。处理方法步骤 1 使用浏览器,通过地址“https://ManageOne运维面主页的访问地址:31943”,登录ManageOne运维面,或通过地址“https://ManageOne主门户的访问地址”,登录ManageOne主门户,选择“运...
- 故障现象数据库重启失败。故障原因可能原因有以下:管理面与节点网络不通。处理方法根据不同的故障场景修复故障实例。步骤 1 使用浏览器,通过地址“https://ManageOne运维面主页的访问地址:31943”,登录ManageOne运维面,或通过地址“https://ManageOne主门户的访问地址”,登录ManageOne主门户,选择“运维中心(OC)”,进入ManageOne... 故障现象数据库重启失败。故障原因可能原因有以下:管理面与节点网络不通。处理方法根据不同的故障场景修复故障实例。步骤 1 使用浏览器,通过地址“https://ManageOne运维面主页的访问地址:31943”,登录ManageOne运维面,或通过地址“https://ManageOne主门户的访问地址”,登录ManageOne主门户,选择“运维中心(OC)”,进入ManageOne...
- 故障现象GaussDB实例创建失败。故障原因可能原因有以下:GaussDB Service服务不正常,或者IAAS服务不正常。处理方法步骤 1 使用浏览器,登录ManageOne运维面。登录地址:https://ManageOne运维面主页的访问地址:31943。例如,https://oc.type.com:31943。默认帐号:admin。默认密码可在《华为云Stack 帐户一览... 故障现象GaussDB实例创建失败。故障原因可能原因有以下:GaussDB Service服务不正常,或者IAAS服务不正常。处理方法步骤 1 使用浏览器,登录ManageOne运维面。登录地址:https://ManageOne运维面主页的访问地址:31943。例如,https://oc.type.com:31943。默认帐号:admin。默认密码可在《华为云Stack 帐户一览...
- 故障现象使用分区表进行分区DDL业务,出现业务报错。故障原因分区DDL操作有新增(Add)、删除(Drop)、交换(Exchange)、清空(Truncate)、分割(Split)、合并(Merge)、移动(Move)、重命名(Rename)共8种,不同的分区DDL有对应的规格限制,用户如果试图越过规格限制进行该类操作,会导致业务报错。处理方法在《特性指南》中“分区表 > 分区表运维管理”章... 故障现象使用分区表进行分区DDL业务,出现业务报错。故障原因分区DDL操作有新增(Add)、删除(Drop)、交换(Exchange)、清空(Truncate)、分割(Split)、合并(Merge)、移动(Move)、重命名(Rename)共8种,不同的分区DDL有对应的规格限制,用户如果试图越过规格限制进行该类操作,会导致业务报错。处理方法在《特性指南》中“分区表 > 分区表运维管理”章...
- 故障现象使用分区表进行DQL/DML业务,出现业务报错。故障原因导致分区表DQL/DML业务报错的原因有很多,需要根据具体的报错内容和报错的业务模型,来判断属于哪些场景。常见的可能原因有以下:开启行迁移开关后,并发UPDATE/DELETE报错。关闭行迁移开关后,跨分区更新导致的报错。插入数据无法路由到已有分区导致的报错。处理方法步骤 1 判断是否为开启行迁移开关导致的并发UPDAT... 故障现象使用分区表进行DQL/DML业务,出现业务报错。故障原因导致分区表DQL/DML业务报错的原因有很多,需要根据具体的报错内容和报错的业务模型,来判断属于哪些场景。常见的可能原因有以下:开启行迁移开关后,并发UPDATE/DELETE报错。关闭行迁移开关后,跨分区更新导致的报错。插入数据无法路由到已有分区导致的报错。处理方法步骤 1 判断是否为开启行迁移开关导致的并发UPDAT...
- 故障现象使用分区表进行相关查询业务,SQL性能慢。故障原因可能原因有以下:分区索引失效,顺序扫描导致的SQL性能慢分区表无法进行分区剪枝导致的SQL性能慢SQL计划选择非最优导致的SQL性能慢处理方法步骤 1 判断是否存在索引异常的行为。步骤 2 部分分区DDL如果不带UPDATE GLOBAL INDEX子句,会导致分区表Global索引失效。同时用户也可以使用ALTER ... 故障现象使用分区表进行相关查询业务,SQL性能慢。故障原因可能原因有以下:分区索引失效,顺序扫描导致的SQL性能慢分区表无法进行分区剪枝导致的SQL性能慢SQL计划选择非最优导致的SQL性能慢处理方法步骤 1 判断是否存在索引异常的行为。步骤 2 部分分区DDL如果不带UPDATE GLOBAL INDEX子句,会导致分区表Global索引失效。同时用户也可以使用ALTER ...
- 故障现象逻辑复制槽不推进或推进缓慢。故障原因可能原因有以下:未使用并行解码。已使用并行解码场景:− 无法正确读取日志。− 存在长事务。− 用户未及时反馈接收到的日志位置。处理方法步骤 1 判断当前逻辑复制槽是否使用并行解码。在解码节点上调用SQL函数:select * from gs_get_parallel_decode_status();返回列中parallel_decod... 故障现象逻辑复制槽不推进或推进缓慢。故障原因可能原因有以下:未使用并行解码。已使用并行解码场景:− 无法正确读取日志。− 存在长事务。− 用户未及时反馈接收到的日志位置。处理方法步骤 1 判断当前逻辑复制槽是否使用并行解码。在解码节点上调用SQL函数:select * from gs_get_parallel_decode_status();返回列中parallel_decod...
- 故障现象并行解码场景读取日志线程或解码线程占用内存过多,导致产生内存不足报错。连接解码DN(如果为连接CN解码则需连接某个主DN)使用如下SQL函数查询,发现contextname为ParallelDecodeDispatcher或ParallelDecodeLog的内存上下文占用内存比较多:select contextname, sum(totalsize)/1024/1024 sum, ... 故障现象并行解码场景读取日志线程或解码线程占用内存过多,导致产生内存不足报错。连接解码DN(如果为连接CN解码则需连接某个主DN)使用如下SQL函数查询,发现contextname为ParallelDecodeDispatcher或ParallelDecodeLog的内存上下文占用内存比较多:select contextname, sum(totalsize)/1024/1024 sum, ...
- 故障现象连接数据库解码失败,报拒绝连接错误。故障原因可能原因有以下:用户没有逻辑解码权限。报错日志如下:FATAL: must be system admin or replication role or a member of the gs_role_replication role to use replication slots用户名和用户所在机器的IP未在数据库解码CN或DN节点上... 故障现象连接数据库解码失败,报拒绝连接错误。故障原因可能原因有以下:用户没有逻辑解码权限。报错日志如下:FATAL: must be system admin or replication role or a member of the gs_role_replication role to use replication slots用户名和用户所在机器的IP未在数据库解码CN或DN节点上...
- 故障现象数据库进程内存占比较高。− 长时间占比较高。− 观察监控平台内存占用的变化曲线,无论当前数据库是否有业务在运行,数据库进程内存占总机器内存的比例长时间处于较高状态,且不下降。− 执行作业期间占比较高。− 数据库进程在没有业务执行时,内存使用持续处于较低的状态,当有业务执行时,内存占用升高,待作业执行结束后,内存又恢复到较低的状态。− 内存上涨不下降。− 数据库进程在执行业务过程中内存... 故障现象数据库进程内存占比较高。− 长时间占比较高。− 观察监控平台内存占用的变化曲线,无论当前数据库是否有业务在运行,数据库进程内存占总机器内存的比例长时间处于较高状态,且不下降。− 执行作业期间占比较高。− 数据库进程在没有业务执行时,内存使用持续处于较低的状态,当有业务执行时,内存占用升高,待作业执行结束后,内存又恢复到较低的状态。− 内存上涨不下降。− 数据库进程在执行业务过程中内存...
- 故障现象JDBC连接数据库或者执行业务语句报错,业务成功率下降或者业务持续失败。故障原因可能原因有以下:应用程序到数据库之间网络通信问题。JDBC配置问题。业务逻辑问题。数据库问题。处理方法Read timed out问题步骤 1 查看应用报错日志。如报错为:An I/O error occured while sending to the backend.detail:Read t... 故障现象JDBC连接数据库或者执行业务语句报错,业务成功率下降或者业务持续失败。故障原因可能原因有以下:应用程序到数据库之间网络通信问题。JDBC配置问题。业务逻辑问题。数据库问题。处理方法Read timed out问题步骤 1 查看应用报错日志。如报错为:An I/O error occured while sending to the backend.detail:Read t...
- 故障现象长事务在数据库的表现是session持续时间长,期间可能伴随cpu、内存升高,严重可导致数据库整体响应缓慢,业务无法正常运行。故障原因可能原因有以下:大量的锁竞争。执行了比较耗时的SQL。处理方法步骤 1 登录CN节点,gsql连接数据库。gsql -d postgres -p 8000 -U user -W password -r说明:集中式实例登录主DN节点。步骤 2 ... 故障现象长事务在数据库的表现是session持续时间长,期间可能伴随cpu、内存升高,严重可导致数据库整体响应缓慢,业务无法正常运行。故障原因可能原因有以下:大量的锁竞争。执行了比较耗时的SQL。处理方法步骤 1 登录CN节点,gsql连接数据库。gsql -d postgres -p 8000 -U user -W password -r说明:集中式实例登录主DN节点。步骤 2 ...
- 故障现象base目录占用磁盘空间大,监控页面dbsize增长快,不符合预期。故障原因可能原因有以下:长事务阻止。处理方法步骤 1 登录CN节点,并通过gsql连接数据库。gsql -d postgres -p 40000 -U user -W password -r主备版登录主DN节点。步骤 2 查看数据库大小。select datname, pg_database_size... 故障现象base目录占用磁盘空间大,监控页面dbsize增长快,不符合预期。故障原因可能原因有以下:长事务阻止。处理方法步骤 1 登录CN节点,并通过gsql连接数据库。gsql -d postgres -p 40000 -U user -W password -r主备版登录主DN节点。步骤 2 查看数据库大小。select datname, pg_database_size...
上滑加载中
推荐直播
-
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中 -
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
热门标签