- 9 月 13-14 日,GOSIM HANGZHOU 2025 大会将在杭州隆重启幕。华为云云原生开源技术专家将在AI 模型 × 基础设施、端侧 AI 工作坊、互动展区等会场带来议题演讲与技术讲解,深度探讨云原生技术创新和产业实践,欢迎现场交流。 9 月 13-14 日,GOSIM HANGZHOU 2025 大会将在杭州隆重启幕。华为云云原生开源技术专家将在AI 模型 × 基础设施、端侧 AI 工作坊、互动展区等会场带来议题演讲与技术讲解,深度探讨云原生技术创新和产业实践,欢迎现场交流。
- 本文聚焦云原生边缘计算与分布式AI训练场景的两类高频隐蔽Bug,结合真实技术环境展开深度分析与修复。在AI训练场景中,K8s与NVIDIA GPU Operator协同下出现“GPU资源假分配”,因调度器与Device Plugin绑定存在时间差,通过多线程优化插件、添加初始化容器等解决; 本文聚焦云原生边缘计算与分布式AI训练场景的两类高频隐蔽Bug,结合真实技术环境展开深度分析与修复。在AI训练场景中,K8s与NVIDIA GPU Operator协同下出现“GPU资源假分配”,因调度器与Device Plugin绑定存在时间差,通过多线程优化插件、添加初始化容器等解决;
- 本文以某企业级云原生平台遭遇的集群资源耗尽故障为切入点,复盘了由ServiceAccount权限溢出引发的危机处置全流程。故障源于默认ServiceAccount过度授权与微服务镜像隐性缺陷叠加,导致临时Pod无节制创建并吞噬资源。文章详细阐述了从内核级监控定位根因、多维度紧急止损,到构建“分级授权+联动校验+底层加固”的权限治理体系的实践路径。 本文以某企业级云原生平台遭遇的集群资源耗尽故障为切入点,复盘了由ServiceAccount权限溢出引发的危机处置全流程。故障源于默认ServiceAccount过度授权与微服务镜像隐性缺陷叠加,导致临时Pod无节制创建并吞噬资源。文章详细阐述了从内核级监控定位根因、多维度紧急止损,到构建“分级授权+联动校验+底层加固”的权限治理体系的实践路径。
- 自动化运维实践:openEuler的实战案例分享 自动化运维实践:openEuler的实战案例分享
- 本文聚焦云原生架构中的隐性故障排查与治理,结合电商大促、支付链路升级等实战场景,深度剖析Pod“假活”、服务网格“规则冲突”、动态配置中心“配置漂移”三大核心问题的成因。针对“探针与应用特性错配”“遗留配置引发路由异常”“线程池阻塞导致配置同步失效”等根源,提出“分层探针+启动优化”“配置全生命周期治理”“线程模型重构+一致性校验”等架构级解决方案。 本文聚焦云原生架构中的隐性故障排查与治理,结合电商大促、支付链路升级等实战场景,深度剖析Pod“假活”、服务网格“规则冲突”、动态配置中心“配置漂移”三大核心问题的成因。针对“探针与应用特性错配”“遗留配置引发路由异常”“线程池阻塞导致配置同步失效”等根源,提出“分层探针+启动优化”“配置全生命周期治理”“线程模型重构+一致性校验”等架构级解决方案。
- 微服务实战:在 openEuler 上把微服务架构落地(实操篇) 微服务实战:在 openEuler 上把微服务架构落地(实操篇)
- 运维自动化要靠啥?聊聊那些正在起风的关键技术趋势 运维自动化要靠啥?聊聊那些正在起风的关键技术趋势
- Karmada v1.15 版本现已发布,v1.15 版本包含了来自 39 位贡献者的 269 次代码提交!本版本包含下列新增特性:多模板工作负载的资源精确感知、集群级故障迁移功能增强、结构化日志、Karmada 控制器和调度器性能显著提升。欢迎大家体验! Karmada v1.15 版本现已发布,v1.15 版本包含了来自 39 位贡献者的 269 次代码提交!本版本包含下列新增特性:多模板工作负载的资源精确感知、集群级故障迁移功能增强、结构化日志、Karmada 控制器和调度器性能显著提升。欢迎大家体验!
- 本文结合云原生开发中的三个真实故障案例,深入拆解底层逻辑与排查思路。案例涉及数据分析服务容器无规律重启、用户数据存储服务PV挂载死锁、电商促销场景Pod调度倾斜,均突破“常识认知”,根源分别在于容器启动进程脱离cgroup管控、存储Class与PV参数隐性不匹配、调度策略与节点规格适配失衡。文章还原了从问题定位到方案落地的全过程,强调云原生排障需回归组件底层原理,而非停留在表面配置核对。 本文结合云原生开发中的三个真实故障案例,深入拆解底层逻辑与排查思路。案例涉及数据分析服务容器无规律重启、用户数据存储服务PV挂载死锁、电商促销场景Pod调度倾斜,均突破“常识认知”,根源分别在于容器启动进程脱离cgroup管控、存储Class与PV参数隐性不匹配、调度策略与节点规格适配失衡。文章还原了从问题定位到方案落地的全过程,强调云原生排障需回归组件底层原理,而非停留在表面配置核对。
- 华为云CCE智能助手已支持智能问答,智能诊断和恢复等能力,欢迎体验。 华为云CCE智能助手已支持智能问答,智能诊断和恢复等能力,欢迎体验。
- 别把 IoT 玩成“线缆地狱”——openEuler 这样落地物联网更省心! 别把 IoT 玩成“线缆地狱”——openEuler 这样落地物联网更省心!
- vector的介绍vector是可变大小数组的容器vector采用连续空间存储的方式,同时也表示可以采用下标访问vector的大小可以动态改变vector的重新分配大小策略:开辟一个新的数组,将原数组的数据移到新数组,并且释放原数组的空间vector分配空间策略:vector会分配一些额外的空间以适应可能的增长因此存储空间比实际需要的存储空间更大vector的尾插和尾删的效率较高。但是非尾... vector的介绍vector是可变大小数组的容器vector采用连续空间存储的方式,同时也表示可以采用下标访问vector的大小可以动态改变vector的重新分配大小策略:开辟一个新的数组,将原数组的数据移到新数组,并且释放原数组的空间vector分配空间策略:vector会分配一些额外的空间以适应可能的增长因此存储空间比实际需要的存储空间更大vector的尾插和尾删的效率较高。但是非尾...
- 边缘计算真落地了:openEuler的边缘部署实战分享 边缘计算真落地了:openEuler的边缘部署实战分享
- 在现代软件开发中,高效、可靠地交付高质量的软件产品是每个团队的目标。为了实现这一目标,一系列最佳实践和技术应运而生。本文将重点讨论四个关键概念:持续集成(Continuous Integration, CI)、基础设施即代码(Infrastructure as Code, IaC)、容器化(Containerization)和金丝雀发布(Canary Release)。我们将探讨这些技术的原... 在现代软件开发中,高效、可靠地交付高质量的软件产品是每个团队的目标。为了实现这一目标,一系列最佳实践和技术应运而生。本文将重点讨论四个关键概念:持续集成(Continuous Integration, CI)、基础设施即代码(Infrastructure as Code, IaC)、容器化(Containerization)和金丝雀发布(Canary Release)。我们将探讨这些技术的原...
- 在过去七年参与的企业数字化转型项目中,我逐渐认识到软件交付流程的革新对技术团队的重要性。本文将分享我在实施DevOps过程中对持续集成、基础设施即代码、容器化以及金丝雀发布的实践心得,希望能为正在进行技术转型的团队提供一些参考。 持续集成:代码质量的第一道防线持续集成(Continuous Integration, CI)已经从最初的概念演变为现代软件开发的标准实践。记得2018年接手一个历... 在过去七年参与的企业数字化转型项目中,我逐渐认识到软件交付流程的革新对技术团队的重要性。本文将分享我在实施DevOps过程中对持续集成、基础设施即代码、容器化以及金丝雀发布的实践心得,希望能为正在进行技术转型的团队提供一些参考。 持续集成:代码质量的第一道防线持续集成(Continuous Integration, CI)已经从最初的概念演变为现代软件开发的标准实践。记得2018年接手一个历...
上滑加载中
推荐直播
-
华为云码道 × 仓颉编程:工程化AI编码探索2026/05/27 周三 19:00-21:00
刘俊杰-华为云仓颉语言专家/李炎-华为云码道技术专家/王智鹏-OpenCangjie开源社区发起人
本场直播围绕华为云仓颉语言与华为云码道的深度结合,展示华为云智能编程从零基础到高效落地的完整生态能力。以华为云码道为引擎,仓颉语言为载体,带给大家日常提效、趣味创新到极速量产的开发体验。
回顾中
热门标签