- Linux系统修改网卡名为eth0、eth1 Linux系统修改网卡名为eth0、eth1
- Linux系统初始化脚本 Linux系统初始化脚本
- gRPC作为云原生通信标准,基于HTTP/2实现高效RPC通信。 通过.proto文件定义服务接口并自动生成多语言客户端/服务端代码。gRPC实现了跨语言远程调用,使开发者能像调用本地方法一样进行分布式通信。 gRPC作为云原生通信标准,基于HTTP/2实现高效RPC通信。 通过.proto文件定义服务接口并自动生成多语言客户端/服务端代码。gRPC实现了跨语言远程调用,使开发者能像调用本地方法一样进行分布式通信。
- Karmada 非常高兴地宣布彭博(Bloomberg)正式加入 Karmada 用户组 。Bloomberg 的加入将进一步加强 Karmada 社区,为项目的持续创新带来新的活力,标志着 Karmada 在社区发展和多样化生产环境中采用的又一个重要里程碑。 Karmada 非常高兴地宣布彭博(Bloomberg)正式加入 Karmada 用户组 。Bloomberg 的加入将进一步加强 Karmada 社区,为项目的持续创新带来新的活力,标志着 Karmada 在社区发展和多样化生产环境中采用的又一个重要里程碑。
- 人们眼中的天才之所以卓越非凡,并非天资超人一等而是付出了持续不断的努力。1万小时的锤炼是任何人从平凡变成超凡的必要条件。———— 马尔科姆·格拉德威尔🌟 Hello,我是Xxtaoaooo!🌈 “代码是逻辑的诗篇,架构是思想的交响” 摘要作为一名在数据库领域的技术实践者,我最近有幸参与了一个系统从Oracle到OpenTenBase的迁移项目。这次经历让我深刻体会到了分布式HTAP数据库... 人们眼中的天才之所以卓越非凡,并非天资超人一等而是付出了持续不断的努力。1万小时的锤炼是任何人从平凡变成超凡的必要条件。———— 马尔科姆·格拉德威尔🌟 Hello,我是Xxtaoaooo!🌈 “代码是逻辑的诗篇,架构是思想的交响” 摘要作为一名在数据库领域的技术实践者,我最近有幸参与了一个系统从Oracle到OpenTenBase的迁移项目。这次经历让我深刻体会到了分布式HTAP数据库...
- 华为云云容器引擎 CCE Autopilot 适用于敏态业务快速创新、潮汐业务弹性伸缩、批量计算等多种场景,助力企业应对多样化需求。 华为云云容器引擎 CCE Autopilot 适用于敏态业务快速创新、潮汐业务弹性伸缩、批量计算等多种场景,助力企业应对多样化需求。
- 9 月 13-14 日,GOSIM HANGZHOU 2025 大会将在杭州隆重启幕。华为云云原生开源技术专家将在AI 模型 × 基础设施、端侧 AI 工作坊、互动展区等会场带来议题演讲与技术讲解,深度探讨云原生技术创新和产业实践,欢迎现场交流。 9 月 13-14 日,GOSIM HANGZHOU 2025 大会将在杭州隆重启幕。华为云云原生开源技术专家将在AI 模型 × 基础设施、端侧 AI 工作坊、互动展区等会场带来议题演讲与技术讲解,深度探讨云原生技术创新和产业实践,欢迎现场交流。
- 本文聚焦云原生监控系统中Prometheus采集K8s容器指标的“间歇性无数据”问题,还原其技术环境(K8s 1.28.3、Prometheus 2.45.0等)与故障现象(指标缺失5-15分钟,高峰期频发)。排查发现,根源在于kubelet的cadvisor指标生成线程不足、缓存策略不当,叠加Calico iptables转发延迟。 本文聚焦云原生监控系统中Prometheus采集K8s容器指标的“间歇性无数据”问题,还原其技术环境(K8s 1.28.3、Prometheus 2.45.0等)与故障现象(指标缺失5-15分钟,高峰期频发)。排查发现,根源在于kubelet的cadvisor指标生成线程不足、缓存策略不当,叠加Calico iptables转发延迟。
- 本文聚焦云原生边缘计算与分布式AI训练场景的两类高频隐蔽Bug,结合真实技术环境展开深度分析与修复。在AI训练场景中,K8s与NVIDIA GPU Operator协同下出现“GPU资源假分配”,因调度器与Device Plugin绑定存在时间差,通过多线程优化插件、添加初始化容器等解决; 本文聚焦云原生边缘计算与分布式AI训练场景的两类高频隐蔽Bug,结合真实技术环境展开深度分析与修复。在AI训练场景中,K8s与NVIDIA GPU Operator协同下出现“GPU资源假分配”,因调度器与Device Plugin绑定存在时间差,通过多线程优化插件、添加初始化容器等解决;
- 本文围绕某智能物流调度系统在云原生架构下的故障排查与优化展开。该系统基于Kubernetes、Istio等构建,业务扩张后高峰时段频发订单提交失败、调度信息延迟等问题。经分层排查,发现根源在于应用层连接池配置不合理、服务网格路由与负载均衡策略缺陷、资源调度及云边通信瓶颈等多层级协同失效。 本文围绕某智能物流调度系统在云原生架构下的故障排查与优化展开。该系统基于Kubernetes、Istio等构建,业务扩张后高峰时段频发订单提交失败、调度信息延迟等问题。经分层排查,发现根源在于应用层连接池配置不合理、服务网格路由与负载均衡策略缺陷、资源调度及云边通信瓶颈等多层级协同失效。
- 本文围绕电商支付链路中云原生服务通信的偶发503错误展开复盘,该故障在流量高峰及服务伸缩时凸显,技术环境基于Kubernetes 1.26、Istio 1.15等典型企业级云原生架构。通过分层溯源发现,问题根源为三层协同失效:Istio控制平面配置推送优先级不合理导致端点列表延迟,数据平面Sidecar资源不足引发健康检查阻塞,内核TCP连接队列参数过小造成连接丢弃。 本文围绕电商支付链路中云原生服务通信的偶发503错误展开复盘,该故障在流量高峰及服务伸缩时凸显,技术环境基于Kubernetes 1.26、Istio 1.15等典型企业级云原生架构。通过分层溯源发现,问题根源为三层协同失效:Istio控制平面配置推送优先级不合理导致端点列表延迟,数据平面Sidecar资源不足引发健康检查阻塞,内核TCP连接队列参数过小造成连接丢弃。
- 本文围绕某互联网公司混合云原生架构迁移中遭遇的PV/PVC动态绑定失效故障展开,复盘了故障排查与解决的全流程。故障根源在于存储class遗留的固定可用区参数,与消息队列PVC采用的“WaitForFirstConsumer”绑定模式冲突,导致PV创建与Pod调度可用区错位。 本文围绕某互联网公司混合云原生架构迁移中遭遇的PV/PVC动态绑定失效故障展开,复盘了故障排查与解决的全流程。故障根源在于存储class遗留的固定可用区参数,与消息队列PVC采用的“WaitForFirstConsumer”绑定模式冲突,导致PV创建与Pod调度可用区错位。
- 本文以某企业级云原生平台遭遇的集群资源耗尽故障为切入点,复盘了由ServiceAccount权限溢出引发的危机处置全流程。故障源于默认ServiceAccount过度授权与微服务镜像隐性缺陷叠加,导致临时Pod无节制创建并吞噬资源。文章详细阐述了从内核级监控定位根因、多维度紧急止损,到构建“分级授权+联动校验+底层加固”的权限治理体系的实践路径。 本文以某企业级云原生平台遭遇的集群资源耗尽故障为切入点,复盘了由ServiceAccount权限溢出引发的危机处置全流程。故障源于默认ServiceAccount过度授权与微服务镜像隐性缺陷叠加,导致临时Pod无节制创建并吞噬资源。文章详细阐述了从内核级监控定位根因、多维度紧急止损,到构建“分级授权+联动校验+底层加固”的权限治理体系的实践路径。
- 本文针对云原生电商集群中Nacos配置中心引发的服务瘫痪故障展开分析。该故障因Nacos旧版客户端长连接重连后未拉取全量配置、应用层配置加载存在线程安全隐患且缺乏降级策略所致。 解决方案涵盖多层面:客户端升级至稳定版并新增主动校验机制;应用层重构为读写分离架构,设计三级降级策略;服务端采用半同步复制与异地多活部署;同时完善全链路监控与应急工具。 本文针对云原生电商集群中Nacos配置中心引发的服务瘫痪故障展开分析。该故障因Nacos旧版客户端长连接重连后未拉取全量配置、应用层配置加载存在线程安全隐患且缺乏降级策略所致。 解决方案涵盖多层面:客户端升级至稳定版并新增主动校验机制;应用层重构为读写分离架构,设计三级降级策略;服务端采用半同步复制与异地多活部署;同时完善全链路监控与应急工具。
- 本文聚焦云原生环境下核心订单服务的性能异常问题,该服务在流量峰值时出现响应迟滞、超时率飙升,常规监控却无异常。通过排查发现,kube-proxy默认iptables模式在Endpoint数量超阈值时规则更新延迟,叠加应用层本地缓存过期引发的请求穿透,形成“叠加效应”。 本文聚焦云原生环境下核心订单服务的性能异常问题,该服务在流量峰值时出现响应迟滞、超时率飙升,常规监控却无异常。通过排查发现,kube-proxy默认iptables模式在Endpoint数量超阈值时规则更新延迟,叠加应用层本地缓存过期引发的请求穿透,形成“叠加效应”。
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签