- 随着企业级应用全面向 Kubernetes(K8s)平台迁移,运维团队的关注点逐渐从“如何部署应用”转移到了“如何在集群生命周期内自动化管理应用”。对于无状态的微服务,K8s 原生的 Deployment 资源已经足够强大;但对于像 TDengine 这样承载着百亿级物联网数据的有状态 时序数据库,简单的启停重启远远不够。数据备份、扩缩容时的数据重平衡、主从节点的自动故障切换等复杂操作,亟需... 随着企业级应用全面向 Kubernetes(K8s)平台迁移,运维团队的关注点逐渐从“如何部署应用”转移到了“如何在集群生命周期内自动化管理应用”。对于无状态的微服务,K8s 原生的 Deployment 资源已经足够强大;但对于像 TDengine 这样承载着百亿级物联网数据的有状态 时序数据库,简单的启停重启远远不够。数据备份、扩缩容时的数据重平衡、主从节点的自动故障切换等复杂操作,亟需...
- 别再手搓集群了:用 Terraform + Helm 把数据平台“养成宠物”变“放养牛群” 别再手搓集群了:用 Terraform + Helm 把数据平台“养成宠物”变“放养牛群”
- 不是写几条规则就叫治理:聊聊平台治理里策略、合规与可观测的“闭环” 不是写几条规则就叫治理:聊聊平台治理里策略、合规与可观测的“闭环”
- Spark / Flink 跑在 Kubernetes 上真的更香吗?聊聊那些没人提前告诉你的性能坑 Spark / Flink 跑在 Kubernetes 上真的更香吗?聊聊那些没人提前告诉你的性能坑
- 别再让开发等审批了:聊聊自动化权限申请与凭证发放,怎么真正提升 DX 别再让开发等审批了:聊聊自动化权限申请与凭证发放,怎么真正提升 DX
- 别再手搓环境了:聊聊我们是怎么用 Terraform + Helm 做内部服务模板化的 别再手搓环境了:聊聊我们是怎么用 Terraform + Helm 做内部服务模板化的
- 别再堆工具了:内部开发者平台(IDP)真正的难点,是“产品思维”和“组织动刀” 别再堆工具了:内部开发者平台(IDP)真正的难点,是“产品思维”和“组织动刀”
- 别再闭眼上 Mesh 了:透明代理 vs Sidecar,到底谁更香? 别再闭眼上 Mesh 了:透明代理 vs Sidecar,到底谁更香?
- 别再裸奔了:云原生时代的内网微分段落地路线图(真·能打版) 别再裸奔了:云原生时代的内网微分段落地路线图(真·能打版)
- Kubernetes就是你的超级餐厅经理:容器倒了?秒级重启!客流量暴涨?自动复制服务员!换新菜单?零停机逐步更新!所有服务的秘方(配置)统一管理。 Kubernetes就是你的超级餐厅经理:容器倒了?秒级重启!客流量暴涨?自动复制服务员!换新菜单?零停机逐步更新!所有服务的秘方(配置)统一管理。
- 云原生架构思路则转向 Shared-Nothing 无共享模式,基于 PostgreSQL 原生流复制实现数据冗余,通过服务发现与集中式存储管理集群状态。Stolon 正是这一思路的成熟落地实现,通过 Keeper、Sentinel、Proxy 三大核心组件协同工作,配合 etcd 实现全局一致的集群管理,能够在动态、不可靠的云环境中完成自动故障检测、自动主从切换、强制脑裂防护、应用透明路由。 云原生架构思路则转向 Shared-Nothing 无共享模式,基于 PostgreSQL 原生流复制实现数据冗余,通过服务发现与集中式存储管理集群状态。Stolon 正是这一思路的成熟落地实现,通过 Keeper、Sentinel、Proxy 三大核心组件协同工作,配合 etcd 实现全局一致的集群管理,能够在动态、不可靠的云环境中完成自动故障检测、自动主从切换、强制脑裂防护、应用透明路由。
- Kubernetes 网络一出事,先别重启:一条从 Pod 打到内核的排查路线图 Kubernetes 网络一出事,先别重启:一条从 Pod 打到内核的排查路线图
- CNI 不是装完就完事:Calico、Cilium、Weave,选错一个,集群网络天天加班 CNI 不是装完就完事:Calico、Cilium、Weave,选错一个,集群网络天天加班
- Service Mesh + L7 路由:不是不用,而是你可能早该关了 Service Mesh + L7 路由:不是不用,而是你可能早该关了
- 春节对咱们运维人来说,从来不是单纯的假期,而是一场“保稳定”的硬仗。这段时间业务流量忽高忽低,比如电商的新春促销、社交平台的祝福发送,都可能让云平台承压,再加上值守人员比平时少,一旦出故障,响应和排查的难度都会翻倍。所以节前深度巡检绝不能走形式,核心就是要把隐性隐患挖出来、把潜在风险堵上,提前给平台“做个体检”,确保节日期间业务能平稳跑起来。下面结合我这些年的一线实操经验,拆解各核心组件的巡检要点 春节对咱们运维人来说,从来不是单纯的假期,而是一场“保稳定”的硬仗。这段时间业务流量忽高忽低,比如电商的新春促销、社交平台的祝福发送,都可能让云平台承压,再加上值守人员比平时少,一旦出故障,响应和排查的难度都会翻倍。所以节前深度巡检绝不能走形式,核心就是要把隐性隐患挖出来、把潜在风险堵上,提前给平台“做个体检”,确保节日期间业务能平稳跑起来。下面结合我这些年的一线实操经验,拆解各核心组件的巡检要点
上滑加载中
推荐直播
-
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中 -
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
热门标签