- 本文为【LLM 推理】专栏第二期,聚焦大模型智能推理开源项目 Kthena 展开深度技术解析。本篇将详细拆解 Kthena Router 的插件化架构设计,并通过完整 Benchmark 测试数据,直观呈现其在 LLM 推理路由、负载均衡与性能优化上的实际效果。 本文为【LLM 推理】专栏第二期,聚焦大模型智能推理开源项目 Kthena 展开深度技术解析。本篇将详细拆解 Kthena Router 的插件化架构设计,并通过完整 Benchmark 测试数据,直观呈现其在 LLM 推理路由、负载均衡与性能优化上的实际效果。
- 华为云OfficeClaw的Harness工程底座是一项融合“驾驭工程”设计哲学的技术框架,采用“思辨专家团”模式实现多位专家智能体对话、独立判断,有效降低单一模型的主观偏差与单点故障风险。它将任务规划、上下文工程、多Agent协同、工具调用、记忆演进、安全治理与执行观测融为一体,为复杂办公任务提供稳定的运行环境。 华为云OfficeClaw的Harness工程底座是一项融合“驾驭工程”设计哲学的技术框架,采用“思辨专家团”模式实现多位专家智能体对话、独立判断,有效降低单一模型的主观偏差与单点故障风险。它将任务规划、上下文工程、多Agent协同、工具调用、记忆演进、安全治理与执行观测融为一体,为复杂办公任务提供稳定的运行环境。
- 本文是「从零开始理解大模型」系列第七篇,本系列共十篇,从 “下一个词预测” 逐步搭建完整的大模型心智模型,每篇均附带可运行代码。本篇聚焦推理过程,带你清晰了解从按下回车到模型输出文字这一秒内,大模型内部完整的运行逻辑。 本文是「从零开始理解大模型」系列第七篇,本系列共十篇,从 “下一个词预测” 逐步搭建完整的大模型心智模型,每篇均附带可运行代码。本篇聚焦推理过程,带你清晰了解从按下回车到模型输出文字这一秒内,大模型内部完整的运行逻辑。
- 本文是「从零开始理解大模型」系列第六篇,系列共十篇,从 “下一个词预测” 逐步构建完整的大模型心智模型,每篇均配备可运行代码。本篇聚焦大模型训练,深度解析 70 亿级参数的学习与生成过程,带你掌握大模型的核心训练原理。 本文是「从零开始理解大模型」系列第六篇,系列共十篇,从 “下一个词预测” 逐步构建完整的大模型心智模型,每篇均配备可运行代码。本篇聚焦大模型训练,深度解析 70 亿级参数的学习与生成过程,带你掌握大模型的核心训练原理。
- 本文是「从零开始理解大模型」系列第五篇,本系列共十篇,从 “下一个词预测” 逐步搭建完整的大模型心智模型,每篇均附带可运行代码。本篇以全景视角讲解 Transformer 架构,带你看懂基础组件如何一步步搭建出大模型的核心架构 本文是「从零开始理解大模型」系列第五篇,本系列共十篇,从 “下一个词预测” 逐步搭建完整的大模型心智模型,每篇均附带可运行代码。本篇以全景视角讲解 Transformer 架构,带你看懂基础组件如何一步步搭建出大模型的核心架构
- 本文为「从零开始理解大模型」系列第四篇,本系列共十篇,从 “下一个词预测” 逐步构建完整的大模型心智模型,每篇均附带可运行代码。本篇聚焦 Attention 机制,讲解大模型如何实现 “阅读理解”,带你理解其核心注意力原理。 本文为「从零开始理解大模型」系列第四篇,本系列共十篇,从 “下一个词预测” 逐步构建完整的大模型心智模型,每篇均附带可运行代码。本篇聚焦 Attention 机制,讲解大模型如何实现 “阅读理解”,带你理解其核心注意力原理。
- AI 正以前所未有的速度渗透进每一个角落,“数据+智能”的化学反应,数据库与 AI 的深度融合,正在重塑我们对数据库设计与应用的想象。以 PostgreSQL 为核心的开源技术大会 HOW 2026 将于 4 月 27~28 日于济南举办,这是第一期「Yolanda 科技见闻」与 HOW 2026 大会的特别联动直播。 AI 正以前所未有的速度渗透进每一个角落,“数据+智能”的化学反应,数据库与 AI 的深度融合,正在重塑我们对数据库设计与应用的想象。以 PostgreSQL 为核心的开源技术大会 HOW 2026 将于 4 月 27~28 日于济南举办,这是第一期「Yolanda 科技见闻」与 HOW 2026 大会的特别联动直播。
- 近期,开源的AReaL强化学习框架正式发布v1.0版本,提供了较完整的Agentic RL训练底座。围绕这一里程碑版本,华为团队也已完成AReaL在Ascend平台上的支持与增强,不仅补齐了安装与运行能力,还进一步打通了训练、推理、权重同步、Agent场景落地等关键链路,使AReaL在昇腾AI基础软硬件平台上具备更强的工程可用性。 近期,开源的AReaL强化学习框架正式发布v1.0版本,提供了较完整的Agentic RL训练底座。围绕这一里程碑版本,华为团队也已完成AReaL在Ascend平台上的支持与增强,不仅补齐了安装与运行能力,还进一步打通了训练、推理、权重同步、Agent场景落地等关键链路,使AReaL在昇腾AI基础软硬件平台上具备更强的工程可用性。
- 本文是「从零开始理解大模型」系列第三篇,系列共十篇,从 “下一个词预测” 逐步构建完整的大模型心智模型,每篇均配备可运行代码。本篇聚焦向量与 Embedding,讲解如何将文字转化为数学表达,带你掌握大模型处理语言的核心基础。 本文是「从零开始理解大模型」系列第三篇,系列共十篇,从 “下一个词预测” 逐步构建完整的大模型心智模型,每篇均配备可运行代码。本篇聚焦向量与 Embedding,讲解如何将文字转化为数学表达,带你掌握大模型处理语言的核心基础。
- 本文是「从零开始理解大模型」系列第二篇,系列共十篇,从 “下一个词预测” 逐步搭建完整大模型心智模型,每篇均附带可运行代码。本篇聚焦 Token,带你了解大模型视角下 “字” 的本质与形态。 本文是「从零开始理解大模型」系列第二篇,系列共十篇,从 “下一个词预测” 逐步搭建完整大模型心智模型,每篇均附带可运行代码。本篇聚焦 Token,带你了解大模型视角下 “字” 的本质与形态。
- 本文是「从零开始理解大模型」系列第一篇,本系列共十篇,将从最基础的 “下一个词预测” 出发,逐步构建完整的大模型心智认知,且每篇均附带可运行代码。本篇从 “猜下一个词” 切入,带你开启大模型原理学习之旅。 本文是「从零开始理解大模型」系列第一篇,本系列共十篇,将从最基础的 “下一个词预测” 出发,逐步构建完整的大模型心智认知,且每篇均附带可运行代码。本篇从 “猜下一个词” 切入,带你开启大模型原理学习之旅。
- 「从零开始理解 Agent」系列番外 —— 在前面的七篇正文里(文末超链接直达),我们从来没关心过一个问题:跑一次 Agent 到底消耗多少 Token?每轮循环花了多少?工具返回结果占了多大比例?这篇番外给 Agent 装上一个 Token 仪表盘,让消耗一目了然。 「从零开始理解 Agent」系列番外 —— 在前面的七篇正文里(文末超链接直达),我们从来没关心过一个问题:跑一次 Agent 到底消耗多少 Token?每轮循环花了多少?工具返回结果占了多大比例?这篇番外给 Agent 装上一个 Token 仪表盘,让消耗一目了然。
- 本文为「从零开始写好 Skill」系列第五篇,承接前序 Agent 骨架与 Skill 基础内容,深入讲解 Skill 的拆分设计与组合使用方法,揭秘 Skill 灵活复用、高效协作的组合之道,帮你更系统地为 Agent 打造好用的 “工作手册”。 本文为「从零开始写好 Skill」系列第五篇,承接前序 Agent 骨架与 Skill 基础内容,深入讲解 Skill 的拆分设计与组合使用方法,揭秘 Skill 灵活复用、高效协作的组合之道,帮你更系统地为 Agent 打造好用的 “工作手册”。
- 「从零开始理解 Agent」系列文章从第一篇起,我们建立了一个核心心智模型:用户输入 → LLM 思考 → 调用工具 → 观察结果 → 继续思考 → ... → 返回答案。这个循环是 Agent 的大脑。但现实中,有些操作根本不需要经过大脑。 「从零开始理解 Agent」系列文章从第一篇起,我们建立了一个核心心智模型:用户输入 → LLM 思考 → 调用工具 → 观察结果 → 继续思考 → ... → 返回答案。这个循环是 Agent 的大脑。但现实中,有些操作根本不需要经过大脑。
- 本文是「从零开始写好 Skill」系列第四篇,承接前序 Agent 骨架内容,针对 Skill 编写繁琐问题,介绍通过 skill-creator 工具高效开发,助力你轻松为 Agent 完善实用的 “工作手册”。 本文是「从零开始写好 Skill」系列第四篇,承接前序 Agent 骨架内容,针对 Skill 编写繁琐问题,介绍通过 skill-creator 工具高效开发,助力你轻松为 Agent 完善实用的 “工作手册”。
上滑加载中
推荐直播
-
华为云码道 × 仓颉编程:工程化AI编码探索2026/05/27 周三 19:00-21:00
刘俊杰-华为云仓颉语言专家/李炎-华为云码道技术专家/王智鹏-OpenCangjie开源社区发起人
本场直播围绕华为云仓颉语言与华为云码道的深度结合,展示华为云智能编程从零基础到高效落地的完整生态能力。以华为云码道为引擎,仓颉语言为载体,带给大家日常提效、趣味创新到极速量产的开发体验。
即将直播
热门标签