• [应用平台AppSta...] 应用平台AppStage运维中心实践 vol.4 一次故障演练,十分钟自动搞定?
    某业务部涉及200+服务,部署架构复杂,各服务间依赖关系盘根错节,每次故障演练都需要耗费大量时间,还容易出现遗漏问题风险……有没有高效可靠的方法, 可以在短时间内支撑高频大规模的故障演练呢?让我们走进该业务部,看B服务如何通过应用平台运维中心实现:1次故障演练,10分钟自动搞定!
  • [线下活动] 华为云马会彬ArchSummit2024会前采访:华为云 AI 原生应用引擎的架构与实践
    作者|马会彬编辑|薛梁  AI 大模型与 GenAI 重塑软件的大趋势下,软件会发生哪些本质的变化?如果“所有软件都值得用 AI 重做一遍”,那么该如何重做?将在 2024 年 6 月 14-15 日举办的 ArchSummit 架构师峰会上,infoQ邀请到了华为云架构与设计部首席架构师马会彬老师来会议上演讲,他将分享华为云“AI 原生应用引擎”的架构与实践话题,从 GenAI 重塑软件的本质变化、以及 AI 原生的概念与内涵解剖,分享华为云 AI 原生应用引擎的架构设计、及实践思考。在正式演讲之前,InfoQ 采访了马会彬老师,请他提前剧透关于 AI 原生应用开发的内容,希望对大家有帮助。InfoQ:您认为在 AI 大模型与 GenAI 重塑软件的大趋势下,软件行业会发生哪些本质性的变化?如何理解 AI 对软件行业带来的颠覆式创新和技术驱动力?马会彬:以大模型为核心的 GenAI 技术所带来的“创造能力”、“推理能力”以及“交互能力”,都是之前的经典 AI 或者经典软件无法实现的,这就为软件这种数字基础设施带来了颠覆式的变革机会;此外,以大模型为核心的 GenAI 也预示着极强的通用 AI(AGI)技术趋势,而且相关技术的进展可以说是日新月异的,尤其是来自以下几方面的技术驱动:1)以 Embedding(语义向量)为代表的技术,解决了万物智能的通用表示问题;2)以 Transformer 架构为代表的技术,解决了 AI 模型的通用架构问题;3)以 Scaling Law 为代表的技术,解决了算力摩尔定律向智能摩尔定律、以及场景泛化摩尔定律的变换;4)以 LLM OS 为代表的系统抽象,解决了通用 AI 计算架构的问题;由此可以判定,从 AI 大模型走向通用人工智能(AGI)将不仅仅是一种技术趋势,而是一种可见的确定性的未来,而这种变化,必将对软件行业带来颠覆式的创新(具体在后续问题中有回答)。InfoQ:从业务视角和技术视角来看,为何认为所有软件都值得用 AI 重做一遍?在 AI 原生应用的概念演变中,业务需求与技术手段的关系发生了怎样的变化?马会彬:对软件产业来说,可以分别从需求方与供给方两个维度来理解;从需求方来看,GenAI 对企业价值创造与价值变现的全流程、以及员工的生产力工具,都将带来积极的重大变化,尤其是在智能客服、智能营销、智能研发、智能办公等领域。另外,从供给方来看,GenAI 对软件的技术架构、软件工程体系、软件的交互设计、以及软件的商业模式,也将带来根本性的革新。InfoQ:您如何定义 AI 原生架构及 AI 原生应用?在实践中,AI 原生架构和传统架构有何区别?马会彬:行业目前对 AI 原生有几种不同的称呼,譬如:AI First、AI Native、AI Oriented Programming 等,简单 AI 原生或 AI 原生应用就是指以 AI 大模型为底座、以生成式架构为核心的一种新应用,也可以说 AI 原生应用就是指应用价值主要来自 AI 大模型的一类应用。传统应用更多以算法、数据结构、逻辑编程为特点,而 AI 原生应用的特点则是以生成式 AI 大模型为基础,以 Prompt 提示词为业务输入,以生成式内容为结果,因此也可以称传统应用为“构成式架构”、而 AI 原生应用为“生成式架构”。InfoQ:对于 AI 原生架构的概念和内涵,您能详细解释一下吗?AI 原生架构如何与现有的软件架构相区别和结合?马会彬:对于 AI 原生架构,一定程度上可以参照业界对云原生架构的概念定义来理解。云原生(Cloud Native)是指构建、运行、管理基于云环境、利用云环境、适应云环境而发展起来的新的软件系统实践范式,包括具备微服务架构、弹性伸缩、分布式、高可用、多租、自动化运维等关键特征的架构实践,以及与之匹配的全功能团队并高度协作的组织实践、采用微服务实现持续交付的工程实践等。那么,AI 原生(AI Native)可以定义为构建、运行、管理基于 AI 大模型、并适应 AI 大模型的应用而发展起来的软件系统实践范式,以这种范式构建的应用就称为 AI 原生应用。AI 原生的软件新范式,包括 AI Native 的软件架构实践、AI4SE 的软件工程实践,以及面向 AI 编程的组织实践,从而实现存量软件的 AI 重塑、以及孵化新的 AI Native 超级应用。InfoQ:在 AI 重塑存量软件方面,您认为有哪些方式和演进路径?在实践中,如何将 AI 技术应用于现有的存量软件中?马会彬:AI 并不是取代存量软件,而是增强存量软件的功能或者改进存量软件的使用体验。大概有四种方式:1)存量软件的某个模块被 AI Native 的模块替代;2)存量软件增加 AI 模块来提升、改善能力及体验;3)存量软件在交互上被 AI Agent 类应用接管;4)存量软件在软件工程上采用 AI4SE 的生成方式,来提升软件开发过程的效率及质量。这里最著名的例子是微软的 Office Copilot。InfoQ:您提到的新的 AI 原生超级应用是指什么?这些超级应用与传统应用相比有何优势和特点?马会彬:随着大模型能力的快速提升,未来可能会出现两类 AI 原生的超级应用。一类是类似 MidJourney 这样的全新的 AIGC 应用;另一类是类似 ChatGPT / Notion AI 这样的新超级入口应用。与传统应用相比,AI 原生的超级应用能够适应的场景更多、功能更广,体验更佳,在开发过程和模式上更多以数据、算力、模型驱动,因此从价值上看应用的价值绝大部分来自于 AI 大模型,业界有说法认为至少 50% 以上;这就与传统应用以产品经理、开发工程师为主的开发模式,形成本质上的差异。InfoQ:您能介绍一下华为云 AI 原生应用引擎的架构设计和实践思考吗?在实践中,该引擎的主要技术特点和应用场景是什么?马会彬:华为云 AI 原生应用引擎来自华为公司自身的 AI 应用实践,属于华为云“经验即服务,让优秀得以复制”战略落地的一个实例。华为公司 +AI 的实践历程起始于 2005 年,从最初的商业智能、到场景 AI、普惠 AI(内部也称 AI 1.0),走到 2022 年的生成式 AI(内部也称 AI 2.0);与 AI 1.0 相比,AI 2.0 在内部也称为是“经验主义”的革命,可以将公司在过去二三十年中持续累积的大量研发代码、专业知识、标准规范等,训练成特定的 AI 大模型,进而服务于上层的业务场景、提供丰富的 AI 技能、超越预期的效果、以及接近人的普适性,从而为生产力提升、生产方式的转变,以及交付模式的变化,带来颠覆性的变化。华为云 AI 原生应用引擎基于华为自身的实践经验及资产积累,是基于华为云的一个云服务化产品实现,定位就是从企业 CIO 视角及应用开发者视角,辅助选好、用好、管好大模型,以及基于大模型实现业务场景和 AI 应用的快速开发与创新。InfoQ:从 CIO 的视角来看,AI 原生应用落地面临的主要挑战和需求是什么?在 AI 原生应用的落地过程中,如何满足企业 CIO 的需求?马会彬:从 CIO 视角看大模型与 AI 原生应用落地主要面临 6 大挑战:1)模型很多、如何选择最匹配、最适合的;2)如何提升模型在场景落地上的智能效果;3)如何建立 IT 部门与业务部门之间 AI 应用构建的协同关系;4)如何准备高质量数据,帮助 AI 理解业务;5)如何建立完善的风险保障机制,保障 AI 落地的安全可信;6)如何平衡、优化大模型带来的成本与效益;华为云 AI 原生应用引擎正是针对这 6 大挑战,基于华为自身的实践经验和生态资产积累,构筑产品功能和竞争力。InfoQ:华为内部在 AI 原生应用落地方面的实践经验有哪些?在实践中,华为是如何克服挑战,取得成功的?马会彬:华为在大的 IT 变革上都是采取自顶向下的方式,首先在公司层面成立了专业的生成式 AI 的变革组织,来统一制定相关的规范和策略,基于此明确建立:一套标准方法、一个 AI 平台、N 类 AI 应用;其次是确定数据治理规范、数据集资产与 AI 应用场景的对应及适配;最后是选择合适的业务场景,从小范围试点逐渐到大规模推广的过程。因此,从自身实践,不仅仅是孵化了一个 AI 平台产品,也包括了 AI 应用落地的统一架构、统一规范、业务实施方法论等知识资产,这些“经验资产”都可以基于华为云来服务更广泛的客户。InfoQ:华为云如何赋能 AI 原生应用创新?其架构和实践方面有哪些特点?在推动 AI 原生应用创新过程中,华为云的主要贡献和作用是什么?马会彬:简单可以归纳为三点:1)华为云 AI 原生应用引擎,提供一站式 AI 应用开发、运行与管理等;2)基于内外部生态沉淀的丰富行业 AI Know-How 和 AI 资产;3)定义 AI 原生应用的参考架构和最佳实践经验。在过去,华为云引领了云原生 2.0 的技术推广,我们也希望与生态伙伴、开发者一起再次引领 AI 原生应用、从理念到实践的推广,助力 AI 大模型从技术创新走向生产场景落地。更多精彩内容,请锁定ArchSummit2024【AI大模型中台实践探索】专题,敬请期待马会彬老师在会上的干货分享!
  • [线下活动] 华为云陈星亮受邀出席AICon2024分享AI Agent 在企业生产中的技术实践
    在人工智能的浪潮之下,AI Agent 正逐渐成为技术前沿探索与实践的焦点,不仅推动着各行各业的革新,也为我们提供了全新的交互体验。大模型技术的不断进步和普及使得 AI Agent 在企业生产、音视频创作、智能设备等多个领域展现出巨大的潜力和价值。为了深入探讨 AI Agent 的发展现状、挑战与未来方向,2024 北京站 AICon 全球人工智能开发与应用大会暨大模型应用生态展精心策划了 AI Agent 专题,将邀请清华副教授和华为云等大厂专家带来专业知识和技术实践分享,以确保听众能获得最大的收益。本次行业盛会将于5月17-18日在北京举办,特别邀请华为云 aPaaS 服务产品部首席架构师陈星亮,分享“AI Agent 在企业生产中的技术实践”议题,这也是aPaaS 服务产品部首次携AI产品亮相外部大型技术大会,陈星亮老师将从当前 AI Agent 进入企业生产场景面临的专业复杂问题、AI 生成结果难以达到可用标准以及知识安全难保障等全新挑战入手,分享华为云 AI Agent 的深入探索和在虚拟客服、会议摘要等场景中的优秀实践,以期解决企业引入 AI 生成技术的瓶颈,并对 AI Agent 在未来的企业生产场景中进行多形态部署和交互进行展望,他的分享希望给听众带来“AI Agent 如何在企业生产场景中充分发挥技术价值”的启发和思考,欢迎关注,敬请期待!陈星亮简介:华为云软件领域专家,工科硕士,在应用软件和云服务开发方面有 20 年丰富经验,现任华为云 aPaaS 服务产品部首席架构师,负责开天 aPaaS 云服务产品的设计和研发工作。曾参加英国 VM、香港 HKT、南方电网等国内外大型 IT 实施项目。当前研究方向:平台工程、AI 原生应用、应用元数据模型等。更多大会信息请点击:议题详情
  • [问题求助] 故障场景库和故障模式库的区别是?
    故障场景库和故障模式库的区别是?
  • [问题求助] 如何理解运维中心演练服务(WiseChoas)的故障场景库?
    如何理解运维中心演练服务(WiseChoas)的故障场景库?
  • [问题求助] 运维中心的演练服务(WiseChoas)有哪些使用场景?
    运维中心的演练服务(WiseChoas)有哪些使用场景?
  • [问题求助] 运维中心的演练服务(WiseChoas)支持多少个故障模式库?
    运维中心的演练服务(WiseChoas)支持多少个故障模式库?
  • [应用平台AppSta...] 如何解锁高效运维?AI算法助力向智能运维升级!
    面对一款业务复杂且业务请求量大还无规律的服务,你还穿梭在多系统间反复巡检问题,为提高运维效率而绞尽脑汁吗?你还在为运维报警不及时、漏报、误报而烦恼不已吗?......应用平台AppStage运维中心,一屏览尽黄金指标!AI算法助力问题分钟级感知、定界到恢复!如此智能化的高效运维,到底怎么实现的?快来一探究竟吧!