- 本文详细介绍了如何在华为云开发者空间的 AI Notebook 平台上,利用 NPU 910B 环境高效部署并运行 YOLOv9_for_PyTorch 目标检测模型。整个流程分为五个关键步骤:环境初始化、依赖安装、模型权重准备、测试数据准备和推理执行,最终实现了对测试图片的实时目标检测并可视化结果。 本文详细介绍了如何在华为云开发者空间的 AI Notebook 平台上,利用 NPU 910B 环境高效部署并运行 YOLOv9_for_PyTorch 目标检测模型。整个流程分为五个关键步骤:环境初始化、依赖安装、模型权重准备、测试数据准备和推理执行,最终实现了对测试图片的实时目标检测并可视化结果。
- Ascend C 核心技术特性一、Ascend C 技术定位:为何需要昇腾原生编程框架?在 AI 算力需求爆发的背景下,通用编程框架(如 CUDA)难以充分适配昇腾芯片的 达芬奇架构(Da Vinci Architecture) 特性(如张量计算单元、多级存储体系),导致算力利用率受限。Ascend C 作为昇腾芯片原生的 算子开发框架,定位为 “底层算力入口”,核心目标是:极致性能:直... Ascend C 核心技术特性一、Ascend C 技术定位:为何需要昇腾原生编程框架?在 AI 算力需求爆发的背景下,通用编程框架(如 CUDA)难以充分适配昇腾芯片的 达芬奇架构(Da Vinci Architecture) 特性(如张量计算单元、多级存储体系),导致算力利用率受限。Ascend C 作为昇腾芯片原生的 算子开发框架,定位为 “底层算力入口”,核心目标是:极致性能:直...
- 背景最近几年,AI 大模型火得一塌糊涂,特别是像 Llama 这样的开源模型,几乎成了每个技术团队都在讨论的热点。不过,这些"巨无霸"模型虽然能力超强,但对硬件的要求也高得吓人。这时候,华为的昇腾 NPU 就派上用场了。说实话,昇腾 NPU 在 AI 计算这块确实有两把刷子。它专门为神经网络计算设计,不仅算力强劲,功耗控制得也不错,最关键的是灵活性很好,可以根据不同场景进行裁剪。所以,用它来... 背景最近几年,AI 大模型火得一塌糊涂,特别是像 Llama 这样的开源模型,几乎成了每个技术团队都在讨论的热点。不过,这些"巨无霸"模型虽然能力超强,但对硬件的要求也高得吓人。这时候,华为的昇腾 NPU 就派上用场了。说实话,昇腾 NPU 在 AI 计算这块确实有两把刷子。它专门为神经网络计算设计,不仅算力强劲,功耗控制得也不错,最关键的是灵活性很好,可以根据不同场景进行裁剪。所以,用它来...
- 昇腾实战|算子模板库Catlass与CANN生态适配 昇腾实战|算子模板库Catlass与CANN生态适配
- 昇腾实战 | 昇腾 NPU 异构编程与 GEMM 调优核心方法 昇腾实战 | 昇腾 NPU 异构编程与 GEMM 调优核心方法
- 昇腾平台 PyTorch 迁移实操:从环境搭建到精度达标的完整步骤 昇腾平台 PyTorch 迁移实操:从环境搭建到精度达标的完整步骤
- 华为CANN算子开发全解析:从基础概念到高性能数据排布在深度学习领域,算子(Operator,简称OP)是模型计算的基本单元。每一个算子承载了特定的数学运算逻辑,例如卷积(Convolution)、池化(Pooling)、归一化(Softmax)、激活函数(ReLU)等。华为CANN(Compute Architecture for Neural Networks)框架提供了强大的算子支持... 华为CANN算子开发全解析:从基础概念到高性能数据排布在深度学习领域,算子(Operator,简称OP)是模型计算的基本单元。每一个算子承载了特定的数学运算逻辑,例如卷积(Convolution)、池化(Pooling)、归一化(Softmax)、激活函数(ReLU)等。华为CANN(Compute Architecture for Neural Networks)框架提供了强大的算子支持...
- 深入解析华为CANN算子开发:从入图到动态Shape推导随着AI计算的不断发展,华为昇腾AI处理器及其CANN算子开发框架在高性能算子实现和图优化中扮演着核心角色。本文将深入解析CANN算子开发的全流程,重点讲解入图阶段的Shape与DataType推导、数据依赖处理及动态输出Shape推导,为开发者提供实践参考。 一、算子开发与入图的概述在传统算子开发中,开发者通常关注算子核心计算逻辑,... 深入解析华为CANN算子开发:从入图到动态Shape推导随着AI计算的不断发展,华为昇腾AI处理器及其CANN算子开发框架在高性能算子实现和图优化中扮演着核心角色。本文将深入解析CANN算子开发的全流程,重点讲解入图阶段的Shape与DataType推导、数据依赖处理及动态输出Shape推导,为开发者提供实践参考。 一、算子开发与入图的概述在传统算子开发中,开发者通常关注算子核心计算逻辑,...
- 华为CANN多核Tiling算子开发详解随着AI算力需求的不断增长,如何高效利用华为Ascend处理器的多核计算能力,成为算子开发的关键技术点。在CANN(Compute Architecture for Neural Networks)框架下,算子开发不仅关注功能实现,更强调性能优化与多核协作。本文将以一个典型的Add算子为例,深入解析在Ascend C方式下,多核Tiling算子开发的... 华为CANN多核Tiling算子开发详解随着AI算力需求的不断增长,如何高效利用华为Ascend处理器的多核计算能力,成为算子开发的关键技术点。在CANN(Compute Architecture for Neural Networks)框架下,算子开发不仅关注功能实现,更强调性能优化与多核协作。本文将以一个典型的Add算子为例,深入解析在Ascend C方式下,多核Tiling算子开发的...
- 深入解析华为CANN算子开发:从Tiling到Kernel实现在AI算子开发中,性能优化与硬件利用率是核心关注点。华为昇腾(Ascend)平台的CANN(Compute Architecture for Neural Networks)提供了一套高效的算子编程框架,使开发者能够充分发挥NPU的计算能力。本文将从算子设计、Tiling策略、核函数实现到临时内存管理等方面,对华为CANN算子开... 深入解析华为CANN算子开发:从Tiling到Kernel实现在AI算子开发中,性能优化与硬件利用率是核心关注点。华为昇腾(Ascend)平台的CANN(Compute Architecture for Neural Networks)提供了一套高效的算子编程框架,使开发者能够充分发挥NPU的计算能力。本文将从算子设计、Tiling策略、核函数实现到临时内存管理等方面,对华为CANN算子开...
- 深入解析华为CANN算子开发:从Tiling到Kernel实现在AI算子开发中,性能优化与硬件利用率是核心关注点。华为昇腾(Ascend)平台的CANN(Compute Architecture for Neural Networks)提供了一套高效的算子编程框架,使开发者能够充分发挥NPU的计算能力。本文将从算子设计、Tiling策略、核函数实现到临时内存管理等方面,对华为CANN算子开... 深入解析华为CANN算子开发:从Tiling到Kernel实现在AI算子开发中,性能优化与硬件利用率是核心关注点。华为昇腾(Ascend)平台的CANN(Compute Architecture for Neural Networks)提供了一套高效的算子编程框架,使开发者能够充分发挥NPU的计算能力。本文将从算子设计、Tiling策略、核函数实现到临时内存管理等方面,对华为CANN算子开...
- 深入华为CANN:Ascend算子编程全面解析随着人工智能算力的不断提升,算子作为AI模型计算的最小单元,其高效开发和优化显得尤为关键。华为Ascend平台的CANN(Compute Architecture for Neural Networks)为开发者提供了完善的算子编程框架,使得在Ascend AI处理器上实现高性能算子成为可能。本文将深入解析CANN算子开发的编程接口、基础与高阶... 深入华为CANN:Ascend算子编程全面解析随着人工智能算力的不断提升,算子作为AI模型计算的最小单元,其高效开发和优化显得尤为关键。华为Ascend平台的CANN(Compute Architecture for Neural Networks)为开发者提供了完善的算子编程框架,使得在Ascend AI处理器上实现高性能算子成为可能。本文将深入解析CANN算子开发的编程接口、基础与高阶...
- 深入解析华为昇腾CANN的静态Tensor算子编程随着AI计算需求的爆炸式增长,算子性能优化成为神经网络推理和训练中的关键环节。华为昇腾(Ascend)平台的CANN(Compute Architecture for Neural Networks)为开发者提供了丰富的算子开发框架,其中静态Tensor编程范式因其低运行时开销和灵活性而备受关注。本文将深入解析静态Tensor编程的设计理念... 深入解析华为昇腾CANN的静态Tensor算子编程随着AI计算需求的爆炸式增长,算子性能优化成为神经网络推理和训练中的关键环节。华为昇腾(Ascend)平台的CANN(Compute Architecture for Neural Networks)为开发者提供了丰富的算子开发框架,其中静态Tensor编程范式因其低运行时开销和灵活性而备受关注。本文将深入解析静态Tensor编程的设计理念...
- 深入解析华为CANN算子编程范式:从矢量到融合算子在AI加速器领域,算子的高效实现是性能优化的关键。华为昇腾CANN(Compute Architecture for Neural Networks)通过其独特的算子编程范式,为开发者提供了高性能算子实现框架。本文将从CANN的抽象硬件架构出发,系统讲解三类典型算子——矢量算子、矩阵算子以及融合算子——的编程模式,并结合示例解析其实现机制。... 深入解析华为CANN算子编程范式:从矢量到融合算子在AI加速器领域,算子的高效实现是性能优化的关键。华为昇腾CANN(Compute Architecture for Neural Networks)通过其独特的算子编程范式,为开发者提供了高性能算子实现框架。本文将从CANN的抽象硬件架构出发,系统讲解三类典型算子——矢量算子、矩阵算子以及融合算子——的编程模式,并结合示例解析其实现机制。...
- 深入解析华为Ascend CANN算子开发:核函数的定义与调用随着人工智能计算的不断发展,算子(Operator)作为深度学习模型底层计算单元的核心组成部分,其性能直接影响模型推理效率。在华为Ascend平台上,CANN(Compute Architecture for Neural Networks)提供了完整的算子开发框架,使开发者能够充分利用Ascend AI处理器的硬件优势。在算子... 深入解析华为Ascend CANN算子开发:核函数的定义与调用随着人工智能计算的不断发展,算子(Operator)作为深度学习模型底层计算单元的核心组成部分,其性能直接影响模型推理效率。在华为Ascend平台上,CANN(Compute Architecture for Neural Networks)提供了完整的算子开发框架,使开发者能够充分利用Ascend AI处理器的硬件优势。在算子...
上滑加载中
推荐直播
-
昇腾AI算法挑战赛-核心算子如何优化?专家带你深度解析2025/11/17 周一 16:00-17:00
王老师 华为算子专家
昇腾AI算法挑战赛进阶赛战鼓催征!本期直播间,我们特邀华为算子专家王老师,为你深度剖析Matmul、wholereducesum等核心算子的底层原理与优化技巧,直击赛题核心。想提升代码效率、冲击更高排名?锁定直播,带你破局!
回顾中 -
AI编码实干派,“码”力全开2026/02/26 周四 15:00-16:30
谈宗玮/于邦旭/丁俊卿/陈云亮/王一男
【中国,深圳,2026年2月26日】,以“AI编码实干派,码力全开”为主题的华为云码道(CodeArts)代码智能体新春发布会在线上成功召开。华为云码道公测版正式发布,为开发者和企业提供具备工程化能力的智能编码解决方案。
回顾中 -
华为云码道-玩转OpenClaw,开启在线养虾模式2026/03/11 周三 19:00-20:00
刘昱,华为云高级工程师/谈心,华为云技术专家/李海仑,上海圭卓智能科技有限公司CEO
OpenClaw 火爆开发者圈,华为云码道最新推出 Skill ——开发者只需输入一句口令,即可部署一个功能完整的「小龙虾」智能体。直播带你玩转华为云码道,玩转OpenClaw
回顾中
热门标签