昇腾_标签_开发者_华为云

博客(1.1k)
视频(22)
论坛(0)
云声(1.2k)
代码示例(0)

在开发者空间使用YOLOV9_for_PyTorch实现物体检测
本文详细介绍了如何在华为云开发者空间的 AI Notebook 平台上，利用 NPU 910B 环境高效部署并运行 YOLOv9_for_PyTorch 目标检测模型。整个流程分为五个关键步骤：环境初始化、依赖安装、模型权重准备、测试数据准备和推理执行，最终实现了对测试图片的实时目标检测并可视化结果。

chenyunliang
发表于2025-12-13 10:48:09
8081 0 0

8.0k 0 0

本文详细介绍了如何在华为云开发者空间的 AI Notebook 平台上，利用 NPU 910B 环境高效部署并运行 YOLOv9_for_PyTorch 目标检测模型。整个流程分为五个关键步骤：环境初始化、依赖安装、模型权重准备、测试数据准备和推理执行，最终实现了对测试图片的实时目标检测并可视化结果。
pytorch 开发者空间昇腾
Ascend C 核心技术特性
Ascend C 核心技术特性一、Ascend C 技术定位：为何需要昇腾原生编程框架？在 AI 算力需求爆发的背景下，通用编程框架（如 CUDA）难以充分适配昇腾芯片的达芬奇架构（Da Vinci Architecture）特性（如张量计算单元、多级存储体系），导致算力利用率受限。Ascend C 作为昇腾芯片原生的算子开发框架，定位为 “底层算力入口”，核心目标是：极致性能：直...

人工智能-张晨光
发表于2025-12-06 09:14:33
7026 0 0

7.0k 0 0

Ascend C 核心技术特性一、Ascend C 技术定位：为何需要昇腾原生编程框架？在 AI 算力需求爆发的背景下，通用编程框架（如 CUDA）难以充分适配昇腾芯片的达芬奇架构（Da Vinci Architecture）特性（如张量计算单元、多级存储体系），导致算力利用率受限。Ascend C 作为昇腾芯片原生的算子开发框架，定位为 “底层算力入口”，核心目标是：极致性能：直...
昇腾
昇腾NPU运行Llama模型全攻略：环境搭建、性能测试、问题解决一网打尽
背景最近几年，AI 大模型火得一塌糊涂，特别是像 Llama 这样的开源模型，几乎成了每个技术团队都在讨论的热点。不过，这些"巨无霸"模型虽然能力超强，但对硬件的要求也高得吓人。这时候，华为的昇腾 NPU 就派上用场了。说实话，昇腾 NPU 在 AI 计算这块确实有两把刷子。它专门为神经网络计算设计，不仅算力强劲，功耗控制得也不错，最关键的是灵活性很好，可以根据不同场景进行裁剪。所以，用它来...

倔强的石头_
发表于2025-12-03 16:19:33
8522 0 0

8.5k 0 0

背景最近几年，AI 大模型火得一塌糊涂，特别是像 Llama 这样的开源模型，几乎成了每个技术团队都在讨论的热点。不过，这些"巨无霸"模型虽然能力超强，但对硬件的要求也高得吓人。这时候，华为的昇腾 NPU 就派上用场了。说实话，昇腾 NPU 在 AI 计算这块确实有两把刷子。它专门为神经网络计算设计，不仅算力强劲，功耗控制得也不错，最关键的是灵活性很好，可以根据不同场景进行裁剪。所以，用它来...
华为开源镜像站 Mirrors 昇腾
昇腾实战|算子模板库Catlass与CANN生态适配
昇腾实战|算子模板库Catlass与CANN生态适配

是Dream呀
发表于2025-12-03 16:09:26
7141 0 0

7.1k 0 0

昇腾实战|算子模板库Catlass与CANN生态适配
Python 昇腾
昇腾实战 | 昇腾 NPU 异构编程与 GEMM 调优核心方法
昇腾实战 | 昇腾 NPU 异构编程与 GEMM 调优核心方法

是Dream呀
发表于2025-12-03 16:04:12
7143 0 0

7.1k 0 0

昇腾实战 | 昇腾 NPU 异构编程与 GEMM 调优核心方法
昇腾
昇腾平台 PyTorch 迁移实操：从环境搭建到精度达标的完整步骤
昇腾平台 PyTorch 迁移实操：从环境搭建到精度达标的完整步骤

是Dream呀
发表于2025-12-03 15:39:16
8023 0 0

8.0k 0 0

昇腾平台 PyTorch 迁移实操：从环境搭建到精度达标的完整步骤
pytorch 昇腾
华为CANN算子开发全解析：从基础概念到高性能数据排布
华为CANN算子开发全解析：从基础概念到高性能数据排布在深度学习领域，算子（Operator，简称OP）是模型计算的基本单元。每一个算子承载了特定的数学运算逻辑，例如卷积（Convolution）、池化（Pooling）、归一化（Softmax）、激活函数（ReLU）等。华为CANN（Compute Architecture for Neural Networks）框架提供了强大的算子支持...

柠檬🍋
发表于2025-11-28 10:39:01
9605 0 1

9.6k 0 1

华为CANN算子开发全解析：从基础概念到高性能数据排布在深度学习领域，算子（Operator，简称OP）是模型计算的基本单元。每一个算子承载了特定的数学运算逻辑，例如卷积（Convolution）、池化（Pooling）、归一化（Softmax）、激活函数（ReLU）等。华为CANN（Compute Architecture for Neural Networks）框架提供了强大的算子支持...
昇腾深度学习神经网络
深入解析华为CANN算子开发：从入图到动态Shape推导
深入解析华为CANN算子开发：从入图到动态Shape推导随着AI计算的不断发展，华为昇腾AI处理器及其CANN算子开发框架在高性能算子实现和图优化中扮演着核心角色。本文将深入解析CANN算子开发的全流程，重点讲解入图阶段的Shape与DataType推导、数据依赖处理及动态输出Shape推导，为开发者提供实践参考。一、算子开发与入图的概述在传统算子开发中，开发者通常关注算子核心计算逻辑，...

柠檬🍋
发表于2025-11-28 10:38:26
8997 0 0

8.9k 0 0

深入解析华为CANN算子开发：从入图到动态Shape推导随着AI计算的不断发展，华为昇腾AI处理器及其CANN算子开发框架在高性能算子实现和图优化中扮演着核心角色。本文将深入解析CANN算子开发的全流程，重点讲解入图阶段的Shape与DataType推导、数据依赖处理及动态输出Shape推导，为开发者提供实践参考。一、算子开发与入图的概述在传统算子开发中，开发者通常关注算子核心计算逻辑，...
昇腾
华为CANN多核Tiling算子开发详解
华为CANN多核Tiling算子开发详解随着AI算力需求的不断增长，如何高效利用华为Ascend处理器的多核计算能力，成为算子开发的关键技术点。在CANN（Compute Architecture for Neural Networks）框架下，算子开发不仅关注功能实现，更强调性能优化与多核协作。本文将以一个典型的Add算子为例，深入解析在Ascend C方式下，多核Tiling算子开发的...

柠檬🍋
发表于2025-11-28 10:37:49
9055 0 0

9.0k 0 0

华为CANN多核Tiling算子开发详解随着AI算力需求的不断增长，如何高效利用华为Ascend处理器的多核计算能力，成为算子开发的关键技术点。在CANN（Compute Architecture for Neural Networks）框架下，算子开发不仅关注功能实现，更强调性能优化与多核协作。本文将以一个典型的Add算子为例，深入解析在Ascend C方式下，多核Tiling算子开发的...
昇腾
深入解析华为CANN算子开发：从Tiling到Kernel实现
深入解析华为CANN算子开发：从Tiling到Kernel实现在AI算子开发中，性能优化与硬件利用率是核心关注点。华为昇腾（Ascend）平台的CANN（Compute Architecture for Neural Networks）提供了一套高效的算子编程框架，使开发者能够充分发挥NPU的计算能力。本文将从算子设计、Tiling策略、核函数实现到临时内存管理等方面，对华为CANN算子开...

柠檬🍋
发表于2025-11-28 10:37:19
9624 0 0

9.6k 0 0

深入解析华为CANN算子开发：从Tiling到Kernel实现在AI算子开发中，性能优化与硬件利用率是核心关注点。华为昇腾（Ascend）平台的CANN（Compute Architecture for Neural Networks）提供了一套高效的算子编程框架，使开发者能够充分发挥NPU的计算能力。本文将从算子设计、Tiling策略、核函数实现到临时内存管理等方面，对华为CANN算子开...
kernel 昇腾
深入解析华为CANN算子开发：从Tiling到Kernel实现
深入解析华为CANN算子开发：从Tiling到Kernel实现在AI算子开发中，性能优化与硬件利用率是核心关注点。华为昇腾（Ascend）平台的CANN（Compute Architecture for Neural Networks）提供了一套高效的算子编程框架，使开发者能够充分发挥NPU的计算能力。本文将从算子设计、Tiling策略、核函数实现到临时内存管理等方面，对华为CANN算子开...

柠檬🍋
发表于2025-11-28 10:37:06
9197 0 0

9.1k 0 0

深入解析华为CANN算子开发：从Tiling到Kernel实现在AI算子开发中，性能优化与硬件利用率是核心关注点。华为昇腾（Ascend）平台的CANN（Compute Architecture for Neural Networks）提供了一套高效的算子编程框架，使开发者能够充分发挥NPU的计算能力。本文将从算子设计、Tiling策略、核函数实现到临时内存管理等方面，对华为CANN算子开...
kernel 昇腾
深入华为CANN：Ascend算子编程全面解析
深入华为CANN：Ascend算子编程全面解析随着人工智能算力的不断提升，算子作为AI模型计算的最小单元，其高效开发和优化显得尤为关键。华为Ascend平台的CANN（Compute Architecture for Neural Networks）为开发者提供了完善的算子编程框架，使得在Ascend AI处理器上实现高性能算子成为可能。本文将深入解析CANN算子开发的编程接口、基础与高阶...

柠檬🍋
发表于2025-11-28 10:36:34
9320 0 0

9.3k 0 0

深入华为CANN：Ascend算子编程全面解析随着人工智能算力的不断提升，算子作为AI模型计算的最小单元，其高效开发和优化显得尤为关键。华为Ascend平台的CANN（Compute Architecture for Neural Networks）为开发者提供了完善的算子编程框架，使得在Ascend AI处理器上实现高性能算子成为可能。本文将深入解析CANN算子开发的编程接口、基础与高阶...
昇腾
深入解析华为昇腾CANN的静态Tensor算子编程
深入解析华为昇腾CANN的静态Tensor算子编程随着AI计算需求的爆炸式增长，算子性能优化成为神经网络推理和训练中的关键环节。华为昇腾（Ascend）平台的CANN（Compute Architecture for Neural Networks）为开发者提供了丰富的算子开发框架，其中静态Tensor编程范式因其低运行时开销和灵活性而备受关注。本文将深入解析静态Tensor编程的设计理念...

柠檬🍋
发表于2025-11-28 10:33:41
9293 0 0

9.2k 0 0

深入解析华为昇腾CANN的静态Tensor算子编程随着AI计算需求的爆炸式增长，算子性能优化成为神经网络推理和训练中的关键环节。华为昇腾（Ascend）平台的CANN（Compute Architecture for Neural Networks）为开发者提供了丰富的算子开发框架，其中静态Tensor编程范式因其低运行时开销和灵活性而备受关注。本文将深入解析静态Tensor编程的设计理念...
开发者昇腾
深入解析华为CANN算子编程范式：从矢量到融合算子
深入解析华为CANN算子编程范式：从矢量到融合算子在AI加速器领域，算子的高效实现是性能优化的关键。华为昇腾CANN（Compute Architecture for Neural Networks）通过其独特的算子编程范式，为开发者提供了高性能算子实现框架。本文将从CANN的抽象硬件架构出发，系统讲解三类典型算子——矢量算子、矩阵算子以及融合算子——的编程模式，并结合示例解析其实现机制。...

柠檬🍋
发表于2025-11-28 10:33:04
9101 0 0

9.1k 0 0

深入解析华为CANN算子编程范式：从矢量到融合算子在AI加速器领域，算子的高效实现是性能优化的关键。华为昇腾CANN（Compute Architecture for Neural Networks）通过其独特的算子编程范式，为开发者提供了高性能算子实现框架。本文将从CANN的抽象硬件架构出发，系统讲解三类典型算子——矢量算子、矩阵算子以及融合算子——的编程模式，并结合示例解析其实现机制。...
昇腾
深入解析华为Ascend CANN算子开发：核函数的定义与调用
深入解析华为Ascend CANN算子开发：核函数的定义与调用随着人工智能计算的不断发展，算子（Operator）作为深度学习模型底层计算单元的核心组成部分，其性能直接影响模型推理效率。在华为Ascend平台上，CANN（Compute Architecture for Neural Networks）提供了完整的算子开发框架，使开发者能够充分利用Ascend AI处理器的硬件优势。在算子...

柠檬🍋
发表于2025-11-28 10:32:34
7890 0 0

7.8k 0 0

深入解析华为Ascend CANN算子开发：核函数的定义与调用随着人工智能计算的不断发展，算子（Operator）作为深度学习模型底层计算单元的核心组成部分，其性能直接影响模型推理效率。在华为Ascend平台上，CANN（Compute Architecture for Neural Networks）提供了完整的算子开发框架，使开发者能够充分利用Ascend AI处理器的硬件优势。在算子...
开发者昇腾

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript