昇腾_标签_开发者_华为云

博客(1.1k)
视频(22)
论坛(0)
云声(1.2k)
代码示例(0)

深入解析华为昇腾 CANN 算子开发与抽象硬件架构
深入解析华为昇腾 CANN 算子开发与抽象硬件架构随着人工智能计算需求的快速增长，硬件与软件的高效协同成为提升AI性能的关键。华为昇腾AI处理器（Ascend AI Processor）通过CANN（Compute Architecture for Neural Networks）框架，为开发者提供了高性能、可扩展的算子开发能力。在本文中，我们将深入解析昇腾AI Core的抽象硬件架构，并...

柠檬🍋
发表于2025-11-28 10:31:51
7108 0 0

7.1k 0 0

深入解析华为昇腾 CANN 算子开发与抽象硬件架构随着人工智能计算需求的快速增长，硬件与软件的高效协同成为提升AI性能的关键。华为昇腾AI处理器（Ascend AI Processor）通过CANN（Compute Architecture for Neural Networks）框架，为开发者提供了高性能、可扩展的算子开发能力。在本文中，我们将深入解析昇腾AI Core的抽象硬件架构，并...
昇腾
华为CANN自定义算子开发全流程解析 —— 以Add算子为例
华为CANN自定义算子开发全流程解析 —— 以Add算子为例随着AI算力的快速发展，硬件加速器在深度学习模型的高效执行中扮演着重要角色。华为Ascend系列NPU提供了强大的计算能力，而CANN（Compute Architecture for Neural Networks）则为开发者提供了丰富的算子开发工具和接口。在本文中，我们将通过一个具体示例——Add自定义算子，详细解析Ascen...

柠檬🍋
发表于2025-11-28 10:31:14
2550 0 0

2.5k 0 0

华为CANN自定义算子开发全流程解析 —— 以Add算子为例随着AI算力的快速发展，硬件加速器在深度学习模型的高效执行中扮演着重要角色。华为Ascend系列NPU提供了强大的计算能力，而CANN（Compute Architecture for Neural Networks）则为开发者提供了丰富的算子开发工具和接口。在本文中，我们将通过一个具体示例——Add自定义算子，详细解析Ascen...
昇腾
华为 CANN 算子开发全解析：从执行模型到工程化落地的深度实践指南
华为 CANN 算子开发全解析：从执行模型到工程化落地的深度实践指南在大模型时代，AI 基础设施不再以纯硬件算力为核心竞争力，真正决定训练与推理效率的，是算力能否被充分释放。而在华为 Ascend 处理器体系中，这一切的底层基础能力都通过 CANN（Compute Architecture for Neural Networks）提供的算子机制得以构建。算子不仅是算力的最小调度单元，更是模...

柠檬🍋
发表于2025-11-26 13:47:54
2024 0 0

2.0k 0 0

华为 CANN 算子开发全解析：从执行模型到工程化落地的深度实践指南在大模型时代，AI 基础设施不再以纯硬件算力为核心竞争力，真正决定训练与推理效率的，是算力能否被充分释放。而在华为 Ascend 处理器体系中，这一切的底层基础能力都通过 CANN（Compute Architecture for Neural Networks）提供的算子机制得以构建。算子不仅是算力的最小调度单元，更是模...
昇腾
深入解析华为CANN算子开发-从TensorFlow框架到昇腾AI执行
深入解析华为CANN算子开发-从TensorFlow框架到昇腾AI执行（训练营深度实战篇）在人工智能加速器的开发实践中，算子（Operator）是连接高层框架与底层硬件的关键纽带。华为昇腾AI处理器通过CANN（Compute Architecture for Neural Networks）提供了高性能算子开发框架，使开发者能够将主流深度学习框架如TensorFlow的算子映射到硬件上执...

柠檬🍋
发表于2025-11-26 11:26:39
1354 0 0

1.3k 0 0

深入解析华为CANN算子开发-从TensorFlow框架到昇腾AI执行（训练营深度实战篇）在人工智能加速器的开发实践中，算子（Operator）是连接高层框架与底层硬件的关键纽带。华为昇腾AI处理器通过CANN（Compute Architecture for Neural Networks）提供了高性能算子开发框架，使开发者能够将主流深度学习框架如TensorFlow的算子映射到硬件上执...
TensorFlow 昇腾
华为CANN昇腾算子开发深度解析与实战
华为CANN算子开发深度解析在深度学习模型加速中，算子是最核心的计算单元，而华为CANN框架为昇腾AI处理器提供了完整的算子开发与优化生态。CANN不仅允许开发者实现单个算子的高性能Kernel，还支持算子入图，通过GE（Graph Engine）在图模式下优化模型执行效率，减少内存占用，并支持多流并行和内存复用。算子开发流程以工程化为基础：首先通过msOpGen创建算子工程，定义算子原型...

柠檬🍋
发表于2025-11-26 11:25:26
1196 0 0

1.1k 0 0

华为CANN算子开发深度解析在深度学习模型加速中，算子是最核心的计算单元，而华为CANN框架为昇腾AI处理器提供了完整的算子开发与优化生态。CANN不仅允许开发者实现单个算子的高性能Kernel，还支持算子入图，通过GE（Graph Engine）在图模式下优化模型执行效率，减少内存占用，并支持多流并行和内存复用。算子开发流程以工程化为基础：首先通过msOpGen创建算子工程，定义算子原型...
昇腾
深入理解华为昇腾 CANN 算子体系：AI Core 与 AI CPU 的协同计算机制
在昇腾 AI 全栈软件体系中，CANN（Compute Architecture for Neural Networks）算子是模型能够在昇腾处理器高效运行的核心基础。不同于一般意义上的 AI 框架算子实现，CANN算子体系直接面向底层硬件，围绕多种计算单元提供高性能执行路径。理解算子类型、开发方式以及编译运行流程，对于算子开发者、框架适配人员乃至模型性能调优者，都具有关键价值。

柠檬🍋
发表于2025-11-26 11:24:33
2071 0 0

2.0k 0 0

在昇腾 AI 全栈软件体系中，CANN（Compute Architecture for Neural Networks）算子是模型能够在昇腾处理器高效运行的核心基础。不同于一般意义上的 AI 框架算子实现，CANN算子体系直接面向底层硬件，围绕多种计算单元提供高性能执行路径。理解算子类型、开发方式以及编译运行流程，对于算子开发者、框架适配人员乃至模型性能调优者，都具有关键价值。
昇腾
昇腾CANN算子-基于 TBE DSL 的自定义算子开发全流程解析
CANN算子-基于 TBE DSL 的自定义算子开发全流程解析（训练营深度实践篇）在昇腾生态不断扩大、多样化 AI 工作负载日益增长的今天，如何高效、安全、可控地构建自定义算子成为许多开发者的核心诉求。华为 CANN（Compute Architecture for Neural Networks）提供的 TBE（Tensor Boost Engine）算子开发框架，不仅包含传统 Sche...

柠檬🍋
发表于2025-11-26 11:23:44
1299 0 0

1.2k 0 0

CANN算子-基于 TBE DSL 的自定义算子开发全流程解析（训练营深度实践篇）在昇腾生态不断扩大、多样化 AI 工作负载日益增长的今天，如何高效、安全、可控地构建自定义算子成为许多开发者的核心诉求。华为 CANN（Compute Architecture for Neural Networks）提供的 TBE（Tensor Boost Engine）算子开发框架，不仅包含传统 Sche...
昇腾
昇腾赋能海外主流大模型 | Llama-2-7b深度测评与部署方案【华为根技术】
总体来看，本次实践不仅验证了 Llama-2-7b 在国产平台上的可行性，也让我对国产 AI 算力的成熟度、研发体验以及未来可持续优化方向有了更直观的认知。

柠檬🍋
发表于2025-11-22 17:13:21
2349 0 0

2.3k 0 0

总体来看，本次实践不仅验证了 Llama-2-7b 在国产平台上的可行性，也让我对国产 AI 算力的成熟度、研发体验以及未来可持续优化方向有了更直观的认知。
昇腾
昇腾加持下的Llama 3.2：开源大模型推理性能1B英文原版与3B中文微调模型实测对比【华为根技术】
昇腾在大模型推理中的性能和稳定性令人印象深刻，其硬件加速优势在实际任务中得到了充分验证。配合 GitCode 平台的云端开发环境，开发者能够轻松部署和测试大模型，享受快速、高效、安全的实验体验。无论是科研验证、教学演示还是轻量应用开发，这一组合都提供了强有力的技术支持，为国产 AI 算力生态的发展注入了活力与信心。

柠檬🍋
发表于2025-11-22 17:11:50
1793 0 0

1.7k 0 0

昇腾在大模型推理中的性能和稳定性令人印象深刻，其硬件加速优势在实际任务中得到了充分验证。配合 GitCode 平台的云端开发环境，开发者能够轻松部署和测试大模型，享受快速、高效、安全的实验体验。无论是科研验证、教学演示还是轻量应用开发，这一组合都提供了强有力的技术支持，为国产 AI 算力生态的发展注入了活力与信心。
昇腾机器学习
基于昇腾910B部署测评gptoss实战推理优化指南【华为根技术】
昇腾（Ascend）是由华为自主研发的新一代专用人工智能处理器（AI Processor），核心目标是为深度学习训练与推理任务提供高性能、低功耗的计算支持。与传统 CPU 或 GPU 不同，NPU 采用了 “算子级优化 + 并行加速架构” 的设计理念，其底层指令集与内存控制逻辑完全围绕神经网络计算特点进行优化，能够实现更高的计算密度与能效比。

柠檬🍋
发表于2025-11-22 17:09:54
3708 0 0

3.7k 0 0

昇腾（Ascend）是由华为自主研发的新一代专用人工智能处理器（AI Processor），核心目标是为深度学习训练与推理任务提供高性能、低功耗的计算支持。与传统 CPU 或 GPU 不同，NPU 采用了 “算子级优化 + 并行加速架构” 的设计理念，其底层指令集与内存控制逻辑完全围绕神经网络计算特点进行优化，能够实现更高的计算密度与能效比。
昇腾
CANN在昇腾上的落地实践与图像分类加速应用【华为根技术】
在本次评测中，我们通过图像分类任务的实战演示，完整呈现了 CANN 在 AI 开发流程中的落地应用。从 PyTorch GPU 训练脚本到昇腾 NPU 环境的迁移，CANN 提供了高效、可复用的工具链，使开发者能够在最小改动的前提下，实现训练脚本的快速迁移和加速执行。通过 GPU2Ascend 自动迁移库，原本需要手动适配的模型和算子，现在可以直接在 NPU 上运行，同时保持计算精度和性能一致性。

柠檬🍋
发表于2025-11-22 13:11:29
1307 0 0

1.3k 0 0

在本次评测中，我们通过图像分类任务的实战演示，完整呈现了 CANN 在 AI 开发流程中的落地应用。从 PyTorch GPU 训练脚本到昇腾 NPU 环境的迁移，CANN 提供了高效、可复用的工具链，使开发者能够在最小改动的前提下，实现训练脚本的快速迁移和加速执行。通过 GPU2Ascend 自动迁移库，原本需要手动适配的模型和算子，现在可以直接在 NPU 上运行，同时保持计算精度和性能一致性。
昇腾机器学习
基于昇腾AI的CANN 特性能力解析-简化 AI 开发与提升计算效率【华为根技术】
CANN（Compute Architecture for Neural Networks）作为华为面向昇腾硬件打造的异构计算架构，通过算子库、图引擎、框架适配及开发者工具链，为 AI 应用开发提供了系统化、可复用的解决方案。本篇文章将深入解析 CANN 的特性能力，并结合核心产品特性，展示其在简化 AI 开发和提升计算效率方面的优势。

柠檬🍋
发表于2025-11-22 13:02:53
1881 0 0

1.8k 0 0

CANN（Compute Architecture for Neural Networks）作为华为面向昇腾硬件打造的异构计算架构，通过算子库、图引擎、框架适配及开发者工具链，为 AI 应用开发提供了系统化、可复用的解决方案。本篇文章将深入解析 CANN 的特性能力，并结合核心产品特性，展示其在简化 AI 开发和提升计算效率方面的优势。
昇腾
探索昇腾AI CANN 的创新使用方式与性能优化-创新算子与高效计算【华为根技术】
CANN 通过高效的异构计算架构和灵活的算子调度机制，使单个 NPU 能够在同一时间高效处理图像、音频、文本等多种模态的数据，实现真正的多模态 AI 计算能力。借助 CANN 的算子优化和图引擎调度，开发者可以在保持低延迟的同时处理复杂的数据融合任务，从而支持实时分析和智能决策。在应用场景中，这种高性能多模态处理能力尤为突出。例如，在智能安防系统中，CANN 能够同步处理视频监控画面和环境音频

柠檬🍋
发表于2025-11-22 12:48:19
1284 0 0

1.2k 0 0

CANN 通过高效的异构计算架构和灵活的算子调度机制，使单个 NPU 能够在同一时间高效处理图像、音频、文本等多种模态的数据，实现真正的多模态 AI 计算能力。借助 CANN 的算子优化和图引擎调度，开发者可以在保持低延迟的同时处理复杂的数据融合任务，从而支持实时分析和智能决策。在应用场景中，这种高性能多模态处理能力尤为突出。例如，在智能安防系统中，CANN 能够同步处理视频监控画面和环境音频
昇腾
CANN 开源赋能协同创新：SGLang+Mooncake+CANN HIXL的PD分离D2D部署
一、CANN开源破壁垒：大模型PD分离部署D2D特性快速落地在大模型推理场景中，预填充（Prefill）与解码（Decode）阶段的计算特性差异显著：Prefill 阶段需处理长序列输入，对算力需求集中；Decode 阶段则以 token-by-token 生成为主，存在频繁的数据交互开销。传统部署方案将两者绑定在同一硬件节点，Prefill和Decode阶段共享硬件资源，且存在资源冗余现象...

昇腾CANN
发表于2025-11-19 09:19:39
5673 0 2

5.6k 0 2

一、CANN开源破壁垒：大模型PD分离部署D2D特性快速落地在大模型推理场景中，预填充（Prefill）与解码（Decode）阶段的计算特性差异显著：Prefill 阶段需处理长序列输入，对算力需求集中；Decode 阶段则以 token-by-token 生成为主，存在频繁的数据交互开销。传统部署方案将两者绑定在同一硬件节点，Prefill和Decode阶段共享硬件资源，且存在资源冗余现象...
开发者昇腾
Ascend310部署Qwen-VL-7B实现吸烟动作识别
本文详细介绍了在OrangePi AI Studio上使用Docker容器部署MindIE环境并运行Qwen2.5-VL-7B-Instruct多模态大模型实现吸烟动作识别的完整过程，验证了在Ascned 310p设备上运行多模态理解大模型的可靠性。

HouYanSong
发表于2025-11-16 00:19:33
6291 0 0

6.2k 0 0

本文详细介绍了在OrangePi AI Studio上使用Docker容器部署MindIE环境并运行Qwen2.5-VL-7B-Instruct多模态大模型实现吸烟动作识别的完整过程，验证了在Ascned 310p设备上运行多模态理解大模型的可靠性。
MindSpore 人工智能昇腾计算机视觉边缘计算

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript