- 1 下载代码git clone https://github.com/jaywalnut310/vits.gitcd vits注意:有时候可能下载不了代码。这边给镜像加速,https://github.akams.cn/, 2 环境安装推荐使用conda环境安装依赖,这边参考:https://3ms.huawei.com/km/groups/3957721/blogs/d... 1 下载代码git clone https://github.com/jaywalnut310/vits.gitcd vits注意:有时候可能下载不了代码。这边给镜像加速,https://github.akams.cn/, 2 环境安装推荐使用conda环境安装依赖,这边参考:https://3ms.huawei.com/km/groups/3957721/blogs/d...
- 前期准备1. 一台昇腾服务器;操作系统以及NPU型号最好跟客户现场保持一致, CPU架构必须保持一致,否则制作的镜像不兼容(本案例以OpenEuler, aarch64架构, 910B为例) 。 通常客户现场的昇腾服务器已经安装好NPU驱动和固件。 如果家里的测试环境需要自己安装,可以参考: 安装NPU驱动和固件-软件安装-软件安装-CANN社区版8.1.RC1.alpha001开发文档-昇... 前期准备1. 一台昇腾服务器;操作系统以及NPU型号最好跟客户现场保持一致, CPU架构必须保持一致,否则制作的镜像不兼容(本案例以OpenEuler, aarch64架构, 910B为例) 。 通常客户现场的昇腾服务器已经安装好NPU驱动和固件。 如果家里的测试环境需要自己安装,可以参考: 安装NPU驱动和固件-软件安装-软件安装-CANN社区版8.1.RC1.alpha001开发文档-昇...
- 1. 项目介绍 ProPainter是一个去掉视频里的静止和移动水印图像的AI项目。ProPainter项目地址:https://github.com/sczhou/ProPainter。 经过改写的资源包propainter_ascend20251029.zip支持使用昇腾910B显卡训练ProPainter,里面包含改写后的代码,已标注的训练数据(包括训练集和验证集)。 2. 安装训练环... 1. 项目介绍 ProPainter是一个去掉视频里的静止和移动水印图像的AI项目。ProPainter项目地址:https://github.com/sczhou/ProPainter。 经过改写的资源包propainter_ascend20251029.zip支持使用昇腾910B显卡训练ProPainter,里面包含改写后的代码,已标注的训练数据(包括训练集和验证集)。 2. 安装训练环...
- 一、运行环境准备1.拉取镜像docker pull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/device/paddle-npu:cann800-ubuntu20-npu-910b-base-aarch64-gcc842.启动容器docker run -it --name paddle-npu-dev -v $(pwd):/work \ --privil... 一、运行环境准备1.拉取镜像docker pull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/device/paddle-npu:cann800-ubuntu20-npu-910b-base-aarch64-gcc842.启动容器docker run -it --name paddle-npu-dev -v $(pwd):/work \ --privil...
- 检查环境1、SSH登录机器后,检查NPU设备状态。运行如下命令,返回NPU设备信息。npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态npu-smi info -l | grep Total # 在每个实例节点上运行此命令可以看到总卡数,用来确认对应卡数已经挂载npu-smi info -t board -i 1 | eg... 检查环境1、SSH登录机器后,检查NPU设备状态。运行如下命令,返回NPU设备信息。npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态npu-smi info -l | grep Total # 在每个实例节点上运行此命令可以看到总卡数,用来确认对应卡数已经挂载npu-smi info -t board -i 1 | eg...
- 当前主流的深度学习框架提供了Eager(Eager Execution,即时执行)模式和图模式的运行方式。Eager模式的特点是每个计算操作下发后立即执行,而图模式则是将所有计算操作构造成一张图,以图的形式下发执行。相较于单个计算操作依次下发的方式,图模式具备图的全局视角,能够更有效地简化和优化计算图操作,从而获得更优执行性能。图引擎(Graph Engine,简称GE)是昇腾平台计算图编译... 当前主流的深度学习框架提供了Eager(Eager Execution,即时执行)模式和图模式的运行方式。Eager模式的特点是每个计算操作下发后立即执行,而图模式则是将所有计算操作构造成一张图,以图的形式下发执行。相较于单个计算操作依次下发的方式,图模式具备图的全局视角,能够更有效地简化和优化计算图操作,从而获得更优执行性能。图引擎(Graph Engine,简称GE)是昇腾平台计算图编译...
- Ascend C编程语言从入门到精通:算子开发实战指南昇腾CANN训练营简介2025年昇腾CANN训练营焕新升级,依托CANN全面开源开放,推出四大定制化专题课程,满足开发者不同阶段的学习需求,快速提升Ascend C算子开发技术。无论你是零基础入门还是进阶提升,都能在这里找到适合自己的学习路径。完成Ascend C算子中级认证和社区任务,即可领取精美证书,更有机会赢取华为手机、平板、开发板... Ascend C编程语言从入门到精通:算子开发实战指南昇腾CANN训练营简介2025年昇腾CANN训练营焕新升级,依托CANN全面开源开放,推出四大定制化专题课程,满足开发者不同阶段的学习需求,快速提升Ascend C算子开发技术。无论你是零基础入门还是进阶提升,都能在这里找到适合自己的学习路径。完成Ascend C算子中级认证和社区任务,即可领取精美证书,更有机会赢取华为手机、平板、开发板...
- 昇腾Atlas 800I A2部署Qwen2.5-7B实战记录在AI大模型应用日益普及的今天,如何选择合适的推理平台成为了许多开发者关注的焦点。本文记录了在华为昇腾Atlas 800I A2推理卡上部署Qwen2.5-7B-Instruct模型的完整过程,包括环境搭建、模型部署、性能调优等关键步骤,希望能为有类似需求的朋友提供参考。 1. 硬件环境准备 1.1 基础配置确认在开始部署前,需... 昇腾Atlas 800I A2部署Qwen2.5-7B实战记录在AI大模型应用日益普及的今天,如何选择合适的推理平台成为了许多开发者关注的焦点。本文记录了在华为昇腾Atlas 800I A2推理卡上部署Qwen2.5-7B-Instruct模型的完整过程,包括环境搭建、模型部署、性能调优等关键步骤,希望能为有类似需求的朋友提供参考。 1. 硬件环境准备 1.1 基础配置确认在开始部署前,需...
- 基于开发者空间昇腾云开发环境完成CANN算子开发实践 基于开发者空间昇腾云开发环境完成CANN算子开发实践
- 从 NV Apex 到 Apex for Ascend:混合精度训练在昇腾平台的适配与编译全流程解析一、背景:从 NV Apex 到 Ascend 适配在 PyTorch 生态中,NVIDIA Apex 一直是混合精度训练(Automatic Mixed Precision, AMP)的核心工具。它能有效降低显存占用、加快模型训练速度,是深度学习训练中极为重要的性能优化手段。随着华为昇腾 N... 从 NV Apex 到 Apex for Ascend:混合精度训练在昇腾平台的适配与编译全流程解析一、背景:从 NV Apex 到 Ascend 适配在 PyTorch 生态中,NVIDIA Apex 一直是混合精度训练(Automatic Mixed Precision, AMP)的核心工具。它能有效降低显存占用、加快模型训练速度,是深度学习训练中极为重要的性能优化手段。随着华为昇腾 N...
- CANN算子开发实战:从概念到代码完整指南昇腾CANN训练营简介2025年昇腾CANN训练营焕新升级,依托CANN全面开源开放,推出四大定制化专题课程,满足开发者不同阶段的学习需求,快速提升Ascend C算子开发技术。无论你是零基础入门还是进阶提升,都能在这里找到适合自己的学习路径。完成Ascend C算子中级认证和社区任务,即可领取精美证书,更有机会赢取华为手机、平板、开发板等大奖。报名... CANN算子开发实战:从概念到代码完整指南昇腾CANN训练营简介2025年昇腾CANN训练营焕新升级,依托CANN全面开源开放,推出四大定制化专题课程,满足开发者不同阶段的学习需求,快速提升Ascend C算子开发技术。无论你是零基础入门还是进阶提升,都能在这里找到适合自己的学习路径。完成Ascend C算子中级认证和社区任务,即可领取精美证书,更有机会赢取华为手机、平板、开发板等大奖。报名...
- 昇腾CANN自定义算子:攻克多模态数据稀疏性与动态性的性能堡垒 从文本到音频:多模态UGC数据的统一挑战在当今海量的用户生成内容(UGC)处理中,文本数据(评论、弹幕、标题)与音频数据(语音识别结果、背景音乐特征)正成为AI模型训练与推理的重要输入源。这些数据经过特征提取(如NLP的Token Embedding、音频的MFCC/梅尔频谱特征)后,普遍呈现出一个关键特征:高维稀疏性。以语音... 昇腾CANN自定义算子:攻克多模态数据稀疏性与动态性的性能堡垒 从文本到音频:多模态UGC数据的统一挑战在当今海量的用户生成内容(UGC)处理中,文本数据(评论、弹幕、标题)与音频数据(语音识别结果、背景音乐特征)正成为AI模型训练与推理的重要输入源。这些数据经过特征提取(如NLP的Token Embedding、音频的MFCC/梅尔频谱特征)后,普遍呈现出一个关键特征:高维稀疏性。以语音...
- 昇腾AI实战:基于AscendCL的YOLOv5目标检测应用开发本文将详细介绍如何在昇腾芯片上使用AscendCL开发一个完整的目标检测应用,基于预训练的YOLOv5模型实现高效的目标检测推理流程。 1. 项目概述与准备 项目目标开发一个能够实时检测图像中多种物体的目标检测程序,实现从输入图像到检测框和类别输出的完整推理流程。 完整工作流程模型加载:将预编译的YOLOv5模型(.om文件)... 昇腾AI实战:基于AscendCL的YOLOv5目标检测应用开发本文将详细介绍如何在昇腾芯片上使用AscendCL开发一个完整的目标检测应用,基于预训练的YOLOv5模型实现高效的目标检测推理流程。 1. 项目概述与准备 项目目标开发一个能够实时检测图像中多种物体的目标检测程序,实现从输入图像到检测框和类别输出的完整推理流程。 完整工作流程模型加载:将预编译的YOLOv5模型(.om文件)...
- 昇腾CANN性能调优实战:从数据驱动到极致优化 摘要本文深入探讨昇腾平台Ascend C程序的系统化性能优化方法论。以msprof性能分析工具为核心,构建从性能瓶颈定位、数据依赖分析到资源利用率优化的完整技术体系。通过向量加法、矩阵乘法等真实场景案例,详细展示Double Buffer、内存访问模式优化、向量化计算等关键技术的实现与效果。提供企业级性能调优工作流,帮助开发者实现算子性能3-... 昇腾CANN性能调优实战:从数据驱动到极致优化 摘要本文深入探讨昇腾平台Ascend C程序的系统化性能优化方法论。以msprof性能分析工具为核心,构建从性能瓶颈定位、数据依赖分析到资源利用率优化的完整技术体系。通过向量加法、矩阵乘法等真实场景案例,详细展示Double Buffer、内存访问模式优化、向量化计算等关键技术的实现与效果。提供企业级性能调优工作流,帮助开发者实现算子性能3-...
- 无论选择哪种路径,都应建立“分析-优化-验证”的迭代流程。利用昇腾提供的Profiler、Memory Tracer等工具链,精准定位瓶颈,实施针对性优化。例如,一个2048x2048的MatMul算子,经过系统化优化后,性能可从初始的512ms(3.2 TFLOPS)提升至92ms(17.8 TFLOPS)。 无论选择哪种路径,都应建立“分析-优化-验证”的迭代流程。利用昇腾提供的Profiler、Memory Tracer等工具链,精准定位瓶颈,实施针对性优化。例如,一个2048x2048的MatMul算子,经过系统化优化后,性能可从初始的512ms(3.2 TFLOPS)提升至92ms(17.8 TFLOPS)。
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签