- 本次实践不仅验证了 Llama-2-7b 模型在国产昇腾平台上的可行性与稳定性,更重要的是展现了 中国自主AI算力体系已具备支持主流大模型落地的能力。这对于未来AI大模型的国产化训练与推理具有战略意义,也为科研机构和企业提供了可信赖的本土化替代路径。 本次实践不仅验证了 Llama-2-7b 模型在国产昇腾平台上的可行性与稳定性,更重要的是展现了 中国自主AI算力体系已具备支持主流大模型落地的能力。这对于未来AI大模型的国产化训练与推理具有战略意义,也为科研机构和企业提供了可信赖的本土化替代路径。
- 本文详细阐述了在OrangePi AI Studio Pro上基于昇腾310P使用MindYolo框架实现YOLOv8模型训练与验证的完整流程,涵盖环境准备、数据集格式转换、模型训练参数配置及性能评估。 本文详细阐述了在OrangePi AI Studio Pro上基于昇腾310P使用MindYolo框架实现YOLOv8模型训练与验证的完整流程,涵盖环境准备、数据集格式转换、模型训练参数配置及性能评估。
- 在AI模型运行过程中,通常需要CPU和AI专用处理器(如昇腾AI处理器)协同工作。CPU所在位置称为主机端(Host),而NPU所在位置称为设备端(Device)。主机端擅长处理复杂的逻辑计算,而设备端擅长进行高并行计算。通过高效的计算调度机制,实现Host和Device之间的高效协同是提高AI模型性能的关键,能够显著提升异构系统资源的利用率。 在AI模型运行过程中,通常需要CPU和AI专用处理器(如昇腾AI处理器)协同工作。CPU所在位置称为主机端(Host),而NPU所在位置称为设备端(Device)。主机端擅长处理复杂的逻辑计算,而设备端擅长进行高并行计算。通过高效的计算调度机制,实现Host和Device之间的高效协同是提高AI模型性能的关键,能够显著提升异构系统资源的利用率。
- 截至目前,华为云已将重大事故为零的记录连续保持了756天,“我们相信,安全、稳定、高质量、持续创新正是客户选择华为云的核心理由。”张平安说。 截至目前,华为云已将重大事故为零的记录连续保持了756天,“我们相信,安全、稳定、高质量、持续创新正是客户选择华为云的核心理由。”张平安说。
- 问: msopgen里面的-f选项有什么用?会生成什么文件呢?答: 在msopgen工具中,-f选项用于指定生成的算子工程框架类型。具体来说,-f aclnn表示生成的是简易自定义算子工程,该工程支持通过单算子API执行(aclnn)方式进行调用。使用这个选项时,生成的工程将包含算子host侧代码实现文件、kernel侧实现文件以及工程编译配置文件等,这些都是后续进行算子开发所必需的模板文件... 问: msopgen里面的-f选项有什么用?会生成什么文件呢?答: 在msopgen工具中,-f选项用于指定生成的算子工程框架类型。具体来说,-f aclnn表示生成的是简易自定义算子工程,该工程支持通过单算子API执行(aclnn)方式进行调用。使用这个选项时,生成的工程将包含算子host侧代码实现文件、kernel侧实现文件以及工程编译配置文件等,这些都是后续进行算子开发所必需的模板文件...
- 学好AscendC算子开发需要系统掌握昇腾NPU的体系架构和编程范式。在这个过程中,准确理解基础概念尤为重要,因为我们常常被学习课程中同一称谓的说法感到迷茫。一些名词在不同上下文环境中具有不同含义,这给初学者带来了不小的认知挑战。以"Block"这一概念为例,其具体含义会随着应用场景的变化而变化:在并行计算语境下,它指代AI Core的逻辑计算单元在数据切分时,它又代表单核计算所需的数据块大... 学好AscendC算子开发需要系统掌握昇腾NPU的体系架构和编程范式。在这个过程中,准确理解基础概念尤为重要,因为我们常常被学习课程中同一称谓的说法感到迷茫。一些名词在不同上下文环境中具有不同含义,这给初学者带来了不小的认知挑战。以"Block"这一概念为例,其具体含义会随着应用场景的变化而变化:在并行计算语境下,它指代AI Core的逻辑计算单元在数据切分时,它又代表单核计算所需的数据块大...
- 1、实验介绍1.1、实验平台介绍本实验详细描述了如何在华为开发者空间 AI NoteBook 上搭建昇腾 Ascend C 算子开发环境,并开发一个AddCustom 自定义算子。1.1.1、华为开发者空间简介华为开发者空间官网地址:https://developer.huaweicloud.com/space 在华为开发者空间,每位注册的开发者都将享有年度内数百小时的云主机使用权,配备5G... 1、实验介绍1.1、实验平台介绍本实验详细描述了如何在华为开发者空间 AI NoteBook 上搭建昇腾 Ascend C 算子开发环境,并开发一个AddCustom 自定义算子。1.1.1、华为开发者空间简介华为开发者空间官网地址:https://developer.huaweicloud.com/space 在华为开发者空间,每位注册的开发者都将享有年度内数百小时的云主机使用权,配备5G...
- 昇腾迁移逻辑图 昇腾迁移逻辑图
- DeepSeek 在预测领域已形成技术架构 - 工具链 - 行业方案的完整闭环,通过与华为云的深度协同,实现了从数据标注到边缘部署的端到端能力。对于开发者,建议优先在智能风控、供应链优化等场景进行试点,充分利用华为云的昇腾算力与工具链优势。未来,随着多模态技术的进一步发展,DeepSeek 有望在自动驾驶、能源管理等领域实现更大突破,推动预测技术向智能化、泛在化方向演进。 DeepSeek 在预测领域已形成技术架构 - 工具链 - 行业方案的完整闭环,通过与华为云的深度协同,实现了从数据标注到边缘部署的端到端能力。对于开发者,建议优先在智能风控、供应链优化等场景进行试点,充分利用华为云的昇腾算力与工具链优势。未来,随着多模态技术的进一步发展,DeepSeek 有望在自动驾驶、能源管理等领域实现更大突破,推动预测技术向智能化、泛在化方向演进。
- 各种参考,各种学习,各种填坑,终于搞出来了,现阶段全网独一份,我通过,并且带着一些学生都通过了,确定了逻辑的正确性,希望也能给大家带来一定的帮助。 各种参考,各种学习,各种填坑,终于搞出来了,现阶段全网独一份,我通过,并且带着一些学生都通过了,确定了逻辑的正确性,希望也能给大家带来一定的帮助。
- 也许读者正兴致勃勃的要按照最佳实践文档在昇腾服务器部署大模型,但没走几步,就被异常卡主了。这个异常可能是GitHub无法访问,也可能是pip安装依赖包时报错无法下载。本文以部署Wan2.1训练环境为背景,介绍安装过程中如何解决网络下载软件包的问题。 也许读者正兴致勃勃的要按照最佳实践文档在昇腾服务器部署大模型,但没走几步,就被异常卡主了。这个异常可能是GitHub无法访问,也可能是pip安装依赖包时报错无法下载。本文以部署Wan2.1训练环境为背景,介绍安装过程中如何解决网络下载软件包的问题。
- 大模型参数量选型指南:从业务需求到技术落地的全流程决策框架 大模型参数量选型指南:从业务需求到技术落地的全流程决策框架
- 对于Ascend C算子开发者而言,为了更高效地操作变量,通常需要满足相应的数据对齐要求。例如在使用DataCopy接口进行数据传输时,必须确保搬运的数据长度和操作数在UB上的起始地址为32字节对齐;在进行向量计算时,操作数的起始地址也需满足32字节对齐的要求。然而,在大多数场景下,会遇到大量非对齐的数据情况。本文提供了完整的处理方案,帮助开发者更加灵活地应对数据非对齐的情况。1. 数据非对... 对于Ascend C算子开发者而言,为了更高效地操作变量,通常需要满足相应的数据对齐要求。例如在使用DataCopy接口进行数据传输时,必须确保搬运的数据长度和操作数在UB上的起始地址为32字节对齐;在进行向量计算时,操作数的起始地址也需满足32字节对齐的要求。然而,在大多数场景下,会遇到大量非对齐的数据情况。本文提供了完整的处理方案,帮助开发者更加灵活地应对数据非对齐的情况。1. 数据非对...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签