- 该案例基于昇腾服务器,以广告词生成任务为例,使用 11 万数据对 GLM4-9B-Chat 模型进行微调。涵盖服务器购买、环境安装、模型与数据集下载、数据预处理、模型微调、评估及推理等流程,介绍了在昇腾环境下基于 LLaMa Factory 框架进行模型优化的具体操作与方法。 该案例基于昇腾服务器,以广告词生成任务为例,使用 11 万数据对 GLM4-9B-Chat 模型进行微调。涵盖服务器购买、环境安装、模型与数据集下载、数据预处理、模型微调、评估及推理等流程,介绍了在昇腾环境下基于 LLaMa Factory 框架进行模型优化的具体操作与方法。
- 开发者的“超级引擎”来了;华为开发者空间学习课程最全干货~;华为云Serverless技术方案重构车联网底层逻辑,让数据从“技术成本黑洞”变为“用户体验引擎”。 开发者的“超级引擎”来了;华为开发者空间学习课程最全干货~;华为云Serverless技术方案重构车联网底层逻辑,让数据从“技术成本黑洞”变为“用户体验引擎”。
- 根据不同的应用场景,昇腾CANN的算子加速库内置了多种MC²通算融合类算子,典型算子包括AllGatherMatMul、MatMulReduceScatter、MatMulAllReduce等。这些算子将AllReduce、ReduceScatter、AllGather等通信过程与MatMul计算进行融合,使SP、TP等并行场景下的通信和矩阵计算实现流水并行,从而加速大模型的执行。 根据不同的应用场景,昇腾CANN的算子加速库内置了多种MC²通算融合类算子,典型算子包括AllGatherMatMul、MatMulReduceScatter、MatMulAllReduce等。这些算子将AllReduce、ReduceScatter、AllGather等通信过程与MatMul计算进行融合,使SP、TP等并行场景下的通信和矩阵计算实现流水并行,从而加速大模型的执行。
- 聚焦 AI 与云计算的深度融合,围绕DeepSeek在云上的应用案例,探讨如何利用 AI 驱动云上应用创新,分享丰富的DeepSeek与华为云结合的优秀案例与实践。 聚焦 AI 与云计算的深度融合,围绕DeepSeek在云上的应用案例,探讨如何利用 AI 驱动云上应用创新,分享丰富的DeepSeek与华为云结合的优秀案例与实践。
- msModelSlim支持多种模型压缩算法(包括量化压缩、稀疏压缩等),为开发者提供更加灵活、高效的模型压缩量化方案。 msModelSlim支持多种模型压缩算法(包括量化压缩、稀疏压缩等),为开发者提供更加灵活、高效的模型压缩量化方案。
- 华为云昇腾云服务已适配DeepSeek系列模型,欢迎广大开发者使用。 华为云昇腾云服务已适配DeepSeek系列模型,欢迎广大开发者使用。
- DeepSeek系列模型首发即支持昇腾平台,让用户能够在昇腾硬件和MindIE推理引擎上实现高效推理; TinyEngine 低代码引擎服务端 Java 版本代码的开源,让开发者能够深入了解 TinyEngine 低代码引擎的前后端运行机制;带你快速搭建基于DeepSeek-R1-Distill-Qwen-32B的Dify工作流最佳实践,实现从知识库或者搜索引擎进行检索... DeepSeek系列模型首发即支持昇腾平台,让用户能够在昇腾硬件和MindIE推理引擎上实现高效推理; TinyEngine 低代码引擎服务端 Java 版本代码的开源,让开发者能够深入了解 TinyEngine 低代码引擎的前后端运行机制;带你快速搭建基于DeepSeek-R1-Distill-Qwen-32B的Dify工作流最佳实践,实现从知识库或者搜索引擎进行检索...
- 基于昇腾用PyTorch实现传统CTR模型WideDeep网络本文主要介绍如何在昇腾上使用pytorch对推荐系统中经典的网络模型WideDeep网络进行训练的实战讲解,使用数据集是criteo,主要内容分为以下几个模块:推荐系统概述WideDeep网络创新点介绍WideDeep的网络架构剖析及搭建使用criteo数据集训练WideDeep网络实战 - criteo数据集介绍 - 模型... 基于昇腾用PyTorch实现传统CTR模型WideDeep网络本文主要介绍如何在昇腾上使用pytorch对推荐系统中经典的网络模型WideDeep网络进行训练的实战讲解,使用数据集是criteo,主要内容分为以下几个模块:推荐系统概述WideDeep网络创新点介绍WideDeep的网络架构剖析及搭建使用criteo数据集训练WideDeep网络实战 - criteo数据集介绍 - 模型...
- 本文主要介绍了如何在昇腾上,使用pytorch对经典的图神经网络GraphSage在论文引用CiteSeer数据集上进行分类训练的实战讲解。内容包括GraphSage创新点分析、GraphSage算法原理、GraphSage网络架构剖析与GraphSage网络模型代码实战分析等等。本实验的目录结构安排如下所示:GraphSage创新点分析GraphSage算法原理GraphSage网络架构剖... 本文主要介绍了如何在昇腾上,使用pytorch对经典的图神经网络GraphSage在论文引用CiteSeer数据集上进行分类训练的实战讲解。内容包括GraphSage创新点分析、GraphSage算法原理、GraphSage网络架构剖析与GraphSage网络模型代码实战分析等等。本实验的目录结构安排如下所示:GraphSage创新点分析GraphSage算法原理GraphSage网络架构剖...
- 感受深度思考的震撼,通俗易懂地带你了解为什么DeepSeek会如此之火? 感受深度思考的震撼,通俗易懂地带你了解为什么DeepSeek会如此之火?
- Dify是一款开源的 LLM 应用开发平台,提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力,轻松构建和运营生成式 AI 原生应用。本文将带你快速搭建基于DeepSeek-R1-Distill-Qwen-32B的Dify工作流最佳实践,实现从知识库或者搜索引擎进行检索。 Dify是一款开源的 LLM 应用开发平台,提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力,轻松构建和运营生成式 AI 原生应用。本文将带你快速搭建基于DeepSeek-R1-Distill-Qwen-32B的Dify工作流最佳实践,实现从知识库或者搜索引擎进行检索。
- DeepSeek系列模型首发即支持昇腾平台,让用户能够在昇腾硬件和MindIE推理引擎上实现高效推理。 DeepSeek系列模型首发即支持昇腾平台,让用户能够在昇腾硬件和MindIE推理引擎上实现高效推理。
- 全新的ENS企业网络服务,专为政企客户的混合多态环境设计,致力于消除网络孤岛和应用孤岛,为客户提供“一张网”的视角;华为云数据库GaussDB以16.1%的市场份额,位列关系型数据库本地部署模式本土厂商第一名。这也是自2020上半年以来,GaussDB连续九次蝉联第一,持续领跑... 全新的ENS企业网络服务,专为政企客户的混合多态环境设计,致力于消除网络孤岛和应用孤岛,为客户提供“一张网”的视角;华为云数据库GaussDB以16.1%的市场份额,位列关系型数据库本地部署模式本土厂商第一名。这也是自2020上半年以来,GaussDB连续九次蝉联第一,持续领跑...
- 1. 背景介绍开源for Huawei(参考:https://developer.huaweicloud.com/programs/opensource/contributing/)通过和公司、高校、社区的开发者合作,完成鲲鹏、昇腾、欧拉、鸿蒙、高斯、云服务等与开源软件的适配开发,帮助繁荣Huawei的基础生态,同时让开源软件能够更加简单、高效的运行于华为云上。开始之前,开发者可以下... 1. 背景介绍开源for Huawei(参考:https://developer.huaweicloud.com/programs/opensource/contributing/)通过和公司、高校、社区的开发者合作,完成鲲鹏、昇腾、欧拉、鸿蒙、高斯、云服务等与开源软件的适配开发,帮助繁荣Huawei的基础生态,同时让开源软件能够更加简单、高效的运行于华为云上。开始之前,开发者可以下...
- 本专题介绍常见的深度学习分布式训练的并行策略和背后使用到的集合通信操作,希望能帮助读者理解分布式训练的原理,以及集合通信之于分布式训练的重要性和必要性。 本专题介绍常见的深度学习分布式训练的并行策略和背后使用到的集合通信操作,希望能帮助读者理解分布式训练的原理,以及集合通信之于分布式训练的重要性和必要性。
上滑加载中
推荐直播
-
基于开源鸿蒙+海思星闪开发板:嵌入式系统开发实战(Day1)
2025/03/29 周六 09:00-18:00
华为开发者布道师
本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用,涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容,旨在帮助学员全面掌握相关技术并进行实际操作
回顾中 -
基于开源鸿蒙+海思星闪开发板:嵌入式系统开发实战(Day2)
2025/03/30 周日 09:00-12:00
华为开发者布道师
本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用,涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容,旨在帮助学员全面掌握相关技术并进行实际操作
回顾中 -
从AI基础到昇腾:大模型初探、DeepSeek解析与昇腾入门
2025/04/02 周三 16:00-17:30
不易 / 华为云学堂技术讲师
昇腾是华为研发的AI芯片,其具有哪些能力?我们如何基于其进行开发?本期直播将从AI以及大模型基础知识开始,介绍人工智能核心概念、昇腾AI基础软硬件平台以及昇腾专区,旨在为零基础或入门级学习者搭建从AI基础知识到昇腾技术的完整学习路径。
回顾中
热门标签