- 1 Pytorch的compile技术PyTorch 的 torch.compile 是一个强大的功能,用于优化 PyTorch 模型的性能。它通过将 PyTorch 的动态图转换为静态图,并利用 Just-In-Time(JIT)编译技术,显著提高模型的推理速度和训练效率。 1.1 PyTorch torch.compile 的作用torch.compile 是 PyTorch 的一个实... 1 Pytorch的compile技术PyTorch 的 torch.compile 是一个强大的功能,用于优化 PyTorch 模型的性能。它通过将 PyTorch 的动态图转换为静态图,并利用 Just-In-Time(JIT)编译技术,显著提高模型的推理速度和训练效率。 1.1 PyTorch torch.compile 的作用torch.compile 是 PyTorch 的一个实...
- 深圳,2025年3月22日 —— 在今日举办的华为鲲鹏合作伙伴大会上,全爱科技作为华为昇腾与鲲鹏合作伙伴,正式发布面向工业场景的的“后羿"工业计算机解决方案。该方案是基于华为鲲鹏KP920处理器与昇腾A310P构建"CPU+NPU"异构算力架构,采用OpenEuler、麒麟国产操作系统。 全爱科技"昇腾+鲲鹏"双引擎工业计算解决方案全爱科技“后羿”工业计算解决方案推出系列产品,其中QAKP9... 深圳,2025年3月22日 —— 在今日举办的华为鲲鹏合作伙伴大会上,全爱科技作为华为昇腾与鲲鹏合作伙伴,正式发布面向工业场景的的“后羿"工业计算机解决方案。该方案是基于华为鲲鹏KP920处理器与昇腾A310P构建"CPU+NPU"异构算力架构,采用OpenEuler、麒麟国产操作系统。 全爱科技"昇腾+鲲鹏"双引擎工业计算解决方案全爱科技“后羿”工业计算解决方案推出系列产品,其中QAKP9...
- 最近qwen2.5系列模型有点火,在昇腾上跑了一下,发现性能稍微有点弱,于是想采用量化推理来提升一下性能,在昇腾官网找到了这篇指导:https://www.hiascend.com/software/modelzoo/models/detail/bd96097296c3426aa3827a8a7cbeb8c6于是决定采用w8a8量化进行推理性能优化。 1. 下载模型权重建议从魔乐社区下载权重... 最近qwen2.5系列模型有点火,在昇腾上跑了一下,发现性能稍微有点弱,于是想采用量化推理来提升一下性能,在昇腾官网找到了这篇指导:https://www.hiascend.com/software/modelzoo/models/detail/bd96097296c3426aa3827a8a7cbeb8c6于是决定采用w8a8量化进行推理性能优化。 1. 下载模型权重建议从魔乐社区下载权重...
- RFT强化微调是一种新型LLM微调方法,通过强化学习与传统微调结合,少量数据即可显著增强领域场景的模型能力。近期,华为云ModelArts Studio大模型开发平台上线强化微调RFT功能,并支持对盘古大模型进行强化微调训练。本文实验通过仅800条医疗辅诊数据训练,模型领域效果提升达10.5%,显著优于DeepSeek-R1等优质通用推理大模型,为大模型的行业领域快速落地提供全新方案。 RFT强化微调是一种新型LLM微调方法,通过强化学习与传统微调结合,少量数据即可显著增强领域场景的模型能力。近期,华为云ModelArts Studio大模型开发平台上线强化微调RFT功能,并支持对盘古大模型进行强化微调训练。本文实验通过仅800条医疗辅诊数据训练,模型领域效果提升达10.5%,显著优于DeepSeek-R1等优质通用推理大模型,为大模型的行业领域快速落地提供全新方案。
- 过去两年里,大模型可以说外界讨论最多的技术话题,且几乎每一次都会出现这样的疑问:大模型的价值到底在哪里?不少人曾尝试给出答案。在日常工作中,生成式AI的能力渐渐成为一种标配,写文案、生成图像、文本翻译、编程等应用越来越成熟。在日常生活中,一个个智能体深度影响了人们的生活,酝酿出了聊天对话、图生视频、帮点外卖等新奇玩法。不久前举办的昇腾AI创新大赛,从另一个角度进行了回答:在千行万业的细分场景... 过去两年里,大模型可以说外界讨论最多的技术话题,且几乎每一次都会出现这样的疑问:大模型的价值到底在哪里?不少人曾尝试给出答案。在日常工作中,生成式AI的能力渐渐成为一种标配,写文案、生成图像、文本翻译、编程等应用越来越成熟。在日常生活中,一个个智能体深度影响了人们的生活,酝酿出了聊天对话、图生视频、帮点外卖等新奇玩法。不久前举办的昇腾AI创新大赛,从另一个角度进行了回答:在千行万业的细分场景...
- PyTorch 实现GoogleNet用于图像分类本实验主要介绍了如何在昇腾上,使用pytorch对经典的GoogleNet模型在公开的CIFAR10数据集进行分类训练的实战讲解。内容包括GoogleNet模型创新点介绍 、GoogleNet网络架构剖析 与GoogleNet网络模型代码实战分析等等。本实验的目录结构安排如下所示:GoogleNet网络模型创新点介绍GoogleNet的网络... PyTorch 实现GoogleNet用于图像分类本实验主要介绍了如何在昇腾上,使用pytorch对经典的GoogleNet模型在公开的CIFAR10数据集进行分类训练的实战讲解。内容包括GoogleNet模型创新点介绍 、GoogleNet网络架构剖析 与GoogleNet网络模型代码实战分析等等。本实验的目录结构安排如下所示:GoogleNet网络模型创新点介绍GoogleNet的网络...
- PyTorch 实现 Alexnet图像分类本文主要介绍了如何在昇腾上,使用pytorch对经典的Alexnet小模型在公开的CIFAR10数据集进行分类训练的实战讲解。内容包括Alexnet网络模型创新点介绍 、Alexnet的网络架构剖析 与网络模型代码实战分析等等本实验的目录结构安排如下所示:Alexnet网络模型创新点介绍Alexnet的网络架构剖析网络模型代码实战分析 Alexn... PyTorch 实现 Alexnet图像分类本文主要介绍了如何在昇腾上,使用pytorch对经典的Alexnet小模型在公开的CIFAR10数据集进行分类训练的实战讲解。内容包括Alexnet网络模型创新点介绍 、Alexnet的网络架构剖析 与网络模型代码实战分析等等本实验的目录结构安排如下所示:Alexnet网络模型创新点介绍Alexnet的网络架构剖析网络模型代码实战分析 Alexn...
- PyTorch 实现 ResNet50 图像分类本实验主要介绍了如何在昇腾上,使用pytorch对经典的resnet50小模型在公开的CIFAR10数据集进行分类训练的实战讲解。内容包括resnet50的网络架构 ,残差模块分析 ,训练代码分析等等本实验的目录结构安排如下所示:Resnet系列网络结构resnet50网络搭建过程及代码详解端到端训练cifar数据集实战 Resnet系列网络... PyTorch 实现 ResNet50 图像分类本实验主要介绍了如何在昇腾上,使用pytorch对经典的resnet50小模型在公开的CIFAR10数据集进行分类训练的实战讲解。内容包括resnet50的网络架构 ,残差模块分析 ,训练代码分析等等本实验的目录结构安排如下所示:Resnet系列网络结构resnet50网络搭建过程及代码详解端到端训练cifar数据集实战 Resnet系列网络...
- 图神经网络(Graph Neural Networks,GNN)是人工智能领域最火热的课题之一,近年来,越来越多的研究机构和企业投入大量精力研究图神经网络,推出了自己的图学习引擎,并将其广泛应用在社交网络、电商推荐、欺诈检测、知识图谱等领域。目前,主流的开源图学习引擎有DGL,PyG,GraphScope,Angel,PGL等,其基本信息如下:可以看出,DGL和PyG支持的算法数量最多,且... 图神经网络(Graph Neural Networks,GNN)是人工智能领域最火热的课题之一,近年来,越来越多的研究机构和企业投入大量精力研究图神经网络,推出了自己的图学习引擎,并将其广泛应用在社交网络、电商推荐、欺诈检测、知识图谱等领域。目前,主流的开源图学习引擎有DGL,PyG,GraphScope,Angel,PGL等,其基本信息如下:可以看出,DGL和PyG支持的算法数量最多,且...
- 五分钟使用硅基流动部署个人DeepSeek教程SiliconCloud介绍:作为集合顶尖大模型的一站式云服务平台,SiliconCloud致力于为开发者提供更快、更便宜、更全面、体验更丝滑的模型API。SiliconCloud已上架包括Qwen2.5-72B、DeepSeek-V2.5、Qwen2、InternLM2.5-20B-Chat、BCE、BGE、SenseVoice-Small、L... 五分钟使用硅基流动部署个人DeepSeek教程SiliconCloud介绍:作为集合顶尖大模型的一站式云服务平台,SiliconCloud致力于为开发者提供更快、更便宜、更全面、体验更丝滑的模型API。SiliconCloud已上架包括Qwen2.5-72B、DeepSeek-V2.5、Qwen2、InternLM2.5-20B-Chat、BCE、BGE、SenseVoice-Small、L...
- 摘要华为云ModelArts Studio(MaaS)平台迎来重大更新,新增了昇腾适配版DeepSeek-R1蒸馏模型,包括DeepSeek-R1-Distill-Llama-8B、DeepSeek-R1-Distill-Qwen-14B和DeepSeek-R1-Distill-Qwen-32B。这些蒸馏模型在多项能力上达到了与OpenAI o1-mini相当的水平。MaaS平台将Deep... 摘要华为云ModelArts Studio(MaaS)平台迎来重大更新,新增了昇腾适配版DeepSeek-R1蒸馏模型,包括DeepSeek-R1-Distill-Llama-8B、DeepSeek-R1-Distill-Qwen-14B和DeepSeek-R1-Distill-Qwen-32B。这些蒸馏模型在多项能力上达到了与OpenAI o1-mini相当的水平。MaaS平台将Deep...
- 环境介绍CPU:aarch64(鲲鹏920)内存:192GNPU:Huawei Ascend 910B (64G)操作系统:EulerOS 2.0 (SP8)CANN版本:CANN-8.0.RC3.alpha001 环境介绍CPU:aarch64(鲲鹏920)内存:192GNPU:Huawei Ascend 910B (64G)操作系统:EulerOS 2.0 (SP8)CANN版本:CANN-8.0.RC3.alpha001
- 1. 安装docker 链接:https://pan.baidu.com/s/1I5uA0hbrgdBKEP-rxIAAIA?pwd=cmus 提取码:cmus --来自百度网盘超级会员V2的分享2. 获取基础镜像 https://ascendhub.huawei.com/#/index (官方基础镜像) http://mirrors.cn-central-221.ovaijisuan.co... 1. 安装docker 链接:https://pan.baidu.com/s/1I5uA0hbrgdBKEP-rxIAAIA?pwd=cmus 提取码:cmus --来自百度网盘超级会员V2的分享2. 获取基础镜像 https://ascendhub.huawei.com/#/index (官方基础镜像) http://mirrors.cn-central-221.ovaijisuan.co...
- Ascend C Tilling计算 Tilling基本概念介绍大多数情况下,Local Memory的存储,无法完全容纳算子的输入与输出的所有数据,需要每次搬运一部分输入数柜进行计算然后搬出,再敲运下一部分输入数据进行计算,直到得到完愁的最终结果,这个数据切分、分块计算的过程称之为Tiling过程每次激运的那一部分数据块,叫做Tiling块根据算子中不同输入形状确定搬入基本块大小的相关算... Ascend C Tilling计算 Tilling基本概念介绍大多数情况下,Local Memory的存储,无法完全容纳算子的输入与输出的所有数据,需要每次搬运一部分输入数柜进行计算然后搬出,再敲运下一部分输入数据进行计算,直到得到完愁的最终结果,这个数据切分、分块计算的过程称之为Tiling过程每次激运的那一部分数据块,叫做Tiling块根据算子中不同输入形状确定搬入基本块大小的相关算...
- 【摘要】 全爱 QA200DK 采用ATLAS200+Hi3519设计的开发板及开发套件 16T算力 支持双路4K 以超小体积提供超强算力,支持锂电池供电,推动小型无人系统进入双目4K实时视频分析阶段。全爱科技推出机器视觉系列产品,专为教育行业打造。推出模块化的机器人和教育平台,应用案例。服务于华为智能计算生态。 【摘要】 全爱 QA200DK 采用ATLAS200+Hi3519设计的开发板及开发套件 16T算力 支持双路4K 以超小体积提供超强算力,支持锂电池供电,推动小型无人系统进入双目4K实时视频分析阶段。全爱科技推出机器视觉系列产品,专为教育行业打造。推出模块化的机器人和教育平台,应用案例。服务于华为智能计算生态。
上滑加载中
推荐直播
-
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中 -
华为云码道全新升级,多会话并行与多智能体协作2026/05/08 周五 19:00-21:00
王一男-华为云码道产品专家;张嘉冉-华为云码道工程师;胡琦-华为云HCDE;程诗杰-华为云HCDG
华为云码道4月份版本全新升级,此次直播深度解读4月份产品特性,通过“特性解读+实操演示+实战案例+设计创新”的组合,全方位展现码道在多会话并行与多智能体协作方面的能力,赋能开发者提升效率
正在直播
热门标签