机器学习_标签_开发者_华为云

博客(8.0k)
视频(11)
论坛(0)
云声(0)
代码示例(0)

基于昇腾服务器微调glm4-9b-chat案例
该案例基于昇腾服务器，以广告词生成任务为例，使用 11 万数据对 GLM4-9B-Chat 模型进行微调。涵盖服务器购买、环境安装、模型与数据集下载、数据预处理、模型微调、评估及推理等流程，介绍了在昇腾环境下基于 LLaMa Factory 框架进行模型优化的具体操作与方法。

HuaweiCloudDeveloper
发表于2025-04-21 10:34:29
129802 3 1

129.8k 3 1

该案例基于昇腾服务器，以广告词生成任务为例，使用 11 万数据对 GLM4-9B-Chat 模型进行微调。涵盖服务器购买、环境安装、模型与数据集下载、数据预处理、模型微调、评估及推理等流程，介绍了在昇腾环境下基于 LLaMa Factory 框架进行模型优化的具体操作与方法。
昇腾机器学习
依柯力YOLO训练调优
本文介绍依柯力 YOLO 训练调优，包括 NPU 环境准备与训练，如创建桶、授权、Notebook 等；精度对齐，用 msprobe 工具定位解决精度问题；性能调优，用 advisor 工具解决亲和 API 等问题；还给出训练加速参数推荐配置，提升训练效率。

HuaweiCloudDeveloper
发表于2025-04-21 09:40:58
134881 1 0

134.8k 1 0

本文介绍依柯力 YOLO 训练调优，包括 NPU 环境准备与训练，如创建桶、授权、Notebook 等；精度对齐，用 msprobe 工具定位解决精度问题；性能调优，用 advisor 工具解决亲和 API 等问题；还给出训练加速参数推荐配置，提升训练效率。
图像处理机器学习
华为大咖说丨稀疏模式崛起，语料未来面临哪些挑战与机遇？
文章来源于时习知公众号全文约2484字，阅读约需9分钟DeepSeek的惊艳亮相让人们开始关注稀疏模式（如MoE，混合专家模型），这种模式不仅改变了AI模型的训练和推理方式，还对语料（知识）的管理和利用提出了新的挑战与机遇。接下来，笔者将从稀疏模式的特点分析出发，来探讨稀疏模式对于语料需求变化和RAG（Retrieval-Augmented Generation，检索增强生成）的影响。 PA...

华为云软件工具链
发表于2025-04-08 10:18:29
128146 5 1

128.1k 5 1

文章来源于时习知公众号全文约2484字，阅读约需9分钟DeepSeek的惊艳亮相让人们开始关注稀疏模式（如MoE，混合专家模型），这种模式不仅改变了AI模型的训练和推理方式，还对语料（知识）的管理和利用提出了新的挑战与机遇。接下来，笔者将从稀疏模式的特点分析出发，来探讨稀疏模式对于语料需求变化和RAG（Retrieval-Augmented Generation，检索增强生成）的影响。 PA...
人工智能机器学习
深度探索AI大模型：DeepMind在计算资源优化与训练效率提升中的经验
AI大模型的挑战与实践：DeepMind的经验分享随着人工智能技术的迅猛发展，AI大模型逐渐成为各大科技公司及研究机构的研发重点。DeepMind，作为Google旗下的人工智能研究机构，一直走在AI大模型技术的前沿。本文将深入探讨AI大模型在实践中的挑战及DeepMind的应对策略，并结合代码实例，展示一些实践经验。 AI大模型的背景与发展AI大模型，通常指的是参数量极大、计算能力需求极...

柠檬🍋
发表于2025-03-24 12:14:13
129036 1 0

129.0k 1 0

AI大模型的挑战与实践：DeepMind的经验分享随着人工智能技术的迅猛发展，AI大模型逐渐成为各大科技公司及研究机构的研发重点。DeepMind，作为Google旗下的人工智能研究机构，一直走在AI大模型技术的前沿。本文将深入探讨AI大模型在实践中的挑战及DeepMind的应对策略，并结合代码实例，展示一些实践经验。 AI大模型的背景与发展AI大模型，通常指的是参数量极大、计算能力需求极...
机器学习
华为大咖说丨DeepSeek-R1训练过程的通俗讲解--一个天才学生的成长之路
网上有许多DeepSeek训练技术的相关文章，但大部分都涉及到大量技术术语，非专业人士不容易理解。为了让大家能够快速理解DeepSeek，笔者把网络知识结合自己的思考，用一种通俗的方式来给大家讲解DeepSeek的训练技术。 DeepSeek-R1中提到的模型训练流程如下：看不懂？没关系，接下来我们用通俗的例子来讲明白里面原理。 01 R1-Zero （R1模型的前世）DeepSeek团队...

华为云软件工具链
发表于2025-03-11 11:46:47
191393 0 3

191.3k 0 3

网上有许多DeepSeek训练技术的相关文章，但大部分都涉及到大量技术术语，非专业人士不容易理解。为了让大家能够快速理解DeepSeek，笔者把网络知识结合自己的思考，用一种通俗的方式来给大家讲解DeepSeek的训练技术。 DeepSeek-R1中提到的模型训练流程如下：看不懂？没关系，接下来我们用通俗的例子来讲明白里面原理。 01 R1-Zero （R1模型的前世）DeepSeek团队...
人工智能机器学习
如何在保障精度的同时，轻量级部署DeepSeek？
msModelSlim支持多种模型压缩算法（包括量化压缩、稀疏压缩等），为开发者提供更加灵活、高效的模型压缩量化方案。

华为云社区精选
发表于2025-02-20 09:53:49
207026 1 2

207.0k 1 2

msModelSlim支持多种模型压缩算法（包括量化压缩、稀疏压缩等），为开发者提供更加灵活、高效的模型压缩量化方案。
昇腾机器学习
深度学习的分布式训练与集合通信（三）
本文将会介绍一些更高阶的并行方式，如序列并行（SP），上下文并行（CP），混合序列并行Ulysess，ZeRO系列并行优化策略，完全分片数据并行（FSDP）。并且，在文章最后将汇总所有介绍过的并行方案与它们的通信模式，帮助读者初步建立起分布式训练与集合通信的知识结构体系。

昇腾CANN
发表于2025-02-12 16:20:35
207838 0 0

207.8k 0 0

本文将会介绍一些更高阶的并行方式，如序列并行（SP），上下文并行（CP），混合序列并行Ulysess，ZeRO系列并行优化策略，完全分片数据并行（FSDP）。并且，在文章最后将汇总所有介绍过的并行方案与它们的通信模式，帮助读者初步建立起分布式训练与集合通信的知识结构体系。
分布式机器学习深度学习
DeepSeek带来的Deepshock，一次看懂DeepSeek
感受深度思考的震撼，通俗易懂地带你了解为什么DeepSeek会如此之火？

华为云社区精选
发表于2025-02-08 17:38:02
214586 2 4

214.5k 2 4

感受深度思考的震撼，通俗易懂地带你了解为什么DeepSeek会如此之火？
上云必读昇腾机器学习
【开发者空间实践指导】基于Spotlight的电商推荐模型训练
本案例主要内容是基于云主机使用Spotlight实现电商平台推荐系统，Spotlight是一个面向推荐系统的Python库，它利用PyTorch的强大计算能力，构建了一系列深浅不一的推荐模型。

开发者空间小蜜蜂
发表于2025-01-07 15:16:57
225408 0 1

225.4k 0 1

本案例主要内容是基于云主机使用Spotlight实现电商平台推荐系统，Spotlight是一个面向推荐系统的Python库，它利用PyTorch的强大计算能力，构建了一系列深浅不一的推荐模型。
Python 开发者机器学习自建电商
华为大咖说丨爆火的AI Agent到底何去何从？
文章来源于时习知公众号全文约2029字,阅读约需7分钟。随着人工智能技术的快速发展，AI Agent成为大模型研究的热点。AI Agent是一种具备主动思考和行动能力的智能体，能够自主感知环境、形成记忆、规划和执行任务，并能与其他Agent协作。但是AI Agent的发展也面临较多的挑战，下面我们就来深入探讨一下。 01 AI Agent发展现状 AI Agent是指通过训练大规模的神经网...

华为云软件工具链
发表于2024-12-16 09:22:26
87771 0 3

87.7k 0 3

文章来源于时习知公众号全文约2029字,阅读约需7分钟。随着人工智能技术的快速发展，AI Agent成为大模型研究的热点。AI Agent是一种具备主动思考和行动能力的智能体，能够自主感知环境、形成记忆、规划和执行任务，并能与其他Agent协作。但是AI Agent的发展也面临较多的挑战，下面我们就来深入探讨一下。 01 AI Agent发展现状 AI Agent是指通过训练大规模的神经网...
人工智能机器学习
为大模型生产核心“燃料”！数据要素模式赋能数据标注基地高效运营
华为云Stack构建ModelArts数据工程套件，为大模型高效率高质量供数

华为云头条
发表于2024-10-22 18:58:56
63196 0 2

63.1k 0 2

华为云Stack构建ModelArts数据工程套件，为大模型高效率高质量供数
机器学习
田间地头“有智慧”，盈禾嘉田打造病虫害防治新模式
致力于借助先进科技技术，赋能数字农业技术装备提升改造的杭州盈禾嘉田科技有限公司，运用AI+大数据技术为农民提供便捷高效的农业科技服务，通过整合和连接产业链中的技术专家、农资服务商和农产品销售渠道资源，构建标准化种植追溯体系与大数据分析能力，为政府及行业用户提供专业解决方案，服务于农作物种植管理工作，在作物长势分析、病虫害调查、农事操作记录、采收期果实管理等田间种植各环节工作中实现自动识别、自动计数

HuaweiCloudDeveloper
发表于2024-07-10 09:53:16
49266 0 0

49.2k 0 0

致力于借助先进科技技术，赋能数字农业技术装备提升改造的杭州盈禾嘉田科技有限公司，运用AI+大数据技术为农民提供便捷高效的农业科技服务，通过整合和连接产业链中的技术专家、农资服务商和农产品销售渠道资源，构建标准化种植追溯体系与大数据分析能力，为政府及行业用户提供专业解决方案，服务于农作物种植管理工作，在作物长势分析、病虫害调查、农事操作记录、采收期果实管理等田间种植各环节工作中实现自动识别、自动计数
DTSE 机器学习
华为大咖说 | AI辅助内部业务训战后有感
为抓住AI大模型技术变革的机遇，通过AI辅助内部业务，提升华为内部各业务领域的作业效率和质量，项目组组织训战让各业务领域懂AI用AI。我参加了上周（6月20日至22日）的第六期训战（for HR领域），收获非常大，必须分享给大家。

华为云软件工具链
发表于2024-07-03 10:55:46
44176 0 1

44.1k 0 1

为抓住AI大模型技术变革的机遇，通过AI辅助内部业务，提升华为内部各业务领域的作业效率和质量，项目组组织训战让各业务领域懂AI用AI。我参加了上周（6月20日至22日）的第六期训战（for HR领域），收获非常大，必须分享给大家。
机器学习
【重磅】华为云盘古大模型5.0，正式发布！
解难题做难事，重塑干行万业

华为云头条
发表于2024-06-21 20:23:34
55978 8 3

55.9k 8 3

解难题做难事，重塑干行万业
机器学习
华为云引领首个代码大模型国际标准立项
推进代码大模型的发展，共创产业价值

华为云头条
发表于2024-05-13 22:20:47
9879 0 1

9.8k 0 1

推进代码大模型的发展，共创产业价值
机器学习

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript