- Prompt learning 教学最终篇:Chatgpt使用场景推荐、优秀学习资料推荐、AI工具推荐 Prompt learning 教学最终篇:Chatgpt使用场景推荐、优秀学习资料推荐、AI工具推荐
- NLP知识图谱项目合集(信息抽取、文本分类、图神经网络、性能优化等) NLP知识图谱项目合集(信息抽取、文本分类、图神经网络、性能优化等)
- 本文将开源数据处理为大模型微调需要的数据,是大模型训练微调的基础步骤。实验考试占比10%。 本文将开源数据处理为大模型微调需要的数据,是大模型训练微调的基础步骤。实验考试占比10%。
- 本文详细讲解了大模型训练的数据处理和文本分词的技术,笔试占比3%。 本文详细讲解了大模型训练的数据处理和文本分词的技术,笔试占比3%。
- 本章主要介绍了小模型和大模型训练数据集的差异性,并详细讲解了大模型训练过程中使用的数据类型。笔试占比3%。 本章主要介绍了小模型和大模型训练数据集的差异性,并详细讲解了大模型训练过程中使用的数据类型。笔试占比3%。
- 本章介绍了大模型的特性、发展以及业务流程,笔试占比10%。 本章介绍了大模型的特性、发展以及业务流程,笔试占比10%。
- CLIP 通过大量的图像和文本对的学习,通过图像和文本特征向量之间的余弦相似度来度量两者的相似性 CLIP 通过大量的图像和文本对的学习,通过图像和文本特征向量之间的余弦相似度来度量两者的相似性
- 本文主要是打通从原始数据到模型训练/推理时所期待的字符串格式这一流程。 本文主要是打通从原始数据到模型训练/推理时所期待的字符串格式这一流程。
- Qwen3-4B分布式全参微调实践 Qwen3-4B分布式全参微调实践
- Qwen/Qwen3-0.6B 全参数微调需要的显卡内存接近30GB,无法在RTX3060显卡上面进行微调。所以本文基于 TRL 中用于监督微调的 SFT Trainer 和 Unsloth(QLoRA)工具,在RTX3060显卡上面实现 Qwen/Qwen3-0.6B 的参数高效微调。 Qwen/Qwen3-0.6B 全参数微调需要的显卡内存接近30GB,无法在RTX3060显卡上面进行微调。所以本文基于 TRL 中用于监督微调的 SFT Trainer 和 Unsloth(QLoRA)工具,在RTX3060显卡上面实现 Qwen/Qwen3-0.6B 的参数高效微调。
- Qwen/Qwen3-0.6B 全参数微调需要的显卡内存接近30GB,无法在RTX3060显卡上面进行微调。所以本文基于 TRL 中用于监督微调的 SFT Trainer 和 PEFT(QLoRA)工具,在RTX3060显卡上面实现 Qwen/Qwen3-0.6B 的参数高效微调。 Qwen/Qwen3-0.6B 全参数微调需要的显卡内存接近30GB,无法在RTX3060显卡上面进行微调。所以本文基于 TRL 中用于监督微调的 SFT Trainer 和 PEFT(QLoRA)工具,在RTX3060显卡上面实现 Qwen/Qwen3-0.6B 的参数高效微调。
- Qwen/Qwen3-0.6B 全参数微调需要的显卡内存接近30GB,无法在RTX3060显卡上面进行微调。所以本文基于 TRL 中用于监督微调的 SFT Trainer 和 PEFT(LoRA) 工具,在RTX3060显卡上面实现 Qwen/Qwen3-0.6B 的参数高效微调。 Qwen/Qwen3-0.6B 全参数微调需要的显卡内存接近30GB,无法在RTX3060显卡上面进行微调。所以本文基于 TRL 中用于监督微调的 SFT Trainer 和 PEFT(LoRA) 工具,在RTX3060显卡上面实现 Qwen/Qwen3-0.6B 的参数高效微调。
- 本文基于 TRL 中用于监督微调的 SFT Trainer 工具,实现 Qwen/Qwen3-0.6B 的全参微调。 本文基于 TRL 中用于监督微调的 SFT Trainer 工具,实现 Qwen/Qwen3-0.6B 的全参微调。
- TRL提供的用于监督微调的 SFT Trainer 工具,可以实现全参数微调和参数高效微调。 TRL提供的用于监督微调的 SFT Trainer 工具,可以实现全参数微调和参数高效微调。
- “混合”精度的精髓在于:用高精度(FP32)保证关键信息的准确性,用低精度(FP16/BF16)加速大部分运算和节省显存。 “混合”精度的精髓在于:用高精度(FP32)保证关键信息的准确性,用低精度(FP16/BF16)加速大部分运算和节省显存。
上滑加载中
推荐直播
-
华为云码道 × 仓颉编程:工程化AI编码探索2026/05/27 周三 19:00-21:00
刘俊杰-华为云仓颉语言专家/李炎-华为云码道技术专家/王智鹏-OpenCangjie开源社区发起人
本场直播围绕华为云仓颉语言与华为云码道的深度结合,展示华为云智能编程从零基础到高效落地的完整生态能力。以华为云码道为引擎,仓颉语言为载体,带给大家日常提效、趣味创新到极速量产的开发体验。
回顾中 -
一个AI团队帮你写代码:华为云码道Agent Space实战2026/06/25 周四 19:00-21:00
张翰文-华为云码道工程师/郭英旭-青软创新科技集团股份有限公司 软件架构师
本场直播聚焦华为云码道Agent Space两大模式:研发办公、代码开发,亲身体验从需求到代码的AI自动化能力。实操演示基于华为 CodeArts CLI,依托 OpenSpec 规格体系从零搭建业务项目。
即将直播
热门标签