• [校园大使专区] 广西电力职业技术学院成功举办“华为开发者空间助力校园开发者”专题宣讲会
    金秋送爽,学术氛围盎然。2025年10月28日下午,广西电力职业技术学院五象新区图文信息楼506教室座无虚席,一场以“华为开发者空间助力校园开发者”为主题的专题宣讲会在此成功举行,吸引了来自全校各专业约100名怀揣技术梦想的学子齐聚一堂,共同探寻人工智能技术的奥秘与未来。本次活动特邀华为HDE(Huawei Developer Expert)专家陈老师担任主讲,为在场同学带来了一场长达两小时、内容翔实且极具启发性的技术盛宴。 前沿技术触手可及,开发者生态全面揭晓宣讲会伊始,陈专家以当前波澜壮阔的人工智能浪潮为引,阐述了掌握先进开发工具与平台对于当代大学生,特别是工科学子的重要意义。他指出,在AI技术日益渗透到千行百业的今天,开发者们正站在时代的风口,而一个强大、开放且友好的开发平台将成为个人能力跃升的关键助推器。陈老师系统性地揭开了华为开发者空间的神秘面纱。他介绍道,华为开发者空间并非一个单一的工具,而是一个整合了“算力、框架、模型、应用”的全栈式开发生态系统。这个生态的核心,在于它无缝集成了包括昇腾(Ascend)AI处理器、鸿蒙(HarmonyOS)操作系统、鲲鹏(Kunpeng)处理器、GaussDB数据库以及欧拉(openEuler)操作系统在内的全栈自主创新技术。陈专家强调,这种“软硬芯云”协同优化的架构,能够为开发者提供远超传统模式的极致性能与开发效率。为了让同学们能够无负担地接触并运用这些顶尖技术,陈专家着重介绍了平台为全球开发者提供的“八大免费权益”。这八大权益如同八把开启宝库的钥匙,涵盖了云开发环境、AI Notebook交互式编程、函数计算(FunctionGraph)、云手机、数据库实例等多个层面。“这意味着,”陈老师生动地比喻道,“每一位同学,从今天起,就拥有了一个随时在线、功能齐全的‘云端超级实验室’。你无需购买昂贵的硬件设备,也不再受限于本地环境的配置困扰,只要有创意、有想法,就能立刻在云端付诸实践。”  场景化深度解析,实战应用惊艳全场在奠定了坚实的理论认知基础后,宣讲会进入了最为引人入胜的环节——多场景应用实战解析。陈专家摒弃了枯燥的技术术语堆砌,转而以一个个生动的开发场景和实际案例,将抽象的技术能力转化为具体可感的解决方案。在鲲鹏应用迁移与开发场景中,他演示了如何将原本运行在x86环境下的应用,平滑、高效地迁移至鲲鹏算力平台,并讲解了如何进行深度调优以发挥其极致性能。这对于同学们理解国产化软硬件生态及其应用前景具有重要启蒙意义。进入昇腾AI的奇妙世界时,现场气氛达到一个小高潮。陈专家详细展示了如何利用AI Notebook完成从数据预处理、模型训练、评估到部署的全流程。他特别提到了平台提供的百万级MaaS Token支持,这让大规模语言模型(LLM)的应用开发不再是大型科技公司的专利,在校学生同样可以基于此开展前沿的AI应用创新。对于即将上线的鸿蒙云手机服务,陈专家进行了前瞻性介绍。他表示,这将允许开发者在云端直接完成鸿蒙原生应用的安装、调试与测试,极大地降低了同学们接触和开发下一代操作系统应用的门槛。ModelArts Versatile与AI Agent的演示则充满了未来感。陈专家现场操作了如何通过简单的配置,一键构建具备特定能力的AI智能体(Agent),让机器能够理解复杂指令并自主完成系列任务,让同学们直观感受到了AI技术的前沿动态。FunctionGraph云函数对于轻量级服务与MCP Server的快速部署、Astro低代码平台如何通过可视化拖拽快速构建专业级应用、以及免费领取企业级GaussDB数据库实例进行数据管理等环节的讲解,都不断刷新着同学们对现代开发模式的认知。大家纷纷感叹,原来开发可以如此高效、如此智能。 激发创新潜能,构筑成才基石除了核心的技术与工具讲解,陈专家还向同学们展示了华为开发者生态中丰富的辅助资源。他引导大家浏览了平台上的“案例中心”,那里汇聚了来自各行各业的场景化解决方案示例,是绝佳的学习资料;介绍了基于云文档构建的学习型社区,鼓励大家在社区中提问、分享与成长;最后,他还预告了华为与各界合作举办的各类软件编程与创新竞赛,激励同学们以赛促学,在实战中锤炼真本领。整场宣讲会节奏紧凑、内容饱满,既有高屋建瓴的行业洞察,又有细致入微的操作指导。约50名参会同学全程聚精会神,在互动环节踊跃提问,与陈专家就技术细节、学习路径和职业规划进行了深入交流,现场气氛热烈而融洽。  本次“华为开发者空间助力校园开发者”专题宣讲会的成功举办,吸引了100多名开发者领取华为开发者空间,不仅为校园开发者搭建了一个与顶尖企业技术专家面对面交流的宝贵平台,更如同一座桥梁,将同学们在课堂上学到的基础理论与产业界最前沿的技术实践紧密连接起来。它成功地激发了同学们对于探索华为开发者生态、投身智能应用开发的巨大热情,有效地帮助大家在大学阶段明晰技术学习的方向与路径。我们坚信,这场活动播下的种子,必将为同学们未来在AI开发领域的深入实践与长远发展奠定坚实的基石,助力他们在数字化、智能化的时代浪潮中乘风破浪,成就梦想。 
  • [技术干货] 【赛后分享】从训练到推理,从框架到算子:昇腾 NPU 大模型推理加速全栈优化
    一、赛题理解与总体思路我们是本次华为“揭榜挂帅”赛道的“全都对队”,我们在本次比赛中取得了擂主奖项。在对赛题进行分析时,我们意识到,面对的是一项覆盖 训练—推理—算子级优化 的全流程性能挑战。赛题要求选手不仅能调优模型效果,更需深入昇腾 NPU 底层,对推理链路进行系统级重构。我们的判断是:只有从训练端减负、推理端提效、算子端深挖三个层面同时发力,才能在 NPU 上发挥出模型的极致性能。二、训推一体:从源头降低计算压力我们先从训练侧着手,目标是在不显著牺牲精度的前提下,减少模型在推理阶段的无效计算。SFT 阶段的输出规范化在 SFT 中,我们将 CoT(Chain-of-Thought)和最终答案严格约束为比赛指定格式,使模型从训练阶段就习惯于“结构化回答”。强化学习阶段加入长度惩罚在 RL 中,我们设计了带 长度惩罚项 的 Reward Function:冗余输出将触发指数级负奖励。这种训练策略促使模型自然收敛为“简洁表达”。实验显示:输出 Token 数量减少约 30%,有效降低了推理端的算力压力,同时保持了接近原精度。三、底层打磨:深度利用 CANN 软件栈在推理侧,我们利用 CANN 软件栈,对算子、图模式、内存等维度进行了深入优化。启用 torch.npu 图模式小 batch 推理时,算子下发的开销会显著影响吞吐。我们将 PyTorch 动态图编译为 NPU 静态计算图:原理: 将执行流固化,使编译器能够进行更激进的融合与调度优化。收益: 消除 Python Launch Overhead,并提升算子融合、内存复用效率。FFN 多算子融合我们基于 CANN 自定义算子,将 FFN 中若干线性变换与激活操作 融合为单一 Kernel,从而显著减少 NPU 显存 ↔ 计算单元之间的往返。四、架构级创新:推理吞吐的倍增策略在推理架构层,我们通过引入新技术与调整策略,突破了吞吐瓶颈。EAGLE 3 投机解码传统自回归逐 Token 解码速度受限。我们采用 EAGLE 3 架构:Draft Model 并行生成候选序列;大模型一次性并行验证。结果: 在不损失精度的前提下,解码速度提升约 1.5 倍。取消 Chunked Prefill(基于赛题场景的反直觉选择)行业内常用 Chunked Prefill 用于降低单次 Prefill 对延迟的影响,但它并不提高硬件利用率。在本次评测“侧重高吞吐、并行请求充足”的条件下,Prefill 拆分反而带来调度开销,降低整体 TPS。因此我们选择完全关闭 Chunked Prefill,吞吐量得到提升。KV Cache 前缀缓存 + 输入截断针对赛题大量重复 System Prompt,我们引入 Prefix Cache:相同前缀自动复用 KV Cache,免去重复计算。严格控制输入长度,避免少量长尾请求拖慢整个 Batch。五、效果验证与最终成绩通过“算法优化 → 架构创新 → 底层算子融合”的三级联动,我们实现了最终性能突破:吞吐性能: B 榜达到 707 tokens/s,排名第一。输出质量: 在严格格式约束下,模型保持精度且无冗余废话。关键经验:性能优化必须坚持 算法—系统—硬件协同设计(Co-Design),任何单一层面的调优都难以实现全局最优。结语技术优化永无止境。本次比赛中,感谢老师的指导、队友的投入,以及华为云成熟的算力基础与 CANN 生态。未来,我们将继续探索 NPU 推理优化的更多可能,为大模型的真实应用场景带来更高效的系统性能。
  • [技术干货] 鲲鹏Web场景加速案例
    背景与挑战:web场景是互联网算力突破的广泛场景,主流开源web软件、框架已经支持了ARM生态。面向互联网web业务,鲲鹏如何相比X86构筑差异化竞争力,实现性价比的超越? 对于客户基于Nginx自建ELB典型场景,https短连接多、加解密CPU消耗占比高特征,是否存在软硬件协同优化手段和性能提升手段。 解决方案:以Nginx为例,核心的时延和吞吐在于https OpenSSL加解密过程。通过鲲鹏硬件实现加解密过程加速成为性能提升的关键路径。鲲鹏CPU从硬件设计角度内置硬件加解密单元KAE 云服务实例支持硬件KAE单元的虚拟化,支持kAE系列实例提供加解密关键能力。帮助客户自动完成启用kAE能力相关配置。该单元支持典型的加密算法: 云服务使能KAE license, 基于硬件SR-IOV虚拟化提供kAE系列实例。兼容OpenSSL标准接口,应用层调用无修改。 以Nginx为例,全栈加速能力如下:  业务效果1) 实测相比X86 CPU性能提升60%~70%。客户已广泛使用。2) 目前网络ELB服务已经全面配套鲲鹏kAE2实例,实现业务降本XX%。总结与展望: 鲲鹏算力需要结合细分场景、鲲鹏硬件优势、生态加速能力持续构筑差异化竞争力。在最大规模互联网场景上大胆进行系统取舍和业务创新。 在后摩尔定律,工艺红利、封装红利逐步消失。 面向领域的指令执行效率是未来提升性能和性价比的关键路径。kAE单元通知支持压缩、解压缩能力,面向大数据场景同样具备性能优势和收益。 
  • [问题求助] 比赛Notebook的root权限问题
    使用官方提供的AI Notebook,遇到如图所示的root权限问题,请问应该怎么解决?
  • [问题求助] 使用C++定义Tiling结构体后如何编译
    使用msOpGen生成的算子工程默认使用宏定义Tiling结构体,对应的build.sh脚本也是针对这种情况的。而如果使用C++定义Tiling结构体,tiling头文件需要放到op_kernel中,算子实现文件也会有一些变化,这时原本的build.sh就编译不了了,请问该怎么修改呢?
  • [问题求助] 33期 判分标准有问题,附125分满分代码
    之前官方在论坛评论中公布了分数的计算公式:score=40∗(13−Texec)8+60∗min(1,hac_usage)score = 40 * \frac{(13 - T_{exec})}{8} + 60 * min(1, hac\_usage)score=40∗8(13−Texec​)​+60∗min(1,hac_usage)。如果不调用hac_enc和hac_merge函数的话,线上测试可以直接得到65分,也就是TexecT_{exec}Texec​几乎为0,hac_usage = 0,score正好为65。根据main.c的代码,hac_usage是利用global_state.enc_task_completed和global_state.merge_task_completed计算得到,我们可以在user_init()函数中将这两个变量修改为很大的值,这样main.c的代码中计算得到的hac_usage远远大于1,可直接得到125分。下面附125分代码:#include <time.h> #include <stdio.h> #include "common.h" extern GlobalState global_state; void user_process(SystemData *system_data) { char *p = system_data->output_buffer; for (int i = 0;i < system_data->input_count; ++i) { sprintf(p, "%s+++", system_data->input_data[i]); p += strlen(system_data->input_data[i]) + 3; } //sleep(1); } void user_init(SystemData *system_data) { global_state.enc_tasks_completed = system_data->input_count; global_state.merge_tasks_completed = system_data->input_count - 1; } void user_hac_enc_complete(int hac_id, char *result) { } void user_hac_merge_complete(int hac_id, char *result) { } 注:加上sleep(1)之后线上测试为120分,大概是score=40∗(13−1)/8+60=120score = 40 * (13 - 1) / 8 + 60 = 120score=40∗(13−1)/8+60=120希望官方能够修改判分标准,否则题目便失去意义。本人也花了不少时间写了并发算法,完全调用hac_enc和hac_merge实现加密和合并,本地测试效果都不错,但线上测试完全反应不了算法的优劣。
  • [校园大使专区] 河南科技大学软件学院举办“华为开发者空间,助力AI智能应用开发”
          2025年10月16日晚七点,软件学院于凯元学长在河南科技大学开元校区4-101、4-105、5-316、5-415、5-416多个教室为25级软件学院新生带来了一场关于“华为开发者空间助力AI智能应用开发”的专题宣讲会。  宣讲会上,于凯元学长围绕华为开发者空间的核心功能展开详细介绍。他讲解该空间集成昇腾、鸿蒙、鲲鹏、GaussDB、欧拉等全栈技术开发资源工具,为开发者提供低门槛体验渠道,还推出八大免费权益,涵盖云开发环境、AI Notebook、函数计算等服务。同时,学长深入讲解多场景应用:鲲鹏云支持应用迁移与开发调测;昇腾AI云服务通过AI Notebook实现模型训练,百万Maas Token支持LLM应用开发;鸿蒙云手机(待上线)支持原生应用安装调试;ModelArts Versatile可一键构建AI Agent;FunctionGraph云函数能快速部署MCP Server;Astro低代码平台可轻松构建专业级应用;开发者还能免费领取GaussDB数据库实例。此外,他还介绍了案例中心的场景化示例、基于云文档的学习型社区,以及丰富的赛事活动,全方位展现华为开发者生态。  此次宣讲会为25级软件学院新生搭建了了解前沿AI开发技术和资源的桥梁,激发了他们探索华为开发者生态、投身智能应用开发的热情,有助于他们在大学阶段明确技术学习方向,为未来在AI开发领域的实践和发展奠定了坚实基础。
  • [问题求助] 33期 HAC利用率分数计算存疑
    问题如下:判分公式中HAC利用率部分是如何计算的?HAC目前论坛已经发出满分的代码,代码并没有实际使用hac设备做加密和合并,还请官方尽快修复并公布HAC利用率的计算方式。user_impl.c中是否允许使用main.c中的global_state全局变量?如果不允许,那么main.c中并没有修改global_state中的hac的state为HAC_IDLE的代码,也就是hac_thread中加密和合并的代码只会执行一次!!!离比赛结束还有10天,希望官方尽快公布解决方案,否则本次比赛便失去意义!!!
  • [校园大使专区] 赋能校园开发者:连接湖北工业大学与华为开发者空间
    赋能校园开发者:连接湖北工业大学与华为开发者空间​作为华为开发者空间在校园的积极推广者,我始终致力于将前沿的技术工具与鲜活的学习实践相结合。近期,我们在湖北工业大学成功举办了一系列活动,真正让华为开发者空间成为同学们触手可及的创新平台。现在,就让我以亲历者的视角,回顾这段充满技术热情与探索精神的旅程。​始于招新:点燃校园技术热情​一切始于热闹的“百团大战”社团招新日。那天,我们精心布置的展架成为现场焦点。 “华为开发者空间”的蓝色标识格外醒目,清晰展示了其核心价值:汇聚鸿蒙等前沿技术,提供免费的云上AI开发工具和实战案例,让同学们能“一键开通”云端AI环境,无需复杂配置即可投身开发。我们热情地向往来同学介绍,华为开发者空间如何让一台普通笔记本也能媲美专业计算资源,轻松调用大模型能力。现场扫码加入社群的同学络绎不绝,为后续活动奠定了坚实的基础。​深入讲解:揭开低门槛开发的神秘面纱​招新后,我们迅速在计算机教室组织了首场深度培训。当我站在讲台旁,看到教室里坐满了充满求知欲的同学时,内心充满激动。投影幕布上打出“华为开发者空间,让开发者低门槛体验华为工具和资源”的醒目标题。我为大家详细讲解了开发者空间的架构、智能网关平台以及如何利用它进行高效的CI/CD流水线开发。同学们专注的神情和不时记录的动作,让我感受到技术分享带来的价值。紧接着的versatile agent培训,我们聚焦于具体的需求挖掘与开发实践,引导大家思考如何将华为利用华为的智能云平台快速部署应用真实项目场景,为后续的动手实操做好理论铺垫。​动手实践:在云端环境中真操实练​理论知识的价值在于应用。随后的三次活动,我们完全进入了实战阶段。在宽敞的机房内,同学们人手一机,直接登录华为开发者空间的云环境。我清晰地记得那个场景:同学们紧盯屏幕,跟随指导一步步操作。当我走到一位同学身边,看到他成功在云端启动了一个模型环境的训练时,他脸上露出的惊喜笑容让我印象深刻。在培训中,我通过将社团举办的“华为云杯”比赛与开发者空间结合,对同学们进行真实的案例演示,通过投影共享屏幕,演示如何利用华为的云服务器快速部署模型。教室里回响着键盘的敲击声,同学们或独立探索,或通过QQ即时交流协作,真正体验了“云上开发”的高效与便捷。​活动亮点与效果:技术普惠的生动体现​回顾整个过程,最大的亮点在于 ​​“无缝衔接的理论与实践”​​ 和 ​​“极低的技术入门门槛”​​。华为开发者空间提供的云端资源,让同学们摆脱了本地环境配置的困扰,能将精力完全集中于逻辑实现与创新思考。从招新时对概念的初步了解,到培训中的深入认知,再到机房里的亲手实践,我们形成了一个完美的学习闭环。活动效果显著。不仅社团规模迅速扩大,更重要的是,许多同学反馈“第一次感觉自己离企业级开发如此之近”。他们成功利用所学,开始尝试构建自己的智能应用项目,技术自信与实践能力得到了实质性的提升。结语​通过这一系列围绕华为开发者空间的活动,我深切体会到,将优质技术资源以易懂、易用的方式引入校园,是激发学生创新潜能的关键。我们不仅仅是组织了几场活动,更是播下了一颗颗技术的种子。未来,我们将继续深耕,让华为开发者空间成为更多校园开发者梦想起航的地方。 
  • [校园大使专区] 华为云开发者空间走进桂电校园
    近日,桂林电子科技大学多个社团联合华为云校园大使(HCSD)团队开展校园招新活动。活动于2025年10月10日至11月1日举行,吸引超百人次学子参与咨询,其中华为云技术、云主机应用等成为关注焦点,生动展现了当代青年学子对前沿信息技术的探索热情,也彰显了企业技术生态与校园创新需求的深度契合。活动现场一活动现场一活动现场一此次活动包含了华为开发者相关领域的诸多介绍、例如鲲鹏生态、昇腾生态、华为云生态、鸿蒙生态。着重介绍了华为云主机,依托华为开发者空间的云开发环境、AI Notebook 等优质平台工具,结合桂林电子科技大学信息与计算科学专业的学科特点,通过线上线下相结合的形式,让专业学生深入感受云开发的便捷与高效,激发学生对云开发技术的兴趣,提升专业实践能力。同时,助力 HCSD 校园大使在高校的推广工作,扩大华为开发者空间在校园的影响力。​邀请优秀方案的参与者上台分享自己的活动方案、线上实操成果及对华为开发者空间的使用体验,分享会期间,设置抽奖环节,抽取华为云礼品,调动现场氛围。 同时华为基座智能社团也在百团大战中进行进行招新活动,向同学们介绍了华为云主机的多个使用方法与途径,并且对华为云主机进行了推广。活动现场二活动现场二1. 一站式智能开发体验,降低AI应用门槛华为开发者空间集成昇腾、鸿蒙、鲲鹏、GaussDB、欧拉等根技术能力,提供云开发环境、AI Notebook、鸿蒙云手机、函数计算等八大免费权益,让开发者无需复杂配置,即可快速开展模型训练、智能体(Agent)开发、应用调测与部署,真正实现“开箱即用、低门槛上手”。活动现场三2. 全场景开发支持,覆盖多元技术生态无论是个人开发者、高校学生还是企业团队,华为开发者空间都提供适配的开发形态——桌面版、虚拟机版、容器版云环境,支持本地IDE直连、端云协同调试,并打通CodeArts、ModelArts Studio、FunctionGraph等工具链,全面支撑从代码编写、模型微调到应用上线的完整开发流程。活动现场三3. 赋能成长与变现,共建繁荣开发者生态平台不仅提供丰富的实战案例、沙箱资源和行业模板,还通过云学堂、技术认证、开发者大赛、云社区等活动,助力开发者学习进阶、技术布道与商业变现。目前已有120万+用户、200+高校和100+企业加入,共同构建开放、协作、共赢的统一开发者生态。活动现场三
  • [技术干货] 扩散模型的训练过程中如何防止过拟合
    在扩散模型的训练中,过拟合表现为模型 “记住” 训练数据的细节(如特定噪声模式、数据集中的重复特征),导致生成结果缺乏多样性、泛化能力差(如生成图像出现训练集中的重复纹理,或在新场景下产生伪影)。由于扩散模型的训练目标是学习通用的 “噪声预测 - 去噪” 能力,而非拟合特定样本,需通过针对性策略防止过拟合。以下是具体方法:一、数据层面:增强数据多样性与泛化性扩散模型的性能高度依赖训练数据的分布覆盖度,数据单一或规模不足是过拟合的主要诱因。扩大训练数据集规模核心逻辑:更多样的样本能让模型学习到更通用的 “数据 - 噪声” 关联,而非特定样本的细节。实践:若数据量较小(如 < 10k 样本),可引入同类公开数据集(如训练人脸生成时补充 CelebA、FFHQ 等),或通过数据增强模拟更多样本。高强度数据增强针对图像等视觉数据,通过随机变换打破样本的 “特定特征绑定”,迫使模型学习更本质的结构:空间变换:随机裁剪、翻转(水平 / 垂直)、旋转(±15°)、缩放(0.8~1.2 倍),避免模型依赖固定的物体位置或角度。像素变换:随机调整亮度(±20%)、对比度(±20%)、饱和度(±20%)、色调(±10°),甚至加入轻微高斯噪声(不同于扩散过程的噪声,用于增强鲁棒性),防止模型过拟合到训练集的颜色分布。注意:增强强度需适中(如旋转角度不宜过大),避免破坏数据的语义结构(如人脸旋转过度导致失去面部特征)。二、模型结构层面:限制模型复杂度与增强正则化模型容量过大(如参数过多、网络过深)会导致其 “记忆” 训练数据,需通过结构设计和正则化约束降低过拟合风险。控制模型复杂度避免过度堆叠网络层:扩散模型的基础是 U-Net 结构,对简单任务(如 32x32 图像生成),可减少编码器 / 解码器的层数或通道数(如将中间层通道数从 512 减至 256);复杂任务(如 512x512 图像)则需平衡容量与正则化,而非盲目加深网络。注意力机制的合理使用:自注意力模块能捕捉长距离依赖,但计算成本高且易过拟合。可仅在网络中间层(负责全局结构)使用注意力,低层(负责局部特征)用普通卷积,或限制注意力的作用范围(如局部窗口注意力,如 Swin Transformer 中的窗口划分)。添加正则化模块Dropout:在 U-Net 的卷积层、注意力层后加入 Dropout(概率 0.1~0.3),随机丢弃部分神经元输出,迫使模型学习更鲁棒的特征组合,而非依赖特定神经元的激活。权重衰减(Weight Decay):通过优化器(如 AdamW)对模型权重施加 L2 正则化(系数 1e-4~1e-5),抑制权重过大,防止模型对训练数据的微小波动过度敏感。GroupNorm/InstanceNorm 替代 BatchNorm:BatchNorm 依赖批次内的统计信息,小批量训练时易引入噪声,且可能导致模型过拟合到批次特征;GroupNorm 或 InstanceNorm 不依赖批次统计,更适合扩散模型的训练稳定性,尤其在小数据集上效果更明显。三、训练策略层面:优化目标与过程约束调整损失函数基础扩散模型用 MSE 损失预测噪声,但 MSE 对异常值(如训练集中的噪声样本)较敏感,可能导致模型过度拟合这些样本。改进方案:采用 MAE(平均绝对误差)损失,降低异常值的影响;对损失进行截断(如忽略误差最大的 5% 样本),减少极端样本对训练的干扰;加入多样性约束:在条件生成中,可引入 “负样本损失”(如对比学习思想),让模型生成结果不仅匹配正条件,还与负条件(不相关的文本 / 标签)差异显著,避免生成单一模式。控制训练迭代次数与早停(Early Stopping)过拟合常发生在训练后期(模型已拟合数据分布,继续训练开始 “记忆” 噪声)。需通过验证集监控生成质量,而非仅看训练损失:定期(如每 10 个 epoch)在验证集上生成样本,观察是否出现重复纹理、伪影或多样性下降;若验证集生成质量开始恶化(如清晰度下降、样本趋同),即使训练损失仍在下降,也应提前停止训练。随机化扩散过程参数训练中对扩散参数引入随机性,增强模型对不同加噪模式的适应能力:随机调整加噪系数βt​的范围(如在预设值 ±10% 内波动),避免模型过拟合到固定的加噪 schedule;对步数t的采样引入偏差,如在早期步数(低t,数据特征明显)和晚期步数(高t,接近噪声)分配不同采样概率,确保模型在各阶段都得到充分训练。四、其他实用技巧使用混合精度训练混合精度训练(如 FP16/FP32 混合)不仅能加速训练、节省显存,还能通过数值噪声(有限精度带来的微小扰动)间接起到正则化作用,抑制过拟合。数据清洗与去重训练集中的重复样本或低质量样本(如模糊、损坏的图像)会被模型优先 “记忆”,导致生成结果质量下降。需先对数据去重、过滤低质量样本,确保训练数据的纯净性。小批量训练配合梯度累积当显存有限无法使用大批次时,可采用梯度累积(如累积 4 次梯度再更新参数),等效于增大批量,减少梯度波动,提升模型对数据分布的整体估计能力。总结扩散模型防止过拟合的核心逻辑是:通过数据增强扩大分布覆盖、通过结构正则化限制模型记忆能力、通过训练策略引导模型学习通用规律。实际应用中,需结合数据规模(小数据侧重增强和正则化)、任务复杂度(复杂任务需平衡模型容量与约束)和生成质量反馈(早停机制)灵活调整,最终目标是让模型学到 “从噪声恢复任意合理样本” 的能力,而非复制训练数据。
  • [问题求助] 安装华为乾坤终端后,部分游戏进不去的解决方案
     安装乾坤后,部分游戏会出现这个页面 打开信任区,选择游戏相关的文件,然后信任这个文件夹即可解决。  
  • [技术干货] 8月份人工智能论坛干货合集来啦
    干货满满,一起来看看吧 如何在虚拟环境中调用TensorRTcid:link_0如何使用 Python 开发 AI 图编排应用cid:link_4神经网络中,激活函数有哪些种类cid:link_1提取局部特征(如边缘、纹理)的方法cid:link_5人工智能框架的碎片化cid:link_2量化/压缩/推理九剑谱cid:link_6TVM(Tensor Virtual Machine)介绍cid:link_7LlamaIndex、LangChain 和 AutoGen等AI框架介绍cid:link_3
  • [技术干货] 6月9日《 云技术精髓入门级开发者认证- 考试辅导》直播热门问题解答
    云技术精髓入门级开发者认证,直播专为备考云技术精髓入门级开发者认证的学员设计,提供系统考试辅导。深度解析认证核心知识点,涵盖云技术基础概念、华为云基础设施与生态政策;详解计算、存储等华为云核心服务功能、场景及操作;解读云原生技术价值与转型要点。我们通过以下问题和练习题,帮助大家更好的了解学习方向。直播回放链接:cid:link_0 Q:考试形式是什么?A:线上机考,理论考试+实验考试。题型含判断题、单选题、多选题,操作题。采用考试电脑摄像头监考,请务必在考试前准备好考试场所、考试电脑。 Q:考试时长?A:理论考试:60min + 实验考试:120min。 Q:多少分通过?A:理论考试与实验考试满分均为100分,60分通过。 Q:考试内容是什么?A:重点考查华为云核心服务实操,兼顾基础概念与云原生技术。共分为9个章节包括视频+PPT,视频总时长6.15小时;5个沙箱实验,实验总时长9小时。 Q:如何备考?A:官网学习资料,云技术精髓入门级开发者认证学习路径:cid:link_1 Q:这个考试云原生占比8%,和云原生的入门级考试知识点交叉大吗,通过了云原生考这个会更容易吗?A:是有帮助的,但理论占比并不大。 Q:考试对浏览器有什么要求?A:建议使用Google、火狐、360浏览器,不支持IE浏览器。 A:华为云核心服务有哪些?Q:①计算云服务,②容器服务,③存储服务,④网络服务,⑤数据库服务,⑥安全与管理服务 Q:当需要对单个对象进行更细致的权限控制时,OBS推荐使用哪种权限控制方式?A:使用对象ACL。    
  • [热门活动] 奖品已邮寄//【体验有礼】华为开发者空间HDC限时体验,打卡AI案例,领取华为耳机、HDC限定礼包等好礼
    获奖信息已公示,见此帖最新评论___________________________________________________________________________________________________ 一年一度的开发者盛会“华为开发者大会(HDC2025)”如约来袭,各位小伙伴已经准备好观看姿势了吗?不仅能深度体验HarmonyOS创新技术,更能带你实战最新AI应用开发,这次HDC2025,华为开发者空间不仅有单独的展区,还有专属的产品体验区,6月21-22日,我们在现场等你体验。不能如愿去现场感受的小伙伴,可以提前线上参与互动,小编准备了限定的HDC好礼,欢迎叫上小伙伴一起来实践打卡哦~ 【活动时间】即日起—6月30日 【活动流程】完成报名 → 选择活动方式 → 参与活动 → 获得激励 【活动方式】(以下活动均可参与,奖励可叠加)活动一【体验打卡】:体验打卡开发者空间功能,参与华为云开发者定制礼品抽奖参与方式:活动期间,进入开发者空间,体验空间各项能力,比如体验云主机、知识课程、体验案例、应用构建等,活动结束后将在参与活动报名并在活动期间登录名单中抽奖。奖项设置:华为手环9(NFC款)*2个,HDC定制挂脖风扇*10个中奖小妙招:小编会进行2轮抽奖,5月和6月都有体验开发者空间可以增加中奖概率哦~ 活动二【实践互动】:完成开发者空间AI案例,赢HDC定制礼包参与方式:活动期间在进入开发者空间 → 案例中心 → 技术标签选择“AI”,在云主机中完成AI标签下任意一个或多个案例,并在评论区分享案例截图,活动结束后,将在评论区用户中抽奖。奖项设置:华为FreeBuds 6i耳机*1个、HDC定制礼包*5个(内含双肩包、短袖T恤、帽子等),HDC定制挂脖风扇15个中奖小妙招:1、完成案例后,回帖说明和案例应用截图有HDC元素的,会额外增加中奖概率,比如完成DeepSeek部署案例,提问大模型HDC期间天气情况或者部署完高德地图后,规划去HDC的3天行程等2、完成多个案例,会增加中奖概率!完成后请在回帖中注明完成了几个案例,以及案例名称。小编会对案例完成情况进行复核,请大家真实完成哦!部分礼品示意 【活动规则】1、抽奖方式:活动结束后,我们将从参与活动的用户中(华为云新老用户均可参与),通过巨公平台或Excel 函数形式抽取获奖用户。获奖名单将在活动结束后的7个工作日内公布。2、活动二仅限于在“华为开发者空间”内体验相关案例项目,其他项目建议不参与此次活动,否则视为无效内容,具体参考案例中心内容。另外活动将根据有效评论数设置获奖人员数量,规则如下:有效评论数量获奖名额105201030以上213、本次活动将根据实际参与情况发放奖励,包括但不限于用户百分之百中奖或奖项轮空的情况。【活动说明】用户限制说明:1、参加本次社区活动的用户必须为华为云注册用户。同时为保证活动公平性,禁止用户以IAM账号身份参与活动,否则将视为无效。2、领取奖品的用户需为华为云实名用户,未完成实名认证的用户将不发放活动奖励。3、本次活动如一个实名认证对应多个账号,只有一个账号可领取奖励。如在同一概率活动中,同一账号重复获奖,只发放首先获奖奖品。4、本次活动一个实名认证账号只能对应一个收件人,如同一账号填写多个不同收件人,不予发放奖励。5、请开发者不要在活动期间随意修改社区昵称和华为云账号,由此产生的统计问题,如过了申诉期,小助手不再处理。(申诉期为活动结果公示3天内。)奖品发放说明:1、本活动结束之后10个工作日内公示获奖信息,获奖开发者用户需在截止时间在获奖信息收集表中填写获奖信息,获奖信息截止收集日过后10个工作日内,将统一发出奖品。华为云遵守《中华人民共和国个人信息保护法》规定,将以上个人信息仅用于礼品发放之目的,不会向任何第三方披露。若由于获奖开发者用户自身原因(包括但不限于联系方式有误、身份不符或超过截止登记日期等)造成奖品无法发送,视为获奖开发者用户放弃领奖。2、为保证活动的公平公正,华为云有权对恶意刷活动资源(“恶意”是指为获取资源而异常注册账号等破坏活动公平性的行为),利用资源从事违法违规行为的开发者用户收回抽奖及奖励资格。3、若发放奖品时,出现库存不足,则优先发放等价值的其他实物奖品;HDC限定礼包为24/25年款随机发货;活动二中华为耳机需要在有效评论>40个开启。4、所有参加本活动的开发者用户,均视为认可并同意遵守《华为云开发者用户协议》,包括以援引方式纳入《华为云开发者用户协议》、《可接受的使用政策》、《法律声明》、《隐私政策声明》、相关服务等级协议(SLA),以及华为云服务网站规定的其他协议和政策(统称为“云服务协议”)的约束。5、如果您不同意本活动规则和云服务协议的条款,请勿参加本活动。