-
在人工智能浪潮席卷全球的当下,培养掌握前沿技术、具备实践开发能力的复合型人才已成为高校与企业的共同使命。为顺应这一趋势,10 月 12 日,华为云 HCSD 高校公开课走进电子科技大学清水河校区,为高校开发者们带来了一场从技术趋势到开发实战的深度技术盛宴。电子科技大学计算机科学与技术学院(网络空间安全学院)副院长肖鸣宇、华为开发者支持与运营部部长林华鼎、华为云开发者技术专家韩增旭、华为云 AI 算法工程师王云艺、华为仓颉语言生态发展经理赵丹荣等嘉宾出席活动,百余名师生到场参与。现场氛围热烈活跃,成为校企协同推进 AI 时代人才培养的生动写照。 ▲ 活动现场图校企携手,共筑数字人才培养基石 活动伊始,电子科技大学计算机科学与技术学院(网络空间安全学院)副院长肖鸣宇在开场致辞中强调,产教融合是推动高等教育高质量发展的关键路径。他指出,校企合作模式既能精准对接数字经济时代企业对复合型技术人才的需求,也为高校优化人才培养方案提供了重要的实践检验场。作为国家“双一流”建设重点高校,电子科技大学始终将创新型数字人才培养置于战略核心地位。肖鸣宇副院长介绍,目前学校与华为云已在科研攻关、人才培养等领域取得丰硕合作成果。面向未来,他期望双方进一步深化协同创新机制、充分发挥各自优势,将鲲鹏生态、昇腾AI、5G通信等前沿技术案例转化为教学资源,合力打造具有全国示范意义的数字化人才培养标杆院校。 ▲ 电子科技大学计算机科学与技术学院(网络空间安全学院)副院长 肖鸣宇华为云开发者支持与运营部部长林华鼎在发言中指出,电子科技大学作为国家“双一流”、985及211工程重点建设高校,在电子信息领域具有顶尖学科实力,且与华为长期保持着深度且富有成效的校企合作关系,为双方后续合作奠定了坚实基础。随后,林华鼎部长结合行业背景,分享了华为应对技术 “卡脖子” 困境时所取得的创新突破。过往,面对外部芯片供应链封锁,华为秉持着“没有退路就是胜利之路”的信念,推出昇腾云等创新产品以实现破局。他详细介绍道,华为先是启动“南泥湾计划”,又于去年推出全球首个光互联超节点 CloudMatrix 384。在今年的全连接大会上,华为再度发布最新超节点产品 Atlas 950 SuperPoD和Atlas 960 SuperPoD,在卡规模、总算力等关键指标上实现全面领先。这一系列成果,既展现出华为的技术韧性,也为开发者提供了高性能的算力底座。基于上述技术基础,林华鼎部长进一步分享了华为云助力AI时代数字人才培养的三大举措:推出企业级 AI Agent 开发平台 Versatile、全面升级支持多人云端协同编程的华为开发者空间以及打造集成 AI 课程与实验沙箱环境的华为云学堂,旨在为开发者提供全链路支持。他表示,在技术爆炸的AI时代,华为云愿成为成电学子前沿技术探索的“黑土地”,期待校企双方持续深化合作,共同培育科技领域拔尖人才,助力成电学子从成电走向世界舞台。 ▲ 华为云开发者支持与运营部部长 林华鼎把握AI新趋势,大模型重塑开发者学习路径 在技术分享环节,华为云 AI 算法工程师王云艺以《大模型时代下,高校开发者如何学好 AI》为主题,深入剖析了大模型的核心逻辑与学习路径。“我们正迈向通用人工智能时代,而大模型已成为 AI 开发的新范式”,王云艺指出。他详细拆解了大模型构建的全流程,并针对高校开发者的学习特点,重点介绍了可低成本参与大模型应用开发关键技术——提示工程 Prompt 以及大模型高效微调。 同时,为了助力高校开发者低门槛参与大模型开发与应用实践,王云艺还介绍了昇腾AI云服务的产品特性与行业应用案例,“昇腾AI云服务提供全栈自主可控、规模算力、极致性价比的开放兼容,百模千态云底座。目前已服务涵盖 1000+ 客户和伙伴,沉淀行业主流 160+ 模型。”他还特别推荐了华为开发者大赛·昇腾 AI 算法挑战赛与华为开发者布道师计划,鼓励同学们通过这些路径获取更多资源与实战机会。 ▲ 华为云AI算法工程师 王云艺打造开发新体验,华为开发者空间赋能效率提升 华为云开发者技术专家韩增旭在《华为开发者空间,为开发者提供AI时代智能应用开发体验》的分享中,为高校开发者们清晰展示了华为开发者空间的核心价值与实践能力。“华为开发者空间是为全球开发者打造的专属开发空间,集成了昇腾、鸿蒙、鲲鹏、GaussDB、欧拉等根技术资源与工具,为开发者提供AI时代的智能应用开发体验。”韩增旭介绍道。他重点拆解了平台的核心优势:一是提供丰富的免费权益,包括180 小时云主机时长、每周 200 万 MaaS Token、每天两小时 AI Notebook 资源、100 万次云函数调用等,可大幅降低开发门槛;二是灵活的云开发环境形态,支持鲲鹏云开发环境、昇腾AI云服务以及鸿蒙场景三种云开发环境,能精准适配不同开发场景需求。为直观体现平台实用性,他分享了多个典型案例,例如实现鲲鹏应用迁移、端云协同开发、昇腾 AI 模型训练以及通过 Versatile Agent 平台快速构建 AI Agent、借助 FunctionGraph 云函数快速部署 MCP Server等。韩增旭表示,华为开发者空间不仅是工具平台,更是开发者成长生态,其配套了多项学习资源,还提供赛事活动与案例共创激励,其核心愿景正是助力开发者通过这些成长路径,在AI时代实现高效创新。 ▲ 华为云DTSE 开发者技术专家 韩增旭构筑生态新语言,仓颉驱动鸿蒙创新 “纵观软件演进历程,软件、硬件的革新都伴随着语言的大变革”。华为仓颉语言生态发展经理赵丹荣在《仓颉语言 + CodeArts:驱动鸿蒙开发生态创新与繁荣》中说道。她聚焦鸿蒙开发,展开介绍了华为自研编程语言仓颉所具备的四大核心特性,并带领高校开发者们摸索了高效掌握仓颉语言的四个阶段。 此外,赵丹荣还详细说明了仓颉语言配套工具链——华为云软件开发生产线 CodeArts 是如何提供从开发、构建到测试的全流程支持。“在过去一年中,CodeArts 已经上线了鸿蒙工具链,并成功支撑了开源鸿蒙项目的构建”。她特别强调,仓颉在鸿蒙生态中的定位,是“繁荣 HarmonyOS NEXT 应用生态,打造适合鸿蒙原生应用开发的语言。” ▲ 华为仓颉语言生态发展经理 赵丹荣实操互动:从理论到实践,深化学习效果 为进一步巩固学习效果,现场还设置了实操环节,由技术专家们带领同学们进行两个方向的实践,一是基于华为云开发者空间 Versatile Agent 平台构建昇腾 C 算子开发知识库;二则是运用仓颉编程语言与 DeepSeek 大模型,从零搭建智能聊天助手。 过程中,同学们踊跃向专家提问,华为云技术专家们全程巡回指导,针对代码调试、资源配置等问题实时解答,确保每位参与者都能完成实践任务,加深对 AI 开发与仓颉语法特性的理解。 颁发校园大使,持续激发创新活力 值得关注的是,活动现场还举行了优秀校园大使颁奖仪式。电子科技大学校方领导肖鸣宇副院长与华为云林华鼎部长共同为校内优秀学生颁发荣誉证书,肯定他们在校园开发者生态建设中的积极作用。未来,这些校园大使将作为华为云学生开发者计划(HCSD)的核心力量,通过组织技术沙龙、竞赛等活动,带动更多同学学习华为云技术,提升创新能力。▲优秀校园大使合影一直以来,华为云以昇腾、鸿蒙、鲲鹏等根技术为核心,深耕数字人才培养,为高校开发者提供覆盖从技术学习到实战落地的全链路支持。此次华为云 HCSD 高校公开课,无疑又是一场将大模型、AI Agent等前沿技术与高校教育场景深度融合的成功实践。展望未来,华为云将持续以华为云学生开发者计划为纽带,一方面深化与电子科技大学的合作,把华为开发者空间等平台的优质学习资源进一步融入教学体系中;另一方面,依托开发者大赛、案例共创等多样化形式,为高校开发者创造更多实战机会,真正培育出契合 AI 时代需求的复合型数字人才,为中国数字经济高质量发展注入核心动能。
-
请求帮助在python 3.11 arm+npu modelarts 环境提供pycolmap 包支持,这个包非常重要,是许多3D vision 任务的核心库,无法替代这个包在Ubuntu 和 其他x86 系统中可以直接通过 pip 安装, 也可以使用 源码编译但是arm中缺乏的支持的比较多,需要多层编译的嵌套,不知道是否华为侧可以提供支持,可以在镜像中直接pip 安装
-
torch 会支持到2.4吗
-
当编译clomap时,会出现多种错误
-
使用b3 torch 环境,提示: cuda_home找不到,我已经参考了文档,设置CUDA_HOME='/usr/local/cuda',但是并不行。$CUDA_HOME='/usr/local/Ascend/' 也不行
-
案例介绍本案例应用基于MaaS结合Astro平台便捷的构造一个诗词生成网站系统,针对用户输入的主题及选择的类型采用Maas平台结合DeepSeek-R1智能输出。 一、概述1. 案例介绍华为开发者空间是专为全球开发者打造的一站式云端开发平台,致力于为每一位开发者提供云主机资源、全套开发工具及云上存储空间。平台汇聚了昇腾 AI、鸿蒙操作系统、鲲鹏处理器、GaussDB 数据库、欧拉操作系统等华为全栈根技术的开发工具与生态资源,配套丰富的实战案例与技术指导,助力开发者从编码开发、调试测试到创新应用,轻松上手、快速进阶。依托华为根技术生态,开发者空间为技术探索、应用创新与能力成长提供强有力的支持,让创新触手可及。华为开发者空间Astro低代码开发平台,提供面向界面、逻辑与数据对象的全方位可视化编排工具,支持通过“拖、拉、拽”等直观操作快速搭建应用。开发者无需编写大量代码,即可实现应用的页面布局、交互逻辑与数据模型的高效配置,真正享受“所见即所得”的敏捷开发体验。通过极简的操作流程,大幅缩短开发周期,提升开发效率,让创新想法快速落地为可用应用。本案例应用基于MaaS结合Astro平台便捷的构造一个诗词生成网站系统,针对用户输入的主题及选择的类型采用Maas平台结合DeepSeek-R1智能输出。通过实际项目操作流程,带领大家深入浅出地掌握如何高效利用 Astro 低代码平台进行应用开发。在本次实践中,您将系统学习 Astro 平台的核心功能,包括模型集成、可视化界面拖拽、页面布局设计、业务逻辑配置,直至应用打包发布的完整开发链路。通过 hands-on 的方式,全面掌握 Astro 低代码平台的基础操作,并深入体验其与大模型能力的深度融合,切实感受低代码技术在提升开发效率、降低开发门槛方面的显著优势。2. 适用对象企业个人开发者高校学生3. 案例时间本案例总时长预计90分钟。4. 案例流程说明:领取华为开发者空间,登录华为开发者空间-低代码应用开发平台新建低代码应用,进入Astro轻应用服务控制台主页,开发应用5. 资源总览本案例预计花费0元。资源名称规格单价(元)时长(分钟)MaaS 平台商用模型DeepSeek-R1 轻量体验包(¥7.00)/ DeepSeek-V3 轻量体验包(¥3.50)领券免费90华为开发者空间 - 低代码应用开发平台系统标配免费90 二、MaaS平台商用模领取整体流程: DeepSeek-R1/V3-64K百万tokens代金券:cid:link_0 代金券使用说明: 购买DeepSeek Tokens套餐包,DeepSeek-R1 轻量体验包(¥7.00)或DeepSeek-V3 轻量体验包(¥3.50); 进入ModelArts Studio服务页面—在线推理—商用服务—DeepSeek-V3/R1-64K—开通服务—API Key配置; 点击DeepSeek-R1/V3-64K百万tokens代金券领取,领取相应的商用代金券,用来开通商用deepseek服务。进入页面后, 点击【立即申请】即可领取成功领取成功后,根据使用说明中的步骤进行使用,首先点击购买DeepSeek入口,进行套餐购买(记得使用领取的优惠券0元购买),购买成功后点击ModelArts Studio服务页面进入MaaS平台。 进入Maas平台后,搜索R1模型进行开通默认勾选所有模型,如果不需要的话可以取消勾选。点击开通服务后面的【调用说明】按钮,可以看到关于API KEY管理,我们使用的核心点就是这个 API KEY ,主要用这个去调用 ,所以大概需要点击API KEY去生成并记录。这里我们就不在赘述流程了。因为比较简单。开通完成API Key后,Maas的领取流程就结束了。相对是很简单的,我们主要需要记住以下2点:1、模型名称:DeepSeek-R12、API Key : 我们自己生成的。三、华为开发者空间-低代码应用开发平台1. 登录华为开发者空间-低代码应用开发平台华为开发者空间Astro低代码开发平台,提供面向界面、逻辑与数据对象的全方位可视化编排工具,支持通过“拖、拉、拽”等直观操作快速搭建应用。开发者无需编写大量代码,即可实现应用的页面布局、交互逻辑与数据模型的高效配置,真正享受“所见即所得”的敏捷开发体验。通过极简的操作流程,大幅缩短开发周期,提升开发效率,让创新想法快速落地为可用应用。登录华为开发者空间,在左侧菜单列表选择华为开发者空间 -> 开发平台 -> Astro 低代码开发,进入华为开发者空间-低代码应用开发平台。点击【新建低代码应用】创建一个新的应用。点击【标准应用】- 【确定】 创建 一个标准低代码应用填写命名空间,点击【确定】开始正式创建标准应用填写必要的名称和标签后,点击确认正式创建成功 创建成功会自动打开一个新的tab页面2. 低代码应用开发平台-模型关联我们优先来关联一下模型,关联完成模型后在创建页面来使用模型。在关联模型前,我们了解一下模型的流程,主要2点。1、关联模型核心是调用模型接口,我们通过连接器对模型进行连接。2、连接创建后通过编排逻辑,将输入与输出封装,并调用 连接器进行模型调用 。连接器创建【集成】-【连接器实例】-【Maas云平台】-【创建】填写标签、名称 :自定义填写模型名称:DeepSeek-R1API Key: 在开通模型时提到的api key创建。填写完成后点击保存连接器就创建成功了可以看到创建成功的连接器,同时连接器详情下面有一个测试。通过测试功能可测试大模型是否成功调用。大家自行测试一下,输入内容能正常输出结果,则无误,否则请检查配置的api key.逻辑编排对于逻辑的编排我们可以简单思考一下,这就像我们封装一个方法一样,肯定会有输入输出才可以进行整体逻辑的编排。所以我们先创建一下输入和输出的参数。点击【数据】-结构体【创建】,在弹出的创建结构体页面中填写名称和唯一标识,点击保存即可创建完成结构体。创建完成后我们需要配置结构体实际的结构。选择结构体,【结构】-【编辑】 开始进行结构体编辑创建实际的结构体内容,包括了role角色和提示词内容content入参结构体创建成功后,因为智能体返回的结果是字串,所以我们不需要创建其他结构体了。我们开始进行编排逻辑。点击【逻辑】-编排【创建】,在添加服务编排弹层中填写标签和名称,这里名称就是后面需要调用的名称。可以理解为函数名称。添加成功后,我们可以看到如下的逻辑编排页面,点击【开始按钮】,可以看到右上角有一个功能是【全局上下文】,这里可以定义上下文所需要的变量信息。我们先直接创建2个变更 ,输入和输出。在下面截图第4点中可以直接修改名称,如果名称错误想重新修改点击变量后面的三个【...】可修改。创建完成基础变量后,我们创建一个对象变量,这个对象变量就是实际调用模型的变量了。点击对象变量【创建】,在弹层中切换到【全局结构体】,名称可以自定义,全局结构体字段选择上面创建的结构体,勾选是否为数组,点击保存,即可创建成功。变量成功创建后,我们开始编排,首先对入口进行参数绑定。接下来我们创建一个赋值,一个连接器,并将其连接起来。赋值:意思是将input输入的字符进行转换赋值为连接器所需要的参数。连接器:就是我们创建的Maas服务,当赋值转换成功后就可调用。添加完成后,我们开始对赋值进行转换。点击【赋值】,将对象变量中的2个参数拖拽添加到变更中,操作符选择= , 角色的值为:"user"固定的,内容则为输入变量(直接拖拽)。转换成功后,我们配置连接器并绑定变量。点击【连接器】后,在基本信息中绑定连接器。切换到连接器参数配置中,绑定输入和输出参数,需要注意的是output变量 是任意类型,不然绑定会失败。如果不是任意类型点击变量 后面【...】进行类型切换。完成后,我们【保存】-【启用】-【运行】开始做一下编排的测试。输入 参数 输出结果 3、功能开发基础准备通过界面功能,开始创建新的界面。点击【界面】-页面【创建】,在弹层中填写标签和名称,点击添加创建完成后我们可以看到下面的操作界面。基础组件:基础的一些组件,如表单、容器等等,可以快速拖拽到页面中。页面内容:显示组件内容的模块。属性栏:针对组件进行相关的属性设置事件栏:对组件进行对应的事件设置。操作栏:保存、预览、全屏、切换电脑/手机在正式开始页面处理之前,我们先创建一个对象。用来接收用户输入的内容及智能体响应的内容。所以我们要有输入和输出字段。我们点击【数据】-对象【创建】,填写对象名称和唯一标识,点击确定创建对象。点击创建的对象,为对象来 添加描述和结果字段。正式开始创建页面,页面分为四块:1、标题2、banner3、输入栏4、输出栏标题添加一个【容器】,设置容器属性为弹性布局,对齐方式居中,再添加一个【标题】配置标题的内容和颜色、字体等banner添加【图片】,上传自定义图片后,设置图片宽度为100%,高度100px输入添加【输入框】,配置标签名称及占位符内容,最后增加数据绑定点击后面的【设置】按钮,点击弹框中的【新增模型】输入自定义的模型名称,选择【对象】,点击【下一步】选择上面我们创建的对象,勾选描述和内容,点击【下一步】,然后点击【确定】。最后,将新增的模型message中的消息内容与输入框进行绑定。输出增加【多行输入框】组件,修改标签名称,最后绑定数据字段。最后一步,完成保存事件最后我们只需要将点击保存的事件完成,就完成 了整个操作流程,就是这样简单。点击【保存】-【事件】-点击【新建】,创建一个自定义js代码编写对应的js代码,核心逻辑是:获取页面上form表单的内容,组装好后发送到逻辑编排方法中,然后返回对应的结果,提交form表单保存。// 表单校验 var _form = context.$component.form; var validFlag = _form.formValidateUnPromise(); if (!validFlag) return false; // 序列化表单数据 var model = context.$model.ref("message").getData(); var modelCopy = JSON.parse(JSON.stringify(model)); // 处理非字符串字段 Object.keys(modelCopy).forEach(item => { if (modelCopy[item] && typeof modelCopy[item] !== "string") { modelCopy[item] = JSON.stringify(modelCopy[item]); } }); // 提取问题字段值 var message = modelCopy["sc__message__CST"] // 构建提示文本 var suggestionText = `你是一位诗人,请根据${message}来创作一首诗词`.replace(/"/g, "'"); // 初始化Flow var _flow = context.flow("sc__scss"); // 调用AI服务获取建议 try { // 提示信息 context.$message.info("正在生成诗词,请等待结果。。。。。。"); const resp = await _flow.run({ input: suggestionText }); const reader = resp.body.getReader(); const decoder = new TextDecoder(); let buffer = ''; let msg = ''; while (true) { const { done, value } = await reader.read(); if (done) break; buffer += decoder.decode(value); const lines = buffer.split('\n'); // 保留最后一行(可能不完整) buffer = lines.pop() || ''; for (const line of lines) { if (!line.trim()) continue; try { const jsonStr = line.startsWith('data: ') ? line.substring(6) : line; if (jsonStr.trim() === '[DONE]') continue; const obj = JSON.parse(jsonStr); const newMsg = obj?.choices[0]?.delta?.content || ''; if (newMsg) msg += newMsg; } catch (err) { console.warn('解析JSON失败,保留到下一轮处理:', err.message); buffer = line + '\n' + buffer; } } } // 最终保存结果 modelCopy.sc__content__CST = msg; context.$model.ref("message").setData(modelCopy); context.$model.ref("textarea_0").setData(msg) // 提交数据 const saveResult = await context.$model.ref("message").save(); if (saveResult.resCode == 0) { const recordId = saveResult.result[0]?.id; if (recordId) { // context.$page.loadStdPage('xiaocao__t_mass', "recordId=" + recordId); // // 成功消息 // context.$message.success('生成成功'); } } } catch (error) { console.error("AI服务调用失败:", error); // 可以添加错误处理逻辑,如显示错误信息 }完成后我们保存,预览。这就是最后的效果啦~ 我正在参加【案例共创】第7期 基于MaaS商用服务 + 华为开发者空间 - Astro 低代码开发平台构建低代码应用 cid:link_1
-
您好我正在notebook配置上手昇腾相关环境,需要一些额外的存储空间来装数据和其他文件,但是我在配置外挂obs的时候遇到了一些问题,还请问这里文档说《选择运行中的Notebook实例,单击实例名称,进入Notebook实例详情页面,在“存储配置”页签,单击“添加数据存储”,设置挂载参数》但是我按照说明点进了notebook详情页但是并没有找到挂载pfs的地方,还请老师指教这个《存储配置》页签在哪里?此外我看北京4,上海1都可以挂载obs,但是没有昇腾算力。还请老师帮助解决。
-
一、背景说明:我正在参加华为昇腾AI算子大赛,第一次接触ModelArts开发平台,在跟着说明文档操作配置环境时出现了一些与说明文档不符的错误,恳请各位路过的大佬不吝赐教指出问题。二、这是错误截图,我无法找到说明文档对应的版本镜像,也无法选择实例规格三、这个是说明文档相关内容截图,文档pdf已上传至附件,相关内容在2.1步骤2即文档第7页或整个word文档的第9页华为云Ascend C算子开发 环境搭建手册
-
体验华为开发者空间《【案例共创】华为开发者空间云开发环境 x DeepSeek打造全链路高效数据分析工作流》案例,反馈改进建议,请直接在评论区反馈即可。体验指导:https://devstation.connect.huaweicloud.com/space/devportal/casecenter/1476b44e28e84471b95a8c43753d2d79/1
-
例如额度在1号到期,部分发放出的代金券到期时间会晚于1号,想问一下在额度到期后这些发放出去的代金券是否仍然有效?
-
我们打算测试一下310p的推理,但是两种租算力的方式: Notebook 以及轻算力节点,搜了一下各个区域,都没有找到310的npu算力。请问有310p算力吗?
-
核心定义全量微调,也称为标准微调或全参数微调,指的是在预训练模型的基础上,使用一个新的、特定领域或任务的数据集,对模型所有参数(权重) 进行再次训练的过程。简单来说,就是把一个已经“学富五车”的通才(预训练模型),通过针对性的学习,变成某个领域的专家(微调后的模型)。一个生动的比喻想象一个刚从医学院毕业的医生(预训练模型):预训练:他在医学院学习了海量的通用医学知识(解剖学、生理学、药理学等),具备了成为一名医生的基础能力。全量微调:现在,他决定成为一名顶尖的心脏外科专家。他进入心脏外科,开始进行大量、高强度的专科训练。在这个过程中,他大脑中所有的知识网络——无论是与心脏相关的还是无关的——都会根据新的专科经验进行调整和优化。他看待普通感冒的角度可能都会因为深厚的心脏知识而发生变化。结果:他成为了一个非常专业的心脏外科医生(全量微调后的模型),在处理心脏相关问题时极其出色,但其底层的基础医学知识也因专科训练而发生了改变。相比之下,P-tuning、LoRA、Adapter 等参数高效微调方法更像是这位医生不去动他原有的大脑结构,而是佩戴一个智能的“专家眼镜”。通过这副眼镜,他看问题时能得出心脏专家的结论,但摘下眼镜后,他仍然是那个通才医生,原有知识丝毫未变。全量微调的关键特点更新所有参数:这是最本质的特征。模型中的每一个权重(从输入层到输出层)都会根据新数据集的损失函数梯度进行更新。高计算成本:由于需要更新海量参数(尤其是对于拥有数十亿甚至万亿参数的大模型),全量微调需要巨大的显存和计算资源。通常需要多个高性能GPU才能完成。高存储成本:微调后的模型需要保存一套完整的、新的参数。如果你对同一个基础模型微调了10个不同的任务,你就需要存储10个完整的模型副本,每个都很大。潜在“灾难性遗忘”风险:模型在专注于学习新任务数据的同时,可能会遗忘在预训练阶段学到的通用知识。如果新数据集很小或不够多样,模型可能会“过度拟合”新任务,导致泛化能力下降。效果潜力最佳:在数据充足、计算资源允许的情况下,全量微调通常能达到最出色的性能。因为它允许模型从底层到顶层全方位地适应新任务,捕捉最细微的数据模式。全量微调的工作流程选择一个预训练模型:例如,BERT、GPT、T5等。准备下游任务数据集:例如,用于情感分析的影评数据集、用于问答的SQuAD数据集等。定义任务头:根据任务类型,在预训练模型顶部添加一个合适的输出层(例如,用于分类的分类器)。配置训练参数:使用一个较小的学习率。因为模型已经在一个大数据集上得到了良好的训练,我们只需要对其进行“微调”,而不是“重新训练”。大的学习率可能会破坏已有的宝贵知识。选择优化器、批次大小等。开始训练:将新数据输入模型。计算损失(预测值与真实值的差距)。通过反向传播算法计算所有参数的梯度。使用优化器更新所有权重。评估与保存:在验证集上评估模型性能,最终保存整个微调好的模型。全量微调 vs. 参数高效微调 特性全量微调参数高效微调更新参数全部参数极少部分参数(如适配器层、LoRA矩阵)计算资源要求极高要求很低存储开销每个任务需保存完整模型,开销大只需保存少量新增参数,可共享基础模型遗忘风险较高较低(冻结了原始参数)性能潜力最高(资源数据充足时)通常接近或达到全量微调水平适用场景计算资源充足、追求极致性能资源有限、需要快速部署多个任务总结全量微调是一种强大但“昂贵”的迁移学习技术,它通过调整模型的所有参数来使其深度适配特定任务。虽然它在效果上潜力巨大,但其高昂的计算和存储成本催生了参数高效微调技术的快速发展。在选择使用哪种方法时,需要在性能、成本和时间之间做出权衡。对于大多数个人开发者和小型团队而言,参数高效微调(如LoRA)是目前更实用、更流行的选择。
-
CANN软件包版本为Ascend-cann-toolkit_8.2.RC1_linux-aarch64.run问题:显示aclError:507015错误
-
在modelarts上运行代码时出现错误,见上图,求助
-
在Modelarts配置云侧环境的时候,安装在ma-user/Ascend目录下的CANN包在停止notebook后会清理掉,导致每次重新启动notebook都需要重新安装CANN包,有什么解决方案吗?
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签