-
1 月 17 日下午,G-Star Gathering Day 广州站在广州(国际)科技成果转化示范基地三楼星空间顺利举办。本次活动由 AtomGit 及华为云开发者联盟 HCDG 主办,吸引了众多开发者、创业者及技术爱好者到场参与。围绕「探索 AI 创意落地与智能体构建的无限可能」这一主题,活动通过主题演讲、实操演示、闪电分享及开放交流等多种形式,深度链接开源生态与 AI 应用实践,为现场伙伴带来了一场高密度的技术盛宴。开场致辞:共建开放、多元的开发者生态活动开始,主持人张润迪对到场嘉宾与开发者表示欢迎。随后,华为云开发者支持与运营部部长林华鼎为活动致辞,从生态建设、开发者成长等维度,分享了华为云对开发者社区的长期投入与期待,并现场邀请开发者加入体验官计划,与开发者共创共享易用好用的开发工具。 随后,联合主办方广州天河科创聚能运营管理有限公司对天河基地的政策支持体系也进行了详细解读。 技术分享:从开源生态到智能体实践AtomGit 深圳办总经理徐建国围绕 AtomGit 的平台定位与生态布局,系统介绍了其作为 AI 原生开源社区的核心能力与发展成果。通过分享 G-Star 开源摘星计划的运营机制与数据表现,展示了 AtomGit 如何从项目孵化、社区运营、资源对接等多维度赋能开源项目成长,构建开发者、企业与生态伙伴协同共建的良性循环,助力中国开源生态实现规模化与高质量发展。 华为云 HCDE、HCDG 胡琦从 Agent 基础原理入手,深入解析了 Astron Agent 这一企业级智能体工作流平台的整体架构与核心能力,重点介绍其在模型管理、AI 工作流编排、MCP 工具集与 RPA 自动化等方面的技术优势。通过真实案例与部署演示,生动展示了如何基于 Astron 快速搭建可规模化落地的智能体应用,帮助开发者将“智能体”从概念转化为可用产品。 华为云开发者生态运营总监童得力介绍华为开发者空间的整体能力,基于开发者空间为开发者提供一系列的工具和资源,包括开箱即用的开发环境、免费算力、预置工具链和丰富的案例库。通过现场实操演示 CodeArts代码智能体,现场指导开发者体验代码智能体的代码开发、调测和修改功能。与会的开发者表示,CodeArts代码智能体能帮助开发者提高开发效率,快速完成开发任务,降低 AI 开发门槛,实现高效落地智能应用。 CodeArts代码智能体是一款集代码大模型、AI IDE、代码 Agent 为一体的智能编码产品。面向代码生成、研发知识问答、单元测试用例生成、代码解释、代码注释、代码调试、代码翻译、代码检查、代码优化等场景功能,为开发者提高研发效率,提供极致的智能化编码体验。(点击参与体验) AtomGit 深圳办技术总监、华为云 HCDE 白晓明从行业趋势出发,深入分析了“跨平台 + 鸿蒙”成为必然选择的背景与价值,并系统对比了 Flutter、React Native、uni-app-x、Kuikly 等主流框架在鸿蒙生态中的适配成熟度与适用场景。他结合实践经验,为不同技术团队提供了清晰的技术选型建议,同时分享开源社区建设与训练营计划,鼓励开发者从使用者走向共建者,深度参与鸿蒙生态建设。 闪电演讲 :开发者真实经验碰撞在最具活力的闪电演讲环节,多位开发者主动上台,用 8 分钟分享自己的项目经验、踩坑故事与成长心得,涵盖 AI 应用、开源实践、创业探索等多个方向。随后大家围绕技术选型、项目落地、社区参与展开深度交流,建立起更多真实链接。 G-Star Gathering Day 不只是一次线下聚会,更是一次技术连接、思想碰撞与生态共建的开始。期待下一站,我们继续相聚,共同探索 AI 与开源的无限可能
-
CodeArts代码智能体启动公测!这是一款集AI IDE、Code Agent、代码大模型为一体的智能编码产品,它面向项目级代码生成、代码续写、研发知识问答、单元测试用例生成、代码解释、代码注释、代码调试、代码翻译、代码检查、代码优化等场景,依据开发者输入的需求描述,准确且高效地生成高质量代码, 如同开发者身边的专属技术顾问。为了让CodeArts产品能力更贴合用户应用场景、进一步提升体验,我们发起本次产品体验官招募活动,邀请各位有热情、有想法的开发者们加入CodeArts代码智能体体验官阵营,提出真实的产品改进意见,以帮助产品开发和优化迭代,合力构建易用、好用、开放的AI Coding平台。点此立即报名体验:cid:link_1活动时间:2026.1.16-2026.2.28活动流程:1、 点击上方按钮完成报名后,访问链接免费开通服务2、 下载安装,参照官网帮助文档(内含最佳实践)或收录进案例中心的实操案例,进行产品深度使用体验;同时需创建至少一个应用;3、 将应用运行的截图发送至活动指定评论区,跟帖评论体验感受,可以围绕体验流程、操作步骤(搭配产品界面截图)等主题;4、在官网云声·建议平台,反馈产品优化建议。包括:交互体验、感官体验、bug类、需求类、能力创新类等,(填写时,关联产品/功能 选择“CodeArts代码智能体”) 并标明以【CodeArts代码智能体产品体验官】为开头,示例:【CodeArts代码智能体产品体验官】整体体验不错,建议考虑XXX场景,实现XXX能力等等。) (CodeArts代码智能体产品体验交流群) 完整完成了以上四步体验任务的开发者,将参与评奖,奖项设置奖项设置获奖要求获奖名额激励礼品礼品示例高价值建议奖被产品研发评选为高价值需求3每人价值500元开发者礼包1份华为手环9NFC版(黑色)华为云云宝一套 开发者定制鼠标建议贡献排名奖被采纳建议数≥3条,且根据积分*排名TOP55每人价值200元开发者礼包1份练秋湖纪念水杯U型按摩枕开发者定制鼠标完成任务激励前50名完整完成任务50每人价值20元开发者礼品1份开发者鼠标垫建议采纳奖通过官网云声·建议平台所提的建议被采纳100每人价值50元开发者礼品1份开发者鼠标说明1、每条被采纳建议累计1积分,被采纳建议数统计截止时间为2026年2月28日24点;2、若出现积分相同且排名一致的情况,因奖品数量有限,根据先到先得原则进行发放;3、同一用户仅限获评一个奖项;4、 如礼品库存不足将替换成等价值礼品活动流程:活动时间:2026年1月16日-2月28日联合评审:2026年3月1日-3月15日奖项公示:2026年3月15日-3月20日奖品发放:获奖名单公布后5个工作日内寄出 关于华为云CodeArts代码智能体平台下载安装指引页面:cid:link_5帮助文档:cid:link_2CodeArts代码智能体产品体验指定评论区:cid:link_4
-
自动迁移方式迁移操作导入自动迁移的库代码。在训练入口.py文件的首行,插入以下引用内容。例如train.py中的首行插入以下引用内容。import torchimport torch_npufrom torch_npu.contrib import transfer_to_npu .....迁移操作完成。请参考训练配置及原始脚本提供的训练流程,在昇腾NPU平台直接运行修改后的模型脚本训练完成后,迁移工具自动保存权重成功,说明迁移成功。若迁移失败,请参考迁移异常处理进行解决迁移异常处理如果模型包含评估、在线推理功能,也可在对应脚本中导入自动迁移库代码,并通过对比评估推理结果和日志打印情况,判断与GPU、CPU是否一致决定是否迁移成功。若训练过程中提示部分CUDA接口报错,可能是部分API(算子API或框架API)不支持引起,用户可参考以下方案进行解决PyTorch GPU2Ascend工具迁移方式进入迁移工具所在路径cd Ascend-cann-toolkit /ascend-toolkit/latest/tools/ms_fmk_transplt/ #${INSTALL_DIR}请替换为CANN软件安装后文件存储路径。若安装的Ascend-cann-toolkit软件包,以root安装举例,则安装后文件存储路径为:/usr/local/Ascend/ascend-toolkit/latest。启动迁移任务./pytorch_gpu2npu.sh -i /home/username/fmktransplt -o /home/username/fmktransplt_output -v 2.1.0 [-s] [distributed -m /home/train/train.py -t model] # /home/username/fmktransplt为原始脚本路径,/home/username/fmktransplt_output为脚本迁移结果输出路径,2.1.0为原始脚本框架版本,/home/train/train.py为训练脚本的入口文件,model为目标模型变量名完成脚本迁移,进入脚本迁移结果的输出路径查看结果件请参考训练配置及原始脚本提供的训练流程,在昇腾NPU平台直接运行修改后的模型脚本。成功保存权重,说明保存权重功能迁移成功。训练完成后,迁移工具自动保存权重成功,说明迁移成功。训练配置为了提升模型运行速度,建议开启使用二进制算子,请参考安装CANN章节安装二进制kernels算子包后,参考如下方式开启a.单卡场景下,修改训练入口文件例如main.py文件,在import torch_npu下方添加如下加粗字体代码import torchimport torch_nputorch_npu.npu.set_compile_mode(jit_compile=False)......b.多卡场景下,如果拉起多卡训练的方式为mp.spawn,则torch_npu.npu.set_compile_mode(jit_compile=False)必须加在进程拉起的主函数中才能使能二进制,否则使能方式与单卡场景相同if is_distributed: mp.spawn(main_worker, nprocs=ngpus_per_node, args=(ngpus_per_node, args))else: main_worker(args.gpu, ngpus_per_node, args)def main_worker(gpu, ngpus_per_node, args): # 加在进程拉起的主函数中 torch_npu.npu.set_compile_mode(jit_compile=False) ......用户训练脚本中包含昇腾NPU平台不支持的torch.nn.DataParallel接口,需要手动修改为torch.nn.parallel.DistributedDataParallel接口执行多卡训练,参考GPU单卡脚本迁移为NPU多卡脚本进行修改若用户训练脚本中包含昇腾NPU平台不支持的amp_C模块,需要用户手动删除import amp_C相关代码内容后,再进行训练若用户训练脚本中包含torch.cuda.get_device_capability接口,迁移后在昇腾NPU平台上运行时,会返回“None”值torch.cuda.get_device_properties接口迁移后在昇腾NPU平台上运行时,返回值不包含minor和major属性,建议用户注释掉调用minor和major属性的代码了解更多请查阅昇腾社区文档:https://www.hiascend.com/document/detail/zh/CANNCommunityEdition/850alpha002/devaids/migrationtools/atlasfmkt_16_0019.html
-
迁移分析 PyTorch Analyse工具提供分析脚本,帮助用户在执行迁移操作前,分析基于GPU平台的PyTorch训练脚本中API、三方库套件、亲和API分析以及动态shape的支持情况前提条件 使用PyTorch Analyse工具前须安装如下依赖。如下命令若使用非root用户安装,需要在安装命令后加上--user,例如:pip3 install pandas --user,安装命令可在任意路径下执行pip3 install pandas #pandas版本号需大于或等于1.2.4pip3 install libcst #Python语法树解析器,用于解析Python文件pip3 install prettytable #将数据可视化为图表形式pip3 install jedi #三方库套件、亲和API分析时必须安装启动分析任务进入分析工具所在路径cd Ascend-cann-toolkit /ascend-toolkit/latest/tools/ms_fmk_transplt/ #${INSTALL_DIR}请替换为CANN软件安装后文件存储路径。若安装的Ascend-cann-toolkit软件包,以root安装举例,则安装后文件存储路径为:/usr/local/Ascend/ascend-toolkit/latest。启动分析任务./pytorch_analyse.sh -i /home/xxx/analysis -o /home/xxx/analysis_output -v 2.1.0 [-m torch_apis] # /home/xxx/analysis为待分析脚本路径,/home/xxx/analysis_output为分析结果输出路径,2.1.0为待分析脚本框架版本,torch_apis为分析模式分析报告简介 分析模式为“torch_apis”时,分析结果如下所示├── xxxx_analysis // 分析结果输出目录│ ├── cuda_op_list.csv //CUDA API列表│ ├── unknown_api.csv //支持存疑的API列表│ ├── unsupported_api.csv //不支持的API列表│ ├── api_precision_advice.csv //API精度调优的专家建议│ ├── api_performance_advice.csv //API性能调优的专家建议│ ├── pytorch_analysis.txt // 分析过程日志分析模式为“third_party”时,分析结果如下所示├── xxxx_analysis // 分析结果输出目录│ ├── cuda_op.csv //CUDA API列表│ ├── framework_unsupported_op.csv //框架不支持的API列表│ ├── full_unsupported_results.csv //全量不支持的API列表│ ├── migration_needed_op.csv //待迁移的API列表│ ├── unknown_op.csv //支持情况存疑的API列表│ ├── pytorch_analysis.txt // 分析过程日志分析模式为“affinity_apis”时,分析结果如下所示├── xxxx_analysis // 分析结果输出目录│ ├── affinity_api_call.csv // 可替换为亲和API的原生API调用列表│ ├── pytorch_analysis.txt // 分析过程日志分析模式为“dynamic_shape”时,分析结果如下所示├── xxxx_analysis // 分析结果输出目录│ ├── 生成脚本文件 // 与分析前的脚本文件目录结构一致│ ├── msft_dynamic_analysis│ ├── hook.py //包含动态shape分析的功能参数│ ├── __init__.py了解更多请查阅昇腾社区文档:https://www.hiascend.com/document/detail/zh/CANNCommunityEdition/850alpha002/devaids/migrationtools/atlasfmkt_16_0018.html
-
简介 PyTorch GPU2Ascend工具可将基于GPU的训练脚本迁移为支持NPU的脚本,大幅度提高脚本迁移速度,降低开发者的工作量。本样例可以让开发者快速体验自动迁移(推荐)和PyTorch GPU2Ascend工具的迁移效率前提条件准备一台基于Atlas 训练系列产品的训练服务器,并安装对应的驱动和固件。驱动和固件的安装请参考安装NPU驱动和固件安装开发套件包Ascend-cann-toolkit,具体请参考安装CANN以安装PyTorch 2.1.0版本为例,具体操作请参考“安装PyTorch”章节,完成PyTorch框架和torch_npu插件的安装使用PyTorch GPU2Ascend迁移前须执行如下命令安装依赖,如下命令如果使用非root用户安装,需要在安装命令后加上--user,例如:pip3 install pandas --userpip3 install pandas #必选,pandas版本号需大于或等于1.2.4pip3 install libcst #必选,语义分析库,用于解析Python文件pip3 install prettytable #必选,将数据可视化为图表形式pip3 install jedi #必选,用于跨文件解析下载main.py文件,将获得ResNet50模型放到用户自定义路径下(如/home/user)自动迁移(推荐) 修改内容少,只需在训练脚本中导入库代码,迁移后直接在昇腾NPU平台上运行。在训练脚本main.py文件中导入自动迁移的库代码。from torch.utils.data import Subsetimport torch_npu from torch_npu.contrib import transfer_to_npu .....切换目录至迁移完成后的训练脚本所在路径(以/home/user为例),执行以下命令使用虚拟数据集进行训练,迁移完成后的训练脚本可在NPU上正常运行。开始打印迭代日志,说明训练功能迁移成功cd /home/userpython main.py -a resnet50 --gpu 1 --epochs 1 --dummy # --gpu 1表示使用卡1,--epochs 1是指迭代次数为1迁移工具自动保存权重成功,说明迁移成功使用PyTorch GPU2Ascend工具迁移进入迁移工具所在路径cd Ascend-cann-toolkit /ascend-toolkit/latest/tools/ms_fmk_transplt/ # ${INSTALL_DIR}请替换为CANN软件安装后文件存储路径。若安装的Ascend-cann-toolkit软件包,以root安装举例,则安装后文件存储路径为:/usr/local/Ascend/ascend-toolkit/latest。执行脚本迁移任务,参考表1配置信息./pytorch_gpu2npu.sh -i /home/user -o /home/out -v 2.1.0 # /home/user为原始脚本路径, /home/out为脚本迁移结果输出路径,2.1.0为原始脚本的PyTorch框架版本切换目录至迁移完成后的训练脚本所在路径(以/home/user为例),执行以下命令使用虚拟数据集进行训练,迁移完成后的训练脚本可在NPU上正常运行。开始打印迭代日志,说明训练功能迁移成功cd /home/userpython main.py -a resnet50 --gpu 1 --epochs 1 --dummy # --gpu 1表示使用卡1,--epochs 1是指迭代次数为1完成脚本迁移,进入脚本迁移结果的输出路径查看结果件迁移工具自动保存权重成功,说明迁移成功了解更多请查阅昇腾社区文档:https://www.hiascend.com/document/detail/zh/CANNCommunityEdition/850alpha002/devaids/migrationtools/atlasfmkt_16_0030.html
-
调优流程 部署开发环境和运行环境-》安装配置AOE-》配置环境变量-》获取IR构图对应的air文件-》执行调优环境准备 AOE工具运行依赖昇腾AI处理器,所以当前工具仅支持昇腾AI处理器所在设备既作开发环境又作运行环境的场景请参考《CANN 软件安装指南》完成驱动、固件以及开发套件包Ascend-cann-toolkit的安装,部署开发环境和运行环境安装第三方依赖配置环境变量 必选环境变量CANN软件基础环境变量:CANN组合包提供进程级环境变量设置脚本,供用户在进程中引用,以自动完成环境变量设置。执行命令参考如下,以下示例均为root或非root用户默认安装路径,请以实际安装路径为准# 以root用户安装toolkit包后配置环境变量source /usr/local/Ascend/ascend-toolkit/set_env.sh # 以非root用户安装toolkit包后配置环境变量source ${HOME}/Ascend/ascend-toolkit/set_env.sh AOE工具依赖Python,以Python3.7.5为例,请以运行用户执行如下命令设置Python3.7.5的相关环境变量#用于设置python3.7.5库文件路径export LD_LIBRARY_PATH=/usr/local/python3.7.5/lib:$LD_LIBRARY_PATH#如果用户环境存在多个python3版本,则指定使用python3.7.5版本export PATH=/usr/local/python3.7.5/bin:$PATH 可选环境变量:AOE调优环境变量,示例如下 export ASCEND_DEVICE_ID=0 export TUNE_BANK_PATH=/home/HwHiAiUser/custom_tune_bank export TE_PARALLEL_COMPILER=8 export REPEAT_TUNE=False执行调优执行AOE调优引擎进行子图调优aoe --framework=1 --model=./xxxx.air --job_type=1执行AOE调优引擎进行子图重载调优aoe --framework=1 --model=./xxxx.air --job_type=1 --reload执行AOE调优引擎进行算子调优aoe --framework=1 --model=./xxxx.air --job_type=2查看调优结果自定义知识库和om模型:子图自定义知识库、算子自定义知识库算子调优结果文件:算子调优结果文件的存放路径优先级为:ASCEND_WORK_PATH > 默认(执行调优的工作目录),若未配置ASCEND_WORK_PATH(可以使用env命令查询是否配置,ASCEND_WORK_PATH详细信息请参考《环境变量参考》),算子调优结果文件存放在默认路径(执行调优的工作目录)。调优过程中,实时生成的结果文件命名为“aoe_result_opat_${timestamp}_${pidxxx}.json”,记录了调优过程中被调优的算子信息。其中${timestamp}为时间戳,格式为:年月日时分秒毫秒,“${pidxxx}”中的“xxx”为进程ID。子图调优结果文件:子图调优结果文件的存放路径优先级为:ASCEND_WORK_PATH > 默认(执行调优的工作目录),若未配置ASCEND_WORK_PATH(可以使用env命令查询是否配置,ASCEND_WORK_PATH详细信息请参考《环境变量参考》),子图调优结果文件存放在默认路径(执行调优的工作目录)。调优过程中,实时生成的结果文件命名为“aoe_result_sgat_${timestamp}_${pidxxx}.json”,记录了调优过程中被调优的子图信息。其中${timestamp}为时间戳,格式为:年月日时分秒毫秒,“${pidxxx}”中的“xxx”为进程ID。性能验证 调优完成后,请使用调优后的自定义知识库(如何使用请参见如何使用调优后的自定义知识库)编译并运行Graph,验证性能是否提高。此过程中如果调用aclgrphBuildModel接口,请刷新算子编译缓存,即将OP_COMPILER_CACHE_MODE设置为force(详见《图模式开发指南》)。否则会导致自定义的知识库无法匹配。了解更多请查阅昇腾社区文档:https://www.hiascend.com/document/detail/zh/CANNCommunityEdition/850alpha002/devaids/aoe/aoeep_16_062.html
-
在线推理场景下调优 TensorFlow在线推理场景支持子图调优和算子调优,TensorFlow在线推理场景下调优和TensorFlow训练场景下在线调优的过程基本相同,可参考TensorFlow训练场景下在线调优。 TensorFlow在线推理场景下调优和TensorFlow训练场景下在线调优的两个小区别如下通过设置环境变量进行调优时,在线推理场景执行的是在线推理脚本,TensorFlow训练场景执行的是训练脚本通过修改脚本进行调优时,在线推理场景仅支持sess.run模式,通过session配置项aoe_mode和work_path使能AOE调优。仅支持TensorFlow 1.15和TensorFlow 2.6.5PyTorch在线推理场景下调优 PyTorch在线推理场景支持算子调优,PyTorch在线推理场景下调优和PyTorch训练场景下调优的过程基本相同,可参考PyTorch训练场景下离线调优。 PyTorch在线推理场景下调优和PyTorch训练场景下调优的区别是:在线推理场景执行的是在线推理脚本,训练场景执行的是训练脚本了解更多请查阅昇腾社区文档:https://www.hiascend.com/document/detail/zh/CANNCommunityEdition/850alpha002/devaids/aoe/aoeep_16_059.html
-
在这个 AI 技术日新月异的时代,开发者该如何精准把握技术趋势,将创意转化为现实? G-Star Gathering Day 广州站正式开启!本次活动由 AtomGit 及华为云开发者联盟 HCDG 主办,我们诚邀广大 AI 从业者、开源技术爱好者齐聚羊城,共同探讨全栈 AI 实践、智能体(Agent)构建以及开源生态的未来。 📅 活动信息活动时间: 2026 年 1 月 17 日(星期六)14:00活动地点:广州(国际)科技成果转化天河基地三楼星空间 🌟 活动亮点本场活动旨在搭建一个深度交流的平台,通过技术分享与实操演练,助力开发者:深度链接:搭建华为云开发者、开源技术社区与开发者的交流桥梁。前瞻视角:分享 AI 全栈技术的最新实践成果与行业趋势。🎤 精彩议程【开篇:生态视角】AtomGit 深圳办总经理徐建国将分享如何利用 AtomGit 打造新一代开源生态。【硬核:AI 与鸿蒙】华为云 HCDE、HCDG 胡琦将揭秘如何利用 openJiuwen 快速构建智能体应用;AtomGit 深圳办技术总监白晓明则会带来跨平台框架开发鸿蒙的实战经验。【实战:创意落地】 华为云开发者生态运营经理王东将开启 50 分钟的“演讲+实操”,手把手带你在华为开发者空间将 AI 创意转化为现实。 ❗️ 温馨提示:请到场的小伙伴带好笔记本电脑,现场参与实操还能获得奖品哦! 🔥 特色环节:闪电演讲 (Lightning Talk)我们特别开放了 5 个“8 分钟闪电分享” 名额! 无论你是想展示自己的开源项目、分享踩坑经验,还是交流技术心得,这都是你展示自我的绝佳机会。参与方式:请在报名表单中备注您的分享主题。📩 立即报名诚邀 AI 从业者与开源技术爱好者参与!
-
调优流程 部署开发环境和运行环境-》安装PyTorch训练相关软件-》dump算子图-》配置环境变量-》执行调优环境准备 AOE工具运行依赖昇腾AI处理器,所以当前工具仅支持昇腾AI处理器所在设备既作开发环境又作运行环境的场景。请参考《CANN 软件安装指南》完成驱动、固件、开发套件包Ascend-cann-toolkit和AI框架PyTorch的安装。算子调优 如何进行算子调优,包括调优前须知、dump算子图、配置环境变量和调优命令 调用前须知请保证训练脚本在昇腾AI处理器上执行成功,功能和精度满足预期不建议用户绑定训练进程到指定的CPU,请使用系统默认的CPU调度策略。否则,可能会影响调优效果为提高调优效率,希望用户尽量控制训练步数。一般情况下,通过一个step能完成一次完整的图执行过程,保证图中所有的算子都能遍历一遍完成调优即可目前仅支持静态算子,暂不支持动态算子仅支持1P脚本进行dump图AOE不支持不同用户同时使用同一device进行调优单个AOE进程时,请确保具备如下条件。多个AOE进程时,可参考如下条件自行扩展调优前,请确保关闭Profiling功能,避免影响调优结果。关闭Profiling功能具体操作请参见《性能调优工具用户指南》 dump算子图方式一:通过aclGenGraphAndDumpForOp接口dump出来算子图。方式二:在模型脚本中添加如下使能代码,将算子图dump到本地。 配置环境变量CANN软件基础环境变量:CANN组合包提供进程级环境变量设置脚本,供用户在进程中引用,以自动完成环境变量设置。执行命令参考如下,以下示例均为root或非root用户默认安装路径,请以实际安装路径为准。# 以root用户安装toolkit包后配置环境变量source /usr/local/Ascend/ascend-toolkit/set_env.sh # 以非root用户安装toolkit包后配置环境变量source ${HOME}/Ascend/ascend-toolkit/set_env.sh AOE工具依赖Python,以Python3.7.5为例,请以运行用户执行如下命令设置Python3.7.5的相关环境变量#用于设置python3.7.5库文件路径export LD_LIBRARY_PATH=/usr/local/python3.7.5/lib:$LD_LIBRARY_PATH#如果用户环境存在多个python3版本,则指定使用python3.7.5版本export PATH=/usr/local/python3.7.5/bin:$PATH调优前也可参考如下示例配置其他环境变量,但为可选配置export ASCEND_DEVICE_ID=0export TUNE_BANK_PATH=/home/HwHiAiUser/custom_tune_bankexport TE_PARALLEL_COMPILER=8export REPEAT_TUNE=False 执行调优aoe --job_type=2 --model_path=dump_path查看调优结果自定义知识库:自定义知识库存放路径的优先级为:TUNE_BANK_PATH>ASCEND_CACHE_PATH>默认;若未配置TUNE_BANK_PATH和ASCEND_CACHE_PATH(可以使用env命令查询是否配置),自定义知识库默认存储在:${HOME}/Ascend/latest/data/aoe/custom/op/${soc_version}。算子调优结果文件:算子调优结果文件的存放路径优先级为:ASCEND_WORK_PATH > 默认(执行调优的工作目录),若未配置ASCEND_WORK_PATH(可以使用env命令查询是否配置,ASCEND_WORK_PATH详细信息请参考《环境变量参考》),算子调优结果文件存放在默认路径(执行调优的工作目录)性能验证 调优完成后,请还原代码,并刷新算子编译缓存,即将ACL_OP_COMPILER_CACHE_MODE设置为force,使用方法示例如下。import torch import torch_npu option = {"ACL_OP_COMPILER_CACHE_MODE":"force"} torch_npu.npu.set_option(option) 使用调优后的自定义知识库前,请确保未开启二进制模式,使用方法如下。torch_npu.npu.set_compile_mode(jit_compile=True)了解更多请查阅昇腾社区文档:https://www.hiascend.com/document/detail/zh/CANNCommunityEdition/850alpha002/devaids/aoe/aoeep_16_041.html
-
在IPv4/IPv6过渡场景中(如464XLAT架构),AFTR(地址族转换路由器)与NAT64设备负责IPv6与IPv4的协议转换和地址映射。当需要追溯外网访问的原始内网IPv6用户时,核心逻辑是通过设备会话表/映射表的关联字段,构建“外网IPv4流 → 转换设备表项 → 内网IPv6主机”的追溯链路。一、追溯核心前提与关键关联字段追溯的核心是利用AFTR和NAT64设备记录表项中“原始IPv6信息”与“转换后IPv4信息”的绑定关系,需先明确两类设备的关键表项字段及协同逻辑:1.1 核心前提条件设备已启用完整的会话/映射表记录功能(默认通常启用,部分场景需配置日志留存时长);AFTR与NAT64为同一过渡架构(如464XLAT中,AFTR集成NAT64功能,或两者通过信令协同);可获取外网侧的追溯线索(如目标IPv4服务器IP、访问时间戳、协议类型、端口号)。1.2 关键表项字段(AFTR与NAT64通用核心字段)字段类型核心字段名称字段作用原始IPv6侧信息原始源IPv6地址(Original Source IPv6)内网发起请求的IPv6用户主机地址(核心追溯目标)原始源端口(Original Source Port)IPv6主机发起请求的端口(用于区分同一主机的多会话)IPv6侧接口/区域(IPv6 Interface/Zone)标识IPv6用户所在的内网区域(辅助定位主机物理位置)转换后IPv4侧信息转换后源IPv4地址(Translated Source IPv4)NAT64分配给IPv6用户的公网IPv4地址(外网日志可见)转换后源端口(Translated Source Port)NAT64映射的公网端口(外网日志可见,用于区分同一IPv4的多用户)目的IPv4地址/端口(Destination IPv4/Port)外网目标服务器地址/端口(追溯线索的核心匹配条件)会话关联信息会话ID(Session ID)AFTR/NAT64设备内部标识会话的唯一ID(用于关联同一会话的完整表项)会话创建时间戳(Session Start Time)匹配外网访问的时间范围(避免因端口复用导致追溯错误)二、分步追溯流程(从外网线索到IPv6主机)假设已获取外网追溯线索:外网IPv4服务器IP(203.0.113.10)、访问时间(2026-01-10 14:30-14:40)、协议(TCP)、目标端口(80),具体追溯步骤如下:步骤1:定位NAT64设备,查询映射表与会话表NAT64是IPv6→IPv4地址映射的核心设备,优先通过外网线索匹配其表项,获取原始IPv6初步信息。登录NAT64设备管理界面/CLI:Web界面:通常路径为【网络配置】→【NAT64配置】→【地址映射表】/【会话表】;CLI登录:通过SSH/Console登录,进入特权模式(如华为设备:nat64> enable)。按外网线索筛选表项: 核心筛选条件:目的IPv4=203.0.113.10、目的端口=80、协议=TCP、时间戳在14:30-14:40之间。CLI查询命令示例(华为NAT64设备):# 查看NAT64会话表(筛选目标IPv4和时间范围) display nat64 session destination-ipv4 203.0.113.10 destination-port 80 protocol tcp start-time 2026-01-10 14:30 end-time 2026-01-10 14:40 # 查看NAT64地址映射表(关联转换后的IPv4和原始IPv6) display nat64 mapping translated-source-ipv4 any destination-ipv4 203.0.113.10提取关键信息: 从查询结果中提取“原始源IPv6地址”“原始源端口”“转换后源IPv4/端口”“会话ID”,示例如下:原始源IPv6:2409:8978:500::123(核心追溯目标候选)转换后源IPv4:198.51.100.20,转换后源端口:54321会话ID:0x123456,创建时间:2026-01-10 14:35:22步骤2:联动AFTR设备表项,验证会话完整性在464XLAT架构中,AFTR负责IPv6-in-IPv4隧道的终结,其会话表记录隧道内外的地址关联,需通过NAT64获取的“会话ID”或“原始IPv6”联动验证,确保会话的唯一性和有效性。登录AFTR设备管理界面/CLI:Web界面:【隧道配置】→【464XLAT】→【AFTR会话表】;CLI登录:进入特权模式(如:aftr> enable)。按关键线索查询AFTR会话表: 筛选条件:可选择“内层原始IPv6=2409:8978:500::123”(从NAT64获取)或“关联会话ID=0x123456”。CLI查询命令示例(华为AFTR设备):# 按原始IPv6查询AFTR会话 display aftr session inner-source-ipv6 2409:8978:500::123 # 按会话ID查询AFTR隧道信息 display aftr session session-id 0x123456验证并补充信息: AFTR表项应匹配NAT64的会话信息,同时补充“隧道外层地址”“IPv6侧接入接口”等信息,示例:内层原始IPv6:2409:8978:500::123(与NAT64一致,验证有效)隧道外层IPv4:10.0.0.1(AFTR与CE设备之间的隧道地址)IPv6侧接入接口:GigabitEthernet0/0/1(内网IPv6用户接入的物理接口)会话状态:ESTABLISHED(会话有效,未中断)步骤3:结合内网设备,精准定位IPv6主机通过NAT64和AFTR表项获取原始IPv6地址后,需结合内网DHCPv6服务器、接入交换机等设备,确认该IPv6地址对应的具体主机(如终端IP绑定、MAC地址、主机名等)。查询DHCPv6服务器分配日志: 若内网IPv6地址通过DHCPv6动态分配,登录DHCPv6服务器,查询“IPv6地址-客户端DUID-MAC地址”绑定记录,筛选条件:IPv6地址=2409:8978:500::123,时间范围包含会话创建时间(14:35左右)。示例结果:IPv6地址2409:8978:500::123 绑定 MAC地址:00:1B:44:11:3A:B2,客户端DUID:000100012A3B4C5D001B44113A8B。查询接入交换机的MAC地址表: 登录AFTR表项中记录的IPv6接入接口(GigabitEthernet0/0/1)所属的接入交换机,查询MAC地址表,筛选条件:MAC地址=00:1B:44:11:3A:B2。CLI查询命令示例(华为交换机):display mac-address 001B-4411-3A8B示例结果:MAC地址对应交换机端口GigabitEthernet0/0/24,VLAN:10(内网业务VLAN)。定位具体主机: 通过交换机端口GigabitEthernet0/0/24的物理部署位置(如办公区A座3楼第24个工位),或结合终端管理系统(如AD域、终端安全管理平台)查询MAC地址00:1B:44:11:3A:B2对应的主机名、登录用户等信息,完成最终追溯。三、常见问题与解决方法3.1 表项查询不到或匹配不到问题原因:会话表项老化(默认老化时间通常为1-30分钟,TCP会话可能更长)、筛选条件错误(如时间范围偏差);解决方法:扩大时间范围查询,查看设备日志留存(部分设备支持将表项日志导出至Syslog服务器),确认外网线索的准确性(如目标IPv4是否为NAT64转换后的地址)。3.2 多个IPv6用户复用同一转换后IPv4地址问题原因:NAT64启用端口复用机制,多个IPv6用户映射到同一公网IPv4地址的不同端口;解决方法:必须结合“转换后源端口”和“会话创建时间戳”精准匹配,避免因端口复用导致追溯错误。3.3 原始IPv6为静态分配,无DHCPv6日志解决方法:查询内网IPv6地址规划表(静态地址分配记录),或通过网络管理平台(如iMaster NCE)查询该IPv6地址的历史在线记录和绑定主机信息。四、关键工具与日志辅助设备自带日志功能:开启NAT64/AFTR的会话日志导出功能,将日志发送至Syslog服务器(如ELK、Splunk),支持长期留存和多条件筛选;网络管理平台:通过华为iMaster NCE、深信服AD等平台,统一采集NAT64、AFTR、交换机、DHCPv6服务器的日志,实现“一键追溯”功能;安全审计工具:若追溯场景为安全事件(如攻击行为),可结合WAF、IPS等安全设备的日志,交叉验证IPv6用户的访问行为,提升追溯准确性。五、总结一下下通过AFTR和NAT64追溯原始IPv6用户的核心是“以外网线索为起点,通过NAT64获取原始IPv6,通过AFTR验证会话有效性,最终结合内网设备定位具体主机”。关键在于确保设备表项/日志的完整留存,精准匹配“原始IPv6-转换后IPv4-端口-时间戳”的关联关系,同时联动内网DHCPv6和接入交换机的信息,形成完整的追溯闭环。
-
华为服务器全面支持SAP HANA(含一体机与TDI方案)及主流企业级数据库,通过SAP官方认证,提供从入门到关键业务的全栈解决方案,性能表现行业领先。一、SAP HANA支持情况(官方认证+全系列覆盖)1.1 核心认证与方案类型方案类型认证状态适用场景SAP HANA一体机官方GA认证(最高16TB/32TB)关键业务、单节点大规模部署SAP HANA TDI方案全认证分布式集群、混合负载场景SAP HANA云部署华为云认证弹性扩展、按需付费场景华为是SAP全球战略合作伙伴,KunLun关键业务服务器与FusionServer机架服务器均通过SAP HANA官方认证,支持从128GB到**64TB+**的内存扩展能力。1.2 支持的服务器型号(核心产品线)服务器系列代表型号最大内存支持核心优势KunLun关键业务服务器9008 V5/9032 V532TB32路CPU扩展、自研NC互联芯片、RAS2.0高可靠特性FusionServer机架服务器2488H V5/5885H V58TB四路/八路CPU、高密度内存、PCIe 4.0高速接口TaiShan鲲鹏服务器2280 V6/5280 V66TB国产ARM架构、多核高并发、低功耗1.3 关键技术适配内存优化:针对SAP HANA内存计算特性,提供多通道内存架构,内存带宽提升40%+存储加速:采用ES3000 PCIe SSD作为数据库日志卷,I/O性能提升3倍,数据持久化时延低至150μs网络增强:支持56Gbps/100Gbps InfiniBand网络,集群通信时延降低20%RAS特性:KunLun服务器提供内存镜像、CPU热插拔、故障隔离等RAS2.0功能,满足99.999%可用性要求二、SAP HANA性能表现2.1 基准测试记录(行业领先)测试场景服务器型号性能指标行业地位SAP BW on HANAFusionServer 2488H V56,781查询/小时同配置全球第一(2018年)SAP BW on HANAKunLun 9008 V55,475查询/小时八路服务器领先水平(2019年)数据加载性能KunLun+ES3000 SSD提升50%分布式集群场景并发处理能力KunLun 9032 V5支持1000+并行任务超大型ERP系统适配2.2 客户实际应用效果中国石油:构建超大型SAP HANA集群,支持1000+并行任务,存储网络带宽提升6倍恒天然:采用5885H V3一体机,SAP S/4HANA处理能力提升7倍,数据足迹减少10倍某金融机构:KunLun服务器支撑16TB SAP HANA部署,系统可靠性提升90%,年故障时间降至**<5分钟**三、其他企业级数据库支持(全生态覆盖)3.1 主流商业数据库数据库类型支持状态性能优化Oracle全版本兼容多核绑定、大页内存、异步I/O优化SQL Server2017/2019/2022认证内存缓冲池扩展、列存储索引加速DB2官方认证并行查询优化、存储分层管理GaussDB原生适配深度融合鲲鹏架构,TPC-C性能达150万tpmC3.2 国产数据库深度适配openGauss:华为自研开源数据库,在TaiShan服务器上性能提升30%+,支持百亿级数据秒级查询达梦/人大金仓:全认证支持,提供国产软硬件一体化解决方案海量数据库Vastbase:基于openGauss内核,在华为服务器上实现100万+ QPS事务处理能力四、性能影响因素与优化建议4.1 核心影响因素调制格式:QPSK系列(2阶)比16QAM系列(4阶)传输距离长2-3倍FEC类型:RSFEC(超强)> SDFEC(软判决)> HFEC(高增益),对应不同误码门限硬件配置:CPU核心数:SAP HANA分析负载建议32核+内存容量:至少为数据库压缩后容量的1.5倍存储类型:NVMe SSD > SAS SSD > SATA HDD软件优化:操作系统:SUSE Linux Enterprise Server(SAP认证版本)内核参数:关闭透明大页、调整内存锁定比例4.2 最佳实践配置负载类型推荐配置性能目标OLAP分析KunLun 9008 V5 + 16TB内存 + ES3000 SSD复杂查询响应时间<1秒OLTP事务FusionServer 2488H V5 + 4TB内存 + 100G网卡事务处理能力>5万tpmC混合负载TDI方案 + 分布式存储分析与事务性能平衡五、查询验证方法(官方文档+设备侧)5.1 文档查询入口华为Hedex文档:产品文档 > 服务器 > KunLun/FusionServer > 兼容性手册 > SAP HANA认证章节SAP官方网站:SAP HANA Hardware Directory > 搜索"Huawei"查看认证列表华为企业业务网站:解决方案 > SAP > SAP HANA > 技术规格5.2 设备侧验证命令 # 查看服务器硬件配置(华为服务器CLI) huawei# display system info huawei# display memory summary # 查看SAP HANA运行状态(Linux系统) sapadm> hdbinfo sapadm> hdbsql -u SYSTEM -p <密码> "SELECT * FROM M_SYSTEM_OVERVIEW 六、总结一下下华为服务器对SAP HANA等企业级数据库提供全面支持+深度优化,通过官方认证确保兼容性,凭借硬件创新(如KunLun的NC芯片、ES3000 SSD)和软件适配(如内存/存储/网络优化)实现行业领先性能。无论是单节点大规模部署还是分布式集群场景,华为服务器均能提供可靠、高效的基础设施支撑。
-
尊敬的华为开发者大赛获奖选手:再次祝贺各位在激烈的竞争中脱颖而出,用创新的技术方案与卓越的作品赢得了属于你们的荣誉!我们深知,每一份获奖作品背后,都凝聚着你们对技术的深度思考、对问题的独特见解以及对创新的不懈追求。这些宝贵的实践与经验,不仅能为开发者点亮引路明灯,更是推动整个开发者社区共同进步的阶梯。为此,我们特别发起 2025华为开发者大赛获奖作品技术征文活动,诚邀各位获奖者分享作品背后的技术故事、架构精髓与实践心得,与全球开发者交流,共同点亮技术前行的道路。 📝 征文方向鼓励开发者从以下两个维度,深入分享您的作品如何取得成功:1. 技术突破:华为云产品如何赋能开发,成就技术创新2. 业务成长:开发者联盟生态社区及大赛平台如何助力,帮助开发者实现商业成功 ✨作品要求作品必须为原创首发,不得抄袭;字数建议不少于1000字,图文并茂更佳;技术案例需包含:大赛作品介绍、技术突破与价值创新与项目最新落地应用。 🎁 参与有礼所有审核通过并正式发布的优质技术征文作者,将获得我们精心准备的 「技术达人」专属礼包,以感谢您为社区贡献的智慧。 ⏰ 活动时间 : 2026年1月8日-2026年3月31日本次活动为针对华为开发者大赛获奖作品的技术分享,我们期待持续汇集您的真知灼见,欢迎您的投稿。 📬 投稿方式 1、将稿件发送至邮箱:HuaweiDeveloperCompetition@huawei.com 邮件主题请注明 【2025获奖征文】- 作品名称 - 作者/团队名 2、联系华为云赛事小助手: 🚀🚀从技术验证到商业探索,你们的每一步都值得被记录、被分享。让我们携手,将比赛中迸发的技术火花,凝聚成可以燎原的智慧之火,赋能更多开发者,共同定义更加璀璨的技术未来。期待您的投稿!
-
尊敬的开发者: 您好! 感谢大家一直以来对沃土云创计划的关注与支持,为了给广大开发者提供更优质、更全面的服务与支持,沃土云创计划将在近期进行升级调整。2026年1月1日起,沃土云创代金券权益申请通道将暂时关闭,请各位开发者耐心等待。 本次调整旨在为2026年全新政策落地做好准备。我们诚挚邀请您持续关注后续发布的版本计划细则,届时将推出更完善更丰富的开发者支持权益。特别说明:对于2025年已成功提交申请的用户,凡符合当时政策要求的,我们将继续按原规则完成审核与权益发放,不受本次调整影响。 给大家带来的不便,我们深表歉意,敬请谅解。如有疑问,欢迎通过官方渠道联系我们。
HuaweiCloudDeveloper
发表于2026-01-06 17:03:09
2026-01-06 17:03:09
最后回复
yd_217172301
2026-04-13 20:35:53
157 1 -
调优流程 训练场景的调优分如下两类子图调优和算子调优梯度调优环境准备 安装软件包及如何安装 软件部署:AOE工具运行依赖昇腾AI处理器,所以当前工具仅支持昇腾AI处理器所在设备既作开发环境又作运行环境的场景快速入门执行训练脚本查看调优结果训练过程中,调优的关键日志信息如下:# TFAdapter开启调优in tune mode, training graph handled by tools# 工具启动调优Aoe tuning graph.子图/算子调优 前提条件:添加环境变量CANN软件基础环境变量:CANN组合包提供进程级环境变量设置脚本,供用户在进程中引用,以自动完成环境变量设置。执行命令参考如下,以下示例均为root或非root用户默认安装路径,请以实际安装路径为准# 以root用户安装toolkit包后配置环境变量source /usr/local/Ascend/ascend-toolkit/set_env.sh # 以非root用户安装toolkit包后配置环境变量source ${HOME}/Ascend/ascend-toolkit/set_env.sh AOE工具依赖Python,以Python3.7.5为例,请以运行用户执行如下命令设置Python3.7.5的相关环境变量#用于设置python3.7.5库文件路径export LD_LIBRARY_PATH=/usr/local/python3.7.5/lib:$LD_LIBRARY_PATH#如果用户环境存在多个python3版本,则指定使用python3.7.5版本export PATH=/usr/local/python3.7.5/bin:$PATH调优前也可参考如下示例配置其他环境变量,但为可选配置export ASCEND_DEVICE_ID=0export TUNE_BANK_PATH=/home/HwHiAiUser/custom_tune_bankexport TE_PARALLEL_COMPILER=8export REPEAT_TUNE=Falseexport REPEAT_TUNE=False 梯度切分调优 前提条件:添加环境变量CANN软件基础环境变量:CANN组合包提供进程级环境变量设置脚本,供用户在进程中引用,以自动完成环境变量设置。执行命令参考如下,以下示例均为root或非root用户默认安装路径,请以实际安装路径为准AOE工具依赖Python,以Python3.7.5为例,请以运行用户执行如下命令设置Python3.7.5的相关环境变量# 以root用户安装toolkit包后配置环境变量source /usr/local/Ascend/ascend-toolkit/set_env.sh # 以非root用户安装toolkit包后配置环境变量source ${HOME}/Ascend/ascend-toolkit/set_env.sh 配置调优模式:# 调优模式,指定为4:GDAT调优,必选配置export AOE_MODE=4# 指定调优后自定义知识库的存储路径,可选配置export TUNE_BANK_PATH=/home/HwHiAiUser/custom_tune_bank了解更多请查阅昇腾社区文档:https://www.hiascend.com/document/detail/zh/CANNCommunityEdition/850alpha002/devaids/aoe/aoeep_16_032.html
AI百校计划技术专家
发表于2026-01-06 16:09:48
2026-01-06 16:09:48
最后回复
TCDEFGHIJKLMNO1PQRSA
2026-01-07 08:40:52
149 1
上滑加载中
推荐直播
-
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中 -
华为云码道全新升级,多会话并行与多智能体协作2026/05/08 周五 19:00-21:00
王一男-华为云码道产品专家;张嘉冉-华为云码道工程师;胡琦-华为云HCDE;程诗杰-华为云HCDG
华为云码道4月份版本全新升级,此次直播深度解读4月份产品特性,通过“特性解读+实操演示+实战案例+设计创新”的组合,全方位展现码道在多会话并行与多智能体协作方面的能力,赋能开发者提升效率
正在直播
热门标签