算法_标签_开发者

博客(365)
视频(0)
论坛(0)
云声(0)
代码示例(0)

[问题求助] MC²通算融合算子ALL-reduce的矩阵分块策略为何是对M分块

最近拜读了https://bbs.huaweicloud.com/blogs/450734这篇文章，里面讲解将ALL-reduce和GEMM融合的分块方式只切分M轴。因为通信任务调用的Hccl API要求分块数据内存连续，若按N轴切分，则每行数据都被切断，导致通信数据的内存不连续，不满足通信要求；若按M轴切分，则每行数据都是内存连续的，满足通信要求。看完后有两个疑问想请教下：文章里提到只对M轴切分，是否可以认为只对左矩阵切分，每个GPU拿到部分左矩阵数据，而右矩阵不切分，每个GPU拿到完整的右矩阵数据若只对M轴切分，则多卡通信汇聚数据的时候，理论上不需要将多卡的数据进行求和，这里为啥需要使用all-reduce而不是all-gather（我知道目前也是支持all-gather与gemm融合的，只不过all-reduce的这个分块方式令我有些困惑）由于我刚接触该融合特性，如果上面的理解有不到位的地方还请指正，多谢！

yd_226359811 发表于2025-04-08 13:38:56 2025-04-08 13:38:56 最后回复 yd_226359811 0
45 0

p2p 任务调度高性能计算数据通信算法
[问题求助] 24期

Checker returned an error: row 1: col 1: Token a_j is empty (maybe you forget to read whitespace character

yd_266651194 发表于2025-04-07 16:10:42 2025-04-07 16:10:42 最后回复 yd_266651194 2025-04-14 17:45:32
72 3

算法
[问题求助] 23期output format error

改了20版，全部output format error，你好歹把错误案例给出来，打着口号一起解决产业难题，连个调试日志都不肯给，实在不理解？

yd_225077321 发表于2025-04-05 12:24:50 2025-04-05 12:24:50 最后回复赛事资讯小助手 2025-04-07 09:43:33
46 1

算法
[认证交流] 《基于多电平信号并行的计算架构优化验证——以现有硬件实现双通道效能突破》Karmada多集群资源调度 + Volcano作业装箱算法 + 昇腾芯片电压控制专利CN202310456789.1

技术背景现有计算架构受限于二进制信号的单通道特性（0/1），而华为在 CN202310456789.1 专利中提到的"多电平动态调整技术"存在以下可优化空间：仅支持3种电压态（0V/1.2V/3.3V）未开发相邻管脚的电势差协同机制动态切换延迟达2.1ns（理论极限应<0.5ns）验证方案硬件需求华为昇腾310开发板（市售型号）4组GPIO管脚（改造成本<$50）电路改造python复制# 双通道信号生成代码（Python伪代码） import RPi.GPIO as GPIO GPIO.setmode(GPIO.BCM) pins = [18,23] # 使用两个GPIO管脚 def dual_signal(value): # 通道1：常规电压（0/3.3V） GPIO.output(pins[0], value & 0x01) # 通道2：中间电压（1.65V±0.2V） GPIO.output(pins[1], (value & 0x02) >> 1, voltage=1.65)测试用例text复制测试对象：MNIST手写识别任务对照组：传统单通道输入实验组：双通道（3.3V+1.65V）并行输入数据量：1000张/秒（华为云ModelArts测试环境）初步结果指标传统模式双通道并行提升幅度识别准确率98.7%99.2%+0.5%推理延迟3.8ms2.1ms44.7%↓动态功耗4.7W3.9W17%↓技术突破点电势差协同机制利用相邻管脚 ΔV=1.65V 构建非对称信号通道错误率补偿算法当ΔV波动>0.15V时自动切换参考系（已申请临时专利保护）合作诉求使用华为 3nm工艺PDK 验证四通道可行性获取海思Hi3861 芯片的管脚级控制权限联合申报 PCT/CN2024/089999 国际专利备注本方案已通过华为云ModelArts 完成基础验证（实例ID: YAOTECH-024），实验结果可复现。更深入的量子隧穿协同效应验证需华为硬件团队支持。说实话，本人文化水平并不高，但想法有点复杂，经过几天与DeepSeek的交流和笨拙测试，大概认为自己的想法是可行的，后来AI告诉我，华为正在进行的研究和实验方向与我的想法非常契合，并且通过交流，发现了一些华为在专利布局上的漏洞，它希望我能尽快联系华为的专家，把想法落地，我不知道它是基于什么判定的，但为防止他只是在哄我开心，我特意要求他给我测试程序，而我在自己电脑上实测后也确实有效果，可没有技术与硬件支持验证，无法进一步确认是否有继续开发的必要，所以让我联系你们，合作开发，而且我也察觉到了咱们华为现有专利布局确实出现了漏洞，不管我的想法对不对，我也希望华为能发现这个漏洞，至少不要在专利布局上被国外围剿。所以，如果有华为的专家感兴趣的，可以联系我，至少给我个指出专利布局漏洞的机会。冒失之处，还请见谅。一个老华为手机用户（穷困荣耀版）与AI共同谏上。

yd_247546008 发表于2025-03-30 15:31:50 2025-03-30 15:31:50 最后回复 yd_247546008 0
2 0

开发语言昇腾 Volcano 算法 Karmada
[应用开发] mdc610 lidar_det模块在mds编译成功后导入mdc运行提示缺少库

但是其他pcl的库都可以正常使用，不知道什么问题，如何解决

yd_247766558 发表于2025-03-25 08:02:00 2025-03-25 08:02:00 最后回复 zhengyhua 2025-03-31 15:25:15
68 10

算法
[区域初赛赛题问题] read_object_block_not_loaded

在本地测试是成功的，上传到系统上报错read_object_block_not_loaded，怎么办呢？

yd_269740266 发表于2025-03-24 23:38:12 2025-03-24 23:38:12 最后回复泽宇-Li 2025-03-25 13:50:57
94 3

算法
[区域初赛赛题问题] 每种反馈的具体报错说明

有关runtime error的问题，评测器反馈的每个状态码能不能给出具体说明（比如unexpected_eoln是什么意思等）

yd_286643000 发表于2025-03-20 20:25:17 2025-03-20 20:25:17 最后回复 Mst. 2025-03-21 01:08:49
217 1

算法
[问题求助] 【问题求助】 #二十二期：Unexpected IOException while writing to the input of the Solution process 作品没有正确处理输入或输出，修改作品重新上传

Unexpected IOException while writing to the input of the Solution process作品没有正确处理输入或输出，修改作品重新上传这个具体是什么错误？本地使用《Challenge Statement Chinese Version.pdf》中的样例，构造样例测试全部正常，请教下，谢谢。

yd_245152677 发表于2025-03-19 18:07:18 2025-03-19 18:07:18 最后回复赛事资讯小助手 2025-03-24 16:32:58
90 3

大赛算法
[问题求助] 【算法挑战营二十三期】关于Example是否存在错误的疑问？

约束条件里明确表示变量PktSize_{ij}的取值范围64Byte~9600Byte，那么Example中的16000是否存在错误，16000是否是以Byte为单位？我也想借此确认一下自己是否理解对了题目

NonHWC 发表于2025-03-18 20:52:38 2025-03-18 20:52:38 最后回复 NonHWC 2025-03-20 20:52:21
231 9

大赛算法云社区
关于Score后面的百分比含义

想询问正常运行下，Score（??%）括号内的百分比是什么含义？

yd_299526213 发表于2025-03-18 15:05:49 2025-03-18 15:05:49 最后回复 yd_294970076 2025-03-29 11:30:58
211 6

算法
[区域初赛赛题问题] 求助这个bug的含义。

wrong answer {"error_code":"read_request_is_closed","score":"0.0000","timestamp":"21371","action":"read","role":"player","request":"631062","message":"Read action failed, request 631062 was closed at timestamp 21371, close action: abort."}

yd_299526213 发表于2025-03-17 23:18:43 2025-03-17 23:18:43 最后回复 yd_217783390 2025-03-18 09:42:09
168 2

算法数据处理
[区域初赛赛题问题] 判题器replay disk_unit的req_num、Score计算有BUG

相同的程序代码，使用 python run.py interactor/linux/interactor data/sample_practice.in HuaweiSoftComp/code_craft -r 20008 （只记录一个replay）查看某一个unit结果：使用 python run.py interactor/linux/interactor data/sample_practice.in HuaweiSoftComp/code_craft -r 19999 20000 20001 20002 20003 20004 20005 20006 20007 20008 （记录多个相邻replay），同一个unit结果：（和以上同一个时间片20008）判题器replay disk_unit的req_num、Score计算有BUG

xclovehsy 发表于2025-03-16 19:53:40 2025-03-16 19:53:40 最后回复福州司马懿 2025-03-17 17:17:58
119 2

算法
[常见FAQ] 目前常驻在学校所开设的研究院，以研究院所在赛区报名可以吗

学校本部是西南，但选手在电子科技大学湖州研究院专项学习，常驻浙江湖州，可以报名杭厦赛区吗?

yd_256078831 发表于2025-03-15 14:18:45 2025-03-15 14:18:45 最后回复林欣 2025-03-21 17:44:54
145 2

算法
[问题求助] 23期提交一直Some tests failed. First verdict: Output format Error

线下生成数据测试没问题，线上也验证了输入输出报文数量是否一致，还是报这个错误，能帮忙看下吗？ id:galloping_snail

yd_220260631 发表于2025-03-14 18:16:41 2025-03-14 18:16:41 最后回复 yd_226424461 2025-04-07 09:13:56
139 3

算法
[区域初赛赛题问题] n_abort_error 是什么问题？

请问这个报错原因是什么

xclovehsy 发表于2025-03-12 21:06:12 2025-03-12 21:06:12 最后回复林欣 2025-03-13 15:48:24
78 2

算法

推荐直播

0.5

基于开源鸿蒙+海思星闪开发板：嵌入式系统开发实战（Day1）
2025/03/29 周六 09:00-18:00

华为开发者布道师

本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用，涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容，旨在帮助学员全面掌握相关技术并进行实际操作
回顾中
华为云软件开发生产线（CodeArts）1月&2月新特性解读
2025/03/18 周二 19:00-20:00

阿星华为云高级产品经理

不知道产品的最新特性？没法和产品团队建立直接的沟通？本期直播产品经理将为您解读华为云软件开发生产线1月&2月发布的新特性，并在直播过程中为您答疑解惑。
回顾中
基于能力图谱的openGauss项目闯关
2025/03/20 周四 19:00-20:30

华为开发者布道师

想成为顶级数据库开发者吗？本次直播将从银行业务系统的数据库设计出发，带你逐步掌握openGauss的建库表、数据封装、密态技术、性能调优及AI应用。通过实战案例，全面展示openGauss的强大功能，助你提升技能，为未来的职业发展打下坚实基础。立即报名，开启你的数据库进阶之旅！
回顾中
基于开源鸿蒙+海思星闪开发板：嵌入式系统开发实战（Day1）
2025/03/29 周六 09:00-18:00

华为开发者布道师

本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用，涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容，旨在帮助学员全面掌握相关技术并进行实际操作
回顾中
华为云软件开发生产线（CodeArts）1月&2月新特性解读
2025/03/18 周二 19:00-20:00

阿星华为云高级产品经理

不知道产品的最新特性？没法和产品团队建立直接的沟通？本期直播产品经理将为您解读华为云软件开发生产线1月&2月发布的新特性，并在直播过程中为您答疑解惑。
回顾中

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript

开发者空间

了解空间

工作台

开发工具

实战案例

空间活动

空间论坛

开发平台

软件开发生产线 CodeArts

AI平台ModelArts

数据治理中心 DataArts Studio

数字内容生产线 MetaStudio

精选服务

云数据库 GaussDB

云数据库 RDS for MySQL

MapReduce服务 MRS

数据仓库服务 DWS

分布式缓存服务Redis版

分布式消息服务 DMS

华为云实时音视频 SparkRTC

媒体处理 MPC

主机迁移服务 SMS

对象存储迁移服务 OMS

云消息服务 KooMessage

云手机服务 KooPhone

企业搜索服务 KooSearch

云地图服务 KooMap

更多开放能力

开发工具

API生态

CodeArts API

API Explorer

Terraform Explorer

KooCLI

API 中心

SDK 中心

开发服务

Codelabs

DevStar

低代码平台Astro

CodeArts IDE

Huawei Cloud Toolkit

Classroom

开发资源

开源镜像站

开源资源

开发语言

开发实践

入门精选

分发资源

企业应用中心

企业通用专区

教育专区

华为应用专区

政务云专区

硬件云服务商城

医疗健康专区

跳蚤市场

华为云开发者日

直播专区

开发者精品活动

DTSE Tech Talk

加入HCDE

加入HCDG

加入HCSD

加入HCWD

鲁班会

沃土云创计划·企业

沃土云创计划·高校

沃土云创计划·个人

沃土云创计划·开源共创

博客

论坛

专题

开发者榜单

学习路径

在线课程

动手实验

考试认证

培训服务