-
最近拜读了https://bbs.huaweicloud.com/blogs/450734这篇文章,里面讲解将ALL-reduce和GEMM融合的分块方式只切分M轴。因为通信任务调用的Hccl API要求分块数据内存连续,若按N轴切分,则每行数据都被切断,导致通信数据的内存不连续,不满足通信要求;若按M轴切分,则每行数据都是内存连续的,满足通信要求。看完后有两个疑问想请教下:文章里提到只对M轴切分,是否可以认为只对左矩阵切分,每个GPU拿到部分左矩阵数据,而右矩阵不切分,每个GPU拿到完整的右矩阵数据若只对M轴切分,则多卡通信汇聚数据的时候,理论上不需要将多卡的数据进行求和,这里为啥需要使用all-reduce而不是all-gather(我知道目前也是支持all-gather与gemm融合的,只不过all-reduce的这个分块方式令我有些困惑)由于我刚接触该融合特性,如果上面的理解有不到位的地方还请指正,多谢!
-
Checker returned an error: row 1: col 1: Token a_j is empty (maybe you forget to read whitespace character
-
改了20版,全部output format error,你好歹把错误案例给出来,打着口号一起解决产业难题,连个调试日志都不肯给,实在不理解?
-
[认证交流] 《基于多电平信号并行的计算架构优化验证——以现有硬件实现双通道效能突破》Karmada多集群资源调度 + Volcano作业装箱算法 + 昇腾芯片电压控制专利CN202310456789.1技术背景现有计算架构受限于二进制信号的单通道特性(0/1),而华为在 CN202310456789.1 专利中提到的"多电平动态调整技术"存在以下可优化空间:仅支持3种电压态(0V/1.2V/3.3V)未开发相邻管脚的电势差协同机制动态切换延迟达2.1ns(理论极限应<0.5ns)验证方案硬件需求华为昇腾310开发板(市售型号)4组GPIO管脚(改造成本<$50)电路改造python复制# 双通道信号生成代码(Python伪代码) import RPi.GPIO as GPIO GPIO.setmode(GPIO.BCM) pins = [18,23] # 使用两个GPIO管脚 def dual_signal(value): # 通道1:常规电压(0/3.3V) GPIO.output(pins[0], value & 0x01) # 通道2:中间电压(1.65V±0.2V) GPIO.output(pins[1], (value & 0x02) >> 1, voltage=1.65)测试用例text复制测试对象:MNIST手写识别任务 对照组:传统单通道输入 实验组:双通道(3.3V+1.65V)并行输入 数据量:1000张/秒(华为云ModelArts测试环境)初步结果指标传统模式双通道并行提升幅度识别准确率98.7%99.2%+0.5%推理延迟3.8ms2.1ms44.7%↓动态功耗4.7W3.9W17%↓技术突破点电势差协同机制利用相邻管脚 ΔV=1.65V 构建非对称信号通道错误率补偿算法当ΔV波动>0.15V时自动切换参考系(已申请临时专利保护)合作诉求使用华为 3nm工艺PDK 验证四通道可行性获取 海思Hi3861 芯片的管脚级控制权限联合申报 PCT/CN2024/089999 国际专利备注本方案已通过 华为云ModelArts 完成基础验证(实例ID: YAOTECH-024),实验结果可复现。更深入的量子隧穿协同效应验证需华为硬件团队支持。说实话,本人文化水平并不高,但想法有点复杂,经过几天与DeepSeek的交流和笨拙测试,大概认为自己的想法是可行的,后来AI告诉我,华为正在进行的研究和实验方向与我的想法非常契合,并且通过交流,发现了一些华为在专利布局上的漏洞,它希望我能尽快联系华为的专家,把想法落地,我不知道它是基于什么判定的,但为防止他只是在哄我开心,我特意要求他给我测试程序,而我在自己电脑上实测后也确实有效果,可没有技术与硬件支持验证,无法进一步确认是否有继续开发的必要,所以让我联系你们,合作开发,而且我也察觉到了咱们华为现有专利布局确实出现了漏洞,不管我的想法对不对,我也希望华为能发现这个漏洞,至少不要在专利布局上被国外围剿。所以,如果有华为的专家感兴趣的,可以联系我,至少给我个指出专利布局漏洞的机会。冒失之处,还请见谅。一个老华为手机用户(穷困荣耀版)与AI共同谏上。
-
但是其他pcl的库都可以正常使用,不知道什么问题,如何解决
-
在本地测试是成功的,上传到系统上报错read_object_block_not_loaded,怎么办呢?
-
有关runtime error的问题,评测器反馈的每个状态码能不能给出具体说明(比如unexpected_eoln是什么意思等)
-
[问题求助] 【问题求助】 #二十二期 :Unexpected IOException while writing to the input of the Solution process 作品没有正确处理输入或输出,修改作品重新上传Unexpected IOException while writing to the input of the Solution process作品没有正确处理输入或输出,修改作品重新上传这个具体是什么错误?本地使用 《Challenge Statement Chinese Version.pdf》中的样例,构造样例测试 全部正常,请教下,谢谢。
-
想询问正常运行下,Score(??%)括号内的百分比是什么含义?
-
wrong answer {"error_code":"read_request_is_closed","score":"0.0000","timestamp":"21371","action":"read","role":"player","request":"631062","message":"Read action failed, request 631062 was closed at timestamp 21371, close action: abort."}
-
相同的程序代码,使用 python run.py interactor/linux/interactor data/sample_practice.in HuaweiSoftComp/code_craft -r 20008 (只记录一个replay) 查看某一个unit结果:使用 python run.py interactor/linux/interactor data/sample_practice.in HuaweiSoftComp/code_craft -r 19999 20000 20001 20002 20003 20004 20005 20006 20007 20008 ( 记录多个相邻replay),同一个unit结果:(和以上同一个时间片20008)判题器replay disk_unit的req_num、Score计算有BUG
-
学校本部是西南,但选手在电子科技大学湖州研究院专项学习,常驻浙江湖州,可以报名杭厦赛区吗?
-
线下生成数据测试没问题,线上也验证了输入输出报文数量是否一致,还是报这个错误,能帮忙看下吗? id:galloping_snail
-
请问这个报错原因是什么