• 练习赛究竟有什么意义?
    关于本次比赛赛题与评测机制的若干疑问与建议“通用的算法就会慢,而特化的算法就会快”,这是我对算法设计的理解.本次复赛训练赛数据集、得分规则设计敷衍, 与正式赛差距过大,导致许多参赛队伍浪费时间在错误的技术路线上.在我看来,训练赛的分数差异主要由算法运行效率带来, 而追求极致的运行速度就会导致丧失部分通用性,而正式赛又变成了重点考察算法在不同数据集上的通用性,分数差异的原因变成了是否能适应多个数据集. 这种变化导致了许多花费大量时间参与训练赛的队伍无缘决赛。1. 背景意义与工业价值本次赛题本质上更接近一个已经被充分研究的“两多边形分离”问题,整体建模较为理想化。我比较关心的是,这样一个问题早已困扰工业界许久.那么让计算几何初学者的同学们来研究是否合理?同学们是否真的能改进现有的算法?赛题组所构造的多边形和查询点是否过于奇特以至于真实世界几乎不可能出现?2. 评测波动对成绩的影响本次赛题的评分规则与程序运行时间直接相关,这导致得分会明显受到评测机时间抖动的影响。实际体验中,分数波动甚至可能接近 3 万分 量级。尽管赛题组声明“取历史最高分作为最终最好成绩”,但这并不能完全解决问题。选手提交一个真实有效但提升幅度较小的优化后,优化效果可能被评测机抖动掩盖。这样一来,选手就无法准确判断某次改动是否真的有效,最终只能通过线上、线下重复评测同一方案、观察平均表现来做判断。这会显著降低选手策略迭代的效率,也会让优化过程更像“刷波动”而不是“做优化”。3. 比赛周期与练习赛设计本次初赛、复赛以及对应练习赛的周期被拉长到将近一个月。对于投入较多时间的选手而言,这样的赛程成本较高,但从结果来看,很多练习阶段的优化并不能有效复用到正式赛中。初赛阶段初赛练习赛与正式赛的判分规则差异巨大;选手在练习阶段很难明确优化精度或者时间,以及精度的具体优化程度;大量选手在练习赛阶段几乎完全同分,区分度有限。复赛阶段复赛内容基本延续初赛正式赛,变化主要只有数据范围和预处理时间;整体内容创新少,出题数据疑似有误;这样的练习赛设计,是否值得选手投入长达一个月的时间去做专项优化?如果练习赛无法有效引导正式赛方向,那么它的训练价值会被明显削弱。4. 数据分布的合理性某个下发数据集经过可视化后如下图所示,其中红色部分为输入查询点:从图中看,5 万个查询点 几乎集中在同一狭窄区域内。这让我产生两个疑问:这个练习赛中的查询分布,与正式赛中的查询分布是否属于同一分布?如果其他未下发数据集也存在类似现象,那么练习赛下发的数据分布是否足够合理?此外,另一份下发数据集似乎也有类似问题,这里不再展开。如果练习赛数据本身带有明显的局部集中性,那么很多高性能优化实际上可能只是针对特定分布做特化,而不具备普适意义。5. 权重设置的参考意义练习赛 Checker 中的 omega 设计看起来极不平衡。据观察,练习赛存在 0.04、0.55、2.25 三个档次,但练习赛中似乎并没有 0.55 档次的数据。这会导致一个明显结果:2.25 档次数据的得分极高;0.55 档次的数据并未在练习赛出现;0.04 档次的数据得分极低,甚至没有优化这个档次分数的意义。但到了正式赛中,权重又被大幅调整,更偏向各数据集之间的平衡。这就使人怀疑:练习赛的判分结果,是否真的具有足够的参考意义?如果练习赛和正式赛的权重导向差异过大,那么练习赛阶段的优化策略就很可能是误导性的。6. 时间参数 T 的设置问题练习赛似乎对所有数据集统一设置了同一个参考时间 T。这会在不同规模的数据集上产生非常不均衡的性能分表现。例如:在 1 万查询 的数据集上,性能分可能只能拿到正确分的 20% 不到;而在 5 万查询 的数据集上,性能分却可能达到正确分的 50% 左右。这会直接导致:是否要追求时间分,很大程度上取决于数据集规模;某些数据集几乎可以只考虑正确率;而另一些数据集又必须为时间分做专门优化。这样一来,选手的优化目标并不统一,而是被数据集规模“绑架”。如果参考时间 T 的设定不能体现不同数据集的客观难度,那么评分机制就难以准确衡量算法本身的性能水平。7. 总体感受与核心问题整体来看,我认为:一场追求性能的比赛,不应该在练习赛和正式赛之间存在如此大的差异。否则,比赛很容易从“考察算法与工程优化能力”,变成“考察谁更擅长针对特定参数和特定分布做拟合”。数据集特征一旦发生变化,那些针对数据特化的方案运行速度自然也会出现明显波动。而正式赛不仅没有下发新的示例数据集,同时线上数据集数量又较多(大约 9 个左右),一次完整评测大约需要 7 分钟 才能返回结果。这意味着:练习赛无法拉开参赛选手的策略差距;正式赛无法在 3 小时 内让选手迅速适应如此庞大的数据分布变化;在这种情况下,正式赛成绩很大程度上依赖于选手是否“提前猜中”出题方向,而不是是否具备稳定、通用、可迁移的优化能力。个人认为, 今年的赛题组对赛题的态度十分敷衍,毁掉了前几年赛题组努力树立出来的口碑.应当给所有参赛选手道歉,下面是部分问题列举:初赛练习赛任务书错误频出, V1.0中提到“保证两个多边形都是凸多边形”, 而下发的数据集却存在凹多边形.赛题组的空中宣讲会照本宣科, 回复的问题都是稿子提前打好的,失去了宣讲会原本的意义赛题组在初赛训练赛阶段表示对选手的得分仅仅34w不满(来源于论坛其他帖子), 然而自己的交互器输入输出的方式竟然是cin,cout,直接导致了训练赛阶段90%以上的耗时都来源于交互器的IO赛题组的程序安全意识淡薄, 谁能想到线上运行平台的沙盒竟然没有禁止选手读写文件? 而赛题组的解决方式竟然是禁止使用多线程/进程? ?选手在论坛中积极提出问题以及反馈,而赛题组却装聋作哑,只回复简单的问题,其他的一概不回复赛题组宣称四月八日会下发判题器与详细得分说明,然而大家等到了晚上十一点多仍然没有等到赛题组宣称某日晚上八点公布晋级复赛名单,但是却让选手们又多等了接近一个小时赛题组宣称某日早上九点下发复赛训练赛赛题,然而到了九点半又说十二点发布,让选手白白浪费时间等待,而复赛所带来的修改竟然是预处理时间从10s变成2s, 严重怀疑赛题组是当日上午九点才开始复赛赛题相关的准备工作8. 希望赛题组回应的问题我比较希望赛题组能够明确回应以下问题:本题当前设定的工业落地价值是否充分?练习赛与正式赛在评分规则、权重设计、数据分布上的差异,是否经过充分论证?当前评测波动较大的情况下,是否有更合理的机制帮助选手判断优化是否真实有效?练习赛下发数据与正式赛数据是否属于同类分布?如果不是,练习赛的训练意义在哪里?统一参考时间 T 的做法是否合理?是否考虑过按数据规模或难度分层设计?当单次评测耗时较长、正式赛时间又有限时,如何保证比赛考察的是算法能力,而不是“参数拟合运气”?附注: 本帖核心观点内容由本人撰写,AI 协助进行内容润色与排版优化。
  • [常见FAQ] 队友可以和队长换位置吗
    队友可以和队长换位置吗
  • [互动交流] 鸿蒙PC上CodeArtsIDE的首要开发方向建议
    当前鸿蒙PC上CodeArtsIDE的首要开发方向主要在开发语言的细节支持上,但是我们必须要承认的是,目前鸿蒙生态建设情况距离可以真正使用CodeArtsIDE进行开发还相去甚远,我在下载这个APP后一直想用,但基本没有使用机会。我想,对于开发者来说,大部分开发时间在Windows主机上,有时外出会携带笔记本电脑,那么IDE只需要支持远程开发功能,就可以完全弥补当前生态建设处于早起阶段的不可用问题,而且这个功能易于实现,大部分功能可以依托主力开发设备上的Windows,这样就不需要通过远程桌面的方式进行非常卡顿的开发操作,同时增加盘古大模型能力,实现这一功能将借助Windows后端极大提高鸿蒙PC的开发实用能力。
  • [互动交流] 找不到Restart
    CodeArts中的jupyter中怎么找不到Restart
  • [问题求助] 作战平台网页报403 Forbidden
    访问AICC作战平台https://scp.sd.huawei.com没有权限,需后台人员添加白名单
  • [问题求助] 多媒体呼出CEll振铃期间播放视频问题
    问题来源】【必填】    中国电信【问题简要】【必填】系统自动拨打用户电话,振铃期间,向用户播放视频名片,显示身份;目前振铃期间无法播放视频文件,只有摘机之后才能正常播放视频【问题类别】【必填】    ivr流程开发(多实例自启动流程)【AICC解决方案版本】【必填】SCEWIN_ICD_V300R008C25SPC016【期望解决时间】【选填】2024-11-13之前【问题现象描述】【必填】多媒体呼出cell执行成功以后,无法播放视频文件,只有摘机以后手机上才播放视频文件,从ivr_trace.log日志上来看,振铃期间是有调用《播放视频》的复合cell,但是手机上没有播放视频,只有接通以后,再播放振铃期间的视频文件
  • [教程] iVR中获取呼出的呼叫ID(字符串)
    1、建立呼叫时会生成一个四字节的呼叫标志,用变量存储2、使用cell获取呼叫ID(十六进制),根据呼叫标志查询到呼叫id的十六进制字符串3、根据以下规则转换成呼叫id字符串select CONCAT(CONV(SUBSTRING('66E4FF9C0D240500',1,8),16,10),'-',CONV(concat(SUBSTRING('66E4FF9C0D240500',13,2),SUBSTRING('66E4FF9C0D240500',9,4)),16,10))
  • [问题求助] IVR流程CID参数变空的问题
    【问题来源】深圳容大【问题简要】CID参数变空的问题【问题类别】IVR(gsl)【AICC解决方案版本】ICD V300R008C20SPC002【问题现象描述】我通过读取INI文件给参数赋值,并且打印参数发现是有值的,但是在后续cell使用过程中发现有的参数变成空值了,请问是什么操作会出现这种情况,应该如何避免?
  • [问题求助] cms表字段取值问题
    【问题来源】【必填】中信保诚人寿【问题简要】【必填】cms表t_cms_agent_opr_5min,字段current_skill_id这个“-1”是代表什么意思呢,技能队列没有这个id【问题类别】【必填】AICC【AICC解决方案版本】【必填】24.100【期望解决时间】【选填】尽快
  • [问题求助] CMS鉴权及接口postman调用
    【问题来源】【必填】中信保诚人寿【问题简要】【必填】签名算法demo生成的Authorization是唯一的吗,每个接口都要这样生成一个吗,如果有人新生成一个,之前的是不是就不能用了,还能有其他的生成方案吗【问题类别】【必填】AICC【AICC解决方案版本】【必填】24.100【期望解决时间】【选填】在线等
  • [问题求助] CMS鉴权及接口postman调用
    【问题来源】【必填】中信保诚人寿【问题简要】【必填】postman调用cms接口401【问题类别】【必填】AICC【AICC解决方案版本】【必填】24.100【期望解决时间】【选填】在线等【问题现象描述】【必填】使用8.15版本生成的Authorization调用cms接口报401,需要最新获取Authorization的方法
  • [分享交流] 求助
    执行loader 报错,报Job commit from a prior MRAppMaster attempt is potentially in progress Preventing multiple commit executions如何解决
  • [互动交流] 4.1以上版本发布了吗,在哪里可以下载
    4.1以上版本发布了吗,在哪里可以下载
  • [常见FAQ] 三等奖证书在哪里能看到啊
    三等奖证书什么时候会发呀?是在网站上下载还是会发到邮箱吗?
  • [问题求助] CloudIPCC旧接口对应AICC的什么接口?
    CloudIPCC对应的老接口 /agentgroup/{0}/allagentstatus需求:查所有坐席的名字