利用数据探测代码实验可以发现:线上的测试数据有明显的特征,分布几乎相同,没有多样性。
这样带来的问题是,经过仔细权衡设计出来的算法不会有优势(毕竟帕累托最优是无法实现的),甚至在某些竞争较大的赛区无法入围复赛。通过提交探测代码得到关于数据的特征后,实现完全只针对该数据分布才会正确或有效的算法,反而会有明显优势。
在上合赛区,第 1 名和第 33 名的差距恰好为 0.1 秒。考虑到线上测试数据的节点数量,仅仅是严格按照题目要求的约束条件对 ID 进行预处理(算法部分都不提了),就足以直接导致该选手无法入围复赛了。
这样的线上测试数据会对比赛产生不好的导向。



max_id < 2e5
max_deg <= 30
No answer contains id > 5e4
歪比歪比
2020-4-27 09:07
支持!!!!
楼上大佬基本考虑齐全了 我支持一个
前32名平均分差已经小于0.003s了,只需要一点点波动,就会直接影响选手的名次。
赞同
确实,题目区分度不高,大家只能面向数据内卷了。。。