机器学习_标签_开发者

博客(7.5k)
视频(11)
论坛(0)
云声(0)
代码示例(0)

[校园大使专区] 赋能校园开发者：连接湖北工业大学与华为开发者空间

赋能校园开发者：连接湖北工业大学与华为开发者空间作为华为开发者空间在校园的积极推广者，我始终致力于将前沿的技术工具与鲜活的学习实践相结合。近期，我们在湖北工业大学成功举办了一系列活动，真正让华为开发者空间成为同学们触手可及的创新平台。现在，就让我以亲历者的视角，回顾这段充满技术热情与探索精神的旅程。始于招新：点燃校园技术热情一切始于热闹的“百团大战”社团招新日。那天，我们精心布置的展架成为现场焦点。 “华为开发者空间”的蓝色标识格外醒目，清晰展示了其核心价值：汇聚鸿蒙等前沿技术，提供免费的云上AI开发工具和实战案例，让同学们能“一键开通”云端AI环境，无需复杂配置即可投身开发。我们热情地向往来同学介绍，华为开发者空间如何让一台普通笔记本也能媲美专业计算资源，轻松调用大模型能力。现场扫码加入社群的同学络绎不绝，为后续活动奠定了坚实的基础。深入讲解：揭开低门槛开发的神秘面纱招新后，我们迅速在计算机教室组织了首场深度培训。当我站在讲台旁，看到教室里坐满了充满求知欲的同学时，内心充满激动。投影幕布上打出“华为开发者空间，让开发者低门槛体验华为工具和资源”的醒目标题。我为大家详细讲解了开发者空间的架构、智能网关平台以及如何利用它进行高效的CI/CD流水线开发。同学们专注的神情和不时记录的动作，让我感受到技术分享带来的价值。紧接着的versatile agent培训，我们聚焦于具体的需求挖掘与开发实践，引导大家思考如何将华为利用华为的智能云平台快速部署应用真实项目场景，为后续的动手实操做好理论铺垫。动手实践：在云端环境中真操实练理论知识的价值在于应用。随后的三次活动，我们完全进入了实战阶段。在宽敞的机房内，同学们人手一机，直接登录华为开发者空间的云环境。我清晰地记得那个场景：同学们紧盯屏幕，跟随指导一步步操作。当我走到一位同学身边，看到他成功在云端启动了一个模型环境的训练时，他脸上露出的惊喜笑容让我印象深刻。在培训中，我通过将社团举办的“华为云杯”比赛与开发者空间结合，对同学们进行真实的案例演示，通过投影共享屏幕，演示如何利用华为的云服务器快速部署模型。教室里回响着键盘的敲击声，同学们或独立探索，或通过QQ即时交流协作，真正体验了“云上开发”的高效与便捷。活动亮点与效果：技术普惠的生动体现回顾整个过程，最大的亮点在于 “无缝衔接的理论与实践” 和 “极低的技术入门门槛”。华为开发者空间提供的云端资源，让同学们摆脱了本地环境配置的困扰，能将精力完全集中于逻辑实现与创新思考。从招新时对概念的初步了解，到培训中的深入认知，再到机房里的亲手实践，我们形成了一个完美的学习闭环。活动效果显著。不仅社团规模迅速扩大，更重要的是，许多同学反馈“第一次感觉自己离企业级开发如此之近”。他们成功利用所学，开始尝试构建自己的智能应用项目，技术自信与实践能力得到了实质性的提升。结语通过这一系列围绕华为开发者空间的活动，我深切体会到，将优质技术资源以易懂、易用的方式引入校园，是激发学生创新潜能的关键。我们不仅仅是组织了几场活动，更是播下了一颗颗技术的种子。未来，我们将继续深耕，让华为开发者空间成为更多校园开发者梦想起航的地方。

Akrie 发表于2025-11-14 10:32:20 2025-11-14 10:32:20 最后回复 Akrie 0
23 0

开发者空间华为云深度学习 HCSD 机器学习
35分数计算问题

35分数计算绝对是写反了，长度越长分数越高，和pdf中的不一样，现在应该按照pdf还是按照判题器的分数。

yd_238581498 发表于2025-10-21 12:54:22 2025-10-21 12:54:22 最后回复 yd_238581498 2025-10-23 17:46:17
250 4

机器学习
33期提交格式问题

33期按照要求提交一直都无法通过，麻烦看下什么问题

yd_238581498 发表于2025-10-17 11:12:54 2025-10-17 11:12:54 最后回复 KaranocaVe 2025-10-25 15:05:40
90 1

机器学习
[问题求助] 34baseline问题

34baseline是不是合理的呢，之前必死啊的最高分都没到6000，感觉理论上线也到不了7000，29-34都有一堆问题，相对来说34算是比较正常的，希望官方能重视，别浪费这么好的题目了。。。

yd_238581498 发表于2025-10-10 11:56:59 2025-10-10 11:56:59 最后回复 yd_286643000 2025-12-01 15:53:58
174 3

C/C++ 机器学习
33期提交问题

请问提交格式是怎么样的，提交一直报错

yd_238581498 发表于2025-10-02 22:53:59 2025-10-02 22:53:59 最后回复 yd_280962683 2025-10-21 12:07:50
164 7

C/C++ 机器学习
[技术干货] MSE量距离，交叉熵量惊讶：回归与分类的尺子之道

在机器学习里，loss 函数就像一把量身高的尺子，只不过它量的是“模型猜得有多离谱”。这把尺子必须和任务目标同刻度，才能给出有意义的误差读数。回归与分类的目标本质不同：前者要预测连续值，后者要挑离散类。于是，尺子也得换刻度——回归用 MSE，分类用交叉熵——这不是拍脑袋的惯例，而是数学、几何、信息论三条线共同拉扯出来的“最顺手的尺”。先聊回归。连续值空间天然带着“距离”概念：房价 302 万比 300 万多 2 万，这 2 万就是欧氏距离。MSE（Mean Squared Error）正是欧氏距离的平方再平均，它把每一个点的误差当成向量长度去惩罚，离得越远惩罚越狠（平方项放大误差）。好处有三：1. 导数简单，残差一次项，梯度更新清爽；2. 几何上对应正交投影，最小二乘有解析解；3. 统计上，如果噪声服从高斯分布，MSE 恰好是负对数似然，最优估计就是均值。换句话说，MSE 不只是“看着顺眼”，它背后站着整个高斯世界的假设：误差对称、独立、同方差。只要这些假设大致成立，MSE 就是“最像”真实分布的那把尺子。再看分类。离散标签没有“距离”——猫和狗之间的“欧氏距离”是毫无意义的。分类关心的是“猜对的概率”：模型说这张图 97% 是狗，3% 是猫，而标签是狗，那我们希望这 97% 再接近 100% 一点。交叉熵（Cross-Entropy）正是衡量“ predicted 分布离 true 分布多远”的尺子，它源自信息论：事件真实发生所需的最小编码长度。把标签做成 one-hot（真实分布），把模型输出做 softmax（预测分布），交叉熵就是“按你的码本给真实事件编码，平均要多花多少比特”。比特越多，说明预测分布越偏离真实分布。与 MSE 相比，交叉熵对“错得离谱”的样本施加指数级大梯度，直接把模型往 0/1 边界推，收敛更快；同时它天然和 softmax 形成“log-likelihood”闭环，最大化 softmax 输出正确类的概率就等价于最小化交叉熵。于是，分类任务里交叉熵成了“信息论认证”的标准尺。一句话总结：回归世界住的是高斯噪声，用 MSE 量距离；分类世界玩的是概率游戏，用交叉熵量“惊讶度”。尺子与刻度对齐，梯度才顺畅，模型才服气。

黄生 发表于2025-09-11 16:38:36 2025-09-11 16:38:36 最后回复江南清风起 2025-09-24 17:15:30
43 7

机器学习
XGBoost如何成为树回归的标杆算法

2016年，陈天奇（Tianqi Chen）和 Carlos Guestrin 发表了一篇题为《XGBoost: A Scalable Tree Boosting System》的论文，迅速引爆机器学习社区。这篇论文不仅详细介绍了XGBoost（eXtreme Gradient Boosting）的高效实现，还使其成为数据科学竞赛（如Kaggle）和工业界的标杆算法。1. 背景：GBDT的局限性在XGBoost之前，梯度提升决策树（GBDT）已经是一种强大的集成学习方法，但它的实现（如 scikit-learn 的 GBDT）存在几个问题：训练速度慢：传统GBDT无法高效处理大规模数据。内存占用高：数据加载和计算优化不足。功能有限：缺少正则化、并行计算等现代优化手段。2. 陈天奇的突破陈天奇当时是华盛顿大学的博士生，研究方向是分布式机器学习系统。他在优化GBDT时，结合了多个创新点：正则化改进：在损失函数中加入 L1/L2 正则化，防止过拟合。二阶泰勒展开：传统GBDT只用一阶梯度，而XGBoost引入二阶导数，使优化更精准。并行化 & 缓存优化：利用CPU多线程加速特征排序，减少计算瓶颈。稀疏数据处理：自动处理缺失值，提高鲁棒性。3. Kaggle竞赛的统治2015-2017年间，XGBoost在Kaggle竞赛中几乎“屠榜”。据统计，超过一半的冠军方案使用了XGBoost或其变种。它的优势在于：灵活：支持分类、回归、排序任务。高效：比传统GBDT快10倍以上。易用：Python/R接口友好，参数调优方便。4. 工业界的影响XGBoost的成功不仅限于竞赛，还被广泛应用于：推荐系统（如Netflix、阿里巴巴）金融风控（信用评分、反欺诈）广告点击率预测（Google、Facebook）5. 后续发展XGBoost的流行催生了更多优化版本，如：LightGBM（微软，2017）：基于直方图的优化，更快。CatBoost（Yandex，2017）：擅长类别特征处理。写在最后陈天奇的XGBoost论文之所以成为经典，是因为它理论扎实、实现高效、应用广泛，至今仍是机器学习工程师的必备工具之一。它的成功也证明，算法优化 + 工程实现的结合，能极大推动技术进步。

黄生 发表于2025-07-27 21:40:09 2025-07-27 21:40:09 最后回复云聪明 2025-07-28 10:01:08
6 1

机器学习
树回归算法：简介、起源与应用

树回归算法是一种结合决策树与回归分析的方法，用于预测连续型目标变量。与传统的线性回归不同，树回归能够自动学习数据中的复杂非线性关系，适用于高维、非结构化的数据集。1. 树回归的基本原理树回归通过递归分割数据，将特征空间划分为多个区域，并在每个区域内拟合简单模型（如均值或线性回归）。其核心步骤包括：特征选择：选择最佳特征和分割点（如最小化均方误差）。递归分割：不断划分子区域，直到满足停止条件（如最大深度或最小样本数）。预测：新样本根据划分规则落入某个区域，用该区域的预测值输出结果。2. 发明背景与动机传统回归方法（如线性回归）假设数据符合线性关系，但在现实问题中，许多数据呈现复杂非线性模式。树回归的提出解决了以下问题：非线性建模：自动拟合数据中的复杂模式，无需人工构造特征。鲁棒性：对异常值和缺失值不敏感。可解释性：树结构直观，便于分析特征重要性。3. 关键贡献者与发展历程树回归的理论基础可追溯至1980年代：Breiman等人（1984）提出的 CART（分类与回归树）是重要里程碑，支持回归任务。后续改进包括M5模型树（Quinlan, 1992）、梯度提升回归树（GBRT）等，进一步提升预测能力。4. 解决的问题与应用领域树回归广泛应用于：医学：疾病风险预测（如血糖水平估计）。金融：股票价格趋势分析、信用评分。工业：设备故障预测、质量控制。环境科学：气候建模、污染预测。5. 总结树回归因其灵活性、可解释性和强大的非线性拟合能力，成为机器学习中的重要工具。后续的随机森林、XGBoost等集成方法进一步提升了其性能，使其在现代数据分析中占据核心地位。

黄生 发表于2025-07-27 21:01:05 2025-07-27 21:01:05 最后回复云聪明 2025-07-28 10:01:04
7 1

机器学习
[技术干货] 卷积神经网络（CNN）比起传统机器学习的优势

卷积神经网络（CNN）作为深度学习的代表模型，在处理具有空间结构或局部相关性的数据（如图像、视频、音频、文本等）时，相比传统机器学习方法（如SVM、随机森林、逻辑回归等）具有显著优势。以下是CNN的核心优势及对比分析：1. 自动特征提取（端到端学习）传统方法：需要手动设计特征（如SIFT、HOG、LBP等），依赖领域知识和大量人工调参，且特征工程的质量直接影响模型性能。CNN优势：通过卷积层自动学习数据的层次化特征（从低级边缘、纹理到高级语义特征），无需人工干预。例如：图像分类：低层卷积核检测边缘，中层检测形状，高层检测物体部件或整体。文本处理：通过卷积核捕捉局部词组合（如n-gram）的语义。2. 局部感知与参数共享（平移不变性）局部感知：CNN的卷积核仅关注输入数据的局部区域（如图像的3×3像素块），而非全局。这符合图像、音频等数据的局部相关性特性，大幅减少参数量。参数共享：同一卷积核在整个输入数据上滑动共享参数，进一步降低计算复杂度。例如：传统全连接网络处理100×100图像需10⁴×10⁴参数，而CNN的3×3卷积核仅需9个参数（忽略通道数）。平移不变性：无论目标在图像中如何移动，CNN都能通过共享的卷积核检测到相同特征（如“猫脸”出现在左上角或右下角）。3. 层次化特征表示（抽象能力）传统方法：浅层模型（如线性SVM）只能学习简单的线性决策边界，难以捕捉复杂模式。CNN优势：通过堆叠多层卷积和池化操作，逐步提取从低级到高级的抽象特征：浅层：边缘、颜色、纹理等。深层：物体部件、场景语义等。这种层次化结构使CNN能处理高度非线性的复杂任务（如图像分类、目标检测）。4. 对数据变换的鲁棒性传统方法：对输入数据的微小变换（如旋转、缩放、平移）敏感，需通过数据增强或手动设计不变性特征来缓解。CNN优势：池化操作（如Max Pooling）通过下采样降低特征图分辨率，增强对局部平移的鲁棒性。数据驱动学习：通过大量训练数据自动学习对旋转、缩放等变换不变的特征（需配合数据增强）。专用架构（如Spatial Transformer Networks）可显式学习输入数据的几何变换。5. 计算效率与可扩展性传统方法：全连接网络或核方法（如SVM）的参数量随输入规模呈平方或指数增长，难以处理高维数据（如百万像素图像）。CNN优势：局部连接和参数共享显著减少参数量，使训练大规模模型成为可能。现代框架（如TensorFlow、PyTorch）支持GPU加速，可高效处理海量数据。迁移学习能力：预训练的CNN模型（如ResNet、VGG）可通过微调快速适配新任务，减少训练数据需求。6. 适用场景广泛CNN不仅限于图像领域，还可扩展到：计算机视觉：图像分类、目标检测、语义分割、人脸识别等。自然语言处理：文本分类（TextCNN）、序列标注（如命名实体识别）。音频处理：语音识别、声纹识别、音乐分类。时间序列分析：通过1D卷积处理传感器数据、股票价格等。与传统方法的对比总结特性CNN传统机器学习特征工程自动学习需手动设计参数数量少（局部连接+共享）多（全连接）对数据变换的鲁棒性强（通过池化、数据增强）弱（需手动处理）计算效率高（GPU加速）低（高维数据时）可解释性较弱（黑盒模型）较强（如决策树、线性模型）适用数据类型结构化数据（图像、文本、音频）结构化或简单非结构化数据何时选择传统方法？数据量极小（CNN易过拟合）。需要强可解释性（如医疗、金融领域）。计算资源有限（CNN训练成本较高）。问题简单（如线性可分数据）。总结CNN的核心优势在于其自动特征提取能力、对局部相关性的高效建模以及对复杂模式的层次化表示，使其在图像、语音等任务中远超传统方法。然而，传统方法在简单任务或小数据场景下仍具有实用价值，两者可结合使用（如用CNN提取特征后输入SVM分类）。

林欣 发表于2025-07-25 11:06:57 2025-07-25 11:06:57 最后回复云聪明 2025-07-28 09:08:25
432 4

机器学习
[技术干货] 机器学习中训练集与测试集误差关系深度解析

一、开篇：误差关系为何是模型评估的核心？当我们训练一个机器学习模型时，常常会遇到这样的困惑：为什么训练集上准确率 99%，测试集却只有 60%？或者为什么两者误差都很高？实际上，训练集与测试集的误差关系是揭开模型性能奥秘的关键钥匙，它能帮助我们诊断过拟合、欠拟合等核心问题，并指导优化方向。本文将从基础概念到数学原理，再到工程实践，全面拆解这一重要关系。二、基础概念：训练集与测试集的本质区别1. 训练集（Training Set）：模型的 "教科书"作用：用于模型学习参数（如权重、偏置），模型通过最小化训练误差来拟合数据规律。关键特性：模型对训练集的 "记忆" 可能包含噪声或特定模式，不能直接代表真实能力。2. 测试集（Test Set）：模型的 "期末考试"作用：用完全独立于训练集的数据评估模型泛化能力，反映其在真实场景中的表现。关键特性：必须与训练集无交集，且分布尽可能接近真实数据，否则评估结果会失真。三、误差关系的三大典型场景：从理想到异常1. 理想场景：泛化能力优秀的标志现象：训练误差与测试误差接近（差距 5%-10%）。原因：模型复杂度适中，训练数据能代表整体分布，学习到了数据的通用规律。案例：用 10 万张正常 / 患病细胞图片训练 CNN，测试集误差仅比训练集高 8%，说明模型有效提取了细胞特征。2. 警惕！过拟合（Overfitting）的陷阱现象：训练误差极低（如 <5%），测试误差显著升高（如> 30%）。本质：模型过度学习训练集的噪声（如某类样本的偶然特征），对新数据适应性差。示例：神经网络层数过多，把猫图片中的 "白色背景" 误判为猫的本质特征，导致识别黑背景猫时出错。3. 欠拟合（Underfitting）：模型能力不足的表现现象：训练误差和测试误差都很高（如 > 40%），且差距很小。本质：模型复杂度不足，无法捕捉数据的基本规律（如用线性模型拟合非线性数据）。示例：用线性回归预测房价，忽略 "地段 × 面积" 的交互特征，导致误差居高不下。四、数学视角：偏差 - 方差分解与泛化误差上界1. 偏差 - 方差分解：误差的底层逻辑训练误差 = 偏差 ² + 方差 + 噪声偏差（Bias）：模型的拟合能力下限，如线性模型无法拟合非线性数据的固有误差。方差（Variance）：模型对训练数据波动的敏感程度，过拟合时方差主导。测试误差 = 训练误差 + 分布偏移误差 + 新增噪声当训练集与测试集分布不一致时，测试误差会进一步升高。2. 泛化误差上界：理论指导实践公式：Test Error≤Training Error+O(Training SizeModel Complexity)结论：训练集规模越大、模型越简单，测试误差越接近训练误差；盲目增加模型复杂度（如深层网络），可能导致测试误差随训练集增大而不降反升。五、实战指南：如何根据误差关系优化模型？1. 过拟合时的 "抢救" 策略优化方向具体方法原理说明数据增强图像旋转 / 缩放、文本同义词替换等，扩充训练集多样性让模型接触更多样例，减少对单一模式的依赖模型简化神经网络剪枝、降低层数，或改用简单模型（如决策树→线性模型）减少模型对噪声的拟合能力，强制学习核心特征正则化约束L1/L2 正则化（限制参数大小）、Dropout（随机丢弃神经元）增加模型参数的 "惩罚项"，避免权重过度拟合训练数据2. 欠拟合时的 "能力提升" 方案增加模型复杂度：线性模型→非线性模型（如 SVM、随机森林），或为神经网络添加层；特征工程优化：提取高阶特征（如房价预测中的 "面积 ²"）、特征交叉（如 "地段 × 户型"）；减少正则化强度：降低 L2 正则化系数，让模型更自由地拟合数据。3. 正常泛化时的 "精益求精"调整超参数：学习率、批量大小、激活函数等（可通过网格搜索或贝叶斯优化）；集成学习：组合多个模型的预测结果（如 Bagging、Boosting），降低单一模型的不确定性。六、延伸：验证集的关键作用与误差关系补充1. 验证集：超参数调优的 "试金石"定义：从训练集中划分出的子集（如 20% 数据），用于选择最优超参数（如正则化系数、学习率）。核心原则：不能用测试集调参，否则会导致对测试集的 "数据窥探"，高估模型性能。2. 理想的误差排序训练误差 < 验证误差 < 测试误差异常情况：若验证误差远低于测试误差，可能是超参数对验证集过拟合（如恰好匹配验证集的噪声）。七、总结：误差关系的三大实战价值评估泛化能力：测试误差与训练误差的差距，是模型能否落地的核心指标；定位问题根源：过拟合 / 欠拟合的诊断无需复杂分析，看误差关系即可快速判断；指导优化方向：从数据增强到模型简化，误差关系为每一步优化提供明确指引。最后提醒：机器学习的本质是平衡 "拟合能力" 与 "泛化能力"，而训练集与测试集的误差关系，正是这一平衡的最佳度量工具。下次遇到模型性能问题时，不妨先看看这两个误差的关系 —— 答案可能就藏在其中！

DevFeng 发表于2025-07-03 11:48:50 2025-07-03 11:48:50 最后回复 DS小龙哥 2025-07-09 15:49:27
436 4

IoT 机器学习
[问题求助] C2120-10-SIU二次开发

我这边想调用C2120-10-SIU这款摄像头获取图像的帧数据，再用自己训练的模型进行检测。用python开发一个独立的软件用python，这样可行吗？之前用海康工业相机是可以这样操作的

yd_289717996 发表于2025-06-21 09:27:26 2025-06-21 09:27:26 最后回复小强鼓掌 2025-06-30 10:12:49
79 2

机器视觉机器学习
一文带你了解自监督学习中的对比学习的负样本采样策略

自监督学习中的对比学习（Contrastive Learning）通过区分正样本对（相似特征）与负样本对（不相似特征）来学习判别性特征表示。其中，负样本采样策略是核心设计之一，直接影响模型对特征空间区分能力的学习效果。以下从负样本的作用机制出发，结合SimCLR、MoCo等经典方法，详细解析其如何通过负样本采样策略提升特征表示质量。一、对比学习的核心逻辑：正样本与负样本的作用对比学习的目标是将同一样本的不同增强视图（正样本对）映射到特征空间中相近的位置，同时将不同样本的增强视图（负样本对）映射到远离的位置。其核心损失函数（如InfoNCE）可形式化为：其中，z_i和z_j是同一原始样本的两个增强视图（正样本对），其余2N-2个样本为负样本（k \neq i）。负样本的关键作用：提供“反例”，迫使模型学习区分不同样本的语义边界，避免特征坍缩（所有样本映射到同一区域）。覆盖数据分布的多样性，使特征空间对不同样本的判别性更强。二、负样本采样策略的设计目标有效的负样本采样需满足两个核心要求：数量充足：足够的负样本能增强对比信号的强度（更多“反例”帮助模型区分）。多样性高：负样本需覆盖数据分布的广泛区域，避免模型仅适应局部模式。三、SimCLR：通过大批次（Large Batch Size）提升负样本数量SimCLR是Google提出的对比学习框架，其核心创新在于通过强数据增强生成高质量正样本对，并利用大批次提供丰富负样本。1. 正样本对的生成：强数据增强SimCLR对同一原始图像应用随机组合的增强操作（如随机裁剪、颜色抖动、高斯模糊、旋转等），生成两个视图（v_1, v_2）。这些增强操作保留了图像的语义一致性（正样本对），但引入了视觉差异（如视角、亮度变化），迫使模型学习对语义不变的特征。2. 负样本的采样：大批次直接提供SimCLR通过增大训练批次大小（如8192），使每个批次的负样本数量达到2N-2（N为每批次原始样本数）。例如，当N=4096时，每个样本的负样本数为8192-2=8190。优势：大批次直接增加了负样本的数量，增强了对比损失的判别能力（更多“反例”帮助模型区分不同样本）。简单高效，无需额外存储或维护负样本库。局限性：批次过大会导致计算和内存开销剧增（需GPU集群支持）。四、MoCo：通过动量编码器与队列维护高质量负样本库MoCo（Momentum Contrast）针对SimCLR的大批次依赖问题，提出动态维护一个大规模、多样化的负样本库，解决了大批次不可行的场景（如单卡训练）。1. 负样本库的构建：队列（Queue）与动量编码器MoCo的核心设计是动量编码器（Momentum Encoder）和负样本队列（Queue）：查询编码器（Query Encoder）：用于编码当前批次的增强视图（查询特征q）。键编码器（Key Encoder）：初始与查询编码器相同，但通过动量更新（缓慢跟随查询编码器的参数变化），用于编码负样本（键特征k）。负样本队列：存储前几个批次的键特征（如65536个），作为当前批次的负样本。每次训练时，当前批次的键特征会被推入队列，最旧的键特征被弹出，保持队列大小固定。2. 负样本的采样：动态更新与去相关性负样本的多样性：队列存储了大量历史批次的键特征，覆盖了更广泛的数据分布（避免固定批次的负样本重复）。去相关性：键编码器通过动量更新（如m=0.999），其参数变化缓慢，避免了查询编码器与键编码器同步更新导致的负样本“过拟合”（即键特征与查询特征同时变化，对比信号减弱）。优势：负样本库规模大（如65536），无需依赖大批次，降低计算开销。队列动态更新保证了负样本的时效性和多样性，避免特征坍缩。实验效果：MoCo在ImageNet线性评估任务中，仅用单卡训练即可达到与SimCLR（需8卡大批次）相近的性能，验证了其负样本策略的有效性。五、负样本采样的通用优化方向除SimCLR和MoCo外，后续工作进一步优化了负样本策略，核心方向包括：1. 负样本的去重与过滤避免同一原始样本的多个增强视图作为负样本（如排除当前批次的正样本对）。过滤语义相似的负样本（如通过聚类剔除相似样本），减少无效对比。2. 负样本的语义控制引入跨域负样本（如其他数据集的样本），扩展特征空间的判别边界。基于类别的负采样（如针对细粒度分类，强制模型区分同类别不同实例的负样本）。3. 动态负样本生成通过生成模型（如GAN）动态生成高质量的负样本，补充真实数据的不足。六、总结：负样本策略如何提升特征质量？SimCLR、MoCo等方法的负样本采样策略通过以下方式提升特征表示质量：数量充足：大批次（SimCLR）或动态队列（MoCo）提供了足够多的负样本，增强了对比信号的强度。多样性高：强数据增强生成的正样本对（SimCLR）、历史批次的负样本队列（MoCo）覆盖了数据分布的广泛区域，迫使模型学习更鲁棒的判别特征。语义对齐：负样本与正样本的语义一致性（如同属一个类别但视觉不同）确保模型学习的是“语义不变性”而非“视觉噪声”，提升特征的泛化能力。简言之，负样本采样策略通过“量”与“质”的双重优化，使模型在对比学习中更有效地捕捉到数据的本质特征，从而提升下游任务（如分类、检测）的性能。

Jack20 发表于2025-06-12 15:38:42 2025-06-12 15:38:42 最后回复加油O幸福 2025-06-30 16:02:29
223 2

云存储 AI Gallery 机器学习
[区域初赛赛题问题] C++可以使用STL库嘛

C++可以使用vector、cin、cout等结构嘛

yd_238581498 发表于2025-03-15 16:50:10 2025-03-15 16:50:10 最后回复 yd_269792794 2025-03-20 21:52:42
176 3

机器学习
[问题求助] 问题求助十七期

offline测试数据中存在点数n为12833，路径长度限制为10的数据（第136个测试数据），按照题目中的叙述，得分为 100*|x|/n，四舍五入，那么|x|一定不会超过20。 2000/12833四舍五入为0，这样的话，得分岂不是一定为0，无论程序找的路径多么优秀？请官方仔细回答，不要答非所问。

yd_238581498 发表于2025-01-25 19:28:58 2025-01-25 19:28:58 最后回复
199 3

机器学习
[问题求助] 十七期求助

第十七期的报错paths are intersected 是什么问题马，pdf中也没有说明；pdf中的C有什么用？答案是只能输出两个路劲嘛，为啥例子是三个？

yd_238581498 发表于2025-01-08 18:17:33 2025-01-08 18:17:33 最后回复 yd_238581498 2025-01-10 20:59:44
170 3

机器学习

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript