- 本文总结分类和回归任务的常用损失函数,比如重点解析了交叉熵损失函数的由来,并给出详细计算公式和、案例分析、代码,同时也描述了 MAE 和 MSE 损失函数。 本文总结分类和回归任务的常用损失函数,比如重点解析了交叉熵损失函数的由来,并给出详细计算公式和、案例分析、代码,同时也描述了 MAE 和 MSE 损失函数。
- 本文分析了激活函数对于神经网络的必要性,同时讲解了几种常见的激活函数的原理,并给出相关公式、代码和示例图。 本文分析了激活函数对于神经网络的必要性,同时讲解了几种常见的激活函数的原理,并给出相关公式、代码和示例图。
- 神经网络模型一般是依靠随机梯度下降优化算法进行神经网络参数更新的,而神经网络参数的学习是非凸问题,利用梯度下降算法优化参数时,网络权重参数的初始值选取十分关键。 神经网络模型一般是依靠随机梯度下降优化算法进行神经网络参数更新的,而神经网络参数的学习是非凸问题,利用梯度下降算法优化参数时,网络权重参数的初始值选取十分关键。
- > 本文大部分内容来自《深度学习》(花书)第三章概率与信息论,从中抽取重要的知识点,并对部分概念和原理加以自己的总结,适合当作原书的补充资料阅读,也可当作快速阅览机器学习原理基础知识的参考资料。 > 本文大部分内容来自《深度学习》(花书)第三章概率与信息论,从中抽取重要的知识点,并对部分概念和原理加以自己的总结,适合当作原书的补充资料阅读,也可当作快速阅览机器学习原理基础知识的参考资料。
- 首先所谓过拟合,指的是一个模型过于复杂之后,它可以很好地“记忆”每一个训练数据中随机噪音的部分而忘记了去“训练”数据中的通用趋势。训练好后的模型过拟合具体表现在:模型在训练数据上损失函数较小,预测准确率较高;但是在测试数据上损失函数比较大,预测准确率较低。 首先所谓过拟合,指的是一个模型过于复杂之后,它可以很好地“记忆”每一个训练数据中随机噪音的部分而忘记了去“训练”数据中的通用趋势。训练好后的模型过拟合具体表现在:模型在训练数据上损失函数较小,预测准确率较高;但是在测试数据上损失函数比较大,预测准确率较低。
- @[toc] 1、百度的行人属性识别项目PP-Human属性识别 方案说明1、目标检测/多目标跟踪获取图片/视频输入中的行人检测框,模型方案为PP-YOLOE,详细文档参考PP-YOLOE。2、通过行人检... @[toc] 1、百度的行人属性识别项目PP-Human属性识别 方案说明1、目标检测/多目标跟踪获取图片/视频输入中的行人检测框,模型方案为PP-YOLOE,详细文档参考PP-YOLOE。2、通过行人检...
- 本文为对目前线性量化优点、原理、方法和实战内容的总结,主要参考 神经网络量化简介 并加以自己的理解和总结,适合初学者阅读和自身复习用。 本文为对目前线性量化优点、原理、方法和实战内容的总结,主要参考 神经网络量化简介 并加以自己的理解和总结,适合初学者阅读和自身复习用。
- TensorRT 是 NVIDIA 官方推出的基于 CUDA 和 cudnn 的高性能深度学习推理加速引擎,能够使深度学习模型在 GPU 上进行低延迟、高吞吐量的部署。 TensorRT 是 NVIDIA 官方推出的基于 CUDA 和 cudnn 的高性能深度学习推理加速引擎,能够使深度学习模型在 GPU 上进行低延迟、高吞吐量的部署。
- 深度学习和计算机视觉方向除了算法训练/研究,还有两个重要的方向: 模型压缩(模型优化、量化)、模型部署(模型转换、后端功能SDK开发)。所谓模型部署,即将算法研究员训练出的模型部署到具体的端边云芯片平台上,并完成特定业务的视频结构化应用开发。 深度学习和计算机视觉方向除了算法训练/研究,还有两个重要的方向: 模型压缩(模型优化、量化)、模型部署(模型转换、后端功能SDK开发)。所谓模型部署,即将算法研究员训练出的模型部署到具体的端边云芯片平台上,并完成特定业务的视频结构化应用开发。
- 为了在更精细的尺度上对陆地表面过程进行建模,迫切需要对吸收的光合有效辐射(FPAR)的精细分辨率部分进行准确的估计。虽然传统的方法难以兼顾普遍性、效率和准确性,但以粗分辨率产品为参考的方法对细分辨率FPAR的运行估计很有希望。然而,目前的方法面临着粗分辨率FPAR产品中FPAR-反射关系代表性不足的主要问题,特别是对于植被茂密的地区。为了克服这一局限性,本文开发了一种增强的缩放方法,提出了... 为了在更精细的尺度上对陆地表面过程进行建模,迫切需要对吸收的光合有效辐射(FPAR)的精细分辨率部分进行准确的估计。虽然传统的方法难以兼顾普遍性、效率和准确性,但以粗分辨率产品为参考的方法对细分辨率FPAR的运行估计很有希望。然而,目前的方法面临着粗分辨率FPAR产品中FPAR-反射关系代表性不足的主要问题,特别是对于植被茂密的地区。为了克服这一局限性,本文开发了一种增强的缩放方法,提出了...
- 关于华为云loT的年终总结. 关于华为云loT的年终总结.
- 我们知道,在一定程度上,网络越深,参数越多,模型越复杂,其最终效果越好。神经网络的压缩算法是,旨在将一个庞大而复杂的预训练模型(pre-trained model)转化为一个精简的小模型。 按照压缩过程对网络结构的破坏程度,我们将模型压缩技术分为“前端压缩”和“后端压缩”两部分。 前端压缩,是指在不改变原网络结构的压缩技术,主要包括知识蒸馏、轻量级网络(紧凑的模型结构设计)以及滤波器(filte 我们知道,在一定程度上,网络越深,参数越多,模型越复杂,其最终效果越好。神经网络的压缩算法是,旨在将一个庞大而复杂的预训练模型(pre-trained model)转化为一个精简的小模型。 按照压缩过程对网络结构的破坏程度,我们将模型压缩技术分为“前端压缩”和“后端压缩”两部分。 前端压缩,是指在不改变原网络结构的压缩技术,主要包括知识蒸馏、轻量级网络(紧凑的模型结构设计)以及滤波器(filte
- 终端设备上运行深度学习算法需要考虑内存和算力的需求,因此需要进行模型复杂度分析,涉及到模型计算量(时间/计算复杂度)和模型参数量(空间复杂度)分析。 终端设备上运行深度学习算法需要考虑内存和算力的需求,因此需要进行模型复杂度分析,涉及到模型计算量(时间/计算复杂度)和模型参数量(空间复杂度)分析。
- 查准率和查全率是一对矛盾的的度量。一般来说,查全率高时,查准率往往偏低;而查全率高时,查准率往往偏低。通常只有在一些简单任务中,才可能使查全率和查准率都很好高。精准率和召回率的关系可以用一个 P-R 图来展示,以查准率 P 为纵轴、查全率 R 为横轴作图,就得到了查准率-查全率曲线,简称 P-R 曲线,PR 曲线下的面积定义为 AP。 查准率和查全率是一对矛盾的的度量。一般来说,查全率高时,查准率往往偏低;而查全率高时,查准率往往偏低。通常只有在一些简单任务中,才可能使查全率和查准率都很好高。精准率和召回率的关系可以用一个 P-R 图来展示,以查准率 P 为纵轴、查全率 R 为横轴作图,就得到了查准率-查全率曲线,简称 P-R 曲线,PR 曲线下的面积定义为 AP。
- 安第斯高原生态系统在地形多样的地区维持着高水平的花卉和动物生物多样性,并提供各种生态系统服务,包括向城市和下游农业谷地供水。谷歌(™)已经开发了一个专门用于测绘的产品(地球引擎),它使用户能够近乎实时地利用基于云计算的解决方案的计算能力,进行土地覆盖变化的测绘和监测。我们探索了在地形复杂、植被类型高度混杂的地形(位于秘鲁安第斯山脉中部的Nor Yauyos Cochas景观保护区)中,利用分... 安第斯高原生态系统在地形多样的地区维持着高水平的花卉和动物生物多样性,并提供各种生态系统服务,包括向城市和下游农业谷地供水。谷歌(™)已经开发了一个专门用于测绘的产品(地球引擎),它使用户能够近乎实时地利用基于云计算的解决方案的计算能力,进行土地覆盖变化的测绘和监测。我们探索了在地形复杂、植被类型高度混杂的地形(位于秘鲁安第斯山脉中部的Nor Yauyos Cochas景观保护区)中,利用分...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签