- 参考:http://www.cnblogs.com/pegasus/archive/2011/05/19/2051416.html 这里讨论利用输入图像中像素的小邻域来产生输出图像的方法,在信号处理中这种方法称为滤波(filtering)。其中,最常用的是线性滤波:输出像素是输入邻域像素的加权和。 1.相关算子(Correlation Operator)... 参考:http://www.cnblogs.com/pegasus/archive/2011/05/19/2051416.html 这里讨论利用输入图像中像素的小邻域来产生输出图像的方法,在信号处理中这种方法称为滤波(filtering)。其中,最常用的是线性滤波:输出像素是输入邻域像素的加权和。 1.相关算子(Correlation Operator)...
- 原文: http://blog.sina.com.cn/s/blog_6df50e1a01019z95.html 1.使用模板处理图像相关概念 模板:矩阵方块,其数学含义是一种卷积运算。 卷积运算:可看作是加权求和的过程,使用到的图像区域中的每个... 原文: http://blog.sina.com.cn/s/blog_6df50e1a01019z95.html 1.使用模板处理图像相关概念 模板:矩阵方块,其数学含义是一种卷积运算。 卷积运算:可看作是加权求和的过程,使用到的图像区域中的每个...
- https://www.jiqizhixin.com/articles/2018-07-03-14 例子: https://github.com/ShikamaruZhang/AdamW optim_adam = torch.optim.Adam(net_Adam.parameters(), lr=LR, betas=(0.9, 0.99), weight_decay... https://www.jiqizhixin.com/articles/2018-07-03-14 例子: https://github.com/ShikamaruZhang/AdamW optim_adam = torch.optim.Adam(net_Adam.parameters(), lr=LR, betas=(0.9, 0.99), weight_decay...
- EfficientNetV2: Smaller Models and Faster Training paper: https://arxiv.org/abs/2104.00298 code(官方TF代码即将开源): https://github.com/google/automl/efficientnetv2 code(大神PyTorch复现代码,刚刚... EfficientNetV2: Smaller Models and Faster Training paper: https://arxiv.org/abs/2104.00298 code(官方TF代码即将开源): https://github.com/google/automl/efficientnetv2 code(大神PyTorch复现代码,刚刚...
- Alexnet,关于卷积神经网络,不同的网络算法,其实大家的框架是一样的,不一样的是大家的卷积层,也就是提取特征的过程。 整个算法的体系 Alexnet包含了八个学习层,五个卷积层和三个全连接层 conv1阶段 输入数据:卷积核:;步长:4;数量(也就是输出个数):96卷积后数据:relu1后的数据:pool1的核:,步长:2pool1后... Alexnet,关于卷积神经网络,不同的网络算法,其实大家的框架是一样的,不一样的是大家的卷积层,也就是提取特征的过程。 整个算法的体系 Alexnet包含了八个学习层,五个卷积层和三个全连接层 conv1阶段 输入数据:卷积核:;步长:4;数量(也就是输出个数):96卷积后数据:relu1后的数据:pool1的核:,步长:2pool1后...
- C3F:首个开源人群计数算法框架 导读:52CV曾经报道多篇拥挤人群计数相关的技术,比如最近的: CVPR 2019 | 西北工业大学开源拥挤人群数据集生成工具,大幅提升算法精度 开源地址: https://github.com/gjy3035/C-3-Framework 这个有个核心网络加自己的人数计数,比如resn... C3F:首个开源人群计数算法框架 导读:52CV曾经报道多篇拥挤人群计数相关的技术,比如最近的: CVPR 2019 | 西北工业大学开源拥挤人群数据集生成工具,大幅提升算法精度 开源地址: https://github.com/gjy3035/C-3-Framework 这个有个核心网络加自己的人数计数,比如resn...
- end2end的意思在不同人看来有不同理解,但是作为程序员/深度学习炼丹娃,应当理解为:至少是从处理过的图像-->最终目标结果(比如分类结果、检测结果、分割结果等)的一个流程,也就是起码把原来的“特征提取”和“用分类器做分类,包括特征选择”的两个模块,串在一起了,而不是显示地分成两个模块。 下面是转载知乎的回答: 作者:王赟 Maigo 链接:https:/... end2end的意思在不同人看来有不同理解,但是作为程序员/深度学习炼丹娃,应当理解为:至少是从处理过的图像-->最终目标结果(比如分类结果、检测结果、分割结果等)的一个流程,也就是起码把原来的“特征提取”和“用分类器做分类,包括特征选择”的两个模块,串在一起了,而不是显示地分成两个模块。 下面是转载知乎的回答: 作者:王赟 Maigo 链接:https:/...
- 深度学习最全优化方法总结比较(SGD,Adagrad,Adadelta,Adam,Adamax,Nadam) 前言 (标题不能再中二了)本文仅对一些常见的优化方法进行直观介绍和简单的比较,各种优化方法的详细内容及公式只好去认真啃论文了,在此我就不赘述了。 SGD 此处的SGD指mini-batch gradient descent,关于batch grad... 深度学习最全优化方法总结比较(SGD,Adagrad,Adadelta,Adam,Adamax,Nadam) 前言 (标题不能再中二了)本文仅对一些常见的优化方法进行直观介绍和简单的比较,各种优化方法的详细内容及公式只好去认真啃论文了,在此我就不赘述了。 SGD 此处的SGD指mini-batch gradient descent,关于batch grad...
- pynvml 多gpu不能显示 多个gpu时,只能显示一个gpu, 解决方法,把cuda重新装。 下面两种方法都能看有多少个gpu? import os import pynvml pynvml.nvmlInit() def usegpu(need_gpu_count=1): nouse = [] for index in range(pynvml.nvmlDe... pynvml 多gpu不能显示 多个gpu时,只能显示一个gpu, 解决方法,把cuda重新装。 下面两种方法都能看有多少个gpu? import os import pynvml pynvml.nvmlInit() def usegpu(need_gpu_count=1): nouse = [] for index in range(pynvml.nvmlDe...
- 原文:http://www.tinymind.cn/articles/1176 在 AlphaGo 对弈李世石、柯洁之后,更多行业开始尝试通过机器学习优化现有技术方案。其实对于实时音视频来讲,对机器学习的研究已有多年,我们曾分享过的实时图像识别只是其中一种应用。我们还可以利用深度学习来做超分辨率。我们这次就分享一下用于超分辨率的深度学习基本框架,以及衍生... 原文:http://www.tinymind.cn/articles/1176 在 AlphaGo 对弈李世石、柯洁之后,更多行业开始尝试通过机器学习优化现有技术方案。其实对于实时音视频来讲,对机器学习的研究已有多年,我们曾分享过的实时图像识别只是其中一种应用。我们还可以利用深度学习来做超分辨率。我们这次就分享一下用于超分辨率的深度学习基本框架,以及衍生...
- 加权边界框融合(WBF) 原文链接:https://arxiv.org/pdf/1910.13302.pdf 源码https://github.com/ZFTurbo/Weighted-Boxes-Fusion WBF 的一些缺陷: 速度慢,大概比标准NMS慢3倍WBF实验中是在已经完成NMS的模型上进行的 下面是WBF的算法步骤: 每个模型的每个预测... 加权边界框融合(WBF) 原文链接:https://arxiv.org/pdf/1910.13302.pdf 源码https://github.com/ZFTurbo/Weighted-Boxes-Fusion WBF 的一些缺陷: 速度慢,大概比标准NMS慢3倍WBF实验中是在已经完成NMS的模型上进行的 下面是WBF的算法步骤: 每个模型的每个预测...
- GoogLeNetInceptionCNN深度学习卷积神经网络 2014年,GoogLeNet和VGG是当年ImageNet挑战赛(ILSVRC14)的双雄,GoogLeNet获得了第一名、VGG获得了第二名,这两类模型结构的共同特点是层次更深了。VGG继承了LeNet以及AlexNet的一些框架结构(详见 大话CNN经典模型:VGGN... GoogLeNetInceptionCNN深度学习卷积神经网络 2014年,GoogLeNet和VGG是当年ImageNet挑战赛(ILSVRC14)的双雄,GoogLeNet获得了第一名、VGG获得了第二名,这两类模型结构的共同特点是层次更深了。VGG继承了LeNet以及AlexNet的一些框架结构(详见 大话CNN经典模型:VGGN...
- Region Proposal Network RPN的实现方式:在conv5-3的卷积feature map上用一个n*n的滑窗(论文中作者选用了n=3,即3*3的滑窗)生成一个长度为256(对应于ZF网络)或512(对应于VGG网络)维长度的全连接特征.然后在这个256维或512维的特征后产生两个分支的全连接层: (1)reg-layer,用于预测proposal的... Region Proposal Network RPN的实现方式:在conv5-3的卷积feature map上用一个n*n的滑窗(论文中作者选用了n=3,即3*3的滑窗)生成一个长度为256(对应于ZF网络)或512(对应于VGG网络)维长度的全连接特征.然后在这个256维或512维的特征后产生两个分支的全连接层: (1)reg-layer,用于预测proposal的...
- 我的理解:就是特征降维,把不重要的信息过滤掉。 深度学习中的注意力机制 最近两年,注意力模型(Attention Model)被广泛使用在自然语言处理、图像识别及语音识别等各种不同类型的深度学习任务中,是深度学习技术中最值得关注与深入了解的核心技术之一。 本文以机器翻译为例,深入浅出地介绍了深度学习中注意力机制的原理及关键计算机制,同时也... 我的理解:就是特征降维,把不重要的信息过滤掉。 深度学习中的注意力机制 最近两年,注意力模型(Attention Model)被广泛使用在自然语言处理、图像识别及语音识别等各种不同类型的深度学习任务中,是深度学习技术中最值得关注与深入了解的核心技术之一。 本文以机器翻译为例,深入浅出地介绍了深度学习中注意力机制的原理及关键计算机制,同时也...
- 1.卷积参数量的计算,若卷积层的输入featuremap的维度为Cin×Hin×Win,卷积核的大小为K1×K2, padding=P1×P2, stride=S1×S2,卷积核(filter)的数量为Cout,则输出特征图的大小为Cout×Hout×Wout,其中: Hout=⌊(H−K1+2P1)/S1⌋+1 Wout=⌊(W−K2+2P2)/S2... 1.卷积参数量的计算,若卷积层的输入featuremap的维度为Cin×Hin×Win,卷积核的大小为K1×K2, padding=P1×P2, stride=S1×S2,卷积核(filter)的数量为Cout,则输出特征图的大小为Cout×Hout×Wout,其中: Hout=⌊(H−K1+2P1)/S1⌋+1 Wout=⌊(W−K2+2P2)/S2...
上滑加载中
推荐直播
-
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中 -
华为云码道全新升级,多会话并行与多智能体协作2026/05/08 周五 19:00-21:00
王一男-华为云码道产品专家;张嘉冉-华为云码道工程师;胡琦-华为云HCDE;程诗杰-华为云HCDG
华为云码道4月份版本全新升级,此次直播深度解读4月份产品特性,通过“特性解读+实操演示+实战案例+设计创新”的组合,全方位展现码道在多会话并行与多智能体协作方面的能力,赋能开发者提升效率
正在直播
热门标签