- 什么是网络爬虫?网络爬虫是一种从互联网抓取数据信息的自动化程序;如果我们把互联网比作一张大的蜘蛛网,数据便是存放于蜘蛛网的各个节点,而爬虫就是一只小蜘蛛(程序),沿着网络抓取自己的猎物(数据)。网络爬虫如何工作?构建网页·构造一个请求并发送给服务器;·接收到响应(页面源代码)并将其解析出来;提取信息·网页的结构有一定的规则,采用正则表达式提取;·使用Requests库,我们可以高效快速地从中... 什么是网络爬虫?网络爬虫是一种从互联网抓取数据信息的自动化程序;如果我们把互联网比作一张大的蜘蛛网,数据便是存放于蜘蛛网的各个节点,而爬虫就是一只小蜘蛛(程序),沿着网络抓取自己的猎物(数据)。网络爬虫如何工作?构建网页·构造一个请求并发送给服务器;·接收到响应(页面源代码)并将其解析出来;提取信息·网页的结构有一定的规则,采用正则表达式提取;·使用Requests库,我们可以高效快速地从中...
- 本系列通过一系列论文的解读,为大家提供人工智能与人类智慧相结合的一些思路。本期的论文是Expert-augmented machine learning。这篇文章提供了这样一种思路:由机器提取特定问题,再由人类解答,以将二者智慧相结合。以下是具体内容。机器学习在越来越多的领域提供无价的价值,然而机器学习的成功受限于数据质量;机器学习的采用受限于给定模型的置信度。经验观察性质的人机表现作为任务... 本系列通过一系列论文的解读,为大家提供人工智能与人类智慧相结合的一些思路。本期的论文是Expert-augmented machine learning。这篇文章提供了这样一种思路:由机器提取特定问题,再由人类解答,以将二者智慧相结合。以下是具体内容。机器学习在越来越多的领域提供无价的价值,然而机器学习的成功受限于数据质量;机器学习的采用受限于给定模型的置信度。经验观察性质的人机表现作为任务...
- 深度学习:NiN(Network In Network)详细讲解与代码实现 网络核心思想LeNet、AlexNet和VGG都有一个共同的设计模式:通过一系列的卷积层与汇聚层来提取空间结构特征;然后通过全连接层对特征的表征进行处理。AlexNet和VGG对LeNet的改进主要在于如何扩大和加深这两个模块。或者,可以想象在这个过程的早期使用全连接层。然而,如果使用了全连接层,可能会完全放弃表征... 深度学习:NiN(Network In Network)详细讲解与代码实现 网络核心思想LeNet、AlexNet和VGG都有一个共同的设计模式:通过一系列的卷积层与汇聚层来提取空间结构特征;然后通过全连接层对特征的表征进行处理。AlexNet和VGG对LeNet的改进主要在于如何扩大和加深这两个模块。或者,可以想象在这个过程的早期使用全连接层。然而,如果使用了全连接层,可能会完全放弃表征...
- 《代码提升 第八篇》 《代码提升 第八篇》
- 监督学习是机器学习当中非常常见的一种机器学习类型,就是在已知输入输出的情况下训练出一个模型,并且将输入映射输出。 监督学习是机器学习当中非常常见的一种机器学习类型,就是在已知输入输出的情况下训练出一个模型,并且将输入映射输出。
- 机器学习:线性判别分析从理论到公式推导(LDA) 数据定义DataSet X:=(xi,yi)i=1N,令X的每个观测值xi∈Rp{(x_i,y_i)}_{i=1}^N,令X的每个观测值xi \in R^p(xi,yi)i=1N,令X的每个观测值xi∈Rp,Y的每个元素yi∈Ry_i\in Ryi∈R,我们继续化简,X=Y=其中yi为+1的输入C1类别,yi为−1的输入C2y_i为+... 机器学习:线性判别分析从理论到公式推导(LDA) 数据定义DataSet X:=(xi,yi)i=1N,令X的每个观测值xi∈Rp{(x_i,y_i)}_{i=1}^N,令X的每个观测值xi \in R^p(xi,yi)i=1N,令X的每个观测值xi∈Rp,Y的每个元素yi∈Ry_i\in Ryi∈R,我们继续化简,X=Y=其中yi为+1的输入C1类别,yi为−1的输入C2y_i为+...
- 今天给大家推荐一篇文章,是我们常见的影像条带修复的文章。 本文的主要内容是:随着云计算的发展,利用谷歌地球引擎(GEE)平台,利用长时间序列的Landsat图像进行水反演、自然灾害监测、土地利用变化等研究也逐渐成为主流。Landsat图像是目前遥感反演的最重要的图像数据源之一。由于单视角图像的时间和天气条件的变化,获得的图像辐射率也不尽相同;因此,使用月或年的时间尺度对多视角图像进行镶嵌,... 今天给大家推荐一篇文章,是我们常见的影像条带修复的文章。 本文的主要内容是:随着云计算的发展,利用谷歌地球引擎(GEE)平台,利用长时间序列的Landsat图像进行水反演、自然灾害监测、土地利用变化等研究也逐渐成为主流。Landsat图像是目前遥感反演的最重要的图像数据源之一。由于单视角图像的时间和天气条件的变化,获得的图像辐射率也不尽相同;因此,使用月或年的时间尺度对多视角图像进行镶嵌,...
- @TOC 概述通过前面的内容,我们深入剖析了单个感知机是如何运作的,如果想了解欢迎考古:感知机从理论到代码。接下里,我们来探讨一下:为什么感知机不能解决疑惑问题,但是多层感知机却可以解决?为什么激活函数从分段函数变成了sigmoid函数? 异或问题 前置我们知道计算机的所有程序最底层都是由与、或、异或来组成的,假设我们证明了多层感知机可以实现这四种运算,那么我们就可以假设它理论上可以逼近任何... @TOC 概述通过前面的内容,我们深入剖析了单个感知机是如何运作的,如果想了解欢迎考古:感知机从理论到代码。接下里,我们来探讨一下:为什么感知机不能解决疑惑问题,但是多层感知机却可以解决?为什么激活函数从分段函数变成了sigmoid函数? 异或问题 前置我们知道计算机的所有程序最底层都是由与、或、异或来组成的,假设我们证明了多层感知机可以实现这四种运算,那么我们就可以假设它理论上可以逼近任何...
- 机器学习:过拟合与欠拟合是如何被解决的?) 什么是过拟合与欠拟合机器学习的主要挑战是我们的算法能够在为观测的数据上误差较小,而不是在只在训练集上表现良好,我们这种能力我们称之为泛化。 过拟合如上右图所示,模型通过训练集很好的拟合了观测数据,训练误差很小,但是由于过度的在训练集上拟合,当其用于推理测试数据时,误差很可能会变大,因为数据是有噪声的并且其本身与真实概率分布也有一定偏差,训练集的概... 机器学习:过拟合与欠拟合是如何被解决的?) 什么是过拟合与欠拟合机器学习的主要挑战是我们的算法能够在为观测的数据上误差较小,而不是在只在训练集上表现良好,我们这种能力我们称之为泛化。 过拟合如上右图所示,模型通过训练集很好的拟合了观测数据,训练误差很小,但是由于过度的在训练集上拟合,当其用于推理测试数据时,误差很可能会变大,因为数据是有噪声的并且其本身与真实概率分布也有一定偏差,训练集的概...
- @TOC 前置知识 1.1随机梯度下降与梯度下降 1.2梯度下降法与最小二乘法的差异 1.3为什么需要梯度下降法 1.4梯度方向为什么是函数下降最快的反方向 1.5 指数加权平均假设有10个数,xix_ixi :=0 1 2 3 4 5 6 7 8 9 ,想求这组数据的平均值,我们所知的方法一般是算是平均法:$$\overline{x}=\dfrac{0+1+2+3+4+5+6+7+8+9... @TOC 前置知识 1.1随机梯度下降与梯度下降 1.2梯度下降法与最小二乘法的差异 1.3为什么需要梯度下降法 1.4梯度方向为什么是函数下降最快的反方向 1.5 指数加权平均假设有10个数,xix_ixi :=0 1 2 3 4 5 6 7 8 9 ,想求这组数据的平均值,我们所知的方法一般是算是平均法:$$\overline{x}=\dfrac{0+1+2+3+4+5+6+7+8+9...
- detect.pyimport argparse #python的命令解析的模块,内置于python,不需要安装import torch.backends.cudnn as cudnn from models.experimental import *from utils.datasets import *from utils.utils import *from models.LPRN... detect.pyimport argparse #python的命令解析的模块,内置于python,不需要安装import torch.backends.cudnn as cudnn from models.experimental import *from utils.datasets import *from utils.utils import *from models.LPRN...
- 灰色预测模型预测题目的套路和思路:年份序列不能通过时间序列分解SSE误差平方和:参考博客:https://www.cnblogs.com/DjangoBlog/p/9575360.html 灰色预测模型(微分方程基础上的,GM(1,1)实质就是一个指数模型):对灰色系统的一个分析,系统也可以称为数据集,灰色的含义为系统的部分信息已知,部分信息未知。(在一定范围内变化的,与时间有关的灰色过程进... 灰色预测模型预测题目的套路和思路:年份序列不能通过时间序列分解SSE误差平方和:参考博客:https://www.cnblogs.com/DjangoBlog/p/9575360.html 灰色预测模型(微分方程基础上的,GM(1,1)实质就是一个指数模型):对灰色系统的一个分析,系统也可以称为数据集,灰色的含义为系统的部分信息已知,部分信息未知。(在一定范围内变化的,与时间有关的灰色过程进...
- 模拟退火算法蒙特卡罗模拟算法(解决简单问题)问题如下:1.求一个给定函数的最值问题(函数在[-3,3]内的最大值)蒙特卡罗模拟算法思想:暴力搜索(随机取多个点代入试值,取最值)缺点在于时间复杂度高,时间复杂度越高,求解花费时间越长(例如30个变量)时间复杂度:简单理解就是一个算法或是一个程序在运行时,所消耗的时间(或者代码被执行的总次数)可以参考博客:https://cloud.tencen... 模拟退火算法蒙特卡罗模拟算法(解决简单问题)问题如下:1.求一个给定函数的最值问题(函数在[-3,3]内的最大值)蒙特卡罗模拟算法思想:暴力搜索(随机取多个点代入试值,取最值)缺点在于时间复杂度高,时间复杂度越高,求解花费时间越长(例如30个变量)时间复杂度:简单理解就是一个算法或是一个程序在运行时,所消耗的时间(或者代码被执行的总次数)可以参考博客:https://cloud.tencen...
- 标准化(去除量纲影响)第一种:Z-Score标准化(用在了主成分分析算法中)简介:Z-Score通过(x-μ)/σ将两组或多组数据转化为无单位的Z-Score分值,使得数据标准统一化,提高了数据可比性,削弱了数据解释性。总结:Z-Score的主要目的就是将不同量级的数据统一转化为同一个量级,统一用计算出的Z-Score值衡量,以保证数据之间的可比性自我理解:Z-Score标准化实际上就是概率... 标准化(去除量纲影响)第一种:Z-Score标准化(用在了主成分分析算法中)简介:Z-Score通过(x-μ)/σ将两组或多组数据转化为无单位的Z-Score分值,使得数据标准统一化,提高了数据可比性,削弱了数据解释性。总结:Z-Score的主要目的就是将不同量级的数据统一转化为同一个量级,统一用计算出的Z-Score值衡量,以保证数据之间的可比性自我理解:Z-Score标准化实际上就是概率...
- 1 很高兴今天能有机会和大家讨论我对“AI工程能力”的一些理解。2 这次的分享内容主要包括三部分,首先是举例说明“人工智能是什么?搞人工智能/机器学习/深度学习的人工作都在做什么?”,然后是以高频词举例,从几个方面介绍做人工智能的工程技术能力,最后说明一个牵涉到深度学习网络的算法从提出需求到工程化的过程。我分享的胶片一共有12页,不会牵涉太多技术细节,预计持续30min。3 ... 1 很高兴今天能有机会和大家讨论我对“AI工程能力”的一些理解。2 这次的分享内容主要包括三部分,首先是举例说明“人工智能是什么?搞人工智能/机器学习/深度学习的人工作都在做什么?”,然后是以高频词举例,从几个方面介绍做人工智能的工程技术能力,最后说明一个牵涉到深度学习网络的算法从提出需求到工程化的过程。我分享的胶片一共有12页,不会牵涉太多技术细节,预计持续30min。3 ...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签