- 目录 1. 什么是类别型特征? 2. 处理类别型特征的编码方式有哪几种? 2.1 序号编码 2.2 独热编码 2.2.1对于类别取值比较多的情况下,使用独热编码注意以下问题: 2.3 二进制编码 3除了这些编码还有哪些? 1. 什么是类别型特征? 类别型特征(Categorical Feature)主要指的是性别(男、女)、血型(A、B、AB、O)等只... 目录 1. 什么是类别型特征? 2. 处理类别型特征的编码方式有哪几种? 2.1 序号编码 2.2 独热编码 2.2.1对于类别取值比较多的情况下,使用独热编码注意以下问题: 2.3 二进制编码 3除了这些编码还有哪些? 1. 什么是类别型特征? 类别型特征(Categorical Feature)主要指的是性别(男、女)、血型(A、B、AB、O)等只...
- 目录 先来看机器学习: 什么是特征? 深度学习是表示学习的经典代表: 深度学习的过程: 深度学习与传统机器学习差别: 深度学习代表算法: 先来看机器学习: 机器学习是利用经验experience来改善 计算机系统自身的性能,通过经验获取知识knowledge。 以往都是人们向计算机输入知识,现在是通过经验的“特征”数据来产生模型model(传统的机器... 目录 先来看机器学习: 什么是特征? 深度学习是表示学习的经典代表: 深度学习的过程: 深度学习与传统机器学习差别: 深度学习代表算法: 先来看机器学习: 机器学习是利用经验experience来改善 计算机系统自身的性能,通过经验获取知识knowledge。 以往都是人们向计算机输入知识,现在是通过经验的“特征”数据来产生模型model(传统的机器...
- 目录 1 . OTCBVS数据集 Dataset 01: OSU Thermal Pedestrian Database Dataset 02: IRIS Thermal/Visible Face Database Dataset 03: OSU Color-Thermal Database Dataset 04: Terravic Facial IR Databa... 目录 1 . OTCBVS数据集 Dataset 01: OSU Thermal Pedestrian Database Dataset 02: IRIS Thermal/Visible Face Database Dataset 03: OSU Color-Thermal Database Dataset 04: Terravic Facial IR Databa...
- 一般情况将K折交叉验证用于模型调优,找到使得模型泛化性能最优的超参值。找到后,在全部训练集上重新训练模型,并使用独立测试集对模型性能做出最终评价。 K折交叉验证使用了无重复抽样技术的好处:每次迭代过程中每个样本点只有一次被划入训练集或测试集的机会。 K折交叉验证图: 如果训练数据集相对较小,则增大k值。 增大k值,在每次迭代过程中将会有更多的数据用于模型训练,能够... 一般情况将K折交叉验证用于模型调优,找到使得模型泛化性能最优的超参值。找到后,在全部训练集上重新训练模型,并使用独立测试集对模型性能做出最终评价。 K折交叉验证使用了无重复抽样技术的好处:每次迭代过程中每个样本点只有一次被划入训练集或测试集的机会。 K折交叉验证图: 如果训练数据集相对较小,则增大k值。 增大k值,在每次迭代过程中将会有更多的数据用于模型训练,能够...
- 机器学习是人工智能AI研究发展到一定阶段的必然产物! 二十世纪五十年代~七十年代初,“推理期”:机器的只能体现在具有逻辑推理能力。 二十世纪七十年代中期开始,AI进入“知识期”,希望机器能够自己学习! 其实,图灵1950年就曾提到过机器学习的可能 五十年代中后期,基于神经网络的“连接主义”学习开始,比如:感知机 六七十年代,基于逻辑表示的“ ”符号主义学习发展, ... 机器学习是人工智能AI研究发展到一定阶段的必然产物! 二十世纪五十年代~七十年代初,“推理期”:机器的只能体现在具有逻辑推理能力。 二十世纪七十年代中期开始,AI进入“知识期”,希望机器能够自己学习! 其实,图灵1950年就曾提到过机器学习的可能 五十年代中后期,基于神经网络的“连接主义”学习开始,比如:感知机 六七十年代,基于逻辑表示的“ ”符号主义学习发展, ...
- 目录 0. Normalization简单解释 1. 常用的归一化方法 (1)线性函数归一化(Min-Max Scaling) (2)零均值归一化(Z-Score Normalization) 2. 为什么说数据归一化不是万能的?有哪些 适用哪些不适用? 0. Normalization简单解释 为了消除数据特征之间的量纲的影响,所以需要进行归一化的处理,... 目录 0. Normalization简单解释 1. 常用的归一化方法 (1)线性函数归一化(Min-Max Scaling) (2)零均值归一化(Z-Score Normalization) 2. 为什么说数据归一化不是万能的?有哪些 适用哪些不适用? 0. Normalization简单解释 为了消除数据特征之间的量纲的影响,所以需要进行归一化的处理,...
- 目录 1. 实际案例: 2. 回顾基本知识: 精确率Precision 召回率Recall 排序问题中,如何衡量模型性能? 精确率和召回率是既矛盾又统一的两个指标 3. 解答实例问题 如何解决或者权衡? P-R曲线 F1 score 是精确率和召回率的调和平均值 1. 实际案例: 搜索引擎提供模糊搜索功能,搜索排序模型返回的TOP 5 精确率非常... 目录 1. 实际案例: 2. 回顾基本知识: 精确率Precision 召回率Recall 排序问题中,如何衡量模型性能? 精确率和召回率是既矛盾又统一的两个指标 3. 解答实例问题 如何解决或者权衡? P-R曲线 F1 score 是精确率和召回率的调和平均值 1. 实际案例: 搜索引擎提供模糊搜索功能,搜索排序模型返回的TOP 5 精确率非常...
- 机器学习基本概念 1. 特征工程1.1 特征工程的目的1.2 怎么做特征工程?1.2.1 特征构建1.2.2 特征提取1.2.2.1特征提取常用方法 1.2.3 特征选择1.2.3.1 特征选择常用方法 2. 结构化数据3. 非结构化数据 1. 特征工程 特征工程师对原始数据进行一系列的工程处理,作为输入供算法和模型使用。 举例:想让机器识别... 机器学习基本概念 1. 特征工程1.1 特征工程的目的1.2 怎么做特征工程?1.2.1 特征构建1.2.2 特征提取1.2.2.1特征提取常用方法 1.2.3 特征选择1.2.3.1 特征选择常用方法 2. 结构化数据3. 非结构化数据 1. 特征工程 特征工程师对原始数据进行一系列的工程处理,作为输入供算法和模型使用。 举例:想让机器识别...
- 目录 回顾知识点: 实际场景: 1. 什么是分类的准确率? 2. 如何避免由于样本比例不均衡导致准确率失效? 回顾知识点: 准确率 : Accuracy 精确率 : Precision 召回率 : Recall 均方根误差 : Root Mean Square Error, RMSE 实际场景: 拿到奢侈品用户数据,训练和测试奢侈品用... 目录 回顾知识点: 实际场景: 1. 什么是分类的准确率? 2. 如何避免由于样本比例不均衡导致准确率失效? 回顾知识点: 准确率 : Accuracy 精确率 : Precision 召回率 : Recall 均方根误差 : Root Mean Square Error, RMSE 实际场景: 拿到奢侈品用户数据,训练和测试奢侈品用...
- 集成学习(ensemble learning)可以说是现在非常火爆的机器学习方法了。它本身不是一个单独的机器学习算法,而是通过构建并结合多个机器学习器来完成学习任务。也就是我们常说的“博采众长”。集成学习可以用于分类问题集成,回归问题集成,特征选取集成,异常点检测集成等等,可以说所有的机器学习领域都可以看到集成学习的身影。本文就对集成学习的原理做一个总结。 1. 集成学习概... 集成学习(ensemble learning)可以说是现在非常火爆的机器学习方法了。它本身不是一个单独的机器学习算法,而是通过构建并结合多个机器学习器来完成学习任务。也就是我们常说的“博采众长”。集成学习可以用于分类问题集成,回归问题集成,特征选取集成,异常点检测集成等等,可以说所有的机器学习领域都可以看到集成学习的身影。本文就对集成学习的原理做一个总结。 1. 集成学习概...
- 目录 1. 模型可以提供什么? 2. 先验信息可以用在哪里? 3. 图像分类训练数据不足带来的问题? 4. 如何解决图像分类训练数据不足? 5. 图像分类任务中,在保持图像类别不变的前提下,可以对训练集中的每幅图像进行哪些变换? 6. 如何训练自己的模型?迁移学习 1. 模型可以提供什么? 训练数据中所蕴含的信息模型构造学习推理过程中,人们提供的先验... 目录 1. 模型可以提供什么? 2. 先验信息可以用在哪里? 3. 图像分类训练数据不足带来的问题? 4. 如何解决图像分类训练数据不足? 5. 图像分类任务中,在保持图像类别不变的前提下,可以对训练集中的每幅图像进行哪些变换? 6. 如何训练自己的模型?迁移学习 1. 模型可以提供什么? 训练数据中所蕴含的信息模型构造学习推理过程中,人们提供的先验...
- By 超神经 场景描述:要问什么水果和夏天最搭,答案一定是西瓜。作为西瓜生产与消费大国,中国在 2018 年以全世界 20% 的人口消耗掉全世界 70% 的西瓜,人均 100 斤。如何挑选最甜的瓜,也成了「吃瓜群众」十分关心的问题。一位浙江大学的博士,用机器学习的方法判断西瓜的成熟度,十分接地气。 关键词:西瓜 声学特征检测 机器学习 ... By 超神经 场景描述:要问什么水果和夏天最搭,答案一定是西瓜。作为西瓜生产与消费大国,中国在 2018 年以全世界 20% 的人口消耗掉全世界 70% 的西瓜,人均 100 斤。如何挑选最甜的瓜,也成了「吃瓜群众」十分关心的问题。一位浙江大学的博士,用机器学习的方法判断西瓜的成熟度,十分接地气。 关键词:西瓜 声学特征检测 机器学习 ...
- Geoffrey Hinton等6位图灵奖得主亲临,百余位顶级学者邀请你加入群聊「2020北京智源大会」,深入系统探讨「人工智能的下一个十年」。 自2009年深度学习崛起以来,第三波人工智能浪潮席卷全球,推动了新一波技术革命。 在这波澜壮阔的11年,我们见证了技术突破、应用创新与产业变革。 技术上,深度学习首先带来计算机视觉、语音识别等领域的突破,让机器识别的... Geoffrey Hinton等6位图灵奖得主亲临,百余位顶级学者邀请你加入群聊「2020北京智源大会」,深入系统探讨「人工智能的下一个十年」。 自2009年深度学习崛起以来,第三波人工智能浪潮席卷全球,推动了新一波技术革命。 在这波澜壮阔的11年,我们见证了技术突破、应用创新与产业变革。 技术上,深度学习首先带来计算机视觉、语音识别等领域的突破,让机器识别的...
- Numpy 和 scikit-learn 都是python常用的第三方库。numpy库可以用来存储和处理大型矩阵,并且在一定程度上弥补了python在运算效率上的不足,正是因为numpy的存在使得python成为数值计算领域的一大利器;sklearn是python著名的机器学习库,它其中封装了大量的机器学习算法,内置了大量的公开数据集,并且拥有完善的文档,因此成... Numpy 和 scikit-learn 都是python常用的第三方库。numpy库可以用来存储和处理大型矩阵,并且在一定程度上弥补了python在运算效率上的不足,正是因为numpy的存在使得python成为数值计算领域的一大利器;sklearn是python著名的机器学习库,它其中封装了大量的机器学习算法,内置了大量的公开数据集,并且拥有完善的文档,因此成...
- 今天强烈推荐一些互联网行业内优质技术公众号,互联网人大部分都关注了,在工作、生活节奏超快的今天,想要不断提升自我,利用碎片化阅读学习是你最佳选择,这些号在行业里深耕已久,会给你带来事半功倍的效果,非诚勿扰,扫码关注。 01 Python爬虫人工智能大数据 公众号由一位零基础转行Python的Python全栈工程师创办,文章以... 今天强烈推荐一些互联网行业内优质技术公众号,互联网人大部分都关注了,在工作、生活节奏超快的今天,想要不断提升自我,利用碎片化阅读学习是你最佳选择,这些号在行业里深耕已久,会给你带来事半功倍的效果,非诚勿扰,扫码关注。 01 Python爬虫人工智能大数据 公众号由一位零基础转行Python的Python全栈工程师创办,文章以...
上滑加载中
推荐直播
-
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中 -
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
热门标签