- 本文是机器学习笔记系列 参考链接:https://vas3k.com/blog/machine_learning/ 机器学习这个主题已经很普遍了,每个人都在谈论它,但很少有人能够透彻地了解它。当前网络上的一些机器学习文章晦涩难懂,理论性太强,或者通篇云里雾里地介绍人工智能、数据科学的魔力以及未来的工作等。 所以呢,本文作者 vas3k 通过简洁的语言和清晰明了... 本文是机器学习笔记系列 参考链接:https://vas3k.com/blog/machine_learning/ 机器学习这个主题已经很普遍了,每个人都在谈论它,但很少有人能够透彻地了解它。当前网络上的一些机器学习文章晦涩难懂,理论性太强,或者通篇云里雾里地介绍人工智能、数据科学的魔力以及未来的工作等。 所以呢,本文作者 vas3k 通过简洁的语言和清晰明了...
- 1 SVM的优点 训练好的模型算法复杂度是由支持向量的个数决定,而不是数据维度决定,所以SVM不太容易过拟合。 SVM训练出来的模型完全依赖于支持向量,即使训练集里面所有非支持点都去除,重复训练过程,结果模型完全一样 一个SVM如果训练得到的支持向量个数少,则模型更容易泛化(比如各有1个点,... 1 SVM的优点 训练好的模型算法复杂度是由支持向量的个数决定,而不是数据维度决定,所以SVM不太容易过拟合。 SVM训练出来的模型完全依赖于支持向量,即使训练集里面所有非支持点都去除,重复训练过程,结果模型完全一样 一个SVM如果训练得到的支持向量个数少,则模型更容易泛化(比如各有1个点,...
- 目录 归纳和演绎 归纳学习分为广义和狭义: 概念学习、概念形成最基本的是布尔概念学习: 解答疑问 归纳和演绎 “归纳”和“演绎”是科学推理的两大基本手段 “归纳”是从特殊到一般,是一个“泛化”过程,是总结经验,比如猫有哪些特点? “演绎” 就是从一般到特殊,从基本情况推出具体情况,是“特化”过程 从“样本”中学习过程 称为“归纳学习” ... 目录 归纳和演绎 归纳学习分为广义和狭义: 概念学习、概念形成最基本的是布尔概念学习: 解答疑问 归纳和演绎 “归纳”和“演绎”是科学推理的两大基本手段 “归纳”是从特殊到一般,是一个“泛化”过程,是总结经验,比如猫有哪些特点? “演绎” 就是从一般到特殊,从基本情况推出具体情况,是“特化”过程 从“样本”中学习过程 称为“归纳学习” ...
- 目录 总述: 1. Word2Vec的两种网络结构 1.1 输入层 1.2 映射层 1.3 输出层 1.4 神经网络的权重 2. Word2Vec与LDA的区别和联系 2.1 主题模型与词嵌入方法 总述: Word2Vec是2013年谷歌提出来目前最为常用的词嵌入模型之一。 Word2Vec是一种浅层的神经网络模型,包含有两种网络结构:CBOW(Co... 目录 总述: 1. Word2Vec的两种网络结构 1.1 输入层 1.2 映射层 1.3 输出层 1.4 神经网络的权重 2. Word2Vec与LDA的区别和联系 2.1 主题模型与词嵌入方法 总述: Word2Vec是2013年谷歌提出来目前最为常用的词嵌入模型之一。 Word2Vec是一种浅层的神经网络模型,包含有两种网络结构:CBOW(Co...
- 由现实世界引出“机器学习” 看到乌云密布,自己推测出要下雨 通过一个苹果的表面和大小,来判断这个苹果是否好吃 我们通过经验来进行判断,这是因为我们积累了许多有用的经验,通过对有用经验的分析,就能对遇到的情况做出相应的对策。 计算机中,经验就是“数据”,判断模型就是“算法”,机器学习就是研究“学习算法”。 举例:当计算机数据库有上千万只猫的照片,并对其特点进行建模分析... 由现实世界引出“机器学习” 看到乌云密布,自己推测出要下雨 通过一个苹果的表面和大小,来判断这个苹果是否好吃 我们通过经验来进行判断,这是因为我们积累了许多有用的经验,通过对有用经验的分析,就能对遇到的情况做出相应的对策。 计算机中,经验就是“数据”,判断模型就是“算法”,机器学习就是研究“学习算法”。 举例:当计算机数据库有上千万只猫的照片,并对其特点进行建模分析...
- 目录 1. 什么是类别型特征? 2. 处理类别型特征的编码方式有哪几种? 2.1 序号编码 2.2 独热编码 2.2.1对于类别取值比较多的情况下,使用独热编码注意以下问题: 2.3 二进制编码 3除了这些编码还有哪些? 1. 什么是类别型特征? 类别型特征(Categorical Feature)主要指的是性别(男、女)、血型(A、B、AB、O)等只... 目录 1. 什么是类别型特征? 2. 处理类别型特征的编码方式有哪几种? 2.1 序号编码 2.2 独热编码 2.2.1对于类别取值比较多的情况下,使用独热编码注意以下问题: 2.3 二进制编码 3除了这些编码还有哪些? 1. 什么是类别型特征? 类别型特征(Categorical Feature)主要指的是性别(男、女)、血型(A、B、AB、O)等只...
- 目录 先来看机器学习: 什么是特征? 深度学习是表示学习的经典代表: 深度学习的过程: 深度学习与传统机器学习差别: 深度学习代表算法: 先来看机器学习: 机器学习是利用经验experience来改善 计算机系统自身的性能,通过经验获取知识knowledge。 以往都是人们向计算机输入知识,现在是通过经验的“特征”数据来产生模型model(传统的机器... 目录 先来看机器学习: 什么是特征? 深度学习是表示学习的经典代表: 深度学习的过程: 深度学习与传统机器学习差别: 深度学习代表算法: 先来看机器学习: 机器学习是利用经验experience来改善 计算机系统自身的性能,通过经验获取知识knowledge。 以往都是人们向计算机输入知识,现在是通过经验的“特征”数据来产生模型model(传统的机器...
- 目录 1 . OTCBVS数据集 Dataset 01: OSU Thermal Pedestrian Database Dataset 02: IRIS Thermal/Visible Face Database Dataset 03: OSU Color-Thermal Database Dataset 04: Terravic Facial IR Databa... 目录 1 . OTCBVS数据集 Dataset 01: OSU Thermal Pedestrian Database Dataset 02: IRIS Thermal/Visible Face Database Dataset 03: OSU Color-Thermal Database Dataset 04: Terravic Facial IR Databa...
- 一般情况将K折交叉验证用于模型调优,找到使得模型泛化性能最优的超参值。找到后,在全部训练集上重新训练模型,并使用独立测试集对模型性能做出最终评价。 K折交叉验证使用了无重复抽样技术的好处:每次迭代过程中每个样本点只有一次被划入训练集或测试集的机会。 K折交叉验证图: 如果训练数据集相对较小,则增大k值。 增大k值,在每次迭代过程中将会有更多的数据用于模型训练,能够... 一般情况将K折交叉验证用于模型调优,找到使得模型泛化性能最优的超参值。找到后,在全部训练集上重新训练模型,并使用独立测试集对模型性能做出最终评价。 K折交叉验证使用了无重复抽样技术的好处:每次迭代过程中每个样本点只有一次被划入训练集或测试集的机会。 K折交叉验证图: 如果训练数据集相对较小,则增大k值。 增大k值,在每次迭代过程中将会有更多的数据用于模型训练,能够...
- 机器学习是人工智能AI研究发展到一定阶段的必然产物! 二十世纪五十年代~七十年代初,“推理期”:机器的只能体现在具有逻辑推理能力。 二十世纪七十年代中期开始,AI进入“知识期”,希望机器能够自己学习! 其实,图灵1950年就曾提到过机器学习的可能 五十年代中后期,基于神经网络的“连接主义”学习开始,比如:感知机 六七十年代,基于逻辑表示的“ ”符号主义学习发展, ... 机器学习是人工智能AI研究发展到一定阶段的必然产物! 二十世纪五十年代~七十年代初,“推理期”:机器的只能体现在具有逻辑推理能力。 二十世纪七十年代中期开始,AI进入“知识期”,希望机器能够自己学习! 其实,图灵1950年就曾提到过机器学习的可能 五十年代中后期,基于神经网络的“连接主义”学习开始,比如:感知机 六七十年代,基于逻辑表示的“ ”符号主义学习发展, ...
- 目录 0. Normalization简单解释 1. 常用的归一化方法 (1)线性函数归一化(Min-Max Scaling) (2)零均值归一化(Z-Score Normalization) 2. 为什么说数据归一化不是万能的?有哪些 适用哪些不适用? 0. Normalization简单解释 为了消除数据特征之间的量纲的影响,所以需要进行归一化的处理,... 目录 0. Normalization简单解释 1. 常用的归一化方法 (1)线性函数归一化(Min-Max Scaling) (2)零均值归一化(Z-Score Normalization) 2. 为什么说数据归一化不是万能的?有哪些 适用哪些不适用? 0. Normalization简单解释 为了消除数据特征之间的量纲的影响,所以需要进行归一化的处理,...
- 目录 1. 实际案例: 2. 回顾基本知识: 精确率Precision 召回率Recall 排序问题中,如何衡量模型性能? 精确率和召回率是既矛盾又统一的两个指标 3. 解答实例问题 如何解决或者权衡? P-R曲线 F1 score 是精确率和召回率的调和平均值 1. 实际案例: 搜索引擎提供模糊搜索功能,搜索排序模型返回的TOP 5 精确率非常... 目录 1. 实际案例: 2. 回顾基本知识: 精确率Precision 召回率Recall 排序问题中,如何衡量模型性能? 精确率和召回率是既矛盾又统一的两个指标 3. 解答实例问题 如何解决或者权衡? P-R曲线 F1 score 是精确率和召回率的调和平均值 1. 实际案例: 搜索引擎提供模糊搜索功能,搜索排序模型返回的TOP 5 精确率非常...
- 机器学习基本概念 1. 特征工程1.1 特征工程的目的1.2 怎么做特征工程?1.2.1 特征构建1.2.2 特征提取1.2.2.1特征提取常用方法 1.2.3 特征选择1.2.3.1 特征选择常用方法 2. 结构化数据3. 非结构化数据 1. 特征工程 特征工程师对原始数据进行一系列的工程处理,作为输入供算法和模型使用。 举例:想让机器识别... 机器学习基本概念 1. 特征工程1.1 特征工程的目的1.2 怎么做特征工程?1.2.1 特征构建1.2.2 特征提取1.2.2.1特征提取常用方法 1.2.3 特征选择1.2.3.1 特征选择常用方法 2. 结构化数据3. 非结构化数据 1. 特征工程 特征工程师对原始数据进行一系列的工程处理,作为输入供算法和模型使用。 举例:想让机器识别...
- 目录 回顾知识点: 实际场景: 1. 什么是分类的准确率? 2. 如何避免由于样本比例不均衡导致准确率失效? 回顾知识点: 准确率 : Accuracy 精确率 : Precision 召回率 : Recall 均方根误差 : Root Mean Square Error, RMSE 实际场景: 拿到奢侈品用户数据,训练和测试奢侈品用... 目录 回顾知识点: 实际场景: 1. 什么是分类的准确率? 2. 如何避免由于样本比例不均衡导致准确率失效? 回顾知识点: 准确率 : Accuracy 精确率 : Precision 召回率 : Recall 均方根误差 : Root Mean Square Error, RMSE 实际场景: 拿到奢侈品用户数据,训练和测试奢侈品用...
- 集成学习(ensemble learning)可以说是现在非常火爆的机器学习方法了。它本身不是一个单独的机器学习算法,而是通过构建并结合多个机器学习器来完成学习任务。也就是我们常说的“博采众长”。集成学习可以用于分类问题集成,回归问题集成,特征选取集成,异常点检测集成等等,可以说所有的机器学习领域都可以看到集成学习的身影。本文就对集成学习的原理做一个总结。 1. 集成学习概... 集成学习(ensemble learning)可以说是现在非常火爆的机器学习方法了。它本身不是一个单独的机器学习算法,而是通过构建并结合多个机器学习器来完成学习任务。也就是我们常说的“博采众长”。集成学习可以用于分类问题集成,回归问题集成,特征选取集成,异常点检测集成等等,可以说所有的机器学习领域都可以看到集成学习的身影。本文就对集成学习的原理做一个总结。 1. 集成学习概...
上滑加载中
推荐直播
-
华为云码道-玩转OpenClaw,在线养虾2026/03/11 周三 19:00-21:00
刘昱,华为云高级工程师/谈心,华为云技术专家/李海仑,上海圭卓智能科技有限公司CEO
OpenClaw 火爆开发者圈,华为云码道最新推出 Skill ——开发者只需输入一句口令,即可部署一个功能完整的「小龙虾」智能体。直播带你玩转华为云码道,玩转OpenClaw
回顾中 -
华为云码道-AI时代应用开发利器2026/03/18 周三 19:00-20:00
童得力,华为云开发者生态运营总监/姚圣伟,华为云HCDE开发者专家
本次直播由华为专家带你实战应用开发,看华为云码道(CodeArts)代码智能体如何在AI时代让你的创意应用快速落地。更有华为云HCDE开发者专家带你用码道玩转JiuwenClaw,让小艺成为你的AI助理。
回顾中 -
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中
热门标签