- 目录 1. 有哪些文本表示模型? 1.1 词袋模型 1.1.1 TF-IDF权重计算 公式: 1.2 主题模型 1.3 词嵌入与深度学习模型 为什么深度学习有用? 1. 有哪些文本表示模型? 词袋模型(Bag of Words)TF-IDF(Term Frequency-Inverse Document Frequency)主题模型(Topic Mo... 目录 1. 有哪些文本表示模型? 1.1 词袋模型 1.1.1 TF-IDF权重计算 公式: 1.2 主题模型 1.3 词嵌入与深度学习模型 为什么深度学习有用? 1. 有哪些文本表示模型? 词袋模型(Bag of Words)TF-IDF(Term Frequency-Inverse Document Frequency)主题模型(Topic Mo...
- 本文是机器学习笔记系列 参考链接:https://vas3k.com/blog/machine_learning/ 机器学习这个主题已经很普遍了,每个人都在谈论它,但很少有人能够透彻地了解它。当前网络上的一些机器学习文章晦涩难懂,理论性太强,或者通篇云里雾里地介绍人工智能、数据科学的魔力以及未来的工作等。 所以呢,本文作者 vas3k 通过简洁的语言和清晰明了... 本文是机器学习笔记系列 参考链接:https://vas3k.com/blog/machine_learning/ 机器学习这个主题已经很普遍了,每个人都在谈论它,但很少有人能够透彻地了解它。当前网络上的一些机器学习文章晦涩难懂,理论性太强,或者通篇云里雾里地介绍人工智能、数据科学的魔力以及未来的工作等。 所以呢,本文作者 vas3k 通过简洁的语言和清晰明了...
- 1 SVM的优点 训练好的模型算法复杂度是由支持向量的个数决定,而不是数据维度决定,所以SVM不太容易过拟合。 SVM训练出来的模型完全依赖于支持向量,即使训练集里面所有非支持点都去除,重复训练过程,结果模型完全一样 一个SVM如果训练得到的支持向量个数少,则模型更容易泛化(比如各有1个点,... 1 SVM的优点 训练好的模型算法复杂度是由支持向量的个数决定,而不是数据维度决定,所以SVM不太容易过拟合。 SVM训练出来的模型完全依赖于支持向量,即使训练集里面所有非支持点都去除,重复训练过程,结果模型完全一样 一个SVM如果训练得到的支持向量个数少,则模型更容易泛化(比如各有1个点,...
- 目录 归纳和演绎 归纳学习分为广义和狭义: 概念学习、概念形成最基本的是布尔概念学习: 解答疑问 归纳和演绎 “归纳”和“演绎”是科学推理的两大基本手段 “归纳”是从特殊到一般,是一个“泛化”过程,是总结经验,比如猫有哪些特点? “演绎” 就是从一般到特殊,从基本情况推出具体情况,是“特化”过程 从“样本”中学习过程 称为“归纳学习” ... 目录 归纳和演绎 归纳学习分为广义和狭义: 概念学习、概念形成最基本的是布尔概念学习: 解答疑问 归纳和演绎 “归纳”和“演绎”是科学推理的两大基本手段 “归纳”是从特殊到一般,是一个“泛化”过程,是总结经验,比如猫有哪些特点? “演绎” 就是从一般到特殊,从基本情况推出具体情况,是“特化”过程 从“样本”中学习过程 称为“归纳学习” ...
- 目录 总述: 1. Word2Vec的两种网络结构 1.1 输入层 1.2 映射层 1.3 输出层 1.4 神经网络的权重 2. Word2Vec与LDA的区别和联系 2.1 主题模型与词嵌入方法 总述: Word2Vec是2013年谷歌提出来目前最为常用的词嵌入模型之一。 Word2Vec是一种浅层的神经网络模型,包含有两种网络结构:CBOW(Co... 目录 总述: 1. Word2Vec的两种网络结构 1.1 输入层 1.2 映射层 1.3 输出层 1.4 神经网络的权重 2. Word2Vec与LDA的区别和联系 2.1 主题模型与词嵌入方法 总述: Word2Vec是2013年谷歌提出来目前最为常用的词嵌入模型之一。 Word2Vec是一种浅层的神经网络模型,包含有两种网络结构:CBOW(Co...
- 由现实世界引出“机器学习” 看到乌云密布,自己推测出要下雨 通过一个苹果的表面和大小,来判断这个苹果是否好吃 我们通过经验来进行判断,这是因为我们积累了许多有用的经验,通过对有用经验的分析,就能对遇到的情况做出相应的对策。 计算机中,经验就是“数据”,判断模型就是“算法”,机器学习就是研究“学习算法”。 举例:当计算机数据库有上千万只猫的照片,并对其特点进行建模分析... 由现实世界引出“机器学习” 看到乌云密布,自己推测出要下雨 通过一个苹果的表面和大小,来判断这个苹果是否好吃 我们通过经验来进行判断,这是因为我们积累了许多有用的经验,通过对有用经验的分析,就能对遇到的情况做出相应的对策。 计算机中,经验就是“数据”,判断模型就是“算法”,机器学习就是研究“学习算法”。 举例:当计算机数据库有上千万只猫的照片,并对其特点进行建模分析...
- 目录 1. 什么是类别型特征? 2. 处理类别型特征的编码方式有哪几种? 2.1 序号编码 2.2 独热编码 2.2.1对于类别取值比较多的情况下,使用独热编码注意以下问题: 2.3 二进制编码 3除了这些编码还有哪些? 1. 什么是类别型特征? 类别型特征(Categorical Feature)主要指的是性别(男、女)、血型(A、B、AB、O)等只... 目录 1. 什么是类别型特征? 2. 处理类别型特征的编码方式有哪几种? 2.1 序号编码 2.2 独热编码 2.2.1对于类别取值比较多的情况下,使用独热编码注意以下问题: 2.3 二进制编码 3除了这些编码还有哪些? 1. 什么是类别型特征? 类别型特征(Categorical Feature)主要指的是性别(男、女)、血型(A、B、AB、O)等只...
- 目录 先来看机器学习: 什么是特征? 深度学习是表示学习的经典代表: 深度学习的过程: 深度学习与传统机器学习差别: 深度学习代表算法: 先来看机器学习: 机器学习是利用经验experience来改善 计算机系统自身的性能,通过经验获取知识knowledge。 以往都是人们向计算机输入知识,现在是通过经验的“特征”数据来产生模型model(传统的机器... 目录 先来看机器学习: 什么是特征? 深度学习是表示学习的经典代表: 深度学习的过程: 深度学习与传统机器学习差别: 深度学习代表算法: 先来看机器学习: 机器学习是利用经验experience来改善 计算机系统自身的性能,通过经验获取知识knowledge。 以往都是人们向计算机输入知识,现在是通过经验的“特征”数据来产生模型model(传统的机器...
- 目录 1 . OTCBVS数据集 Dataset 01: OSU Thermal Pedestrian Database Dataset 02: IRIS Thermal/Visible Face Database Dataset 03: OSU Color-Thermal Database Dataset 04: Terravic Facial IR Databa... 目录 1 . OTCBVS数据集 Dataset 01: OSU Thermal Pedestrian Database Dataset 02: IRIS Thermal/Visible Face Database Dataset 03: OSU Color-Thermal Database Dataset 04: Terravic Facial IR Databa...
- 一般情况将K折交叉验证用于模型调优,找到使得模型泛化性能最优的超参值。找到后,在全部训练集上重新训练模型,并使用独立测试集对模型性能做出最终评价。 K折交叉验证使用了无重复抽样技术的好处:每次迭代过程中每个样本点只有一次被划入训练集或测试集的机会。 K折交叉验证图: 如果训练数据集相对较小,则增大k值。 增大k值,在每次迭代过程中将会有更多的数据用于模型训练,能够... 一般情况将K折交叉验证用于模型调优,找到使得模型泛化性能最优的超参值。找到后,在全部训练集上重新训练模型,并使用独立测试集对模型性能做出最终评价。 K折交叉验证使用了无重复抽样技术的好处:每次迭代过程中每个样本点只有一次被划入训练集或测试集的机会。 K折交叉验证图: 如果训练数据集相对较小,则增大k值。 增大k值,在每次迭代过程中将会有更多的数据用于模型训练,能够...
- 机器学习是人工智能AI研究发展到一定阶段的必然产物! 二十世纪五十年代~七十年代初,“推理期”:机器的只能体现在具有逻辑推理能力。 二十世纪七十年代中期开始,AI进入“知识期”,希望机器能够自己学习! 其实,图灵1950年就曾提到过机器学习的可能 五十年代中后期,基于神经网络的“连接主义”学习开始,比如:感知机 六七十年代,基于逻辑表示的“ ”符号主义学习发展, ... 机器学习是人工智能AI研究发展到一定阶段的必然产物! 二十世纪五十年代~七十年代初,“推理期”:机器的只能体现在具有逻辑推理能力。 二十世纪七十年代中期开始,AI进入“知识期”,希望机器能够自己学习! 其实,图灵1950年就曾提到过机器学习的可能 五十年代中后期,基于神经网络的“连接主义”学习开始,比如:感知机 六七十年代,基于逻辑表示的“ ”符号主义学习发展, ...
- 目录 0. Normalization简单解释 1. 常用的归一化方法 (1)线性函数归一化(Min-Max Scaling) (2)零均值归一化(Z-Score Normalization) 2. 为什么说数据归一化不是万能的?有哪些 适用哪些不适用? 0. Normalization简单解释 为了消除数据特征之间的量纲的影响,所以需要进行归一化的处理,... 目录 0. Normalization简单解释 1. 常用的归一化方法 (1)线性函数归一化(Min-Max Scaling) (2)零均值归一化(Z-Score Normalization) 2. 为什么说数据归一化不是万能的?有哪些 适用哪些不适用? 0. Normalization简单解释 为了消除数据特征之间的量纲的影响,所以需要进行归一化的处理,...
- 目录 1. 实际案例: 2. 回顾基本知识: 精确率Precision 召回率Recall 排序问题中,如何衡量模型性能? 精确率和召回率是既矛盾又统一的两个指标 3. 解答实例问题 如何解决或者权衡? P-R曲线 F1 score 是精确率和召回率的调和平均值 1. 实际案例: 搜索引擎提供模糊搜索功能,搜索排序模型返回的TOP 5 精确率非常... 目录 1. 实际案例: 2. 回顾基本知识: 精确率Precision 召回率Recall 排序问题中,如何衡量模型性能? 精确率和召回率是既矛盾又统一的两个指标 3. 解答实例问题 如何解决或者权衡? P-R曲线 F1 score 是精确率和召回率的调和平均值 1. 实际案例: 搜索引擎提供模糊搜索功能,搜索排序模型返回的TOP 5 精确率非常...
- 机器学习基本概念 1. 特征工程1.1 特征工程的目的1.2 怎么做特征工程?1.2.1 特征构建1.2.2 特征提取1.2.2.1特征提取常用方法 1.2.3 特征选择1.2.3.1 特征选择常用方法 2. 结构化数据3. 非结构化数据 1. 特征工程 特征工程师对原始数据进行一系列的工程处理,作为输入供算法和模型使用。 举例:想让机器识别... 机器学习基本概念 1. 特征工程1.1 特征工程的目的1.2 怎么做特征工程?1.2.1 特征构建1.2.2 特征提取1.2.2.1特征提取常用方法 1.2.3 特征选择1.2.3.1 特征选择常用方法 2. 结构化数据3. 非结构化数据 1. 特征工程 特征工程师对原始数据进行一系列的工程处理,作为输入供算法和模型使用。 举例:想让机器识别...
- 目录 回顾知识点: 实际场景: 1. 什么是分类的准确率? 2. 如何避免由于样本比例不均衡导致准确率失效? 回顾知识点: 准确率 : Accuracy 精确率 : Precision 召回率 : Recall 均方根误差 : Root Mean Square Error, RMSE 实际场景: 拿到奢侈品用户数据,训练和测试奢侈品用... 目录 回顾知识点: 实际场景: 1. 什么是分类的准确率? 2. 如何避免由于样本比例不均衡导致准确率失效? 回顾知识点: 准确率 : Accuracy 精确率 : Precision 召回率 : Recall 均方根误差 : Root Mean Square Error, RMSE 实际场景: 拿到奢侈品用户数据,训练和测试奢侈品用...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签