- 什么是Gensim Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的API接口 补充一些概念: 语料(Corpus):一组原始文本的集合,用于无监督... 什么是Gensim Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的API接口 补充一些概念: 语料(Corpus):一组原始文本的集合,用于无监督...
- 对于任何一个深度学习的框架,都能够训练文本数据,当然NLTK在自然语言处理也占有一定的名声和权重 任何东西都离不开你我 来源 github # 导入torch的模块 import torch import torch.nn as nn from torch.autograd import Variable import torch.optim as optim i... 对于任何一个深度学习的框架,都能够训练文本数据,当然NLTK在自然语言处理也占有一定的名声和权重 任何东西都离不开你我 来源 github # 导入torch的模块 import torch import torch.nn as nn from torch.autograd import Variable import torch.optim as optim i...
- 上篇通过实例了解了过拟合,那如何处理将是本文处理的问题 Dropout抑制过拟合 在每一次训练中,随机丢弃一部分隐藏单元,从而加强另一部分单元的学习 原理 取平均的作用:先回到标准的模型没有dropout,我们会用相同的训练数据去训练5个不同的神经网络,一般会得到5个不同的结果,此时我们可以采用“5个结果取均值”或者“对数取胜的投票策略”去决定最懂结果... 上篇通过实例了解了过拟合,那如何处理将是本文处理的问题 Dropout抑制过拟合 在每一次训练中,随机丢弃一部分隐藏单元,从而加强另一部分单元的学习 原理 取平均的作用:先回到标准的模型没有dropout,我们会用相同的训练数据去训练5个不同的神经网络,一般会得到5个不同的结果,此时我们可以采用“5个结果取均值”或者“对数取胜的投票策略”去决定最懂结果...
- 在讲內积空间之前,先提一下线性空间,这是內积空间的基础,也是我们学习任何一门理科所必备的常识。 线性空间介绍: 向量空间亦称向量空间。它是线性代数的中心内容和基本概念之一。设V是一个非空集合,P是一个域。若: 1.在V中定义了一种运算,称为加法,即对V中任意两个元素α与β都按... 在讲內积空间之前,先提一下线性空间,这是內积空间的基础,也是我们学习任何一门理科所必备的常识。 线性空间介绍: 向量空间亦称向量空间。它是线性代数的中心内容和基本概念之一。设V是一个非空集合,P是一个域。若: 1.在V中定义了一种运算,称为加法,即对V中任意两个元素α与β都按...
- 前些时间,可能是导师随口一提机器学习,再加上室友们都是人工智能学院的学生,对机器学习等耳濡目染。鉴于目前的趋势,人工智能的浪潮来袭,有必要了解乃至认真学习一番,于是就从寻找入门的博客开始学习,机缘巧合,让我遇到了这么一个系列,看了几篇后,受益匪浅,对人工智能竟然有了一丝的想法。 当然收益不仅于此,看到了博主将博客的内容以目录的形式展示出来,这个想法让我也想对自己的博客条理化... 前些时间,可能是导师随口一提机器学习,再加上室友们都是人工智能学院的学生,对机器学习等耳濡目染。鉴于目前的趋势,人工智能的浪潮来袭,有必要了解乃至认真学习一番,于是就从寻找入门的博客开始学习,机缘巧合,让我遇到了这么一个系列,看了几篇后,受益匪浅,对人工智能竟然有了一丝的想法。 当然收益不仅于此,看到了博主将博客的内容以目录的形式展示出来,这个想法让我也想对自己的博客条理化...
- 特征工程 数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上 限而已。根据特征使用方案,有计划地获取、处理和监控数据和特征的工作称之为特征工程,目的是 最大限度地从原始数据中提取特征以供算法和模型使用。 根据特征选择的形式又可以将特征选择方法分为3种: 用sklearn中的feature_selection库来进行特征选择 Filter: 过滤法... 特征工程 数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上 限而已。根据特征使用方案,有计划地获取、处理和监控数据和特征的工作称之为特征工程,目的是 最大限度地从原始数据中提取特征以供算法和模型使用。 根据特征选择的形式又可以将特征选择方法分为3种: 用sklearn中的feature_selection库来进行特征选择 Filter: 过滤法...
- 来源 kaggle Machine Learning Micro-Course Home Page import pandas as pd melbourne_file_path = 'melb_data.csv/melb_data.csv' melbourne_data = pd.read_csv(melbourne_file_path) print(len(... 来源 kaggle Machine Learning Micro-Course Home Page import pandas as pd melbourne_file_path = 'melb_data.csv/melb_data.csv' melbourne_data = pd.read_csv(melbourne_file_path) print(len(...
- 激活函数 PyTorch实现了常见的激活函数,其具体的接口信息可参见官方文档,这些激活函数可作为独立的layer使用。这里将介绍最常用的激活函数ReLU,其数学表达式为: R e L U ( x ) = m a x ( 0 , x ) ReLU(x)=max(0,x) R 激活函数 PyTorch实现了常见的激活函数,其具体的接口信息可参见官方文档,这些激活函数可作为独立的layer使用。这里将介绍最常用的激活函数ReLU,其数学表达式为: R e L U ( x ) = m a x ( 0 , x ) ReLU(x)=max(0,x) R
- 什么是回归分析 回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因... 什么是回归分析 回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因...
- 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 笔者,最近参加的贪心科技的机器学习训练营。。。。。。。。 学习本是一个反复的过程。 竟然要我写笔记交作业,还要写在知乎。。。。。。。。 我知乎没文章啊啊啊啊 我赶紧找下之前写的博文 从简单的一元回归分析入门机器学习 用多元线性回... 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 笔者,最近参加的贪心科技的机器学习训练营。。。。。。。。 学习本是一个反复的过程。 竟然要我写笔记交作业,还要写在知乎。。。。。。。。 我知乎没文章啊啊啊啊 我赶紧找下之前写的博文 从简单的一元回归分析入门机器学习 用多元线性回...
- 分类学习 输入:一组有标签的训练数据(也称观察和评估),标签表明了这些数 据(观察)的所署类别。 输出:分类模型根据这些训练数据,训练自己的模型参数,学习出一个 适合这组数据的分类器,当有新数据(非训练数据)需要进行类别判断,就 可以将这组新数据作为输入送给学好的分类器进行判断。 划分数据集 训练集(training set):顾名思义用来训练模型的已标注数据,... 分类学习 输入:一组有标签的训练数据(也称观察和评估),标签表明了这些数 据(观察)的所署类别。 输出:分类模型根据这些训练数据,训练自己的模型参数,学习出一个 适合这组数据的分类器,当有新数据(非训练数据)需要进行类别判断,就 可以将这组新数据作为输入送给学好的分类器进行判断。 划分数据集 训练集(training set):顾名思义用来训练模型的已标注数据,...
- 学习率是深度学习中的一个重要的超参,如何调整学习率是训练出好模型的关键要素之一。 关于学习率的大小 在训练过程中,一般根据训练轮数设置动态变化的学习率。 刚开始训练时:学习率以 0.01 ~ 0.001 为宜。 一定轮数过后:逐渐减缓。 接近训练结束:学习速率的衰减应该在100倍以上。 两种学习率衰减模式,一种为线性衰减,一种为指数衰减... 学习率是深度学习中的一个重要的超参,如何调整学习率是训练出好模型的关键要素之一。 关于学习率的大小 在训练过程中,一般根据训练轮数设置动态变化的学习率。 刚开始训练时:学习率以 0.01 ~ 0.001 为宜。 一定轮数过后:逐渐减缓。 接近训练结束:学习速率的衰减应该在100倍以上。 两种学习率衰减模式,一种为线性衰减,一种为指数衰减...
- DBSCAN算法是一种基于密度的聚类算法: 聚类的时候不需要预先指定簇的个数 最终的簇的个数不定 DBSCAN算法将数据点分为三类: 核心点:在半径Eps内含有超过MinPts数目的点 边界点:在半径Eps内点的数量小于MinPts,但是落在核心点的邻域内 噪音点:既不是核心点也不是边界点的点 DBSCAN算法流程: 将所有点标记为核心... DBSCAN算法是一种基于密度的聚类算法: 聚类的时候不需要预先指定簇的个数 最终的簇的个数不定 DBSCAN算法将数据点分为三类: 核心点:在半径Eps内含有超过MinPts数目的点 边界点:在半径Eps内点的数量小于MinPts,但是落在核心点的邻域内 噪音点:既不是核心点也不是边界点的点 DBSCAN算法流程: 将所有点标记为核心...
- https://github.com/shunchan0677/Tensorflow_in_ROS Tensorflow_in_ROS 我做了一个ros-node从相机图像预测数字。我使用Tensorflow教程Deep MNIST模型(https://www.tensorflow.org/versions/r0.11/tutorials/mnist/pros/inde... https://github.com/shunchan0677/Tensorflow_in_ROS Tensorflow_in_ROS 我做了一个ros-node从相机图像预测数字。我使用Tensorflow教程Deep MNIST模型(https://www.tensorflow.org/versions/r0.11/tutorials/mnist/pros/inde...
- @Author:Runsen 什么是逻辑回归 回想一下线性回归,它被用于确定一个连续因变量的值。逻辑回归通常用于分类目的。与线性回归不同,因变量只能采用有限数量的值,即因变量是分类的。当可能结果的数量只有两个时,它被称为二元逻辑回归。 从大的类别上来说,逻辑回归是一种有监督的统计学习方法,主要用于对样本进行分类。 逻辑回归与线性回归的关系 逻辑回归也被称为... @Author:Runsen 什么是逻辑回归 回想一下线性回归,它被用于确定一个连续因变量的值。逻辑回归通常用于分类目的。与线性回归不同,因变量只能采用有限数量的值,即因变量是分类的。当可能结果的数量只有两个时,它被称为二元逻辑回归。 从大的类别上来说,逻辑回归是一种有监督的统计学习方法,主要用于对样本进行分类。 逻辑回归与线性回归的关系 逻辑回归也被称为...
上滑加载中
推荐直播
-
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中 -
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
热门标签