- 案例流程 1) 制作词向量,可以使用gensim这个库,也可以直接用现成的 2) 词和ID的映射,常规套路了 3) 构建RNN网络架构 4) 训练我们的模型 5) 试试咋样 导入数据 首先,我们需要去创建词向量。为了简单起见,我们使用训练好的模型来创建。 作为该领域的一个最大玩家,Google 已经帮助我们在大规模数据集上训练出来了 Word2Vec 模型,包... 案例流程 1) 制作词向量,可以使用gensim这个库,也可以直接用现成的 2) 词和ID的映射,常规套路了 3) 构建RNN网络架构 4) 训练我们的模型 5) 试试咋样 导入数据 首先,我们需要去创建词向量。为了简单起见,我们使用训练好的模型来创建。 作为该领域的一个最大玩家,Google 已经帮助我们在大规模数据集上训练出来了 Word2Vec 模型,包...
- VGG16网络是13层卷积层,运算起来非常的忙,如果使用CPU基本跑不了 import keras from keras import layers import numpy as np import os import shutil 12345 还是猫狗数据集,2000张训练集,1000张测试集 base_dir = '../猫狗数据集/cat_dog' tr... VGG16网络是13层卷积层,运算起来非常的忙,如果使用CPU基本跑不了 import keras from keras import layers import numpy as np import os import shutil 12345 还是猫狗数据集,2000张训练集,1000张测试集 base_dir = '../猫狗数据集/cat_dog' tr...
- 参考:https://blog.csdn.net/m0_37870649/article/details/80979783 sklean的线性模型完成kaggle房价预测问题 https://www.kaggle.com/c/house-prices-Advanced-regression-techniques 赛题给我们79个描述房屋的特征,要求我们据此预测房屋的... 参考:https://blog.csdn.net/m0_37870649/article/details/80979783 sklean的线性模型完成kaggle房价预测问题 https://www.kaggle.com/c/house-prices-Advanced-regression-techniques 赛题给我们79个描述房屋的特征,要求我们据此预测房屋的...
- 大家都知道sklearn这玩意,听说过xlearn 吗? xLearn 是一款高性能的,易用的,并且可扩展的机器学习算法库,你可以用它来解决大规模机器学习问题,尤其是大规模稀疏数据机器学习问题。 官方文档 https://xlearn-doc-cn.readthedocs.io/en/latest/python_api/ 在近年来,大规模稀疏数据机器学习算法被广泛... 大家都知道sklearn这玩意,听说过xlearn 吗? xLearn 是一款高性能的,易用的,并且可扩展的机器学习算法库,你可以用它来解决大规模机器学习问题,尤其是大规模稀疏数据机器学习问题。 官方文档 https://xlearn-doc-cn.readthedocs.io/en/latest/python_api/ 在近年来,大规模稀疏数据机器学习算法被广泛...
- 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 使用决策树预测糖尿病 分类任务 数据源: https://www.kaggle.com/uciml/pima-indians-diabetes-database#diabetes.csv 注意: 需要使用如下命令安装额外两... 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 使用决策树预测糖尿病 分类任务 数据源: https://www.kaggle.com/uciml/pima-indians-diabetes-database#diabetes.csv 注意: 需要使用如下命令安装额外两...
- 谱聚类算法 该算法首先根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵,并且计算矩阵的特征值和特征向量 , 然后选择合适 的特征向量聚类不同的数据点。谱聚类算法最初用于计算机视觉 、VLS I 设计等领域, 最近才开始用于机器学习中,并迅速成为国际上机器学习领域的研究热点。 谱聚类算法建立在图论中的谱图理论基础上,其本质是将聚类问题转化为图的最优划分问题,... 谱聚类算法 该算法首先根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵,并且计算矩阵的特征值和特征向量 , 然后选择合适 的特征向量聚类不同的数据点。谱聚类算法最初用于计算机视觉 、VLS I 设计等领域, 最近才开始用于机器学习中,并迅速成为国际上机器学习领域的研究热点。 谱聚类算法建立在图论中的谱图理论基础上,其本质是将聚类问题转化为图的最优划分问题,...
- 使用二分类逻辑回归识别贷款违约风险 为了说明逻辑回归的应用场景,这里引入一个案例,该案例有关银行贷款违约,我们使用二分类逻辑回归来评估信用风险,如果您是银行的贷款人员,那么您希望能够识别那些指示可能违约贷款的人的特征,并使用这些特征来识别不良的贷款。 这里我们使用的数据集假设有850位以往客户的贷款信息,前700个案例是以前给予贷款的客户,这些客户的违约情况是已经知... 使用二分类逻辑回归识别贷款违约风险 为了说明逻辑回归的应用场景,这里引入一个案例,该案例有关银行贷款违约,我们使用二分类逻辑回归来评估信用风险,如果您是银行的贷款人员,那么您希望能够识别那些指示可能违约贷款的人的特征,并使用这些特征来识别不良的贷款。 这里我们使用的数据集假设有850位以往客户的贷款信息,前700个案例是以前给予贷款的客户,这些客户的违约情况是已经知...
- KFold模块 from sklearn.model_selection import KFold 为什么要使用交叉验证?交叉验证的介绍 交叉验证是在机器学习建立模型和验证模型参数时常用的办法。 交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同... KFold模块 from sklearn.model_selection import KFold 为什么要使用交叉验证?交叉验证的介绍 交叉验证是在机器学习建立模型和验证模型参数时常用的办法。 交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同...
- GAN 生成式对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。原始 GAN 理论中,并不要求 G 和 ... GAN 生成式对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。原始 GAN 理论中,并不要求 G 和 ...
- ELI5主要是用于处理文本分类的机器学习的库 MLI5是一个Python库,允许使用统一API可视化地调试各种机器学习模型。 它内置了对多个ML框架的支持,并提供了一种解释黑盒模型的方法。它有助于调试机器学习分类器并解释它们的预测。 scikit-learn。目前,ELI5允许解释scikit-learning线性分类器和回归量的权重和预测,将决策树打印为文本或... ELI5主要是用于处理文本分类的机器学习的库 MLI5是一个Python库,允许使用统一API可视化地调试各种机器学习模型。 它内置了对多个ML框架的支持,并提供了一种解释黑盒模型的方法。它有助于调试机器学习分类器并解释它们的预测。 scikit-learn。目前,ELI5允许解释scikit-learning线性分类器和回归量的权重和预测,将决策树打印为文本或...
- 在决策树中有一个很重要的概念就是深度 没错决策树很容易过拟合 从iris来看下所谓的过拟合 环境 jupyter notebook 导入包 import numpy as np import pandas as pd import matplotlib.pyplot as plt import matplotlib as mpl from sklea... 在决策树中有一个很重要的概念就是深度 没错决策树很容易过拟合 从iris来看下所谓的过拟合 环境 jupyter notebook 导入包 import numpy as np import pandas as pd import matplotlib.pyplot as plt import matplotlib as mpl from sklea...
- 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 这次回归 之前写过关于平安股票的,竟然没想到是同一个案例 平安股票分析 说明下这个模型是没用的 import numpy as np # 数学计算 import pandas as pd # 数据处理, 读取 CSV... 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 这次回归 之前写过关于平安股票的,竟然没想到是同一个案例 平安股票分析 说明下这个模型是没用的 import numpy as np # 数学计算 import pandas as pd # 数据处理, 读取 CSV...
- 一、首推:压缩感知“Hello World”代码初步学习 本文真的对我理解压感起到很大的帮助,特别在OMP(正交匹配追踪重构算法)算法的讲解中,尤为精彩,我从来没有见过哪个博主能如此认真的去一行一行地解释,解读代码,我对此十分感谢。 个人认为,能有超过70%注释的代码才是负责人的代码,当然也是好的代码。本文做到的不仅如此,简直优秀。为此,我一行一行的抄写了里面的代码。 精彩节... 一、首推:压缩感知“Hello World”代码初步学习 本文真的对我理解压感起到很大的帮助,特别在OMP(正交匹配追踪重构算法)算法的讲解中,尤为精彩,我从来没有见过哪个博主能如此认真的去一行一行地解释,解读代码,我对此十分感谢。 个人认为,能有超过70%注释的代码才是负责人的代码,当然也是好的代码。本文做到的不仅如此,简直优秀。为此,我一行一行的抄写了里面的代码。 精彩节...
- 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 往期文章: K-means算法 k - means 是无监督学习的一种,主要用于分类 首先确定K值,就是类别数,我们想把数据分为几类。根据k值随机选取K个点,作为中心点,分别计算其余各个点到这K个点的距离。对于每一个非... 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 往期文章: K-means算法 k - means 是无监督学习的一种,主要用于分类 首先确定K值,就是类别数,我们想把数据分为几类。根据k值随机选取K个点,作为中心点,分别计算其余各个点到这K个点的距离。对于每一个非...
- 朴素贝叶斯分类器的三个流程: 准备阶段: 在这个阶段我们需要确定特征属性,比如对于通过“身高”为高、“体重”为中等、“鞋码”为中等,这些特征 预测性别 问题中,对每个特征属性进行适当划分,然后由人工对一部分数据进行分类,形成训练样本。 训练阶段: 这个阶段就是生成分类器,主要工作是计算每个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率。输入是特... 朴素贝叶斯分类器的三个流程: 准备阶段: 在这个阶段我们需要确定特征属性,比如对于通过“身高”为高、“体重”为中等、“鞋码”为中等,这些特征 预测性别 问题中,对每个特征属性进行适当划分,然后由人工对一部分数据进行分类,形成训练样本。 训练阶段: 这个阶段就是生成分类器,主要工作是计算每个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率。输入是特...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签