- 贝叶斯算法中最重要用的用的最广的是 使用多项式朴素贝叶斯的地方是文本分类,其中特征与待分类文档中的字数或频率有关。 将使用20个新闻组语料库中的稀疏字数功能来将这些短文档分类。 数据集的介绍 使用 sklearn.datasets中的 fetch_20newsgroups 该数据集介绍 20 newsgroups数据集18000篇新闻文章,一共涉及到20种话... 贝叶斯算法中最重要用的用的最广的是 使用多项式朴素贝叶斯的地方是文本分类,其中特征与待分类文档中的字数或频率有关。 将使用20个新闻组语料库中的稀疏字数功能来将这些短文档分类。 数据集的介绍 使用 sklearn.datasets中的 fetch_20newsgroups 该数据集介绍 20 newsgroups数据集18000篇新闻文章,一共涉及到20种话...
- 下面我带大家整理下机器学习的回归算法 基本回归方法(线性、决策树、SVM、KNN)和集成方法(随机森林,Adaboost和GBRT) 下面是源码 import numpy as np import matplotlib.pyplot as plt def get_data(): x1_train = np.linspace(01234 下面我带大家整理下机器学习的回归算法 基本回归方法(线性、决策树、SVM、KNN)和集成方法(随机森林,Adaboost和GBRT) 下面是源码 import numpy as np import matplotlib.pyplot as plt def get_data(): x1_train = np.linspace(01234
- GridSearchCV GridSearchCV的主要参数 GridSearchCV(estimator, param_grid, cv=None, scoring=None) estimator: 代表我们想要采用的分类器,如决策树,随机森林,SVM,kNN,朴素贝叶斯等等 param_grid: 代表我们想要优化的参数和取值,输入的是字典或者列表... GridSearchCV GridSearchCV的主要参数 GridSearchCV(estimator, param_grid, cv=None, scoring=None) estimator: 代表我们想要采用的分类器,如决策树,随机森林,SVM,kNN,朴素贝叶斯等等 param_grid: 代表我们想要优化的参数和取值,输入的是字典或者列表...
- Dropout Dropout 是一类用于神经网络训练或推理的随机化技术,这类技术已经引起了研究者们的广泛兴趣,并且被广泛地应用于神经 网络正则化、模型压缩等任务。 其实很简单,只需要添加Dropout层 model=keras.models.Sequential() model.add(keras.layers.Dense(150, activation="re... Dropout Dropout 是一类用于神经网络训练或推理的随机化技术,这类技术已经引起了研究者们的广泛兴趣,并且被广泛地应用于神经 网络正则化、模型压缩等任务。 其实很简单,只需要添加Dropout层 model=keras.models.Sequential() model.add(keras.layers.Dense(150, activation="re...
- 声明:本文示例来自于GitHub用户vkasojhaa的项目,一切权利归其所有,此处仅是自己学习分享。 实现了基于机器学习的乳腺癌的恶性和良性预测,比较了不同机器学习算法之间的性能。主要目的是评估在每种算法的准确性和效率方面对数据进行分类的正确性。 loss # 损失值:预估值与实际值之间的均方差 optimizer # 优化器 trainer = ... 声明:本文示例来自于GitHub用户vkasojhaa的项目,一切权利归其所有,此处仅是自己学习分享。 实现了基于机器学习的乳腺癌的恶性和良性预测,比较了不同机器学习算法之间的性能。主要目的是评估在每种算法的准确性和效率方面对数据进行分类的正确性。 loss # 损失值:预估值与实际值之间的均方差 optimizer # 优化器 trainer = ...
- 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 对于这个Titanic泰坦尼克号生存绝对有笔记 Seaborn数据可视化 通过Logistic Regression预测Titanic乘客是否能在事故中生还 导入工具库和数据查看缺失数据 2.1. 年龄2.2. 仓位2... 先把来源写上 来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities 对于这个Titanic泰坦尼克号生存绝对有笔记 Seaborn数据可视化 通过Logistic Regression预测Titanic乘客是否能在事故中生还 导入工具库和数据查看缺失数据 2.1. 年龄2.2. 仓位2...
- 来源: https://tensorflow.google.cn/tensorboard TensorBoard是TensorFlow中的又一神器级工具,想用户提供了模型可视化的功能。我们都知道,在构建神经网络模型时,只要模型开始训练,很多细节对外界来说都是不可见的,参数如何变化,准确率怎么样了,loss还在减小吗,这些问题都很难弄明白。但是,TensorB... 来源: https://tensorflow.google.cn/tensorboard TensorBoard是TensorFlow中的又一神器级工具,想用户提供了模型可视化的功能。我们都知道,在构建神经网络模型时,只要模型开始训练,很多细节对外界来说都是不可见的,参数如何变化,准确率怎么样了,loss还在减小吗,这些问题都很难弄明白。但是,TensorB...
- 为什么数据质量控制重要呢? 质量控制是生物分析的基本概念之一,用在保证组学测定的数据的重复性和精确性。由于色谱系统与质谱直接与样品接触, 随着分析样品的增多,色谱柱和质谱会逐步的污染,导致信号的漂移。通过重复使用同一个质控样本来跟踪整个数据采集过程的行为, 已经被大多数的分析化学领域专家推荐和使用。质控样本被用于评估整个质谱数据在采集过程中的信号漂移, 这些... 为什么数据质量控制重要呢? 质量控制是生物分析的基本概念之一,用在保证组学测定的数据的重复性和精确性。由于色谱系统与质谱直接与样品接触, 随着分析样品的增多,色谱柱和质谱会逐步的污染,导致信号的漂移。通过重复使用同一个质控样本来跟踪整个数据采集过程的行为, 已经被大多数的分析化学领域专家推荐和使用。质控样本被用于评估整个质谱数据在采集过程中的信号漂移, 这些...
- 目录 前言 复指数信号与傅里叶分析 LTI系统对复指数信号的响应 连续周期时间信号的傅里叶级数(FS) 离散时间复指数信号的周期性质 离散周期信号的傅里叶级数(DFS) 傅里叶级数与线性时不变系统 滤波器简介 周期方波的傅里叶级数系数 连续时间傅里叶变换(FT) 周期信号的傅里叶变换 几个判断线性时不变系统的精彩例子 连续时间傅里叶变换的共轭与共轭对... 目录 前言 复指数信号与傅里叶分析 LTI系统对复指数信号的响应 连续周期时间信号的傅里叶级数(FS) 离散时间复指数信号的周期性质 离散周期信号的傅里叶级数(DFS) 傅里叶级数与线性时不变系统 滤波器简介 周期方波的傅里叶级数系数 连续时间傅里叶变换(FT) 周期信号的傅里叶变换 几个判断线性时不变系统的精彩例子 连续时间傅里叶变换的共轭与共轭对...
- 数据的预处理 通过特征提取,我们能得到未经处理的特征,这时的特征可能有以下问题: 不属于同一量纲: 即特征的规格不一样,不能够放在一起比较。无量纲化可以解决这一问题。 信息冗余: 对于某些定量特征,其包含的有效信息为区间划分,例如学习成绩,假若只关心“及格”或不“及格”,那么需要将定量的考分,转换成“1”和“0”表示及格和未及格。二值化可以解决这一问题。 定性特... 数据的预处理 通过特征提取,我们能得到未经处理的特征,这时的特征可能有以下问题: 不属于同一量纲: 即特征的规格不一样,不能够放在一起比较。无量纲化可以解决这一问题。 信息冗余: 对于某些定量特征,其包含的有效信息为区间划分,例如学习成绩,假若只关心“及格”或不“及格”,那么需要将定量的考分,转换成“1”和“0”表示及格和未及格。二值化可以解决这一问题。 定性特...
- EM聚类 EM算法也称期望最大化(Expectation-Maximum,简称EM)算法它是一个基础算法,是很多机器学习领域算法的基础,比如隐式马尔科夫算法(HMM), LDA主题模型的变分推断等等。 EM算法解决这个的思路是使用启发式的迭代方法,既然我们无法直接求出模型分布参数,那么我们可以先猜想隐含数据(EM算法的E步),接着基于观察数据和猜测的隐含数据一起来极... EM聚类 EM算法也称期望最大化(Expectation-Maximum,简称EM)算法它是一个基础算法,是很多机器学习领域算法的基础,比如隐式马尔科夫算法(HMM), LDA主题模型的变分推断等等。 EM算法解决这个的思路是使用启发式的迭代方法,既然我们无法直接求出模型分布参数,那么我们可以先猜想隐含数据(EM算法的E步),接着基于观察数据和猜测的隐含数据一起来极...
- 基于RDKit和Python3的化合物溶解度的机器学习模型小案例。 《仅供参考》 # In[1]:导入依赖包 from rdkit import Chem, DataStructsfrom rdkit.Chem import AllChemfrom rdkit.ML.Descriptors import MoleculeDescriptorsfrom rdkit.Chem... 基于RDKit和Python3的化合物溶解度的机器学习模型小案例。 《仅供参考》 # In[1]:导入依赖包 from rdkit import Chem, DataStructsfrom rdkit.Chem import AllChemfrom rdkit.ML.Descriptors import MoleculeDescriptorsfrom rdkit.Chem...
- 分类变量特征提取 分类数据的独热编码方法,分类变量特征提取(One-of-K or One-Hot Encoding): 通过二进制数来表示每个解释变量的特征 from sklearn.feature_extraction import DictVectorizer onhot_encoder = DictVectorizer() instances=[{'city... 分类变量特征提取 分类数据的独热编码方法,分类变量特征提取(One-of-K or One-Hot Encoding): 通过二进制数来表示每个解释变量的特征 from sklearn.feature_extraction import DictVectorizer onhot_encoder = DictVectorizer() instances=[{'city...
- 闲话机器、编程、智能 先上视频短片,主题关于人工智能与机器人学:http://v.youku.com/v_show/id_XMTc2NTUyNzY3Ng 开篇明义: 教育,通过一般或特定的方式,希望将人塑造成机器; 编程,通过一般或特定的代码,最终让机器拥有智能。 ----------------------------------------------- 机器----&g... 闲话机器、编程、智能 先上视频短片,主题关于人工智能与机器人学:http://v.youku.com/v_show/id_XMTc2NTUyNzY3Ng 开篇明义: 教育,通过一般或特定的方式,希望将人塑造成机器; 编程,通过一般或特定的代码,最终让机器拥有智能。 ----------------------------------------------- 机器----&g...
- 摘要 药物研发管线漫长、复杂且取决于许多因素。机器学习(ML)通过丰富且高质量的数据改进指定问题的发现和决策。机器学习在药物发现的所有阶段都有应用:靶标验证、生物标志物的鉴定和临床试验中数字病理学数据的分析。应用程序的范围和方法不同,有些方法可以产生准确的预测和解释。应用机器学习的主要挑战在于ML产生的结果缺乏可解释性和可重复性,可能限制其应用。在所有领域,仍然需要生成系统... 摘要 药物研发管线漫长、复杂且取决于许多因素。机器学习(ML)通过丰富且高质量的数据改进指定问题的发现和决策。机器学习在药物发现的所有阶段都有应用:靶标验证、生物标志物的鉴定和临床试验中数字病理学数据的分析。应用程序的范围和方法不同,有些方法可以产生准确的预测和解释。应用机器学习的主要挑战在于ML产生的结果缺乏可解释性和可重复性,可能限制其应用。在所有领域,仍然需要生成系统...
上滑加载中
推荐直播
-
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中 -
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
热门标签