数据挖掘_标签_开发者_华为云

博客(1.6k)
视频(0)
论坛(0)
云声(0)
代码示例(0)

数据挖掘十大算法--Apriori算法
一、Apriori 算法概述 Apriori 算法是一种最有影响力的挖掘布尔关联规则的频繁项集的算法，它是由Rakesh Agrawal 和RamakrishnanSkrikant 提出的。它使用一种称作逐层搜索的迭代方法，k- 项集用于探索（k+1）- 项集。首先，找出频繁 1- 项集的集合。该集合记作L1。L1 用于找频繁2- 项...

格图洛书
发表于2021-12-30 22:49:53
2691 0 0

2.6k 0 0

一、Apriori 算法概述 Apriori 算法是一种最有影响力的挖掘布尔关联规则的频繁项集的算法，它是由Rakesh Agrawal 和RamakrishnanSkrikant 提出的。它使用一种称作逐层搜索的迭代方法，k- 项集用于探索（k+1）- 项集。首先，找出频繁 1- 项集的集合。该集合记作L1。L1 用于找频繁2- 项...
数据挖掘
数据挖掘学习笔记之人工神经网络（二）
多层网络和反向传播算法我们知道单个感知器仅能表示线性决策面。然而我们可以将许多的类似感知器的模型按照层次结构连接起来，这样就能表现出非线性决策的边界了，这也叫做多层感知器，重要的是怎么样学习多层感知器，这个问题有两个方面： 1、  要学习网络结构； 2、  要学习连接权值对于一个给定的网络有一个相当简...

格图洛书
发表于2021-12-30 22:47:20
2549 0 0

2.5k 0 0

多层网络和反向传播算法我们知道单个感知器仅能表示线性决策面。然而我们可以将许多的类似感知器的模型按照层次结构连接起来，这样就能表现出非线性决策的边界了，这也叫做多层感知器，重要的是怎么样学习多层感知器，这个问题有两个方面： 1、  要学习网络结构； 2、  要学习连接权值对于一个给定的网络有一个相当简...
数据挖掘神经网络
数据挖掘十大经典算法
                            &...

格图洛书
发表于2021-12-30 22:40:56
2635 0 0

2.6k 0 0

                            &...
数据挖掘
数据挖掘学习笔记--决策树C4.5
在网上和教材上也看了有很多数据挖掘方面的很多知识，自己也学习很多，就准备把自己学习和别人分享的结合去总结下，以备以后自己回头看，看别人总还是比不上自己写点，及时有些不懂或者是没有必要。定义：分类树（决策树）是一种十分常用的分类方法。他是一种监管学习，所谓监管学习说白了很简单，就是给定一堆样本，每个样本都有一组属性和一个类别，这些类别...

格图洛书
发表于2021-12-30 22:05:13
3282 0 0

3.2k 0 0

在网上和教材上也看了有很多数据挖掘方面的很多知识，自己也学习很多，就准备把自己学习和别人分享的结合去总结下，以备以后自己回头看，看别人总还是比不上自己写点，及时有些不懂或者是没有必要。定义：分类树（决策树）是一种十分常用的分类方法。他是一种监管学习，所谓监管学习说白了很简单，就是给定一堆样本，每个样本都有一组属性和一个类别，这些类别...
决策树数据挖掘
基于云计算的海量数据挖掘
一 基于云计算的海量数据挖掘 2008年7 月，《Communications of the ACM》杂志发表了关于云计算的专辑，云计算因其清晰的商业模式而受到广泛关注，并得到工业和学术界的普遍认可。目前工业界推出的云计算平台有Amazon公司的EC2和S3，Google公司的Google Apps Engine, I...

格图洛书
发表于2021-12-30 02:54:11
3359 0 0

3.3k 0 0

一 基于云计算的海量数据挖掘 2008年7 月，《Communications of the ACM》杂志发表了关于云计算的专辑，云计算因其清晰的商业模式而受到广泛关注，并得到工业和学术界的普遍认可。目前工业界推出的云计算平台有Amazon公司的EC2和S3，Google公司的Google Apps Engine, I...
云计算数据挖掘
数据挖掘系列（3）--关联规则评价
前面我们讨论的关联规则都是用支持度和自信度来评价的，如果一个规则的自信度高，我们就说它是一条强规则，但是自信度和支持度有时候并不能度量规则的实际意义和业务关注的兴趣点。一个误导我们的强规则

格图洛书
发表于2021-12-30 02:19:59
2461 0 0

2.4k 0 0

前面我们讨论的关联规则都是用支持度和自信度来评价的，如果一个规则的自信度高，我们就说它是一条强规则，但是自信度和支持度有时候并不能度量规则的实际意义和业务关注的兴趣点。一个误导我们的强规则
数据挖掘
数据挖掘系列（4）使用weka做关联规则挖掘
前面几篇介绍了关联规则的一些基本概念和两个基本算法，但实际在商业应用中，写算法反而比较少，理解数据，把握数据，利用工具才是重要的，前面的基础篇是对算法的理解，这篇将介绍开源利用数据挖掘工具weka进行管理规则挖掘。 w

格图洛书
发表于2021-12-30 02:17:44
2637 0 0

2.6k 0 0

前面几篇介绍了关联规则的一些基本概念和两个基本算法，但实际在商业应用中，写算法反而比较少，理解数据，把握数据，利用工具才是重要的，前面的基础篇是对算法的理解，这篇将介绍开源利用数据挖掘工具weka进行管理规则挖掘。 w
数据挖掘
13-字符串操作--数据分析
字符串操作 In [1]: ...

brucexiaogui
发表于2021-12-30 02:17:34
2374 0 0

2.3k 0 0

字符串操作 In [1]: ...
数据挖掘
数据挖掘之分类
2、分类 1、过分拟合问题：造成原因有：（1）噪声造成的过分拟合（因为它拟合了误标记的训练记录，导致了对检验集中记录的误分类）；（2）根据少量训练记录做出分类决策的模型也容易受过分拟合的影响。（由于训练数据缺乏具有代表性的样本，在没有多少训练记录的情况下，学习算法仍然继续细化模型就会产生这样的模型，当决策树的叶节点没有足够的代表性...

格图洛书
发表于2021-12-30 02:14:53
2763 0 0

2.7k 0 0

2、分类 1、过分拟合问题：造成原因有：（1）噪声造成的过分拟合（因为它拟合了误标记的训练记录，导致了对检验集中记录的误分类）；（2）根据少量训练记录做出分类决策的模型也容易受过分拟合的影响。（由于训练数据缺乏具有代表性的样本，在没有多少训练记录的情况下，学习算法仍然继续细化模型就会产生这样的模型，当决策树的叶节点没有足够的代表性...
数据挖掘机器学习
python-pandas之Series数据分析（四）
python-pandas之Series数据分析（四）   '''Series的定义：Series是一种类似于一维数组的对象，它由一组数据（各种NumPy数据类型）以及一组与之相关的数据标签（即索引）组成。Series对象本质上是一个NumPy的数组，因此NumPy的数组处理函数可以直接对Series进行处理。但是Seri...

brucexiaogui
发表于2021-12-30 01:49:25
2612 0 0

2.6k 0 0

python-pandas之Series数据分析（四）   '''Series的定义：Series是一种类似于一维数组的对象，它由一组数据（各种NumPy数据类型）以及一组与之相关的数据标签（即索引）组成。Series对象本质上是一个NumPy的数组，因此NumPy的数组处理函数可以直接对Series进行处理。但是Seri...
Python 数据挖掘
10-时间操作--数据分析
数据表的时间类型操作 In [59]: ...

brucexiaogui
发表于2021-12-30 01:48:29
2598 0 0

2.5k 0 0

数据表的时间类型操作 In [59]: ...
数据挖掘
2-Pandas索引--数据分析
Pandas索引 import pandas as pddf = pd.read_csv('C:/JupyterWork/data/titanic.csv') :5df['Age'][:5]0 22.01 38.02 26.03 35.04 35.0Name: Age, dtype: float641、指...

brucexiaogui
发表于2021-12-30 01:42:39
2513 0 0

2.5k 0 0

Pandas索引 import pandas as pddf = pd.read_csv('C:/JupyterWork/data/titanic.csv') :5df['Age'][:5]0 22.01 38.02 26.03 35.04 35.0Name: Age, dtype: float641、指...
数据挖掘
日志和告警数据挖掘经验谈
　　最近参与了了一个日志和告警的数据挖掘项目，里面用到的一些思路在这里和大家做一个分享。　　　　项目的需求是收集的客户系统一个月300G左右的的日志和告警数据做一个整理，主要是归类(Grouping)和关联(Correlation)，从而得到告警和日志的一些统计关系，这些统计结果可以给一线支持人员参考。　　　　得到的数据主要分为...

格图洛书
发表于2021-12-30 01:35:20
2765 0 0

2.7k 0 0

　　最近参与了了一个日志和告警的数据挖掘项目，里面用到的一些思路在这里和大家做一个分享。　　　　项目的需求是收集的客户系统一个月300G左右的的日志和告警数据做一个整理，主要是归类(Grouping)和关联(Correlation)，从而得到告警和日志的一些统计关系，这些统计结果可以给一线支持人员参考。　　　　得到的数据主要分为...
数据挖掘
python-Numpy数据分析（一）
python-Numpy数据分析（一）   使用numpy创建数据 import numpy as np print('将普通的一维列表生成Numpy一维数组')data = [1,23,45,5,4]arr = np.array(data)print(arr)print('打印数组元素类型')print(arr.dty...

brucexiaogui
发表于2021-12-30 01:32:46
3260 0 0

3.2k 0 0

python-Numpy数据分析（一）   使用numpy创建数据 import numpy as np print('将普通的一维列表生成Numpy一维数组')data = [1,23,45,5,4]arr = np.array(data)print(arr)print('打印数组元素类型')print(arr.dty...
Numpy Python 容器数据挖掘
11-pandas常用操作--数据分析
pandas常用操作 In [3]: ...

brucexiaogui
发表于2021-12-30 01:30:40
2476 0 0

2.4k 0 0

pandas常用操作 In [3]: ...
数据挖掘

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript