您对华为云开发者网站的整体评价?

非常不满意 非常满意

0

1

2

3

4

5

6

7

8

9

10

*您遇到了哪些问题?(最多选三项)
*您感到满意的原因是?(最多选三项)
*请针对您所遇到的问题给出具体的反馈
200/200
数据集
红酒质量数据集
用于回归或分类建模的简单而干净的练习数据集。
Melody
15个月以前
99KB 1 454 9
  • 许可证类型 ? Open Data Commons
  • 标签
    表格
  • 资产ID 867957d8-2d53-462b-9c46-73928de04696

描述

背景

这两个数据集与葡萄牙“Vinho Verde”葡萄酒的红色和白色品种有关。有关更多详细信息,请参阅参考文献[Cortez et al.,2009]。由于隐私和计算的问题,仅提供物理化学(输入)和感官(输出)变量的数据(例如,没有关于葡萄品种,葡萄酒品牌,葡萄酒销售价格等的数据)。


这个数据集也可以从UCI机器学习存储库https://archive.ics.uci.edu/ml/datasets/wine+quality获得

内容

更多信息请参阅 [Cortez et al., 2009].

输入变量 (基于物理化学的测试):

1 - fixed acidity

2 - volatile acidity

3 - citric acid

4 - residual sugar

5 - chlorides

6 - free sulfur dioxide

7 - total sulfur dioxide

8 - density

9 - pH

10 - sulphates

11 - alcohol

输出变量 (基于感官的数据):

12 - quality (分数从0到10)

提示

一个可能有趣的事情是,除了使用回归建模外,可以将您的因变量(葡萄酒质量)的任意截止值设置为例如7或更高,分类为“好/1”,其余为“不好/0”。

这使您可以在例如决策树算法上练习超参数调整,查看ROC曲线和AUC值。即使不进行任何特征工程或过度拟合,您也应该能够获得0.88的AUC(甚至不使用随机森林算法)。

KNIME 是一个很好的工具(GUI),可以用于此.

1 - 文件读取器(用于csv)到线性相关节点,以及基本EDA的交互式直方图。

2- 文件读取器到“规则引擎节点”,将10分制转换为二元变量(好酒和其他),放入规则引擎的代码类似于这样:

  • qualityquality > 6.5 => “good”
  • TRUE => “bad”

    3- 规则引擎节点输出到列过滤器节点的输入,以过滤您的原始10分特征(这可以防止泄漏)

    4- 列过滤器节点输出到分区节点的输入(您的标准训练/测试集拆分,例如75%/ 25%,选择“随机”或“分层”)

    5- 分区节点训练数据拆分输出到决策树学习器节点的输入

    6- 分区节点测试数据拆分输出到决策树预测器节点的输入

    7- 决策树学习器节点输出到决策树节点输入

    8- 决策树输出到ROC节点的输入…(在这里,您可以根据AUC值评估模型)

使用启发

使用机器学习来确定哪些物理化学特性使葡萄酒“好”!

致谢

这个数据集也可以从UCI机器学习存储库获取:https://archive.ics.uci.edu/ml/datasets/wine+quality

相关出版物

P. Cortez, A. Cerdeira, F. Almeida, T. Matos and J. Reis. Modeling wine preferences by data mining from physicochemical properties.
In Decision Support Systems, Elsevier, 47(4):547-553, 2009.

数据集来源

www.kaggle.com

原作者

UCI MACHINE LEARNING

预览

winequality-red.csv 注:数据预览展示前100条数据,每条数据展示前50列。
fixed acidity
volatile acidity
citric acid
residual sugar
chlorides
free sulfur dioxide
total sulfur dioxide
density
pH
sulphates
alcohol
quality
7.4
0.7
0.0
1.9
0.076
11.0
34.0
0.9978
3.51
0.56
9.4
5
7.8
0.88
0.0
2.6
0.098
25.0
67.0
0.9968
3.2
0.68
9.8
5
7.8
0.76
0.04
2.3
0.092
15.0
54.0
0.997
3.26
0.65
9.8
5
11.2
0.28
0.56
1.9
0.075
17.0
60.0
0.998
3.16
0.58
9.8
6
7.4
0.7
0.0
1.9
0.076
11.0
34.0
0.9978
3.51
0.56
9.4
5
7.4
0.66
0.0
1.8
0.075
13.0
40.0
0.9978
3.51
0.56
9.4
5
7.9
0.6
0.06
1.6
0.069
15.0
59.0
0.9964
3.3
0.46
9.4
5
7.3
0.65
0.0
1.2
0.065
15.0
21.0
0.9946
3.39
0.47
10.0
7
7.8
0.58
0.02
2.0
0.073
9.0
18.0
0.9968
3.36
0.57
9.5
7
7.5
0.5
0.36
6.1
0.071
17.0
102.0
0.9978
3.35
0.8
10.5
5
共 100 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 10
前往

限制

  • 谁可以看 ? 公开

版本

版本号 版本ID 发布时间 发布状态 版本说明
1.0.0 MiGMXb 2023-05-08 12:18 已完成
--

若您怀疑合法知识产权遭受侵犯,可以通过此链接进行投诉与建议。