机器学习_标签_开发者

博客(48.5k)
视频(11)
论坛(5.1k)
云声(0)
代码示例(0)

[分享交流] 机器学习中的线性回归

机器学习中的线性回归简介线性回归是机器学习领域中最简单而有效的模型之一。它用于建立自变量（输入）和因变量（输出）之间的线性关系。在实际应用中，线性回归广泛用于预测、分析和建模。让我们深入了解线性回归的基本原理和应用。基本原理线性回归基于假设，即自变量和因变量之间存在线性关系。这种关系通常可以表示为一条直线的方程：$$ y = mx + b $$ 其中，(y) 是因变量，(x) 是自变量，(m) 是斜率，(b) 是截距。模型的目标是找到最适合数据的直线，使得预测值与实际值之间的差异最小化。公司应用许多公司在实际业务中使用线性回归来解决各种问题，例如销售预测、市场分析、资源规划等。下面是一些公司应用线性回归的实际场景：1. 零售行业零售公司可以使用线性回归来预测产品销售量。通过分析历史销售数据，他们可以建立一个模型，考虑因素如季节性、促销活动和市场趋势，以便更好地管理库存和优化供应链。2. 金融领域金融公司可能使用线性回归来评估贷款申请的信用风险。通过分析借款人的信用历史、收入和其他因素，他们可以预测违约的概率，从而更明智地决定是否批准贷款。3. 医疗保健医疗机构可以利用线性回归来预测患者的住院时间或治疗成本。通过考虑患者的健康状况、疾病历史和其他变量，他们可以制定更有效的治疗计划和资源分配。Python 代码演示下面是一个使用 Python 进行线性回归的简单示例。我们将使用 scikit-learn 库，这是一个强大的机器学习库。# 导入必要的库 import numpy as np from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression import matplotlib.pyplot as plt # 生成一些示例数据 np.random.seed(42) X = 2 * np.random.rand(100, 1) y = 4 + 3 * X + np.random.randn(100, 1) # 将数据拆分为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 创建并拟合线性回归模型 model = LinearRegression() model.fit(X_train, y_train) # 打印模型的系数和截距 print("Coefficient:", model.coef_) print("Intercept:", model.intercept_) # 在测试集上进行预测 y_pred = model.predict(X_test) # 绘制原始数据和回归线 plt.scatter(X_test, y_test, color='black') plt.plot(X_test, y_pred, color='blue', linewidth=3) plt.xlabel('X') plt.ylabel('y') plt.title('Linear Regression Example') plt.show()以上代码演示了如何创建一个简单的线性回归模型，将数据拆分为训练集和测试集，并绘制原始数据及拟合的回归线。进阶主题1. 多变量线性回归前面的例子是单变量线性回归，但线性回归也适用于多个自变量的情况。多变量线性回归的方程可以表示为： $$ y = b_0 + b_1 \cdot x_1 + b_2 \cdot x_2 + \ldots + b_n \cdot x_n $$ 其中， $$ x_1, x_2, \ldots, x_n $$ 是多个自变量， $$ b_0, b_1, b_2, \ldots, b_n $$ 是模型的系数。这样的模型可用于更复杂的现实场景。2. 正则化为了防止过拟合，线性回归模型通常会使用正则化。L1 正则化和 L2 正则化是两种常见的方法。它们通过在成本函数中引入正则化项，惩罚系数过大的模型，从而提高模型的泛化能力。# 使用 L2 正则化的线性回归 from sklearn.linear_model import Ridge ridge_model = Ridge(alpha=1.0) # alpha 是正则化强度 ridge_model.fit(X_train, y_train)3. 多项式回归在某些情况下，数据可能不是线性的，这时可以使用多项式回归。它通过引入自变量的高次项来拟合曲线关系。from sklearn.preprocessing import PolynomialFeatures # 将特征转换为多项式特征 poly_features = PolynomialFeatures(degree=2, include_bias=False) X_poly = poly_features.fit_transform(X) # 然后使用线性回归拟合多项式特征 poly_model = LinearRegression() poly_model.fit(X_poly, y)更多实际应用1. 房价预测房地产公司可以使用线性回归来预测房屋价格。模型可以考虑诸如房屋大小、地理位置、周围设施等因素。2. 股票价格预测金融公司可能使用线性回归来分析股票价格的趋势。考虑因素如市场指数、公司业绩等，可以帮助他们制定投资策略。3. 营销效果分析营销团队可以使用线性回归来分析广告投放对销售的影响。这有助于优化广告预算和选择最有效的营销渠道。模型评估与调优1. 模型评估指标在使用线性回归模型时，了解模型的性能是至关重要的。一些常用的模型评估指标包括：均方误差（Mean Squared Error, MSE）：衡量模型预测值与实际值之间的平方差的平均值。from sklearn.metrics import mean_squared_error mse = mean_squared_error(y_test, y_pred) print("Mean Squared Error:", mse)R平方（R-squared）：衡量模型解释因变量变化的比例，取值范围在0到1之间。from sklearn.metrics import r2_score r2 = r2_score(y_test, y_pred) print("R-squared:", r2)2. 模型调优为了提高模型性能，可能需要进行一些调优步骤：特征工程：选择合适的特征对模型性能至关重要。可以通过特征选择或创建新的特征来改进模型。# 示例：使用 SelectKBest 进行特征选择 from sklearn.feature_selection import SelectKBest, f_regression selector = SelectKBest(score_func=f_regression, k=2) X_new = selector.fit_transform(X, y)超参数调优：调整模型的超参数，如正则化强度、多项式次数等，以获得更好的性能。# 示例：使用网格搜索调整超参数 from sklearn.model_selection import GridSearchCV param_grid = {'alpha': [0.1, 1.0, 10.0]} grid_search = GridSearchCV(Ridge(), param_grid, cv=5) grid_search.fit(X_train, y_train) best_alpha = grid_search.best_params_['alpha']如果大家觉得有用的话，可以关注我下面的微信公众号，极客李华，我会在里面更新更多行业资讯和企业面试内容，让大家更好学习编程，我的抖音，B站也是极客李华。

极客李华 发表于2024-01-31 10:49:10 2024-01-31 10:49:10 最后回复极客李华 0
11 0

机器学习
[问题求助] 摄像头视觉场景物品存在报警识别功能需求

功能需求场景：传送货梯，人不能进入，只有货品进入，做到货品在货梯空间存在5分钟发出报警功能。

冬虫 发表于2023-12-08 10:09:58 2023-12-08 10:09:58 最后回复冬虫 2023-12-08 14:52:56
58 3

图像识别机器学习
[技术干货] 基于MindSpore的监督学习实验

目的与要求实验目的：了解逻辑回归的基本概念了解如何使用 MindSpore 进行逻辑回归实验实验要求：使用 MindSpore 实现了逻辑回归，生成可以区分2类鸢尾花的逻辑回归模型。内容与设计思想1、实验内容：逻辑回归是机器学习中的一种经典算法，它是广义线性回归的一种形式，与线性回归有明显的不同。逻辑回归的主要特点包括：自变量分布不受限制：逻辑回归不要求自变量（特征）的分布遵循特定的概率分布，因此可以应用于各种类型的特征数据。因变量是离散型变量：逻辑回归用于处理离散型的因变量，通常是二分类问题（例如，是/否、1/0），但也可以扩展到多分类问题。分析概率关系：逻辑回归分析的是因变量取某个值的概率与自变量之间的关系。它估计了某个事件发生的概率，而不是直接估计事件的值。具体到这个实验中，使用MindSpore进行逻辑回归，目标是在一个二分类数据集上分析自变量（特征）与因变量（概率）之间的关系。2、设计思想：数据准备à数据读取预处理à模型建立与训练à模型评估使用环境MindSpore 1.3华为云ModelArts：ModelArts 是华为云提供的面向开发者的一站式 AI 开发平台，集成了昇腾 AI 处理器资源池，用户可以在该平台下体验 MindSpore。主要实验内容和结果展示ModelArts开发环境搭建在华为云主页搜索 Modelarts，点击“AI 开发平台 ModelArts”中的“进入控制台”选择“北京四”地区，在左侧下拉框中点击“开发环境”中的“Notebook”，点击创建按钮来创建一个新的 Notebook，选择如下配置：名称：MachineLearning工作环境：Ascend+ARM 算法开发和训练基础镜像。存储配置：默认存储。点击“下一步”，确认规格如下后选择提交：当 Notebook 状态变为“运行中”时，点击右侧“打开”按钮打开 Notebook。打开后选择右侧“MindSpore-python3.7-aarch64”按钮，进入 Notebook 环境：数据准备Iris 数据集是模式识别最著名的数据集之一。数据集包含 3 类，每类 50 个实例，其中每个类都涉及一种鸢尾植物。第一类与后两类可线性分离，后两类之间不能线性分离，所以本实验取前两类数据，做一个 2 分类数据集。2.1下载数据我们从Iris数据集官网下载[iris.data 文件](cid:link_0)2.2上传数据到实验环境在新建的 notebook 实验环境中，通过如图所示的“上传”按钮，然后选择自己本地已下载好的数据文件“iris.data”，将数据文件上传到实验环境中。3、导入 MindSpore 模块和辅助模块读取 Iris 数据集，并查看部分数据输出：4、抽取样本取前两类样本（共 100 条），将数据集的 4 个属性作为自变量 X。将数据集的 2 个类别映射为{0, 1}，作为因变量 Y。 4、样本可视化取样本的前两个属性进行 2 维可视化，可以看到在前两个属性上两类样本是线性可分的。输出：5、分割数据集将数据集按 8:2 划分为训练集和验证集：6、数据类型转换使用 MindSpore 的 GeneratorDataset 接口将 numpy.ndarray 类型的数据转换为 Dataset：7、模型创建与训练可视化逻辑回归函数逻辑回归常用的联系函数是 Sigmoid（S 形函数），Sigmoid 函数如下图所示，可以将连续值映射到{0, 1}，同时也是单调可微的。输出：7、建模使用 MindSpore 提供的 nn.Dense(4, 1)算子（https://www.mindspore.cn/api/zh-CN/0.2.0-alpha/api/python/mindspore/mindspore.nn.html#mindspore.nn.Dense)作为线性部分，其中(4, 1)表示每个样本的输入是含 4 个元素的向量，输出是含 1 个元素的向量，即 W 是 1x4的矩阵。算子会随机初始化权重 W 和偏置 b。使用 SigmoidCrossEntropyWithLogits 算子(https://www.mindspore.cn/api/zh-CN/0.3.0-alpha/api/python/mindspore/mindspore.ops.operations.html?#mindspore.ops.operations.S igmoidCrossEntropyWithLogits)作为非线性部分：对于每个样本 N_i，模型的计算方式如下： 8、模型训练使用 2 分类的 Iris 数据集对模型进行几代（Epoch）训练：输出：9、模型评估然后计算模型在测试集上精度，测试集上的准确率达到了 1.0 左右，即逻辑回归模型学会了区分 2 类鸢尾花。输出：五、实验总结本实验使用 MindSpore 实现了逻辑回归，用来解决 2 分类问题。在 Iris 数据集上进行训练后，所得的模型可以很好的表示每个样本类别 y 和属性 x 的关系。通过这个实验，我收获了处理二分类问题的基础知识，了解了如何评估模型性能，并学习了如何使用MindSpore框架实现机器学习模型。这些技能对于解决各种分类问题和将来进一步深入学习机器学习有重要意义。六、创新设计要实现多分类，导入数据等部分与2分类一致，输出标签需要独热编码，创建Softmax回归模型，python代码如下：import csvimport numpy as npimport mindspore as msfrom mindspore import nnfrom mindspore import contextfrom mindspore import datasetfrom mindspore.train.callback import LossMonitorfrom mindspore.common.api import ms_functionfrom mindspore.ops import operations as Pfrom sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_split# 设置计算设备context.set_context(mode=context.GRAPH_MODE, device_target="Ascend")# 加载Iris数据集iris = load_iris()X, y = iris.data, iris.target# 创建标签映射label_map = {0: 'Iris-setosa', 1: 'Iris-versicolor', 2: 'Iris-virginica'}# 划分数据集X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 定义Softmax回归模型class SoftmaxRegression(nn.Cell): def __init__(self, num_features, num_classes): super(SoftmaxRegression, self).__init__() self.fc = nn.Dense(num_features, num_classes) def construct(self, x): return self.fc(x)# 创建模型num_features = X_train.shape[1]num_classes = len(np.unique(y))model = SoftmaxRegression(num_features, num_classes)# 损失函数loss_fn = nn.SoftmaxCrossEntropyWithLogits(sparse=True)# 优化器optimizer = nn.SGD(params=model.trainable_params(), learning_rate=0.01)# 数据处理XY_train = list(zip(X_train, y_train))ds_train = dataset.GeneratorDataset(XY_train, ['x', 'y'])ds_train = ds_train.shuffle(buffer_size=len(X_train)).batch(32, drop_remainder=True)# 自定义训练循环def train_model(model, loss_fn, optimizer, num_epochs, ds_train): for epoch in range(num_epochs): total_loss = 0 for data in ds_train.create_dict_iterator(num_epochs=1): x = ms.Tensor(data['x'], ms.float32) y = ms.Tensor(data['y'], ms.int32) with ms_function(): output = model(x) loss = loss_fn(output, y) grads = P.GradOperation(get_by_list=True)(loss, model.trainable_params()) total_loss += loss.asnumpy() optimizer(grads) print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {total_loss / len(ds_train)}')# 训练模型train_model(model, loss_fn, optimizer, num_epochs=50, ds_train)# 评估模型def evaluate_model(model, X_test, y_test): x = ms.Tensor(X_test, ms.float32) y = ms.Tensor(y_test, ms.int32) output = model(x) predicted = np.argmax(output.asnumpy(), axis=1) accuracy = np.mean(predicted == y.asnumpy()) return accuracyaccuracy = evaluate_model(model, X_test, y_test)print(f'Test accuracy is {accuracy * 100:.2f}%')

yd_295233300 发表于2023-12-07 23:25:35 2023-12-07 23:25:35 最后回复林欣 2023-12-11 09:10:32
64 1

机器学习 MindSpore
[技术干货] Minst T分类实验

目的与要求实验目的：学习 PyTorch 基础: 通过实现一个简单的卷积神经网络，学习如何使用PyTorch 构建深度学习模型。熟悉卷积神经网络结构: 了解卷积层、池化层、全连接层等卷积神经网络的基本组件，以及它们在图像分类任务中的作用。实践深度学习训练循环: 通过编写训练和测试循环，理解深度学习模型的训练过程，包括前向传播、反向传播、损失计算等步骤。掌握 PyTorch 工具: 学会使用 PyTorch 提供的工具和模块，例如优化器（Optimizer）和学习率调度器（Learning Rate Scheduler）。实验结果分析: 通过测试模型并分析测试结果，评估模型在手写数字识别任务上的性能。2、实验要求：使用 PyTorch 实现一个卷积神经网络（CNN），并使用 MNIST 数据集进行训练和测试，从而实现手写数字识别实验原理1、卷积神经网络 (CNN):一类专门设计用于处理网格状数据（如图像）的深度学习模型。它包含卷积层、池化层和全连接层。卷积层能够有效地提取图像中的特征，而池化层则用于降采样，减小计算量。这有助于CNN学习图像中的局部模式和整体结构。2、MNIST 数据集:包含手写数字图像，每个图像都是28x28像素的灰度图。它是一个常用的基准数据集，用于测试图像分类算法的性能。每个图像都带有相应的标签，表示图像中的数字。3、激活函数 (Activation Function): 在神经网络中，激活函数引入非线性性质，允许网络学习复杂的映射关系。在本实验中，Rectified Linear Unit（ReLU）是主要的激活函数，用于在卷积层和全连接层之间引入非线性。4、损失函数 (Loss Function): 用于度量模型输出与真实标签之间的差异。5、优化器 (Optimizer): 用于更新模型参数以最小化损失。6、学习率调度器 (Learning Rate Scheduler): 用于动态调整学习率，帮助模型更好地收敛。7、训练循环: 包括前向传播、反向传播和参数更新。在训练期间，模型通过多次迭代学习如何准确地预测手写数字的标签。8、测试循环: 在训练结束后，模型通过测试集进行评估。测试集上的性能指标，如损失和准确率，可用于评估模型的泛化能力。使用环境PyTorchTorchvisionPyCharm2022.3.2实验过程环境设置：安装PyTorch和torchvision:代码理解:仔细阅读所提供的Python代码，了解代码的结构每个模块和函数的作用。下载Minst数据集：模型定义:查看Net类，了解卷积神经网络的结构，包括卷积层、池化层、全连接层等，补充forward函数。训练参数设置:阅读代码中的参数设置，包括批量大小、学习率、训练轮数等。训练循环:调用train函数执行训练循环，该函数包括多个训练周期，每个周期包括多个批次。在每个批次中，进行前向传播、损失计算、反向传播和参数更新。测试模型:调用test函数对训练后的模型在测试集上进行评估。该函数计算模型在测试集上的损失和准确率。调整训练参数，包括批量大小、学习率、训练轮数，观察训练过程中的训练损失和测试准确率等输出，评估模型的性能。五、实验结果及分析 batch_size=64，epochs=1，学习率=1时（即默认值），训练结果为：batch_size=32，epochs=1，学习率=1时，训练结果为：batch_size=128，epochs=1，学习率=1时，训练结果为：这表明对于更大或者更小的批量，模型的准确率会有所下降。batch_size=64，epochs=5，学习率=1时，训练结果为：可以发现损失轮数增加，训练时长增加，但准确率与平均损失会减少，模型更准确。batch_size=64，epochs=1，学习率=0.8时，训练结果为：可以发现，较小的学习率可能需要更多的训练时间，但可能导致更稳定的收敛。六、附录未修改 batch_size和learning_rate的代码：from __future__ import print_functionimport argparseimport torchimport torch.nn as nnimport torch.nn.functional as Fimport torch.optim as optimfrom torchvision import datasets, transformsfrom torch.optim.lr_scheduler import StepLR# 定义神经网络模型class Net(nn.Module): def __init__(self): super(Net, self).__init__() # 卷积层 self.conv1 = nn.Conv2d(1, 32, 3, 1) self.conv2 = nn.Conv2d(32, 64, 3, 1) # 丢弃层 self.dropout1 = nn.Dropout(0.25) self.dropout2 = nn.Dropout(0.5) # 全连接层 self.fc1 = nn.Linear(9216, 128) self.fc2 = nn.Linear(128, 10) def forward(self, x): # 卷积和激活层 x = self.conv1(x) x = F.relu(x) x = self.conv2(x) x = F.relu(x) # 最大池化层 x = F.max_pool2d(x, 2) x = self.dropout1(x) # 展平数据以供全连接层使用 x = torch.flatten(x, 1) # 全连接层，包括激活和丢弃 x = self.fc1(x) x = F.relu(x) x = self.dropout2(x) x = self.fc2(x) # 输出层使用对数softmax激活 output = F.log_softmax(x, dim=1) return output# 训练模型的函数def train(args, model, device, train_loader, optimizer, epoch): model.train() for batch_idx, (data, target) in enumerate(train_loader): data, target = data.to(device), target.to(device) optimizer.zero_grad() output = model(data) # 负对数似然损失 loss = F.nll_loss(output, target) loss.backward() optimizer.step() if batch_idx % args.log_interval == 0: print('训练 Epoch: {} [{}/{} ({:.0f}%)]\t损失: {:.6f}'.format( epoch, batch_idx * len(data), len(train_loader.dataset), 100. * batch_idx / len(train_loader), loss.item())) if args.dry_run: break# 测试模型的函数def test(model, device, test_loader): model.eval() test_loss = 0 correct = 0 with torch.no_grad(): for data, target in test_loader: data, target = data.to(device), target.to(device)

yd_295233300 发表于2023-12-07 22:50:57 2023-12-07 22:50:57 最后回复黄生 2024-01-02 08:25:15
39 1

AI开发平台ModelArts Python 机器学习 MindSpore
[课程学习] K-means鸢尾花聚类实验

目的与要求实验目的：学习 PyTorch 基础: 通过实现一个简单的卷积神经网络，学习如何使用PyTorch 构建深度学习模型。熟悉卷积神经网络结构: 了解卷积层、池化层、全连接层等卷积神经网络的基本组件，以及它们在图像分类任务中的作用。实践深度学习训练循环: 通过编写训练和测试循环，理解深度学习模型的训练过程，包括前向传播、反向传播、损失计算等步骤。掌握 PyTorch 工具: 学会使用 PyTorch 提供的工具和模块，例如优化器（Optimizer）和学习率调度器（Learning Rate Scheduler）。实验结果分析: 通过测试模型并分析测试结果，评估模型在手写数字识别任务上的性能。2、实验要求：使用 PyTorch 实现一个卷积神经网络（CNN），并使用 MNIST 数据集进行训练和测试，从而实现手写数字识别实验原理1、卷积神经网络 (CNN):一类专门设计用于处理网格状数据（如图像）的深度学习模型。它包含卷积层、池化层和全连接层。卷积层能够有效地提取图像中的特征，而池化层则用于降采样，减小计算量。这有助于CNN学习图像中的局部模式和整体结构。2、MNIST 数据集:包含手写数字图像，每个图像都是28x28像素的灰度图。它是一个常用的基准数据集，用于测试图像分类算法的性能。每个图像都带有相应的标签，表示图像中的数字。3、激活函数 (Activation Function): 在神经网络中，激活函数引入非线性性质，允许网络学习复杂的映射关系。在本实验中，Rectified Linear Unit（ReLU）是主要的激活函数，用于在卷积层和全连接层之间引入非线性。4、损失函数 (Loss Function): 用于度量模型输出与真实标签之间的差异。5、优化器 (Optimizer): 用于更新模型参数以最小化损失。6、学习率调度器 (Learning Rate Scheduler): 用于动态调整学习率，帮助模型更好地收敛。7、训练循环: 包括前向传播、反向传播和参数更新。在训练期间，模型通过多次迭代学习如何准确地预测手写数字的标签。8、测试循环: 在训练结束后，模型通过测试集进行评估。测试集上的性能指标，如损失和准确率，可用于评估模型的泛化能力。使用环境PyTorchTorchvisionPyCharm2022.3.2四、实验结果及分析 Test set: Average Loss :0.0473 Accuracy :9851/10000 99%五、附录未修改 batch_size和learning_rate的代码：from __future__ import print_functionimport argparseimport torchimport torch.nn as nnimport torch.nn.functional as Fimport torch.optim as optimfrom torchvision import datasets, transformsfrom torch.optim.lr_scheduler import StepLR# 定义神经网络模型class Net(nn.Module): def __init__(self): super(Net, self).__init__() # 卷积层 self.conv1 = nn.Conv2d(1, 32, 3, 1) self.conv2 = nn.Conv2d(32, 64, 3, 1) # 丢弃层 self.dropout1 = nn.Dropout(0.25) self.dropout2 = nn.Dropout(0.5) # 全连接层 self.fc1 = nn.Linear(9216, 128) self.fc2 = nn.Linear(128, 10) def forward(self, x): # 卷积和激活层 x = self.conv1(x) x = F.relu(x) x = self.conv2(x) x = F.relu(x) # 最大池化层 x = F.max_pool2d(x, 2) x = self.dropout1(x) # 展平数据以供全连接层使用 x = torch.flatten(x, 1) # 全连接层，包括激活和丢弃 x = self.fc1(x) x = F.relu(x) x = self.dropout2(x) x = self.fc2(x) # 输出层使用对数softmax激活 output = F.log_softmax(x, dim=1) return output# 训练模型的函数def train(args, model, device, train_loader, optimizer, epoch): model.train() for batch_idx, (data, target) in enumerate(train_loader): data, target = data.to(device), target.to(device) optimizer.zero_grad() output = model(data) # 负对数似然损失 loss = F.nll_loss(output, target) loss.backward() optimizer.step() if batch_idx % args.log_interval == 0: print('训练 Epoch: {} [{}/{} ({:.0f}%)]\t损失: {:.6f}'.format( epoch, batch_idx * len(data), len(train_loader.dataset), 100. * batch_idx / len(train_loader), loss.item())) if args.dry_run: break# 测试模型的函数def test(model, device, test_loader): model.eval() test_loss = 0 correct = 0 with torch.no_grad(): for data, target in test_loader: data, target = data.to(device), target.to(device)

yd_295233300 发表于2023-12-07 12:09:49 2023-12-07 12:09:49 最后回复 yd_295233300 0
65 0

AI开发平台ModelArts 卷积神经网络 cnn 机器学习 MindSpore
[技术干货] 监督学习 & 无监督学习

定义监督学习和无监督学习是机器学习的两种主要方法。监督学习：这种方法需要带有标签的训练数据，通常由人工标注或专家知识提供。训练数据由输入物件（通常是向量）和预期输出组成，例如分类标签或连续值。在监督学习中，模型通过学习输入数据与输出数据之间的对应关系，生成一个函数，将输入映射到合适的输出，例如分类。无监督学习：无监督学习不需要标签，因此可以利用更丰富的未标记数据。在无监督学习中，训练数据只包含输入样本，没有相应的标签或预期输出。无监督学习的目标是从数据中推断出隐藏的结构、关系或规律，例如聚类、降维和关联规则挖掘等。区别监督学习监督学习的优点在于其精准性。由于监督学习利用了带有标签的训练数据，通过训练模型来预测输出结果，因此可以获得相对准确的预测结果。此外，在某些特定领域，如医学图像处理或金融市场预测等，监督学习可以利用专家知识或历史数据进行训练，从而获得更准确的预测结果。然而，监督学习的缺点在于其数据获取和标注的成本较高。在很多应用场景中，获取带有标签的数据需要大量的人力物力投入，特别是在数据量庞大或标注数据要求较高的场景中，监督学习的成本会更高。无监督学习无监督学习的优点在于其利用未标记的数据进行训练，从而避免了监督学习中的数据获取和标注成本。无监督学习通过对数据进行挖掘和分析，发现数据中的内在结构和规律，从而进行聚类、降维和关联规则挖掘等任务。在某些特定领域，如社交网络分析或市场调研中，无监督学习可以充分利用未标记的数据，获取更丰富的信息和洞察。然而，无监督学习的缺点在于其结果的解释性相对较弱。由于无监督学习没有利用带有标签的数据进行训练，因此其结果的解释性通常不如监督学习强。此外，在某些应用场景中，无监督学习可能需要更多的计算资源和时间来进行模型训练和优化。准确率监督学习和无监督学习各有其准确率优势。监督学习的准确率相对较高。这是因为监督学习利用了带有标签的训练数据进行训练，可以通过比较实际输出和预期输出之间的误差来优化模型。此外，监督学习通常采用诸如回归、分类、聚类等算法，这些算法经过优化和调整，可以获得相对准确的预测结果。然而，监督学习的准确率也取决于多种因素，如数据的质量和数量、模型的复杂度和训练的充分性等。如果训练数据不充分或存在噪声，或者模型过于复杂，那么监督学习的准确率可能会下降。无监督学习的准确率通常比监督学习低。这是因为无监督学习没有利用带有标签的数据进行训练，而是通过挖掘和分析未标记的数据来发现数据中的内在结构和规律。无监督学习通常采用诸如聚类、降维等算法，这些算法的目的是从数据中提取有用的信息和洞见，而不是直接预测结果。然而，无监督学习也有其独特的优势。例如，在某些情况下，无监督学习可以利用未标记的数据进行训练，从而避免监督学习中数据获取和标注的成本。此外，无监督学习可以发现数据中的隐藏结构和模式，从而提供对数据更深入的理解和洞见。因此，无法简单地判断哪种学习的准确率更高，而是需要根据具体的应用场景和需求来选择合适的学习方法。在某些场景中，如预测股票价格或疾病诊断等需要相对准确的结果时，监督学习可能更合适。而在另一些场景中，如社交网络分析或市场调研中，无监督学习可以提供更丰富的信息和洞见。成本由于监督学习需要人工获取标注，因此成本肯定是大大高于无监督学习

林欣 发表于2023-11-29 19:46:20 2023-11-29 19:46:20 最后回复浩泽学编程 2024-01-15 16:28:17
67 5

机器学习
[公告] 华为云实时智能风控RTD简介

1 背景1.1 风控概念互联网诞生以来，互联互通的信息浪潮，压缩了传输的空间和时间，打破了以往阻绝流动的藩篱，人们的生活得到了极大的便利。尤其是在移动互联网的背景下，没有绝对的隐私，没有绝对的安全，风险无所不在。风控技术是保证机构和个人利益重要手段。风控（Risk Control）是指在金融、营销、互联网等领域中，通过识别、评估和管理风险，采取相应的措施来控制和降低风险的过程。 1.2 传统风控技术挑战随着黑灰色产业链产业化，精准化，移动化，技术化，风控技术面临巨大挑战。传统风控系统数据维度单一，多维度多场景难以协同，很难应对团伙欺诈等新变化。事中缺乏对复杂、高并发场景的实时计算能力，既要实现笔笔风控检测又要保障用户体验的双目标难以满足。另外欺诈模式隐蔽化，场景化，社工化演变，经验规则无法应对多变场景，自动化水平低。 1.3 实时智能风控的价值实时智能风控是一种利用人工智能（AI）技术对风险识别和管理的方法。它通过自研算法模型对大数据分析、机器学习等技术进行融合，提供实时、准确和全面的风险识别和管理，以保护组织免受潜在的威胁和损失。它可以应用于不同领域，如金融服务、电子商务、保险、网络安全等。2 华为云实时智能风控RTD关键能力2.1 变量和规则计算变量和规则是RTD系统核心概念。变量是规则的输入，在规则执行前会进行一系列的计算。根据变量的特征可以分为事件变量，批次变量，实时查询变量，模型变量和窗口变量等。变量和规则具有以下特点：丰富的变量来源，覆盖业务场景广泛。支持黑白名单，满足特殊业务诉求。规则可分组加权计算。支持第三方请求变量，扩展决策流。 2.2 复杂规则实现复杂规则特点：需要保存历史数据，大窗口计算，数据间有相互作用。举例：几天内多笔转账金额上下浮动10%。几天内多笔转帐金额连续递增。传统规则引擎做法：类似drools规则引擎 + mysql或oracle等。缺点：需要java代码+SQL，开发成本高。复杂规则SQL交互多，性能很差；一般都是秒级或者分钟级响应。流处理技术做法：通过流处理计算统计值，加CEP判断，这种一般适合于依赖历史数据少的，基于当前数据的特征或者黑白名单或者有前后顺序的数据处理。缺点：大窗口计算性能差，甚至无法计算。不同的计算逻辑无法共享数据，占用内存资源多。需借助多流Join对多事件源协同处理。最好的实现方法：超高性能的内存计算DB引擎 + 支持事务的PLSQL实现规则。 2.3 多维度协同决策维度是业务管理颗粒度，比如说卡人维度、卡片维度、商户维度等，不同的维度可以定义各自的变量和规则。实时智能风控RTD支持多多维度协同计算，决策准确性更高。多事件源：多事件源共享内存计算引擎，实现数据共享，比如先识别登录才能转账多维度：父子维度多维度同时决策，比如一个帐户在过去3天转帐超过5次，设备使用都是安卓，这次转账使用了非安卓手机，且IP地址不一样。近数据源计算：规则在数据节点执行，近数据计算，实时性高，性能达到极致。 2.4 灰度发布灰度发布（Gray Deployment）是一种软件发布策略，它允许在生产环境中逐步将新版本的软件部署给一部分用户或服务器，以便在全面推广之前进行测试和评估。降低风险：灰度发布可以帮助降低发布新版本时的风险。通过逐步将新版本部署给一小部分用户或服务器，可以在全面推广之前及时发现和解决潜在的问题和错误。这样可以避免出现全面发布后对所有用户造成的严重故障或影响。提供实时反馈：通过将新版本的软件部署给一小部分用户或服务器，可以获得实时的用户反馈。这些反馈可以帮助开发团队及时了解新版本的性能、稳定性和用户体验，并根据反馈进行必要的调整和改进。控制发布节奏：灰度发布允许控制发布的节奏和速度。可以根据实际情况逐步增加新版本的部署比例，确保系统的稳定性和可用性。如果在灰度发布的过程中发现了问题，可以暂停或回滚发布，以避免对所有用户造成不良影响。 2.5 冠军挑战者冠军挑战者（Champion-Challenger）是一种在业务或技术领域中常用的策略，它通过同时运行并比较不同的解决方案或策略，以确定最佳的方案。创新和改进：冠军挑战者方案鼓励创新和改进。通过同时尝试多个解决方案或策略，可以发现新的想法和方法，提高业务或技术的效率和效果。挑战者方案可以激发竞争和创造力，推动组织不断进步和发展。降低风险：冠军挑战者方案可以降低决策的风险。通过同时运行多个方案，可以在实践中评估它们的表现和结果。这样可以避免过度依赖单一方案而导致的潜在风险和失败。如果挑战者方案表现更好，可以及时调整冠军方案，减少潜在的损失。数据驱动决策：冠军挑战者方案基于数据和实证结果进行决策。通过同时运行多个方案并收集相关数据，可以进行客观的比较和评估。这样可以基于实际数据做出决策，而不是仅凭主观判断或假设。 2.6 规则和模型融合机器学习在风控场景使用越来越广泛，它可以帮助机构和组织更好地识别、评估和管理各种风险。欺诈检测：机器学习可以用于欺诈检测，通过分析大量的交易数据和用户行为模式，识别潜在的欺诈行为。基于历史数据和模式识别算法，机器学习模型可以自动识别异常交易、盗刷和欺诈活动，帮助机构及时采取措施防止和减少损失。信用评估：机器学习可以用于信用评估，通过分析借款人的个人信息、历史借贷记录和其他相关数据，预测其违约风险。机器学习模型可以根据大量的历史数据和特征，建立预测模型来评估借款人的信用状况，并帮助机构做出更准确的信用决策。信用卡反欺诈：机器学习可以用于信用卡反欺诈，通过分析持卡人的消费模式、地理位置和其他行为特征，识别潜在的信用卡欺诈行为。机器学习模型可以实时监测交易，并根据模式识别和异常检测算法，自动识别可疑交易和欺诈行为。 3 华为云实时智能风控RTD的优势实时智能风控RTD是一个企业级分布式实时决策引擎平台，具备满足大数据量、高并发、低时延，自定义规则，水平扩展的特性，是数据到商业决策的“最后一公里”，为企业提供风控、营销等高价值的精准决策。系统的高可扩展性，能够方便融合机器学习等外部模型作为变量输入，提高决策的精确性。高性能：实时智能风控RTD是分布式决策引擎，采用自研超高性能内存计算引擎支持近数据计算NDP。处理时延百毫秒级。处理能力可横向扩展。处理达到5000TPS。高可靠：支持Rest、异步消息接入，即可以通过不同的协议接入RTD平台。高性能的多协议接入部件，隐藏内部网络拓扑细节。业务处理单元采用分布式架构、规则执行引擎主备架构、支持分库分表。易用性：使用传统的SQL语言，容易理解，学习，编写。支持SQL/PLSQL规则定义。支持应用实时监控。满足事中和事后两种场景。自主性：支持用户自定义事件渠道、自定义维度、自定义事件源。多样数据源灵活接入。业务人员可自定义规则、自助秒级上下线规则。支持机器学习评分模式。创新性：多技术融合：规则引擎、流处理、AI、内存库、近数据计算。变量+ 规则 + AI 模型融合。规则集管理。灰度发布、冠军挑战者。4 实时智能风控RTD在金融领域的应用实时智能风控RTD在某金融机构深度使用，取得非常好的成效：风险案件下降率83%，防堵损失数亿元。12个控制渠道，覆盖95%的业务场景，侦测覆盖率提升10%。30毫秒神速响应，加速银行智能反欺诈，用户体验好。转账免动码下降85%，登录免动码下降95%，节约短信费用数千万元。金额BP值达到千分之一，行业领先。 5 展望总结随着时代技术，互联网产品形态的不断发展，风控需要持续不断的学习和对抗。移动支付占比超过70%，网络伪冒趋势不断上升。欺诈手段呈现专业化，产业化，隐蔽化，场景化，风险不断增大。未来，实时智能风控RTD将更加的注重人工智能大模型的融合和算法创新，提高风险预测的准确性和实时性。

zhou jian 发表于2023-11-02 09:26:41 2023-11-02 09:26:41 最后回复 zhou jian 0
347 0

金融专区数据使能通用安全机器学习
[问题求助] ApolloScape Scene Parsing数据集应该如何使用？

ApolloScape Scene Parsing数据集应该如何使用？

皮牙子抓饭 发表于2023-10-31 16:45:07 2023-10-31 16:45:07 最后回复
7 1

机器学习
[其他] 浅谈机器学习之应用场景

机器学习应用广泛，无论是在军事领域还是民用领域，都有机器学习算法施展的机会，主要包括以下几个方面。数据分析与挖掘“数据挖掘”和"数据分析”通常被相提并论，并在许多场合被认为是可以相互替代的术语。关于数据挖掘，已有多种文字不同但含义接近的定义，例如“识别出巨量数据中有效的.新颖的、潜在有用的最终可理解的模式的非平凡过程”，无论是数据分析还是数据挖掘，都是帮助人们收集、分析数据，使之成为信息，并做出判断，因此可以将这两项合称为数据分析与挖掘。数据分析与挖掘技术是机器学习算法和数据存取技术的结合，利用机器学习提供的统计分析、知识发现等手段分析海量数据，同时利用数据存取机制实现数据的高效读写。机器学习在数据分析与挖掘领域中拥有无可取代的地位，2012年Hadoop进军机器学习领域就是一个很好的例子。模式识别模式识别起源于工程领域，而机器学习起源于计算机科学，这两个不同学科的结合带来了模式识别领域的调整和发展。模式识别研究主要集中在两个方面。（1）研究生物体（包括人）是如何感知对象的，属于认识科学的范畴。（2）在给定的任务下，如何用计算机实现模式识别的理论和方法，这些是机器学习的长项，也是机器学习研究的内容之一。模式识别的应用领域广泛，包括计算机视觉、医学图像分析、光学文字识别、自然语言处理、语音识别、手写识别、生物特征识别、文件分类、搜索引擎等，而这些领域也正是机器学习大展身手的舞台，因此模式识别与机器学习的关系越来越密切。在生物信息学上的应用随着基因组和其他测序项目的不断发展，生物信息学研究的重点正逐步从积累数据转移到如何解释这些数据。在未来，生物学的新发现将极大地依赖于在多个维度和不同尺度下对多样化的数据进行组合和关联的分析能力，而不再仅仅依赖于对传统领域的继续关注。序列数据将与结构和功能数据基因表达数据、生化反应通路数据表现型和临床数据等一系列数据相互集成。如此大量的数据，在生物信息的存储、获取、处理、浏览及可视化等方面，都对理论算法和软件的发展提出了迫切的需求。另外，由于基因组数据本身的复杂性也对理论算法和软件的发展提出了迫切的需求。而机器学习方法例如神经网络、遗传算法、决策树和支持向量机等正适合于处理这种数据量大、含有噪声并且缺乏统一理论的领域。具体应用（1）虚拟助手。Siri，Alexa，Google Now都是虚拟助手。顾名思义，当使用语音发出指令后，它们会协助查找信息。对于回答，虚拟助手会查找信息，回忆语音指令人员的相关查询，或向其他资源（如电话应用程序）发送命令以收集信息。人们甚至可以指导助手执行某些任务，例如“设置7点的闹钟”等。（2）交通预测。生活中人们经常使用GPS导航服务。当使用GPS导航服务时，人们当前的位置和速度被保存在中央服务器上来进行流量管理。之后使用这些数据用于构建当前流量的映射。通过机器学习可以解决配备GPS的汽车数量较少的问题，在这种情况下的机器学习有助于根据估计找到拥挤的区域。（3）过滤垃圾邮件和恶意软件。电子邮件客户端使用了许多垃圾邮件过滤方法。为了确保这些垃圾邮件过滤器能够不断更新，它们使用了机器学习技术。多层感知器和决策树归纳等是由机器学习提供支持的一些垃圾邮件过滤技术。每天检测到超过325000个恶意软件，每个代码与之前版本的90%～98%相似。由机器学习驱动的系统安全程序理解编码模式。因此，他们可以轻松检测到2%～10%变异的新恶意软件，并提供针对它们的保护。（3）快速揭示细胞内部结构。借由高功率显微镜和机器学习，美国科学家研发出一种新算法，可在整个细胞的超高分辨率图像中自动识别大约30种不同类型的细胞器和其他结构。相关论文发表在最新一期的《自然》杂志上。（4）2022年，中国科学家利用机器学习的方法，快速得到相接双星的参数和误差。

QGS 发表于2023-10-29 20:29:15 2023-10-29 20:29:15 最后回复 @Wu 2023-10-31 15:35:50
18 1

机器学习
华为atlas openeuler操作系统制卡失败

制卡失败，失败原因为qemu is broken or the version of qemu is not compatible我已经按照华为官方文档的要求安装了相应的依赖软件，为什么还会出现qemu broken的错误

yd_289084269 发表于2023-06-09 10:48:54 2023-06-09 10:48:54 最后回复 yd_289084269 2023-06-09 10:48:54
66 0

ARM 昇腾 openEuler 智能边缘平台 IEF 机器学习
浅谈强化学习

强化学习（Reinforcement Learning, RL），是机器学习的范式和方法论之一，用于描述和解决智能体（agent）在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。强化学习是智能体（Agent）以“试错”的方式进行学习，通过与环境进行交互获得的奖赏指导行为，目标是使智能体获得最大的奖赏，强化学习不同于连接主义学习中的监督学习，主要表现在强化信号上，强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号)，而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少，RLS必须靠自身的经历进行学习。通过这种方式，RLS在行动-评价的环境中获得知识，改进行动方案以适应环境。强化学习的常见模型是标准的马尔可夫决策过程（Markov Decision Process）。按给定条件，强化学习可分为基于模式的强化学习（model-based RL）和无模式强化学习（model-free RL），以及主动强化学习（active RL）和被动强化学习（passive RL）。强化学习的变体包括逆向强化学习、阶层强化学习和部分可观测系统的强化学习。求解强化学习问题所使用的算法可分为策略搜索算法和值函数（value function）算法两类。深度学习可以在强化学习中得到使用，形成深度强化学习。强化学习理论受到行为主义心理学启发，侧重在线学习并试图在探索-利用（exploration-exploitation）间保持平衡。不同于监督学习和非监督学习，强化学习不要求预先给定任何数据，而是通过接收环境对动作的奖励（反馈）获得学习信息并更新模型参数。强化学习问题在信息论、博弈论、自动控制等领域有得到讨论，被用于解释有限理性条件下的平衡态、设计推荐系统和机器人交互系统。一些复杂的强化学习算法在一定程度上具备解决复杂问题的通用智能，可以在围棋和电子游戏中达到人类水平。

QGS 发表于2023-03-20 21:48:07 2023-03-20 21:48:07 最后回复 @Wu 2023-03-31 16:54:10
70 1

机器学习
[其他] 有监督机器学习和无监督机器学习的核心哲学

有监督机器学习的核心哲学：使用“数据驱动”方法让计算机可以学习输入/输出之间的正确映射。它需要一系列“标记”记录，其中包含训练集中的输入和期望的输出，以便将输入到输出的映射学习为一种准确的行为表现。可以用下面这个图来表示：无监督机器学习的核心哲学：让计算机学习输入的内部结构而不是输入/输出之间的正确映射。它通过对数据的模式和相关关系进行分析来理解不存在标记数据要求的输入数据。它通常会发现输入数据内部的隐藏模式。个人觉得无监督机器学习应该更高级一些，因为它有更多一点的无为而治的意思在里面。

黄生 发表于2023-03-02 22:30:14 2023-03-02 22:30:14 最后回复 @Wu 2023-03-31 16:54:38
44 6

机器学习
ModelArts

如何通过python代码在桶中创建文件夹？想把训练完的数据保存起来，报错没有这样的目录，mkdir没创建出来

yd_233802039 发表于2023-03-02 19:50:36 2023-03-02 19:50:36 最后回复运气男孩 2023-03-30 15:54:39
38 1

AI开发平台ModelArts 对象存储服务 OBS 机器学习
[其他] 浅谈机器学习算法—高斯混合模型 (GMM)

机器学习算法：高斯混合模型 (GMM) 。它们用于根据概率分布将数据分类为不同的类别。高斯混合模型可用于许多不同的领域，包括金融、营销等等！这里要对高斯混合模型进行介绍以及真实世界的示例、它们的作用以及何时应该使用GMM。高斯混合模型 (GMM) 是一个概率概念，用于对真实世界的数据集进行建模。GMM是高斯分布的泛化，可用于表示可聚类为多个高斯分布的任何数据集。高斯混合模型是一种概率模型，它假设所有数据点都是从具有未知参数的高斯分布的混合中生成的。高斯混合模型可用于聚类，这是将一组数据点分组为聚类的任务。GMM 可用于在数据集中可能没有明确定义的集群中查找集群。此外，GMM 可用于估计新数据点属于每个集群的概率。高斯混合模型对异常值也相对稳健，这意味着即使有一些数据点不能完全适合任何集群，它们仍然可以产生准确的结果。这使得 GMM 成为一种灵活而强大的数据聚类工具。它可以被理解为一个概率模型，其中为每个组假设高斯分布，并且它们具有定义其参数的均值和协方差。 GMM 由两部分组成——均值向量 (μ) 和协方差矩阵 (Σ)。高斯分布被定义为呈钟形曲线的连续概率分布。高斯分布的另一个名称是正态分布。这是高斯混合模型的图片：它可以被理解为一个概率模型，其中为每个组假设高斯分布，并且它们具有定义其参数的均值和协方差。GMM 由两部分组成——均值向量 (μ) 和协方差矩阵 (Σ)。高斯分布被定义为呈钟形曲线的连续概率分布。高斯分布的另一个名称是正态分布。高斯混合模型的图片： GMM 有许多应用，例如密度估计、聚类和图像分割。对于密度估计，GMM 可用于估计一组数据点的概率密度函数。对于聚类，GMM 可用于将来自相同高斯分布的数据点组合在一起。对于图像分割，GMM 可用于将图像划分为不同的区域。高斯混合模型可用于各种用例，包括识别客户群、检测欺诈活动和聚类图像。在这些示例中的每一个中，高斯混合模型都能够识别数据中可能不会立即明显的聚类。因此，高斯混合模型是一种强大的数据分析工具，应该考虑用于任何聚类任务。在高斯混合模型中，期望最大化方法是估计高斯混合模型（GMM）参数的有力工具。期望称为E，最大化称为M。期望用于找到用于表示高斯混合模型的每个分量的高斯参数。最大化被称为 M 并且它涉及确定是否可以添加新数据点，可以从下面链接进一步了解期望最大化。

QGS 发表于2023-02-28 17:12:19 2023-02-28 17:12:19 最后回复黄生 2023-03-05 12:43:48
31 1

机器学习
[技术干货] 如何全面掌握图机器学习？最新《图学习》全面综述

图学习旨在学习现实世界中常见的复杂节点关系和图的拓扑结构，如社交网络、学术网络和电子商务网络等。这些关系使得图数据与传统的表格数据不同，其中节点依赖于非欧氏空间，包含了丰富的信息。图学习从图论发展到图数据挖掘，现在被赋予表示学习的能力，使其在各种场景中取得了出色的性能，甚至包括文本、图像、化学和生物。由于在现实世界中的广泛应用前景，图学习已经成为机器学习中一个热门且有前景的领域。近年来，已有成千上万的研究成果被提出用于解决图学习中的各种问题，引起了学术界越来越多的关注，因此对已有的有价值的研究成果进行综述变得至关重要。尽管一些研究人员已经注意到这种现象，并完成了关于图学习的令人印象深刻的调研。然而，由于图学习的快速扩展，它们未能以更合乎逻辑的方式将相关目标、方法和应用联系起来，并涵盖当前丰富的场景和具有挑战性的问题。1. 引言图学习旨在对图进行建模，图是一种广泛存在于真实场景中的非欧氏数据，与以往机器学习中的数据结构有很大不同，如社交网络[1]、[2]、[3]，学术网络[4]、[5]、[6]，电子商务网络[7]、[8]、[9]，企业知识图谱[10]、[11]、[12]等。挖掘图中节点间复杂连接关系和拓扑结构中蕴含的丰富信息，对于图上的许多任务和应用具有重要意义。此外，传统应用也可以转换为图数据(如计算机视觉[13]、[14]、[15]、语言模型[16]、[17]、[18]、物理[19]、[20]和化学[21]、[22])。重点假设不同实体之间存在许多未直接观察到的潜在联系。这使得图学习不仅是一种处理自然图结构的方法，而且是一种思考各种问题的方式。由于图学习具有广阔的应用前景，因此在国内外引起了广泛的关注。尽管之前关于图的理论工作帮助人们理解图上的各种字符，并提供了基本的分析框架。这些工作通常集中在较小的模拟图上，这限制了它们在真实场景中的应用，特别是当图上存在复杂的关系和结构时。尽管在这一领域已经有了一些显著而详细的调查。目前还缺乏一个综合的、将相关的目标、方法和应用联系起来，形成一个有机的、逻辑的综述。此外，每年在顶级会议上都有数百篇关于图学习的研究，并且数量还在高速增长。由于其发展迅速，缺乏涵盖最新趋势和挑战的全面调研。图2按时间顺序展示了有影响力的图学习方法。这些方法主要分为3类(图挖掘方法、图表示方法和深度图学习方法)。在图学习早期，大多数方法集中于图的字符[1]或利用图的结构信息在小图[25]、[26]上完成一些下游任务。图表示学习目前占据主流地位，可归纳为图嵌入方法和图神经网络方法两大类。这两类方法都旨在学习节点、边或图的语义表示。前者直接优化嵌入，可以减少图结构信息的损失;后者利用深度神经网络，在图上建模信息传递过程。如图3所示，在本综述中，我们从图学习目标的角度提供了一个直观的分类法。根据图的元素(即节点、边和图结构)对以前对图的工作进行排序。基于这种逻辑，综述了图上的相关方法和任务。展示了图学习在现实世界中的各种应用上的出色性能。最后，提出了图学习的发展趋势和挑战，以期进一步推动该领域的研究。本综述的主要贡献总结如下。提供了一个新的分类法，以调查以前关于数据、模型和任务的研究。总结了当前图学习在现实世界中的应用。提出了图学习的当前趋势和挑战。本文的其余部分组织如下。第2节从数据、模型和任务3个角度，基于节点、边和图结构对已有工作进行了直观的分类。第3节展示了用于图学习的主要方法和当前的研究趋势。第四部分总结了该方法在实际中的应用。第5节提出了当今图学习面临的挑战。2 方法在本节中，我们将当前的模型分为两大类(即传统模型和图神经网络)。传统模型可以进一步分为3类(即矩阵分解模型、基于随机游走的模型和基于自编码器的模型)。首先回顾了传统模型，其中一些仍然活跃或与GNN相结合，并给出了当前模型的许多启示。在大多数场景下，与传统模型相比，GNN表现出更高的表达能力和出色的性能。本文将GNN归纳为两个方面。3 应用介绍当前图学习在现实世界中的主要应用，包括传统的机器学习场景，如推荐系统、自然语言处理、计算机视觉和金融科技，以及科学场景中的新兴应用，如化学、生物、物理和数学。最后，总结了图学习中流行的数据集。

可爱又积极 发表于2022-12-22 19:08:29 2022-12-22 19:08:29 最后回复可爱又积极 2022-12-22 19:08:30
28 0

深度学习机器学习

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript