神经网络_标签_开发者

博客(2.1k)
视频(0)
论坛(936)
云声(0)
代码示例(0)

[技术干货] MindSpore前馈神经网络运用

MindSpore前馈神经网络运用实验经典介绍本实验主要介绍使用MindSpore开发前馈神经网络，并使用Fashion-MNIST数据集训练和测试模型。实验目的掌握如何使用MindSpore进行简单前馈神经网络的开发。了解如何使用MindSpore进行简单图片分类任务的训练。了解如何使用MindSpore进行简单图片分类任务的测试和预测。预备知识熟练使用Python。具备一定的深度学习理论知识，如感知机、前馈神经网络、损失函数、优化器，训练策略等。了解华为云的基本使用方法，包括OBS（对象存储）、ModelArts（AI开发平台）、训练作业等功能。华为云官网：https://www.huaweicloud.com了解并熟悉MindSpore AI计算框架，MindSpore官网：https://www.mindspore.cn/实验环境MindSpore 1.0.0（MindSpore版本会定期更新，本指导也会定期刷新，与版本配套）；华为云ModelArts（控制台左上角选择“华北-北京四”）：ModelArts是华为云提供的面向开发者的一站式AI开发平台，集成了昇腾AI处理器资源池，用户可以在该平台下体验MindSpore。实验准备已经对ModelArts云环境很熟悉的玩家可以直接跳到实验步骤。数据集准备Fashion-MNIST是一个替代MNIST手写数字集的图像数据集。它是由Zalando（一家德国的时尚科技公司）旗下的研究部门提供。其涵盖了来自10种类别的共7万个不同商品的正面图片。Fashion-MNIST的大小、格式和训练集/测试集划分与原始的MNIST完全一致。60000/10000的训练测试数据划分，28x28x1的灰度图片。这里介绍一下经典的MNIST（手写字母）数据集。经典的MNIST数据集包含了大量的手写数字。十几年来，来自机器学习、机器视觉、人工智能、深度学习领域的研究员们把这个数据集作为衡量算法的基准之一。实际上，MNIST数据集已经成为算法作者的必测的数据集之一，但是MNIST数据集太简单了。很多深度学习算法在测试集上的准确率已经达到99.6%。从Fashion-MNIST GitHub仓库下载如下4个文件到本地并解压：train-images-idx3-ubyte training set images（47,042,560 bytes） train-labels-idx1-ubyte training set labels（61,440 bytes） t10k-images-idx3-ubyte test set images (7,843,840 bytes) t10k-labels-idx1-ubyte test set labels (12,288 bytes) 1234脚本准备从课程gitee仓库上下载本实验相关脚本。将脚本和数据集组织为如下形式：feedforward ├── Fashion-MNIST │ ├── test │ │ ├── t10k-images-idx3-ubyte │ │ └── t10k-labels-idx1-ubyte │ └── train │ ├── train-images-idx3-ubyte │ └── train-labels-idx1-ubyte └── main.py 创建OBS桶本实验需要使用华为云OBS存储脚本和数据集，可以参考快速通过OBS控制台上传下载文件了解使用OBS创建桶、上传文件、下载文件的使用方法（下文给出了操作步骤）。提示：华为云新用户使用OBS时通常需要创建和配置“访问密钥”，可以在使用OBS时根据提示完成创建和配置。也可以参考获取访问密钥并完成ModelArts全局配置获取并配置访问密钥。打开OBS控制台，点击右上角的“创建桶”按钮进入桶配置页面，创建OBS桶的参考配置如下：区域：华北-北京四数据冗余存储策略：单AZ存储桶名称：全局唯一的字符串存储类别：标准存储桶策略：公共读归档数据直读：关闭企业项目、标签等配置：免上传文件点击新建的OBS桶名，再打开“对象”标签页，通过“上传对象”、“新建文件夹”等功能，将脚本和数据集上传到OBS桶中。上传文件后，查看页面底部的“任务管理”状态栏（正在运行、已完成、失败），确保文件均上传完成。若失败请：参考上传对象大小限制/切换上传方式，参考上传对象失败常见原因。若无法解决请新建工单，产品类为“对象存储服务”，问题类型为“桶和对象相关”，会有技术人员协助解决。实验步骤推荐使用ModelArts训练作业进行实验，适合大规模并发使用。若使用ModelArts Notebook，请参考LeNet5及Checkpoint实验案例，了解Notebook的使用方法和注意事项。代码梳理导入MindSpore模块和辅助模块用到的框架主要包括：mindspore，用于神经网络的搭建numpy，用于处理一些数据matplotlib，用于画图、图像展示struct，用于处理二进制文件import osimport structimport sysfrom easydict import EasyDict as edictimport matplotlib.pyplot as pltimport numpy as npimport mindsporeimport mindspore.dataset as dsimport mindspore.nn as nnfrom mindspore import contextfrom mindspore.nn.metrics import Accuracyfrom mindspore.train import Modelfrom mindspore.train.callback import ModelCheckpoint, CheckpointConfig, LossMonitor, TimeMonitorfrom mindspore import Tensorcontext.set_context(mode=context.GRAPH_MODE, device_target='Ascend')变量定义cfg = edict({ 'train_size': 60000, # 训练集大小 'test_size': 10000, # 测试集大小 'channel': 1, # 图片通道数 'image_height': 28, # 图片高度 'image_width': 28, # 图片宽度 'batch_size': 60, 'num_classes': 10, # 分类类别 'lr': 0.001, # 学习率 'epoch_size': 20, # 训练次数 'data_dir_train': os.path.join('Fashion-MNIST', 'train'), 'data_dir_test': os.path.join('Fashion-MNIST', 'test'), 'save_checkpoint_steps': 1, # 多少步保存一次模型 'keep_checkpoint_max': 3, # 最多保存多少个模型 'output_directory': './model_fashion', # 保存模型路径 'output_prefix': "checkpoint_fashion_forward" # 保存模型文件名字})读取并处理数据读取数据def read_image(file_name): ''' :param file_name: 文件路径 :return: 训练或者测试数据如下是训练的图片的二进制格式 [offset] [type] [value] [description] 0000 32 bit integer 0x00000803(2051) magic number 0004 32 bit integer 60000 number of images 0008 32 bit integer 28 number of rows 0012 32 bit integer 28 number of columns 0016 unsigned byte ?? pixel 0017 unsigned byte ?? pixel ........ xxxx unsigned byte ?? pixel ''' file_handle = open(file_name, "rb") # 以二进制打开文档 file_content = file_handle.read() # 读取到缓冲区中 head = struct.unpack_from('>IIII', file_content, 0) # 取前4个整数，返回一个元组 offset = struct.calcsize('>IIII') imgNum = head[1] # 图片数 width = head[2] # 宽度 height = head[3] # 高度 bits = imgNum * width * height # data一共有60000*28*28个像素值 bitsString = '>' + str(bits) + 'B' # fmt格式：'>47040000B' imgs = struct.unpack_from(bitsString, file_content, offset) # 取data数据，返回一个元组 imgs_array = np.array(imgs).reshape((imgNum, width * height)) # 最后将读取的数据reshape成【图片数，图片像素】二维数组 return imgs_arraydef read_label(file_name): ''' :param file_name: :return: 标签的格式如下： [offset] [type] [value] [description] 0000 32 bit integer 0x00000801(2049) magic number (MSB first) 0004 32 bit integer 60000 number of items 0008 unsigned byte ?? label 0009 unsigned byte ?? label ........ xxxx unsigned byte ?? label The labels values are 0 to 9. ''' file_handle = open(file_name, "rb") # 以二进制打开文档 file_content = file_handle.read() # 读取到缓冲区中 head = struct.unpack_from('>II', file_content, 0) # 取前2个整数，返回一个元组 offset = struct.calcsize('>II') labelNum = head[1] # label数 bitsString = '>' + str(labelNum) + 'B' # fmt格式：'>47040000B' label = struct.unpack_from(bitsString, file_content, offset) # 取data数据，返回一个元组 return np.array(label)def get_data(): # 文件获取 train_image = os.path.join(cfg.data_dir_train, 'train-images-idx3-ubyte') test_image = os.path.join(cfg.data_dir_test, "t10k-images-idx3-ubyte") train_label = os.path.join(cfg.data_dir_train, "train-labels-idx1-ubyte") test_label = os.path.join(cfg.data_dir_test, "t10k-labels-idx1-ubyte") # 读取数据 train_x = read_image(train_image) test_x = read_image(test_image) train_y = read_label(train_label) test_y = read_label(test_label) return train_x, train_y, test_x, test_y数据预处理和处理结果图片展示train_x, train_y, test_x, test_y = get_data()train_x = train_x.reshape(-1, 1, cfg.image_height, cfg.image_width)test_x = test_x.reshape(-1, 1, cfg.image_height, cfg.image_width)train_x = train_x / 255.0test_x = test_x / 255.0train_x = train_x.astype('Float32')test_x = test_x.astype('Float32')train_y = train_y.astype('int32')test_y = test_y.astype('int32')print('训练数据集样本数：', train_x.shape[0])print('测试数据集样本数：', test_y.shape[0])print('通道数/图像长/宽：', train_x.shape[1:])print('一张图像的标签样式：', train_y[0]) # 一共10类，用0-9的数字表达类别。plt.figure()plt.imshow(train_x[0,0,...])plt.colorbar()plt.grid(False)plt.show()训练数据集数量： 60000测试数据集数量： 10000通道数/图像长/宽： (1, 28, 28)一张图像的标签样式： 9使用MindSpore GeneratorDataset接口将numpy.ndarray类型的数据转换为Dataset# 转换数据类型为DatasetXY_train = list(zip(train_x, train_y))ds_train = ds.GeneratorDataset(XY_train, ['x', 'y'])ds_train = ds_train.shuffle(buffer_size=cfg.train_size).batch(cfg.batch_size, drop_remainder=True)XY_test = list(zip(test_x, test_y))ds_test = ds.GeneratorDataset(XY_test, ['x', 'y'])ds_test = ds_test.shuffle(buffer_size=cfg.test_size).batch(cfg.batch_size, drop_remainder=True)定义前馈神经网络前馈神经网络是一种最简单的神经网络，各神经元分层排列（其中每一层包含若干个神经元）。每个神经元只与前一层的神经元相连，接收前一层的输出，并输出给下一层，各层间没有反馈。是目前应用最广泛、发展最迅速的人工神经网络之一。第0层叫输入层，最后一层叫输出层，其他中间层叫做隐含层（或隐藏层、隐层）。隐层可以是一层，也可以是多层，是由全连接层堆叠而成。# 定义前馈神经网络class Forward_fashion(nn.Cell): def __init__(self, num_class=10): # 一共分十类，图片通道数是1 super(Forward_fashion, self).__init__() self.num_class = num_class self.flatten = nn.Flatten() self.fc1 = nn.Dense(cfg.channel * cfg.image_height * cfg.image_width, 128) self.relu = nn.ReLU() self.fc2 = nn.Dense(128, self.num_class) def construct(self, x): x = self.flatten(x) x = self.fc1(x) x = self.relu(x) x = self.fc2(x) return x训练使用Fashion-MNIST数据集对上述定义的前馈神经网络模型进行训练。训练策略如下表所示，可以调整训练策略并查看训练效果。batch size number of epochs learning rate input shape optimizer60 20 0.001 (1，28，28) Adam# 构建网络network = Forward_fashion(cfg.num_classes)# 定义模型的损失函数，优化器net_loss = nn.SoftmaxCrossEntropyWithLogits(sparse=True, reduction="mean")net_opt = nn.Adam(network.trainable_params(), cfg.lr)# 训练模型model = Model(network, loss_fn=net_loss, optimizer=net_opt, metrics={"acc"})loss_cb = LossMonitor(per_print_times=int(cfg.train_size / cfg.batch_size))config_ck = CheckpointConfig(save_checkpoint_steps=cfg.save_checkpoint_steps, keep_checkpoint_max=cfg.keep_checkpoint_max)ckpoint_cb = ModelCheckpoint(prefix=cfg.output_prefix, directory=cfg.output_directory, config=config_ck)print("============== Starting Training ==============")model.train(cfg.epoch_size, ds_train, callbacks=[ckpoint_cb, loss_cb], dataset_sink_mode=False)============== Starting Training ==============epoch: 1 step: 1000, loss is 0.6812696epoch: 2 step: 1000, loss is 0.39710096epoch: 3 step: 1000, loss is 0.43427807epoch: 4 step: 1000, loss is 0.3170758epoch: 5 step: 1000, loss is 0.24550956epoch: 6 step: 1000, loss is 0.4204946epoch: 7 step: 1000, loss is 0.35653585epoch: 8 step: 1000, loss is 0.31376493epoch: 9 step: 1000, loss is 0.27455378epoch: 10 step: 1000, loss is 0.18871705epoch: 11 step: 1000, loss is 0.20512795epoch: 12 step: 1000, loss is 0.2589024epoch: 13 step: 1000, loss is 0.31454447epoch: 14 step: 1000, loss is 0.24145015epoch: 15 step: 1000, loss is 0.32082427epoch: 16 step: 1000, loss is 0.27023837epoch: 17 step: 1000, loss is 0.34484679epoch: 18 step: 1000, loss is 0.41191268epoch: 19 step: 1000, loss is 0.07990202epoch: 20 step: 1000, loss is 0.26586318评估测试# 使用测试集评估模型，打印总体准确率metric = model.eval(ds_test, dataset_sink_mode=False)print(metric)预测class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']#从测试集中取出一组样本，输入模型进行预测test_ = ds_test.create_dict_iterator()._get_next()#利用key值选出样本test = Tensor(test_['x'], mindspore.float32)predictions = model.predict(test)softmax = nn.Softmax()predictions = softmax(predictions)predictions = predictions.asnumpy()true_label = test_['y'].asnumpy()true_image = test_['x'].asnumpy()for i in range(15): p_np = predictions[i, :] pre_label = np.argmax(p_np) print('第' + str(i) + '个sample预测结果：', class_names[pre_label], ' 真实结果：', class_names[true_label[i]])对预测结果可视化# -------------------定义可视化函数--------------------------------# 输入预测结果序列，真实标签序列，以及图片序列# 目标是根据预测值对错，让其标签显示为红色或者蓝色。对：标签为蓝色；错：标签为红色def plot_image(predicted_label, true_label, img): plt.grid(False) plt.xticks([]) plt.yticks([]) # 显示对应图片 plt.imshow(img, cmap=plt.cm.binary) # 显示预测结果的颜色，如果对上了是蓝色，否则为红色 if predicted_label == true_label: color = 'blue' else: color = 'red' # 显示对应标签的格式，样式 plt.xlabel('{},({})'.format(class_names[predicted_label], class_names[true_label]), color=color)# 将预测的结果以柱状图形状显示蓝对红错def plot_value_array(predicted_label, true_label,predicted_array): plt.grid(False) plt.xticks([]) plt.yticks([]) this_plot = plt.bar(range(10), predicted_array, color='#777777') plt.ylim([0, 1]) this_plot[predicted_label].set_color('red') this_plot[true_label].set_color('blue')# 预测15个图像与标签，并展现出来num_rows = 5num_cols = 3num_images = num_rows * num_colsplt.figure(figsize=(2 * 2 * num_cols, 2 * num_rows))for i in range(num_images): plt.subplot(num_rows, 2 * num_cols, 2 * i + 1) pred_np_ = predictions[i, :] predicted_label = np.argmax(pred_np_) image_single = true_image[i, 0, ...] plot_image(predicted_label, true_label[i], image_single) plt.subplot(num_rows, 2 * num_cols, 2 * i + 2) plot_value_array(predicted_label, true_label[i], pred_np_)plt.show()适配训练作业(可跳过)创建训练作业时，运行参数会通过脚本传参的方式输入给脚本代码，脚本必须解析传参才能在代码中使用相应参数。如data_url和train_url，分别对应数据存储路径(OBS路径)和训练输出路径(OBS路径)。脚本对传参进行解析后赋值到args变量里，在后续代码里可以使用。import argparseparser = argparse.ArgumentParser()parser.add_argument('--data_url', required=True, default=None, help='Location of data.')parser.add_argument('--train_url', required=True, default=None, help='Location of training outputs.')args, unknown = parser.parse_known_args()MindSpore暂时没有提供直接访问OBS数据的接口，需要通过ModelArts自带的moxing框架与OBS交互。将OBS桶中的数据拷贝至执行容器中，供MindSpore使用：import moxing# src_url形如's3://OBS/PATH'，为OBS桶中数据集的路径，dst_url为执行容器中的路径moxing.file.copy_parallel(src_url=args.data_url, dst_url='Fashion-MNIST/')如需将训练输出（如模型Checkpoint）从执行容器拷贝至OBS，请参考：import moxing# src_url为执行容器中的路径，dst_url形如's3://OBS/PATH'，目录若不存在则会新建moxing.file.copy_parallel(src_url='model_fashion', dst_url=args.train_url) 创建训练作业可以参考使用常用框架训练模型来创建并启动训练作业。打开ModelArts控制台-训练管理-训练作业，点击“创建”按钮进入训练作业配置页面，创建训练作业的参考配置：算法来源：常用框架->Ascend-Powered-Engine->MindSpore；代码目录：选择上述新建的OBS桶中的feedforward目录；启动文件：选择上述新建的OBS桶中的feedforward目录下的main.py；数据来源：数据存储位置->选择上述新建的OBS桶中的feedforward目录下的Fashion-MNIST目录；训练输出位置：选择上述新建的OBS桶中的feedforward目录并在其中创建model_fashion目录；作业日志路径：同训练输出位置；规格：Ascend:1*Ascend 910；其他均为默认；启动并查看训练过程：点击提交以开始训练；在训练作业列表里可以看到刚创建的训练作业，在训练作业页面可以看到版本管理；点击运行中的训练作业，在展开的窗口中可以查看作业配置信息，以及训练过程中的日志，日志会不断刷新，等训练作业完成后也可以下载日志到本地进行查看；参考上述代码梳理，在日志中找到对应的打印信息，检查实验是否成功；运行成功。实验小结本实验展示了如何使用MindSpore进行Fashion-MNIST数据集分类。首先训练前馈神经网络，然后使用训练后的前馈神经网络模型对Fashion-MNIST测试数据进行分类，从结果上分析准确率大于80%，即前馈神经网络学习到了Fashion-MNIST数据集分类。————————————————原文链接：https://blog.csdn.net/weixin_54227557/article/details/123533208

多米诺的古牌 发表于2022-06-19 20:05:26 2022-06-19 20:05:26 最后回复多米诺的古牌 2022-06-19 20:05:26
37 0

神经网络机器学习 MindSpore
[基础知识] 【MindSpore易点通】深度学习系列-经典卷积神经网络

上周小伙伴说我们卷积神经网络讲的太简单了，基础嘛，当然要先打好（）。这不，更加复杂的卷积神经网络来了~经典CNN之LeNet手写字体识别模型LeNet5诞生于1994年，是最早的卷积神经网络之一。LeNet5利用卷积、参数共享、池化等操作提取特征，避免了大量的计算成本，最后使用全连接神经网络进行分类识别。 LeNet5的网络结构示意图LeNet5由7层CNN（不包含输入层）组成，图中输入的原始图像大小是32×32像素，卷积层：Ci；子采样层（pooling，池化）：Si；全连接层：Fi。C1层（卷积层）：该层使用了6个卷积核，每个卷积核的大小为5×5，可以得到6个特征图（feature map）。（1）特征图大小每个卷积核（5×5）与原始的输入图像（32×32）进行卷积，这样得到的特征图大小为（32-5+1）×（32-5+1）= 28×28这里有个小知识点：卷积核与输入图像按卷积核大小逐个区域进行匹配计算，匹配后原始输入图像的尺寸将变小，因为边缘部分卷积核无法越出界，只能匹配一次，匹配计算后的尺寸变为Cr×Cc=（Ir-Kr+1）×（Ic-Kc+1），其中Cr、Cc，Ir、Ic，Kr、Kc分别表示卷积后结果图像、输入图像以及卷积核的行列大小。（2）参数个数由于参数（权值）共享，对于同个卷积核每个神经元均使用相同的参数，因此，参数个数为（5×5+1）×6= 156，其中5×5为卷积核参数，1为偏置参数。（3）连接数卷积后的图像大小为28×28，因此每个特征图有28×28个神经元，每个卷积核参数为（5×5+1）×6，因此，该层的连接数为（5×5+1）×6×28×28=1223042、S2层（下采样层，也称池化层）：（1）特征图大小这一层主要是做池化或者特征映射（特征降维），池化单元为2×2，因此，6个特征图的大小经池化后即变为14×14。由于池化单元之间没有重叠，在池化区域内进行聚合统计后得到新的特征值，因此经2×2池化后，每两行两列重新算出一个特征值出来，相当于图像大小减半，因此卷积后的28×28图像经2×2池化后就变为14×14。这一层的计算过程是：2×2 单元里的值相加，然后再乘以训练参数w，再加上一个偏置参数b（每一个特征图共享相同的w和b)，然后取sigmoid值（S函数：0-1区间），作为对应的该单元的值。卷积操作与池化的示意图（2）参数个数S2层由于每个特征图都共享相同的w和b这两个参数，因此需要2×6=12个参数（3）连接数下采样之后的图像大小为14×14，因此S2层的每个特征图有14×14个神经元，每个池化单元连接数为2×2+1（1为偏置量），因此，该层的连接数为（2×2+1）×14×14×6 = 58803、C3层（卷积层）：C3层有16个卷积核，卷积模板大小为5×5。（1）特征图大小与C1层的分析类似，C3层的特征图大小为（14-5+1）×（14-5+1）= 10×10（2）参数个数需要注意的是，C3与S2并不是全连接而是部分连接，有些是C3连接到S2三层、有些四层、甚至达到6层，通过这种方式提取更多特征，连接的规则如下表所示：例如第一列表示C3层的第0个特征图（feature map）只跟S2层的第0、1和2这三个feature maps相连接，计算过程为：用3个卷积模板分别与S2层的3个feature maps进行卷积，然后将卷积的结果相加求和，再加上一个偏置，再取sigmoid得出卷积后对应的feature map了。其它列也是类似（有些是3个卷积模板，有些是4个，有些是6个）。因此，C3层的参数数目为（5×5×3+1）×6 +（5×5×4+1）×9 +5×5×6+1 = 1516（3）连接数卷积后的特征图大小为10×10，参数数量为1516，因此连接数为1516×10×10= 151600S4（下采样层，也称池化层）：（1）特征图大小与S2的分析类似，池化单元大小为2×2，因此，该层与C3一样共有16个特征图，每个特征图的大小为5×5。（2）参数数量与S2的计算类似，所需要参数个数为16×2 = 32（3）连接数连接数为（2×2+1）×5×5×16 = 2000C5层（卷积层）：（1）特征图大小该层有120个卷积核，每个卷积核的大小仍为5×5，因此有120个特征图。由于S4层的大小为5×5，而该层的卷积核大小也是5×5，因此特征图大小为（5-5+1）×（5-5+1）= 1×1。这样该层就刚好变成了全连接，当然这里真的只是coincidence，如果原始输入的图像比较大，则该层就不是全连接了。（2）参数个数本层的参数数目为120×（5×5×16+1） = 48120（3）连接数由于该层的特征图大小刚好为1×1，因此连接数为48120×1×1=481206、F6层（全连接层）：（1）特征图大小F6层有84个单元，由于输出层的对应的是一个7×12的比特图，如下图所示，-1表示白色，1表示黑色，这样每个符号的比特图的黑白色就对应于一个编码。该层有84个特征图，特征图大小与C5一样都是1×1，与C5层全连接。（2）参数个数由于是全连接，参数数量为（120+1）×84=10164。跟经典神经网络一样，F6层计算输入向量和权重向量之间的点积，再加上一个偏置，然后将其传递给sigmoid函数得出结果。（3）连接数由于是全连接，连接数与参数数量一样，也是10164。7、OUTPUT层（输出层）：Output层也是全连接层，共有10个节点，分别代表数字0到9。如果第i个节点的值为0，则表示网络识别的结果是数字i。（1）特征图大小该层采用径向基函数（RBF）的网络连接方式，假设x是上一层的输入，y是RBF的输出，则RBF输出的计算方式是：上式中的Wij的值由i的比特图编码确定，i从0到9，j取值从0到7×12-1。RBF输出的值越接近于0，表示当前网络输入的识别结果与字符i越接近。（2）参数个数由于是全连接，参数个数为84×10=840（3）连接数由于是全连接，连接数与参数个数一样，也是840LeNet卷积层用来识别图像⾥的空间模式，例如线条和物体局部，池化层则⽤来降低卷积层对位置的敏感性，在交替使用卷积层和最大池化层后接全连接层来进⾏图像分类，展示了通过梯度下降训练卷积神经网络可以达到手写数字识别在当时最先进的结果。经典CNN之AlexNet第一个典型的CNN是LeNet5网络结构，但是第一个引起大家注意的网络却是AlexNet。AlexNet网络结构网络总共的层数为8层，5层卷积，3层全连接层。1、第一层：卷积层C1，输入为224×224×3的图像，卷积核的数量为96，卷积核的大小为11×11×3，步长stride 为4，pad = 0，表示不扩充边缘;卷积后的图形大小：wide = (224 + 2 * padding - kernel_size) / stride + 1 = 54height = (224 + 2 * padding - kernel_size) / stride + 1 = 54dimention = 96然后进行 (Local Response Normalized), 后面跟着池化pool_size = (3, 3), stride = 2, pad = 0，最终获得第一层卷积的feature map。2、第二层：卷积层C2, 输入为上一层卷积的feature map，卷积的个数为256个，卷积核的大小为：5×5×48，pad = 2，stride = 1，然后做 LRN，最后 max_pooling， pool_size = (3, 3), stride = 2。3、第三层：卷积层C3, 输入为第二层的输出，卷积核个数为384, kernel_size = (3 ×3×256)，padding = 1，第三层没有做LRN和Pool。4、第四层：卷积层C4, 输入为第三层的输出，卷积核个数为384, kernel_size = (3×3), padding = 1, 和第三层一样，没有LRN和Pool。5、第五层：卷积层C5, 输入为第四层的输出，卷积核个数为256，kernel_size = (3×3×3), padding = 1。然后直接进行max_pooling, pool_size = (3, 3), stride = 2;6、第6,7,8层是全连接层，每一层的神经元的个数为4096，最终输出softmax为1000，然后全连接层中使用了RELU和Dropout。AlexNet将LeNet的思想发扬光大，把CNN的基本原理应用到了很深很宽的网络中。首先成功使用ReLU作为CNN的激活函数，并验证其效果在较深的网络超过了Sigmoid，成功解决了Sigmoid在网络较深时的梯度弥散问题。Relu函数：然后选择采用覆盖的池化操作。常规的池化层由于没有重叠，所以pool_size 和 stride一般是相等的，例如8×8的一个图像，如果池化层的尺寸是2×2，那么经过池化后的操作得到的图像是4×4，这种设置叫做不覆盖的池化操作。而如果 stride < pool_size, 那么就会产生覆盖的池化操作，这种有点类似于convolutional化的操作，在训练模型过程中，覆盖的池化层更不容易过拟合。同时，神经网络的一个比较严重的问题就是过拟合问题，AlexNet采用的数据扩充和Dropout的方法处理过拟合问题。对于某一层神经元，通过定义的概率来随机删除一些神经元，同时保持输入层与输出层神经元的个数不变，然后按照神经网络的学习方法进行参数更新，下一次迭代中，重新随机删除一些神经元，直至训练结束。总结AlexNet和LeNet的设计理念非常相似，但也存在显著差异。首先，AlexNet比相对较小的LeNet5要深得多。AlexNet由八层组成：五个卷积层、两个全连接隐藏层和一个全连接输出层。其次，AlexNet使用ReLU而不是sigmoid作为其激活函数。AlexNet的更高层建立在底层表示的基础上，以表示更大的特征，如眼睛、鼻子、草叶等等。而更高的层可以检测整个物体，如人、飞机、狗或飞盘。最终的隐藏神经元可以学习图像的综合表示，从而使属于不同类别的数据易于区分。AlexNet首次证明了学习到的特征可以超越手工设计的特征，AlexNet在结果上要优于LeNet很多，特别是其在处理大规模数据方便的优势更是明显。AlexNet的问世也开启了深度学习在计算机视觉领域的大规模应用。一般我们可以将其看做浅层神经网络和深层神经网络的分界线。当然啦，经典的CNN还是有很多其他的网络的，比如VGG、GoogLeNet、ResNet等等，欢迎大伙儿一起学习使用呀！

Skytier 发表于2022-06-10 09:51:22 2022-06-10 09:51:22 最后回复 Skytier 2022-06-10 09:51:22
715 0

卷积神经网络神经网络
[技术干货] 【论文分享】基于SqueezeNet卷积神经网络的车辆检测

基于SqueezeNet卷积神经网络的车辆检测魏泽发1, 崔华21 长安大学教育技术与网络中心，陕西西安 7100642 长安大学信息工程学院，陕西西安 710064摘要在智能交通系统中，针对车辆目标检测算法可移植性不高、检测速度较慢等问题，提出了一种基于SqueezeNet卷积神经网络的车辆检测方法。通过融合SqueezeNet与SSD（single shot multibox detector）算法的车辆检测方法，在UA-DETRAC数据集上进行训练，实现了车辆目标的快速检测，提升了模型的可移植性，缩短了单帧检测时间。实验结果表明，所提模型在保证准确率的同时，模型单帧检测时间可达22.3 ms，模型大小为16.8 MB，相较于原SSD算法，模型大小减少了约8/9。关键词：智能交通 ; 卷积神经网络 ; SqueezeNet ; 车辆检测1 引言随着智能交通系统的不断发展和完善，实现车辆的精准、快速检测成为智能交通系统中的关键。车辆检测是自动驾驶的重要组成部分，在减少甚至避免交通事故方面具有重要意义。同时，车辆检测可以为交通管理部门提供准确的数据支撑，在交通管制、拥堵检测和信号配时等方面有广泛应用。传统的车辆检测算法需要对图像进行预处理，然后对整幅图像进行滑动窗口遍历操作，通过初步判断车辆目标可能会出现的位置，人工设计车辆目标的某种特征，如常见的方向梯度直方图（HOG,histogram of oriented gradient）特征[1]、尺度不变特征变换（SIFT,scale-invariant feature transform）特征[2]、哈尔特征（Haar-link feature）[3]和加速稳健特征（SURF,speeded up robust feature）[4]等，最后将特征送入支持向量机（SVM,support vector machine）[5]或 Adaboost[6]分类器进行分类，完成检测任务。但是人工设计特征存在很大弊端，在设计过程中会过于依赖以往经验，且算法在陌生场景下的表现效果不好，检测算法的稳健性不强，极大地阻碍了检测算法的应用。随着深度学习在各个领域取得了较大突破，目标检测将面临新的发展机遇。深度学习目标检测算法在检测准确率上有巨大的提升，主要得益于卷积神经网络强大的特征提取能力。卷积神经网络可以自动提取目标中的关键特征信息，不需要人工设计和经验，只需要向网络中传递足够多的图像数据即可，因此，该算法具有更高的稳健性，更适应不同场景，在实际应用中具有较大优势。基于深度学习的目标检测算法主要包括两类，即one-stage方法和two-stage方法。其中，two-stage方法首先需要使用生成算法产生一系列候选框，然后在候选框上进行回归和分类操作，该方法的特点是检测准确率高、检测速度较慢。2014年，Girshick等[7]提出了R-CNN（region-CNN）目标检测算法，利用选择性搜索（selective search）[8]方法生成候选框，然后将候选框送入卷积神经网络提取特征，最后将特征输入 SVM 分类器进行回归运算。为了改善 two-stage 方法中存在的问题，研究人员提出了one-stage 方法，其主要思路是摒弃候选框生成过程，直接利用卷积神经网络在图像数据上进行卷积操作，然后在后续特征图上不断提取信息，最后从提取出的信息中取部分特征层完成最终的检测任务，该方法的检测速度较快，但是检测准确率较低。2016年，YOLO（you only look once）目标检测系列算法[9,10,11]很好地解决了算法的实时性问题，通过将检测和分类两个过程整合为一个过程，在每个特征单元上预测检测框的位置和类别，然后结合图像中的背景信息在整个图像特征上进行预测，虽然检测准确率下降了，但该算法为未来的研究工作提供了很好的思路和方向。SSD检测算法[12]很好地结合了R-CNN目标检测算法和YOLO目标检测系列算法的优势，继承了 R-CNN 算法的 anchor 机制和YOLO算法的回归思想，通过在多个尺度的特征图上生成不同长宽比的候选框，实现对各种尺寸目标的检测。相比于R-CNN目标检测算法和YOLO目标检测系列算法，SSD算法在各个领域中的应用更广泛。本文提出一种基于 SqueezeNet[13]与 SSD 算法融合的车辆目标检测算法，利用轻量级卷积神经网络SqueezeNet的特性，在保证同等检测准确率的同时，大幅度减少模型的参数量，且缩短了模型的单帧检测时间。这为将算法移植到如现场可编程逻辑门阵列（FPGA,field programmable gate array）这类移动开发板上提供了可能，也意味着服务器在同等时间内可以处理更多数据，大幅度提升了服务器的利用效率。2 结束语本文提出了一种基于 SqueezeNet 卷积神经网络的车辆目标检测算法，解决了在智能交通系统中关于车辆目标检测算法可移植性不高、检测速度较慢等问题，该算法通过将SqueezeNet与SSD算法融合，同时根据融合后的模型表现采取针对性改进方式，在保证模型检测准确率的同时，降低网络参数量，缩短模型的单帧检测时间，实现了对车辆目标的精准、快速检测，为模型的移植、开发提供了可能。因此，利用该技术的车辆目标检测算法可以应用于交通摄像头、车载相机等设备拍摄的场景，对自动驾驶以及交通管理部门工作效率的提升具有重要意义。The authors have declared that no competing interests exist.作者已声明无竞争性利益关系。3 原文链接http://www.infocomm-journal.com/wlw/article/2020/2096-3750/2096-3750-4-3-00120.shtml

乔天伊 发表于2022-06-08 08:34:20 2022-06-08 08:34:20 最后回复谭涟漪 2022-06-09 12:46:41
358 7

神经网络交通智能体
[行业资讯] 特斯联取得智能物联网技术最新突破多项研究成果入选国际顶刊

新华财经北京5月12日电（记者吴丛司）记者12日获悉，特斯联近期在智能物联网技术（AIoT）领域取得最新科研成果，主要包括：优化智能物联网的能耗、延时与交互，算力网络的资源管理和任务调度，以及多智体反馈神经网络框架和应用。以上技术突破由特斯联前不久任命的首席科学家杨旸博士带队完成，该科研成果已被IEEE国际学术期刊和国际顶级会议收录。智能物联网的能耗、时延与交互由于蜂窝移动通信系统基础设施的封闭性，以及缺乏有效的现场测量工具，NB-IoT网络的许多重要指标一直以来都没有被深入地研究，例如：无线接入性能和能耗等。基于实际应用场景中完成的扎实研究工作，团队进一步给出了提升智能物联网技术规范和芯片设计方向的优化建议。在工业物联网的应用场景中，无线传感器设备无需铺设专门的有线网络，具有灵活性和可扩展等优势。但是，工业生产环境中复杂时变的无线衰落信道会导致无法预测的随机服务时延和时延抖动，严重降低了工业生产闭环反馈控制系统的性能和稳定性，这是无线传感器设备和无线通信技术应用于高精度、高可靠的自动化工业生产系统的最主要技术挑战。针对工业物联网应用场景中的严苛时延要求，杨旸博士及团队提出了在无线多径衰落信道中对时延分布进行塑形的新方法，通过对原始最优化函数的解耦分析，设计了“双层闭式反馈控制算法（TACAN）”，实现了时延分布方差的最小化，从而显著提高了工业物联网系统的可靠性和稳定性。算力网络的资源管理和任务调度在智能物联网的应用场景中，边缘计算资源的广泛部署可以及时有效地满足终端用户的低时延、强计算、快响应等服务需求。针对复杂多变的无线信道环境和多层次的移动通信网络架构，杨旸博士与团队提出了基于大规模多天线中继节点辅助的多层次算力系统，来增强复杂用户任务的计算能力和效率。多智体反馈神经网络框架和应用杨旸博士及团队提出了“多智体反馈神经网络”（MAFENN）框架，包含三个充分合作的智能体，其中的反馈智能体模拟了灵长类动物大脑中的信号反馈和错误纠正机制，有效提升了神经网络训练过程中的反馈学习能力、特征提取能力、噪声和干扰消除能力。

一览芳华 发表于2022-06-07 22:45:32 2022-06-07 22:45:32 最后回复谭涟漪 2022-06-08 12:38:50
337 8

IoT 神经网络
[调试调优] 使用Mindspore创建神经网络，construct函数的调用，以及无法调试的问题？

【功能模块】MindsopreCell是MindSpore核心编程结构，是构建所有网络的基类，construct函数定义执行的过程，有一些语法限制。【操作步骤&问题现象】1、参照https://education.huaweicloud.com/courses/course-v1:HuaweiX+CBUCNXA030+Self-paced/courseware/72548e98ce8649d793a5f3f5e225b948/c7dffdd1d89b4fc9912748d67c33e1bd/的例子2、class LENET5中函数construct用于创建神经网络,但在代码中看不到调用位置，这样我们无法从逻辑上理解程序的运行过程，该函数有一个参数x，我们如何给它提供实参，即使调试也看不到数据x的维度变化，很难看懂程序，这样无法结合程序理解数据流的变化。【截图信息】【日志信息】（可选，上传日志内容或者附件）

yd_219730538 发表于2022-06-07 08:57:45 2022-06-07 08:57:45 最后回复 yd_219730538 2022-06-21 10:23:06
328 4

神经网络 MindSpore
[执行问题] 【MindSpore产品】【数据处理功能】加入数据增强之后，报出卷积输入类型不同的问题

【功能模块】# 图像增强trans = [ transforms.RandomCrop((32, 32), (4, 4, 4, 4), fill_value=(255,255,255)), # 对图像进行自动裁剪 transforms.RandomHorizontalFlip(prob=0.5), # 对图像进行随机水平翻转 transforms.RandomRotation(degrees=20, fill_value=(255,255,255)), # transforms.HWC2CHW(), # (h, w, c)转换为(c, h, w)]# 下载解压并加载CIFAR-10训练数据集dataset_train = Cifar10(path=data_dir, split='train', batch_size=6, shuffle=True, resize=32, download=True, transform=trans)ds_train = dataset_train.run()model.train(num_epochs, ds_train, callbacks=[ValAccMonitor(model, ds_val, num_epochs)])【操作步骤&问题现象】Traceback (most recent call last): File "F:/8.Learning Task/MindSpore/ResNet/train.py", line 49, in <module> model.train(num_epochs, ds_train, callbacks=[ValAccMonitor(model, ds_val, num_epochs)]) File "D:\Anaconda1\lib\site-packages\mindspore\train\model.py", line 906, in train sink_size=sink_size) File "D:\Anaconda1\lib\site-packages\mindspore\train\model.py", line 87, in wrapper func(self, *args, **kwargs) File "D:\Anaconda1\lib\site-packages\mindspore\train\model.py", line 546, in _train self._train_process(epoch, train_dataset, list_callback, cb_params) File "D:\Anaconda1\lib\site-packages\mindspore\train\model.py", line 794, in _train_process outputs = self._train_network(*next_element) File "D:\Anaconda1\lib\site-packages\mindspore\nn\cell.py", line 586, in __call__ out = self.compile_and_run(*args) File "D:\Anaconda1\lib\site-packages\mindspore\nn\cell.py", line 964, in compile_and_run self.compile(*inputs) File "D:\Anaconda1\lib\site-packages\mindspore\nn\cell.py", line 937, in compile _cell_graph_executor.compile(self, *inputs, phase=self.phase, auto_parallel_mode=self._auto_parallel_mode) File "D:\Anaconda1\lib\site-packages\mindspore\common\api.py", line 1006, in compile result = self._graph_executor.compile(obj, args_list, phase, self._use_vm_mode())TypeError: mindspore\core\utils\check_convert_utils.cc:701 _CheckTypeSame] For primitive[Conv2D], the input type must be same.name:[w]:Ref[Tensor(F32)].name:[x]:Tensor[UInt8].WARNING: Logging before InitGoogleLogging() is written to STDERR[CRITICAL] CORE(22848,1,?):2022-6-6 12:59:53 [mindspore\core\utils\check_convert_utils.cc:701] _CheckTypeSame] For primitive[Conv2D], the input type must be same.name:[w]:Ref[Tensor(F32)].name:[x]:Tensor[UInt8].【日志信息】（可选，上传日志内容或者附件）不知该如何让input的类型相同，求大佬们能看看，给个办法，谢谢！！！总体代码如下：# train.pyfrom mindvision.dataset import Cifar10import mindspore.dataset.vision.c_transforms as transforms# 数据集根目录data_dir = "./datasets"# 图像增强# 图像增强trans = [ transforms.RandomCrop((32, 32), (4, 4, 4, 4), fill_value=(255,255,255)), # 对图像进行自动裁剪 transforms.RandomHorizontalFlip(prob=0.5), # 对图像进行随机水平翻转 transforms.RandomRotation(degrees=20, fill_value=(255,255,255)), # transforms.HWC2CHW(), # (h, w, c)转换为(c, h, w)]# 下载解压并加载CIFAR-10训练数据集dataset_train = Cifar10(path=data_dir, split='train', batch_size=6, shuffle=True, resize=32, download=True, transform=trans)ds_train = dataset_train.run()step_size = ds_train.get_dataset_size()# 下载解压并加载CIFAR-10测试数据集dataset_val = Cifar10(path=data_dir, split='test', batch_size=6, resize=32, download=True)ds_val = dataset_val.run()from mindspore.train import Modelfrom mindvision.engine.callback import ValAccMonitorfrom mindvision.classification.models.head import DenseHeadfrom mindspore import nnfrom ResNet.resnet import resnet50# 定义ResNet50网络network = resnet50(pretrained=True)# 全连接层输入层的大小in_channel = network.head.dense.in_channelshead = DenseHead(input_channel=in_channel, num_classes=10)# 重置全连接层network.head = head# 设置学习率num_epochs = 40lr = nn.cosine_decay_lr(min_lr=0.00001, max_lr=0.001, total_step=step_size * num_epochs, step_per_epoch=step_size, decay_epoch=num_epochs)# 定义优化器和损失函数opt = nn.Momentum(params=network.trainable_params(), learning_rate=lr, momentum=0.9)loss = nn.SoftmaxCrossEntropyWithLogits(sparse=True, reduction='mean')# 实例化模型model = Model(network, loss, opt, metrics={"Accuracy": nn.Accuracy()})# 模型训练model.train(num_epochs, ds_train, callbacks=[ValAccMonitor(model, ds_val, num_epochs)])

章明狼 发表于2022-06-06 13:07:45 2022-06-06 13:07:45 最后回复 yd_216359722 2022-06-20 19:45:32
584 4

神经网络 MindSpore
[技术干货] 【论文分享】基于多特征时空图卷积网络的水运通航密度预测

基于多特征时空图卷积网络的水运通航密度预测董伟, 张磊磊, 金子恒, 孙伟, 高俊波上海海事大学信息工程学院，上海 201306摘要面对港航信息化发展的需求，物联网技术助力我国水运交通感知网络的建设。水运交通大数据分析已成为交通领域研究者和实践者关注的热点。在水运交通中，各港口的通航密度具有非线性、时空相关性和异质性，对其进行精准预测将面临巨大的挑战。提出一种基于多特征时空图卷积网络（MFSTGCN,multi-feature spatio-temporal graph convolution network）的预测方法，解决了水运交通中通航密度的预测问题。MFSTGCN方法从通航量、船舶平均航速和船舶密度3个特征出发，利用空间维图卷积和时间维卷积操作有效捕获通航密度的时空相关性。在某航运平台采集的长江港口船舶自动识别系统（AIS,automatic identification system）数据集上进行实验，结果表明，MFSTGCN 方法的预测效果优于时空图卷积网络（STGCN,spatio-temporal graph convolution network）方法的预测效果。关键词：水运交通 ; 通航密度 ; 时空相关性 ; 图卷积网络 ; 多特征1 引言随着港航管理信息化的快速发展，物联网技术被应用于我国内河通航管理。在“十二五”规划期间，交通运输部组织开展了长三角航道网及京杭大运河水系智能航运信息服务（船联网）应用示范工程[1]。在江苏、浙江和上海地区开展了物联网关键技术研究及攻关，建设内河水运交通感知网络，满足海量数据管理与区域化应用需求。在“十三五”规划期间，我国的智慧交通建设不断发展，水运领域交通大数据的服务水平和决策能力得到大幅度提高。此外，宝船网、船讯网、船队在线（HiFleet）等航运智慧平台的出现是水运交通基础数据和数据交换平台的建设成果，同时表明面向管理服务、决策与智能化应用的智慧水运研究正在不断发展。我国的内河水运交通以内河货运船舶为主，通航密度是指在单位时间内通过某一航道断面的船舶或船队数量，它是水运交通中评价港口和航道通航情况的重要交通量，是一种典型的时空数据，同时在时间维度和空间维度上呈现相关性和异质性。通航密度的预测将为内河码头和航道的规划与建设、船舶航行安全预警和内河码头选址等提供可靠的数据支撑，对智慧水运建设具有重要的现实意义。因此，通航密度预测问题是智慧水运交通的研究热点之一。2 交通量预测的相关研究针对水运通航密度的预测问题，本文提出一种基于深度学习的通航密度预测方法——MFSTGCN模型。从与水运通航密度相关的多个交通量出发，使用基于STGCN的深度学习模型处理水运路网中的空间结构特征和时空相关性，既可以有效融合数据的多特征，又可以有效捕获数据的时空特性。交通量预测是一类典型的时空数据预测问题，不同类别的交通数据内嵌于连续空间，并且随时间发生动态变化。特别地，学者们将深度学习方法用于解决时空数据预测问题，利用卷积神经网络（CNN,convolutional neural network）可以有效提取网格数据的空间特征和交通量的空间特征。从发展历程来看，交通量预测方法可分为基于统计的方法、传统机器学习方法和基于深度学习的方法3类。其中，基于统计的方法包括历史均值（HA,history average）法、自回归积分滑动平均（ARIMA,auto-regressive integrated moving average）法[2]、卡尔曼滤波等；传统机器学习方法包括K近邻算法[3]、支持向量机[4]和随机森林算法等。近年来，深度学习方法被用于解决交通量预测问题，成为水运交通领域研究的热点之一。如何对复杂的时空依赖关系建模将是交通量预测的重点，对于此类时空预测问题，研究工作主要从两个方面展开：1) 将问题视作时序预测类问题，将空间依赖看作是静态的，进而采用图卷积定义空间依赖关系；2) 将时间依赖看作是严格周期性的，以图卷积方法建模动态的空间依赖关系。长短期记忆（LSTM,long short-term memory）网络以其端到端建模、易于映入外生变量和自动特征抽取的特点，成为一种流行的时间序列建模框架。Ma 等[5]最先将 LSTM 网络应用于交通领域，借助道路交通的传感器数据预测未来的道路交通速度。之后，Ma等[6]提出了一种基于CNN的交通速度预测方法，将交通网络作为图像进行学习，并对大规模、全网范围内的交通速度进行预测。Liu等[7]考虑交通流数据的时间特征、空间特征和周期性特征，结合 CNN 和 LSTM 网络生成一个Conv-LSTM模块，用于提取交通流的时空特征，然后使用 Bi-LSTM（Bi-directional long short-term memory）技术提取交通流的周期特征。Yao等[8]提出了一种时空动态网络（STDN,spatial-temporal dynamic network），基于局部CNN门控机制对空间位置之间的动态相似性进行建模，并使用周期性注意力转移机制处理长期的周期性时间转移。Li等[9]借鉴循环神经网络（RNN,recurrent neural network）提出扩散卷积递归神经网络（DCRNN,diffusion convolutional recurrent neural network），在有向图上对交通流以扩散形式进行建模，同时集成了交通流中的空间与时间依赖。其他基于 RNN 的研究工作包括时空多图卷积神经网络（STMGCN,spatiotemporal multi-graph convolution network）[10]、时间图卷积神经网络（T-GCN,temporal graph convolution network）[11]、图注意力长短期记忆（GATLSTM,graph attention long short-term memory）网络[12]、基于特征的长短期记忆（FBLSTM,feature based long short-term memory）网络[13]、时空循环卷积网络（SRCN,spatiotemporal recurrent convolutional network）[14]。Yu等[15]提出了STGCN解决交通领域的时间序列预测问题，没有使用常规的CNN和RNN单元，而是将问题用图表示出来，并建立具有完整卷积结构的模型，使得模型训练速度更快、参数更少。STGCN 模型通过对多尺度交通网络的建模，有效地捕获了时空相关性。冯宁等[16]在STGCN模型的基础上，结合交通流量的周期特征，提出了多组件STGCN，通过3个组件分别建模流量数据的近期、日周期、周周期特性，并相继提出时空注意力机制图卷积网络（ASTGCN,attention spatial-temporal graph convolutional network）[17]和时空同步图卷积网络（STSGCN,spatial-temporal synchronous graph convolutional network）[18]。ASTGCN利用空间注意力机制捕捉不同位置之间的动态空间相关性；STSGCN以路网结构为基础，将多个近邻时间步的空间图连接起来，使用图卷积方法捕获复杂的局部时空相关性，同时针对时空网络序列的不同部分使用相互独立的组件对时空异质性进行建模。Diao等[19]针对空间依赖关系会随时间变化的问题提出图卷积神经网络（GCNN,graph convolution neural network），其核心是对拉普拉斯矩阵进行动态分析，将张量分解融入深度学习框架，将实时交通数据分解为一个稳定的、依赖于长期时空关系的全局分量和一个捕捉短期波动的局部分量。目前，交通量预测问题在道路交通领域已取得丰硕的研究成果，但是在目标主体、数据采集方式和领域特征方面，水运交通与道路交通有一定区别。1) 道路交通的主体是车辆，水运交通的主体是运输船舶，而不同类型的船舶在船舶长度和航速上存在较大差异，单个主体之间的差异将影响交通量预测的准确性。2) 在道路交通中，采集的交通量通常比较密集，交通量具有平稳性，并有明显的周期性和趋势性；水运交通受采集手段（如AIS发送频率与船速相关）、气象水文和通航状态（如停航、施工）等因素的影响大，交通量的误差大、时间间隔长、波动性大，表现出非平稳性和周期性不显著等特征。因此，水运交通的交通量预测更具挑战性。本文考虑水运交通的通航密度受船舶自身属性影响较大，不能准确反映交通规律。将通航密度、船舶的平均航速与船舶密度相关特征结合起来，建立多特征的通航密度预测模型，克服单个主体之间差异的难点，并可以在一定程度上解决水运交通中交通量预测的非平稳性和周期性不显著的问题。3 结束语本文从水运交通中交通量的特点出发，提出了一种基于MFSTGCN的水运通航密度预测方法。该方法结合图卷积和标准卷积构造时空卷积块来同时捕获交通数据的时空特性，并将通航密度、船舶密度和平均船速等多个特征应用于预测模型，解决了水运交通量非平稳、随机性强和周期性不显著等特征造成的预测准确率低的问题。通过内河水运船舶AIS数据集上的实验，验证了本文所提模型在预测准确率上优于其他对比模型，表明该模型在捕获时空特征及时空相关性方面具有一定优势。本文探索了图卷积网络在水运交通领域中的应用，对智能水运交通的发展具有重要的现实意义。The authors have declared that no competing interests exist.作者已声明无竞争性利益关系。4 原文链接http://www.infocomm-journal.com/wlw/article/2020/2096-3750/2096-3750-4-3-00078.shtml

乔天伊 发表于2022-06-06 08:33:19 2022-06-06 08:33:19 最后回复宅肥 2022-06-06 21:58:40
249 4

神经网络
[调试调优] mindspore情感分析时RNN网络搭建出错

【功能模块】在参考https://gitee.com/mindspore/docs/blob/r1.1/tutorials/training/source_zh_cn/advanced_use/nlp_sentimentnet.md#%E4%BD%BF%E7%94%A8sentimentnet%E5%AE%9E%E7%8E%B0%E6%83%85%E6%84%9F%E5%88%86%E7%B1%BB进行情感分类实战训练时，想要把lstm网络改为rnn网络【操作步骤&问题现象】在查看mindsprore文档后发现nn.RNN和nn.LSTM的区别在于LSTM比RNN多一个参数c，把代码中的所有c删除后训练时出现函数参数个数不匹配的原因，但本人水平有限，没有找到具体哪里导致的这个原因。【截图信息】修改后代码如下：# 定义需要单层LSTM小算子堆叠的设备类型。 STACK_LSTM_DEVICE = ["CPU"] # 短期内存（h）和长期内存（c）初始化为0 # 定义lstm_default_state函数来初始化网络参数及网络状态。 def lstm_default_state(batch_size, hidden_size, num_layers, bidirectional): """初始化默认输入.""" num_directions = 2 if bidirectional else 1 h = Tensor(np.zeros((num_layers * num_directions, batch_size, hidden_size)).astype(np.float32)) #c = Tensor(np.zeros((num_layers * num_directions, batch_size, hidden_size)).astype(np.float32)) return h def stack_lstm_default_state(batch_size, hidden_size, num_layers, bidirectional): """init default input.""" num_directions = 2 if bidirectional else 1 h_list = [] for _ in range(num_layers): h_list.append(Tensor(np.zeros((num_directions, batch_size, hidden_size)).astype(np.float32))) #c_list.append(Tensor(np.zeros((num_directions, batch_size, hidden_size)).astype(np.float32))) h= tuple(h_list) return h# 针对不同的场景，自定义单层LSTM小算子堆叠，来实现多层LSTM大算子功能。 class StackRNN(nn.Cell): """ Stack multi-layers LSTM together. """ def __init__(self, input_size, hidden_size, num_layers=3, has_bias=True, batch_first=False, dropout=0.0, bidirectional=True): super(StackRNN, self).__init__() self.num_layers = num_layers self.batch_first = batch_first self.transpose = ops.Transpose() # direction number num_directions = 2 if bidirectional else 1 # input_size list input_size_list = [input_size] for i in range(num_layers - 1): input_size_list.append(hidden_size * num_directions) # layers layers = [] for i in range(num_layers): layers.append(nn.RNNCell(input_size=input_size_list[i], hidden_size=hidden_size, has_bias=has_bias, )) # weights weights = [] for i in range(num_layers): # weight size weight_size = (input_size_list[i] + hidden_size) * num_directions * hidden_size * 4 if has_bias: bias_size = num_directions * hidden_size * 4 weight_size = weight_size + bias_size # numpy weight stdv = 1 / math.sqrt(hidden_size) w_np = np.random.uniform(-stdv, stdv, (weight_size, 1, 1)).astype(np.float32) # lstm weight weights.append(Parameter(initializer(Tensor(w_np), w_np.shape), name="weight" + str(i))) # self.lstms = layers self.weight = ParameterTuple(tuple(weights)) print(1) def construct(self, x, hx): """construct""" print(2) if self.batch_first: x = self.transpose(x, (1, 0, 2)) # stack lstm h= hx hn= None for i in range(self.num_layers): x, hn, _, _ = self.lstms[i](x, h[i], self.weight[i]) if self.batch_first: x = self.transpose(x, (1, 0,2)) return x, (hn)其他部分未作修改【日志信息】（可选，上传日志内容或者附件）

mfangf 发表于2022-06-04 15:56:10 2022-06-04 15:56:10 最后回复 yd_216359722 2022-06-20 20:32:09
563 4

神经网络 MindSpore
[技术干货] 卷积基本知识总结

高斯核中方差越大则中间自己的权重就变小。高斯核尺寸越大参与计算的面积就越大则就越受到周围像素的影响更多请参考：https://www.bilibili.com/video/BV1V54y1B7K3?p=7

恋上钢琴的虫 发表于2022-06-04 11:47:43 2022-06-04 11:47:43 最后回复多米诺的古牌 2022-06-19 20:41:18
221 1

神经网络
[执行问题] mindspore情感分析时RNN网络搭建出错

【功能模块】在参考https://gitee.com/mindspore/docs/blob/r1.1/tutorials/training/source_zh_cn/advanced_use/nlp_sentimentnet.md#%E4%BD%BF%E7%94%A8sentimentnet%E5%AE%9E%E7%8E%B0%E6%83%85%E6%84%9F%E5%88%86%E7%B1%BB进行情感分类实战训练时，想要把lstm网络改为rnn网络【操作步骤&问题现象】在查看mindsprore文档后发现nn.RNN和nn.LSTM的区别在于LSTM比RNN多一个参数c，把代码中的所有c删除后训练时出现函数参数个数不匹配的原因，但本人水平有限，没有找到具体哪里导致的这个原因。【截图信息】修改后代码如下：# 定义需要单层LSTM小算子堆叠的设备类型。 STACK_LSTM_DEVICE = ["CPU"] # 短期内存（h）和长期内存（c）初始化为0 # 定义lstm_default_state函数来初始化网络参数及网络状态。 def lstm_default_state(batch_size, hidden_size, num_layers, bidirectional): """初始化默认输入.""" num_directions = 2 if bidirectional else 1 h = Tensor(np.zeros((num_layers * num_directions, batch_size, hidden_size)).astype(np.float32)) #c = Tensor(np.zeros((num_layers * num_directions, batch_size, hidden_size)).astype(np.float32)) return h def stack_lstm_default_state(batch_size, hidden_size, num_layers, bidirectional): """init default input.""" num_directions = 2 if bidirectional else 1 h_list = [] for _ in range(num_layers): h_list.append(Tensor(np.zeros((num_directions, batch_size, hidden_size)).astype(np.float32))) #c_list.append(Tensor(np.zeros((num_directions, batch_size, hidden_size)).astype(np.float32))) h= tuple(h_list) return h# 针对不同的场景，自定义单层LSTM小算子堆叠，来实现多层LSTM大算子功能。 class StackRNN(nn.Cell): """ Stack multi-layers LSTM together. """ def __init__(self, input_size, hidden_size, num_layers=3, has_bias=True, batch_first=False, dropout=0.0, bidirectional=True): super(StackRNN, self).__init__() self.num_layers = num_layers self.batch_first = batch_first self.transpose = ops.Transpose() # direction number num_directions = 2 if bidirectional else 1 # input_size list input_size_list = [input_size] for i in range(num_layers - 1): input_size_list.append(hidden_size * num_directions) # layers layers = [] for i in range(num_layers): layers.append(nn.RNNCell(input_size=input_size_list[i], hidden_size=hidden_size, has_bias=has_bias, )) # weights weights = [] for i in range(num_layers): # weight size weight_size = (input_size_list[i] + hidden_size) * num_directions * hidden_size * 4 if has_bias: bias_size = num_directions * hidden_size * 4 weight_size = weight_size + bias_size # numpy weight stdv = 1 / math.sqrt(hidden_size) w_np = np.random.uniform(-stdv, stdv, (weight_size, 1, 1)).astype(np.float32) # lstm weight weights.append(Parameter(initializer(Tensor(w_np), w_np.shape), name="weight" + str(i))) # self.lstms = layers self.weight = ParameterTuple(tuple(weights)) print(1) def construct(self, x, hx): """construct""" print(2) if self.batch_first: x = self.transpose(x, (1, 0, 2)) # stack lstm h= hx hn= None for i in range(self.num_layers): x, hn, _, _ = self.lstms[i](x, h[i], self.weight[i]) if self.batch_first: x = self.transpose(x, (1, 0,2)) return x, (hn)其他部分未作修改【日志信息】（可选，上传日志内容或者附件）

mfangf 发表于2022-06-03 19:58:11 2022-06-03 19:58:11 最后回复埼玉 2022-06-06 09:32:13
448 2

神经网络 MindSpore
[其他] Fire-YOLO：一种用于火灾检测的小目标检测方法

文章来源于当交通遇上机器学习，作者CY1.文章信息论文链接：https://www.mdpi.com/2071-1050/14/9/4930/htm2.摘要针对森林火灾图像中小目标、类火目标和类烟目标的检测，以及不同自然光下的火灾检测，提出了一种改进的Fire-YOLO深度学习算法。Fire-YOLO检测模型从三维扩展了特征提取网络，增强了火灾小目标识别的特征传播，提高了网络性能，减少了模型参数。进一步，通过特征金字塔的提升，得到了性能最好的预测框。与最先进的目标检测网络相比，Fire-YOLO取得了优异的结果，尤其是在火灾和烟雾的小目标检测方面。总体而言，Fire-YOLO检测模型可以有效地处理小火源目标、类火和类烟目标的检测。当输入图像尺寸为416 × 416分辨率时，平均检测时间为0.04 s /帧，可以提供实时的森林火灾检测。此外，文章提出的算法也可以应用于其他复杂情况下的小目标检测。3.简介火灾探测对于保护森林资源、保护人民生命财产至关重要。近年来，随着火灾图像探测成为研究热点，图像探测具有探测时间早、精度高、系统安装灵活、能有效探测大空间复杂建筑结构火灾等优点。一类方法基于火灾发生时的颜色识别，但基于颜色的方法对亮度和阴影非常敏感。因此，这些方法产生的假警报数量很高。随着机器学习的发展，深度学习技术已广泛应用于检测。有学者提出了一种使用微调卷积神经网络（CNN）的早期火灾探测框架，但该模型具有较高的计算成本。有的学者使用深度融合CNN进行烟雾探测，它结合了注意机制、特征级和决策级融合模块。然而，仍有一些小目标未能实现。有的学者使用了一种基于区域的快速卷积神经网络（R-CNN），根据空间特征检测可疑火灾区域（SRoF）和非火灾区域。这可以通过减少错误探测成功地提高火灾探测精度，但探测速度相对较慢。有的学者提出了一种基于YOLO-V3和YOLO-V4的森林烟雾检测算法。与YOLO-V4相比，YOLO-V3的模型更小，更易于部署。在此基础上，文章选择了YOLO-V3模型作为整体算法，并对其进行了改进。提出了对YOLO-V3算法的改进。网络中加入了空心卷积和DenseNet，提高了火灾早期小规模火焰的探测效果。然而，方法存在火焰定位不准确和屏蔽性能差的问题。I-YOLOv3-tiny模型通过网络结构优化、多尺度融合和K-均值聚类来提高检测精度，但检测速度有待提高。通过提高特征图的分辨率，它减少了火灾探测中的误差，但由于计算量的增加，相应的处理时间也增加了。将分类模型和目标检测模型结合用于火灾探测的方法降低了计算成本，提高了探测精度。尽管如此，它不适用于火灾早期小目标的探测场景。有的学者通过将原始网络结构中的两步降采样卷积网络替换为图像双分割和双线性上采样网络，扩大了小目标的特征，提高了小目标的检测精度。虽然这会增加参数的数量，但计算成本也会增加。对于具有实时性要求的火灾探测，仍需进一步改进。这些问题给火灾场景中小目标的检测带来了巨大的挑战。4.模型A. YOLO-V3YOLO- v3是由YOLO和YOLOV2网络演化而来的对象检测模型。与Faster R-CNN相比，YOLO- v3是单级检测算法，这意味着YOLO网络不需要Regional Proposal network (RPN)，而是直接检测图像中的目标。这样既考虑了检测速度和检测精度，又减小了模型参数的尺寸。YOLO-V3对每个类别独立使用逻辑回归，取代了DarkENT-19到DarkENT-53的特征提取网络。YOLO-V3几乎与其他目标检测算法一样精确，但速度至少是后者的两倍。YOLO-V3的特征提取网络为Darknet-53。Darknet-53通过不断地使用卷积、标准化、池化等操作，提取输入到YOLO-V3网络的火灾图像的特征，并通过卷积不断地对火灾图像进行特征提取。这种方法广泛应用于其他各种网络模型中，ResNet也通过增加网络的深度来提高网络的精度。虽然可以同时缩放两个或三个维度，但由于深度和宽度之间有一定的关系，需要进行复杂的手动调整，也就是说只能调整深度和宽度才能达到更好的精度。目前，YOLO-V3模型在火灾探测中并未得到广泛应用。B.Fire-YOLOFire-YOLO是一种单阶段检测模型。FireYOLO用于火灾探测的步骤如下所示。首先,网络输入火灾图像分为S×S网格,和检测在每个探测单元格:是否有火焰或者烟雾的中心目标是发现落在S2的网格,网格负责检测目标被检测出来。然后，每个网格预测3个边界框，并给出这些边界框的置信度。置信计算的定义如下。当目标落在网格中时Pγ = 1，否则Pγ = 0。IoU表示预测边界框与真实边界框的重合。置信度反映了网格中是否存在对象以及包含对象时预测边界框的准确性。当多个包围盒同时检测到同一目标时，YOLO网络将使用非最大抑制(Non-Maximum Suppression, NMS)方法选择最佳包围盒。利用卷积神经网络对视频中的火情和烟雾进行分类来检测火情，具有良好的准确率。文章提出的Fire-YOLO模型从深度、宽度和分辨率三个维度考虑，实现了更加均衡的网络架构。Fire-YOLO火灾探测步骤如下图所示。将输入图像划分为S×S网格，每个网格预测三个边界框和置信度分数。然后，使用非最大值抑制方法选择最佳边界框。Effentnet的提出为设计一种标准化的卷积神经网络尺度方法提供了可能。通过平衡网络深度、宽度和分辨率这三个维度，可以在深度、宽度和分辨率这三个维度上实现更均衡的网络架构，而无需复杂的人工调整。由于火灾数据集中大量的检测对象为小火焰和烟雾，这种简单高效的复合尺度变换方法相对于其他的一维尺度变换方法可以进一步提高火灾的检测精度，并能充分节约计算资源。最终，文章使用的改进后的Effentnet比精度相同的卷积神经网络速度更快，参数更少，模型更小，具有明显的优势。提出的Fire-YOLO火灾探测模型网络结构如下图所示。与YOLO-V3中特征提取网络Darknet53中使用的残块不同，Fire-YOLO的特征提取网络使用了一个移动倒瓶颈卷积(MBConv)，该卷积由深度卷积和挤压-激活网络(SENet)组成。MBConv块的结构,最重要的是,一个1×1卷积内核用于增加图像的维数,接下来通过切除卷积和SENet反过来,最后用1×1卷积内核来减少图像的维数输出。输入图像经过特征提取网络并上采样后，得到对应的特征图，即图像对应的向量特征矩阵。为了获得小目标的高层特征信息，特征图将经过卷积集处理，卷积集由5个卷积层组成，卷积核交替为1 × 1和3 × 3。然后利用池化层将高维向量扁平化为一维向量，由激活函数进行处理。将这些向量输入到激活函数中，得到相应的分类结果，并选择最有可能的结果作为特征提取网络输出。针对Darknet-53特征提取网络在深度、宽度和分辨率三个维度平衡方面的性能缺陷，文章在文章提出的fire数据集上使用改进的Effecentnet特征提取网络，弥补了Darknet-53在小目标检测方面的性能不足，提高了小目标检测的特征提取能力。对于输入的小目标图像，增强了小目标特征的学习能力，提高了小目标特征提取网络的性能。为了更好地处理小目标图像，Fire-YOLO模型首先将输入图像缩放到416 × 416像素，然后使用Effecentnet从图像中提取特征。经过多层的深度可分卷积、全局平均池化、特征压缩和特征扩展，对深度可分卷积学习到的特征映射进行上采样。通过特征金字塔处理得到不同尺度的预测框。文章提出的Fire-YOLO模型预测了13 × 13、26 × 26、52 × 52三种不同尺度的边界盒。用于小目标检测的深度可分离卷积结合了逐条通道卷积和逐级点卷积两种级别，提取不同粒度的小目标特征。深度可分卷积的结构如下图所示。通过比较YOLO-V3中使用的Darknet-53特征提取网络、快速R-CNN中使用的RPN目标建议网络和Fire YOLO中使用的深度可分离卷积，发现深度可分离卷积在计算复杂度方面具有优异的性能。这种卷积结构加快了模型的训练速度，提高了模型的检测精度。在火灾探测模型的实际应用中，可以加快网络的处理速度，如果计算量较小，可以达到实时图像处理的目的，从而实现火灾危险的实时探测。同时，该模型的硬件要求也降低了，以便于部署。SENet主要由两个阶段组成。第一个阶段是挤压阶段。第二个阶段是激发阶段。在获得挤压的矢量后，使用完全连接的层，并预测每个通道的重要性。随后，将其应用于与初始特征映射相对应的信道，以便小目标的特征信息将被赋予更高的优先级。SENet的结构如下图所示。在深度学习网络模型中，激活函数是一个连续可导的非线性函数，可以拟合非线性关系。激活函数及其导数的形式比较简单，可以加快网络的学习速度。正确使用激活函数对模型的训练和模型对目标预测的准确性都具有重要意义。活化函数的导数不宜过大或过小，最好稳定在1左右。文章提出的模型使用了Swish激活函数，其表达式为：其中β是常数或可训练参数。Swish具有无上界、无下界、光滑、非单调的特点。Swish在深度模式上比ReLU要好。乙状结肠的饱和函数很容易导致梯度的消失,借鉴ReLU的影响,当它是非常大的,它将方法,但当x→∞,函数的一般趋势比ReLU ReLU相似但更复杂。Swish函数可以看作是一个介于线性函数和ReLU函数之间的平滑函数。C. 性能指标文章利用训练后的Fire-YOLO模型对测试图像进行一系列实验，验证算法的性能。评价神经网络模型有效性的相关指标有:precision, recall, F1, AP值。在二元分类问题中，根据真类别和预测类别的组合，样本可分为四种类型:真阳性(TP)、假阳性(FP)、真阴性(TN)和假阴性(FN)。分类结果的混淆矩阵如下表所示。其余指标的公式根据混淆矩阵计算如下：5.实验分析本节介绍训练网络的实验环境、数据集、模型效果评价指标以及实验结果分析。通过一系列不同模型的对比实验，分析了文章提出的新模型的优越性。实验过程中使用了火数据集和小目标数据集。通过fire数据集对目标检测网络的准确性进行了验证和评估，在不同光照条件、类火烟雾目标等复杂环境下具有良好的检测效果;在小目标火力数据集上验证了该检测方法。结果证实，Fire-YOLO更容易检测到较小的目标。Fire-YOLO检测模型接收416 × 416像素图像作为输入，由于GPU性能限制，批处理大小设为8，每个模型训练100 epoch，初始学习速率为10−3，50 epoch后除以10。A. 数据采集实验中使用的数据集是通过采集消防公益平台上的消防图片来构建的。将fire数据集和小目标数据集分别划分为训练集、验证集和测试集，以便在相同的实验设置下对不同的模型进行训练。第一个数据集为火焰数据集，文章使用的图像数据是公共网站上收集的火灾和烟雾图像。这19819张原始图像包括不同天气和光线线下的火焰和烟雾。在对以上数据集图像进行编号后，使用LabelImg工具进行手动标记，包括绘制边框和分类类别。考虑到标签与数据的对应关系，为保证数据集分布均匀，将数据集按70%、20%、10%的比例随机分为训练集、验证集和测试集。为了保证实验环境相同，最终数据集以PASCAL VOC数据集格式存储。为了防止神经网络中过拟合，对于像素区域不清晰的阳性样本不进行标记。完成的数据集如下表所示。第二个数据集为小目标检测数据集，文章自制了370张图像的数据集。数据集的内容都是包含小目标的火焰和烟雾。通过将250 × 250像素的火焰图像嵌入到1850 × 1850像素的图像中，可以使被探测目标在图像中的面积非常小。最后使用LabelImg工具手工标注小目标。B. 算法的比较分析为了验证模型的性能，文章使用火焰和烟雾图像作为训练集。将所提出的模型与YOLO-V3和Faster R-CNN检测方法进行了比较。三种模型在试验过程中的P-R曲线如图5所示。准确率、召回率、F1评分和mAP值如下表所示。基于以上结果，文章提出的Fire-YOLO在检测性能上优于YOLO-V3和Faster R-CNN。Fire-YOLO模型的精度为0.915,F1的值为0.73,mAP的值为0.802，高于其他两个模型，体现了该模型的优越性。同时Fire-YOLO降低了计算成本，节约了资源，更有利于社会的可持续发展。C. 小目标的检测性能在火灾探测过程中，由于摄像机离火源太远，实际的火源位置在捕获的图像中只占很小的区域，这将导致网络模型对火焰和烟雾的探测非常差。通过比较三种不同的目标检测模型在小目标火灾数据集上的准确率、召回率和mAP，可以得出文章提出的Fire-YOLO模型对非常小的目标对象的检测效率优于Faster R-CNN和未改进的YOLO-V3网络。训练于射击小目标数据集的Fire-YOLO对待检测小目标图像在深度、宽度和分辨率三个维度上进行自适应调整，增强了信息之间的交互作用。从而增强了Fire-YOLO提取小目标特征的能力，提高了小目标物体的检测精度。下表给出了三种模型方法对小目标射击数据集评价指标的具体结果。三种不同模型对小目标火力数据集的检测效率差异较大。文章提出的Fire-YOLO模型的准确率和召回率比其他模型更显著。准确率可达75.48%，可实现对小目标的检测。森林火灾的早期及时发现可以大大减少对生态环境的破坏，减少火灾造成的经济损失，促进生态环境的可持续发展。训练后Fire-YOLO网络模型具有良好的火力目标探测效率。文章使用Fire-YOLO模型来检测非常小的火力目标，并将检测结果图形化显示。较小的射击目标是小目标射击数据集中验证数据集中的所有图像。对Fire-YOLO进行了30多个验证插图的验证，最终的图像检测结果如下图所示。Fire-YOLO可以检测到图片中所有的火和烟，而YOLO-V3和Faster R-CNN在检测结果中只能检测到图像中的部分目标。D. 类火和类烟目标的探测性能通过对比模型对丰富的类火和类烟图像的检测性能，可以发现Fire-YOLO对类火和类烟目标具有更好的检测效率。除了Fire-YOLO，其他模型分别将图像中的光和云误判为火和烟。显然，Fire-YOLO对图像纹理特征更加敏感，这是由于在特征提取网络中结合了1 × 1卷积核和SE模块。最后，提高了该模型在探测混淆目标时的鲁棒性。三种模型的类火和类烟检测结果如下图所示。在上述情况下，Fire-YOLO模型大大减少了误检的发生，减少了劳动力消耗，节约了社会资源。E. 模型在不同自然光下的检测性能本节通过对比不同自然光照条件下的多幅火灾图像，测试Fire-YOLO在真实环境中的性能。在实际火灾探测现场，会出现光线不足或光线很强的情况。在这种场景下，会对火灾探测产生一定的影响。使用大尺度feature map对模型进行改进，识别小目标对象，但在弱光条件下存在误判。检测结果如下图所示。通过比较FasterR-CNN、YOLO-V3和Fire-YOLO模型的检测性能，结果表明该模型在不同光照条件下具有良好的性能，对光照变化具有较强的鲁棒性。Fire-YOLO模式的这些优势可以减少火灾对森林的危害，减少温室效应对人类的影响，促进可持续发展文章提出的Fire- YOLO模型在小目标、类火、类烟探测以及不同明度下的火灾探测等方面都取得了令人满意的效果。在实际应用中，该方法不仅具有实时性，而且具有良好的鲁棒性。然而文章检测算法仍然存在检测精度低、检测半遮挡目标具有挑战性的问题。这可能是由于在实际环境中探测火焰时，火灾的可变性和火灾蔓延的复杂性，造成了火灾检查的困境，如下图所示。.

@Wu 发表于2022-05-31 15:30:18 2022-05-31 15:30:18 最后回复 @Wu 2022-05-31 15:30:18
251 0

图像处理人工智能神经网络
[其他] 网络结构创新在医学图像分割中的应用

2.1 基于模型压缩的分割方法为了实现实时处理高分辨率的2D/3D医学图像（例如CT、MRI和组织病理学图像等），研究人员提出了多种压缩模型的方法。weng等人利用NAS技术应用于U-Net网络，得到了在CT，MRI和超声图像上具有更好的器官/肿瘤分割性能的小型网络。Brugger通过利用组归一化（group normalization ）和Leaky-ReLU（leaky ReLU function），重新设计了U-Net架构，以使网络对3D医学图像分割的存储效率更高。也有人设计了参数量更少的扩张卷积module。其他一些模型压缩的方法还有权重量化（十六位、八位、二值量化）、蒸馏、剪枝等等。 2.2 编码-解码结构的分割方法 Drozdal提出了一种在将图像送入分割网络之前应用简单的CNN来对原始输入图像进行归一化的方法，提高了单子显微镜图像分割、肝脏CT、前列腺MRI的分割精度。Gu提出了在主干网络利用扩张卷积来保留上下文信息的方法。Vorontsov提出了一种图到图的网络框架，将具有ROI的图像转换为没有ROI的图像（例如存在肿瘤的图像转换为没有肿瘤的健康图像），然后将模型去除的肿瘤添加到新的健康图像中，从而获得对象的详细结构。Zhou等人提出了一种对U-Net网络的跳跃连接重新布线的方法，并在胸部低剂量CT扫描中的结节分割，显微镜图像中的核分割，腹部CT扫描中的肝脏分割以及结肠镜检查视频中的息肉分割任务中测试了性能。Goyal将DeepLabV3应用到皮肤镜彩色图像分割中，以提取皮肤病变区域。 2.3 基于注意力机制的分割方法 Nie提出了一种注意力模型，相比于baseline模型（V-Net和FCN），可以更准确地分割前列腺。SinHa提出了一种基于多层注意力机制的网络，用于MRI图像腹部器官分割。Qin等人提出了一个扩张卷积模块，以保留3D医学图像的更多细节。其他基于注意力机制的啼血图像分割论文还有很多。 2.4 基于对抗学习的分割网络 Khosravan提出了从CT扫描中进行胰腺分割的对抗训练网络。Son用生成对抗网络进行视网膜图像分割。Xue使用全卷积网络作为生成对抗框架中的分割网络，实现了从MRI图像分割脑肿瘤。还有其他一些成功应用GANs到医学图像分割问题的论文，不再一一列举。 2.5 基于RNN的分割模型递归神经网络（RNN）主要用于处理序列数据，长短期记忆网络（LSTM）是RNN的一个改进版本，LSTM通过引入自环（self-loops）使得梯度流能长期保持。在医学图像分析领域，RNN用于对图像序列中的时间依赖性进行建模。Bin等人提出了一种将全卷积神经网络与RNN融合的图像序列分割算法，将时间维度上的信息纳入了分割任务。Gao等人利用CNN和LSTM拉对脑MRI切片序列中的时间关系进行建模，以提高4D图像中的分割性能。Li等人先用U-Net获得初始分割概率图，后用LSTM从3D CT图像中进行胰腺分割，改善了分割性能。其他利用RNN进行医学图像分割的论文还有很多，不再一一介绍。 2.6 小结这部分内容主要是分割算法在医学图像分割中的应用，所以创新点并不多，主要还是对不同格式（CT还是RGB，像素范围，图像分辨率等等）的数据和不同部位数据的特点（噪声、对象形态等等），经典网络需要针对不同数据进行改进，以适应输入数据格式和特征，这样能更好的完成分割任务。虽然说深度学习是个黑盒，但整体上模型的设计还是有章可循的，什么策略解决什么问题、造成什么问题，可以根据具体分割问题进行取舍，以达到最优的分割性能。

@Wu 发表于2022-05-31 15:11:35 2022-05-31 15:11:35 最后回复 @Wu 2022-05-31 15:11:35
248 0

神经网络
[其他] 适合新手的深度学习综述（5）--深度神经网络

在本节中，我们将简要地讨论深度神经网络 (DNN)，以及它们最近的改进和突破。神经网络的功能与人脑相似。它们主要由神经元和连接组成。当我们说深度神经网络时，我们可以假设有相当多的隐藏层，可以用来从输入中提取特征和计算复杂的函数。Bengio(2009) 解释了深度结构的神经网络，如卷积神经网络 (CNN)、自编码器 (AE) 等及其变体。Deng 和 Yu(2014) 详细介绍了一些神经网络架构，如 AE 及其变体。Goodfellow 等 (2016) 对深度前馈网络、卷积网络、递归网络及其改进进行了介绍和技巧性讲解。Schmidhuber(2014) 提到了神经网络从早期神经网络到最近成功技术的完整历史。5.1 深度自编码器自编码器 (AE) 是神经网络 (NN)，其中输出即输入。AE 采用原始输入，编码为压缩表示，然后解码以重建输入。在深度 AE 中，低隐藏层用于编码，高隐藏层用于解码，误差反向传播用于训练.。5.1.1 变分自编码器变分自动编码器 (VAE) 可以算作解码器。VAE 建立在标准神经网络上，可以通过随机梯度下降训练 (Doersch,2016)。5.1.2 多层降噪自编码器在早期的自编码器 (AE) 中，编码层的维度比输入层小（窄）。在多层降噪自编码器 (SDAE) 中，编码层比输入层宽 (Deng and Yu, 2014)。5.1.3 变换自编码器深度自动编码器 (DAE) 可以是转换可变的，也就是从多层非线性处理中提取的特征可以根据学习者的需要而改变。变换自编码器 (TAE) 既可以使用输入向量，也可以使用目标输出向量来应用转换不变性属性，将代码引导到期望的方向 (Deng and Yu,2014)。5.2 深度卷积神经网络四种基本思想构成了卷积神经网络 (CNN)，即：局部连接、共享权重、池化和多层使用。CNN 的第一部分由卷积层和池化层组成，后一部分主要是全连接层。卷积层检测特征的局部连接，池层将相似的特征合并为一个。CNN 在卷积层中使用卷积而不是矩阵乘法。Krizhevsky 等人 (2012) 提出了一种深度卷积神经网络 (CNN) 架构，也称为 AlexNet，这是深度学习 (Deep Learning, DL) 的一个重大突破。网络由 5 个卷积层和 3 个全连接层组成。该架构采用图形处理单元 (GPU) 进行卷积运算，采用线性整流函数 (ReLU) 作为激活函数，用 Dropout 来减少过拟合。Iandola 等人 (2016) 提出了一个小型的 CNN 架构，叫做「SqueezeNet」。Szegedy 等人 (2014) 提出了一种深度 CNN 架构，名为 Inception。Dai 等人 (2017) 提出了对 Inception-ResNet 的改进。Redmon 等人 (2015) 提出了一个名为 YOLO (You Only Look Once) 的 CNN 架构，用于均匀和实时的目标检测。Zeiler 和 Fergus (2013) 提出了一种将 CNN 内部激活可视化的方法。Gehring 等人 (2017) 提出了一种用于序列到序列学习的 CNN 架构。Bansal 等人 (2017) 提出了 PixelNet，使用像素来表示。Goodfellow 等人 (2016) 解释了 CNN 的基本架构和思想。Gu 等人 (2015) 对 CNN 的最新进展、CNN 的多种变体、CNN 的架构、正则化方法和功能以及在各个领域的应用进行了很好的概述。5.2.1 深度最大池化卷积神经网络最大池化卷积神经网络 (MPCNN) 主要对卷积和最大池化进行操作，特别是在数字图像处理中。MPCNN 通常由输入层以外的三种层组成。卷积层获取输入图像并生成特征图，然后应用非线性激活函数。最大池层向下采样图像，并保持子区域的最大值。全连接层进行线性乘法。在深度 MPCNN 中，在输入层之后周期性地使用卷积和混合池化，然后是全连接层。5.2.2 极深的卷积神经网络Simonyan 和 Zisserman(2014) 提出了非常深层的卷积神经网络 (VDCNN) 架构，也称为 VGG Net。VGG Net 使用非常小的卷积滤波器，深度达到 16-19 层。Conneau 等人 (2016) 提出了另一种文本分类的 VDCNN 架构，使用小卷积和池化。他们声称这个 VDCNN 架构是第一个在文本处理中使用的，它在字符级别上起作用。该架构由 29 个卷积层组成。5.3 网络中的网络Lin 等人 (2013) 提出了网络中的网络 (Network In Network,NIN)。NIN 以具有复杂结构的微神经网络代替传统卷积神经网络 (CNN) 的卷积层。它使用多层感知器 (MLPConv) 处理微神经网络和全局平均池化层，而不是全连接层。深度 NIN 架构可以由 NIN 结构的多重叠加组成。5.4 基于区域的卷积神经网络Girshick 等人 (2014) 提出了基于区域的卷积神经网络 (R-CNN)，使用区域进行识别。R-CNN 使用区域来定位和分割目标。该架构由三个模块组成：定义了候选区域的集合的类别独立区域建议，从区域中提取特征的大型卷积神经网络 (CNN)，以及一组类特定的线性支持向量机 (SVM)。5.4.1 Fast R-CNNGirshick(2015) 提出了快速的基于区域的卷积网络 (Fast R-CNN)。这种方法利用 R-CNN 架构能快速地生成结果。Fast R-CNN 由卷积层和池化层、区域建议层和一系列全连接层组成。5.4.2 Faster R-CNNRen 等人 (2015) 提出了更快的基于区域的卷积神经网络 (Faster R-CNN)，它使用区域建议网络 (Region Proposal Network, RPN) 进行实时目标检测。RPN 是一个全卷积网络，能够准确、高效地生成区域建议 (Ren et al.，2015)。5.4.3 Mask R-CNN何恺明等人 (2017) 提出了基于区域的掩模卷积网络 (Mask R-CNN) 实例目标分割。Mask R-CNN 扩展了 R-CNN 的架构，并使用一个额外的分支用于预测目标掩模。5.4.4 Multi-Expert R-CNNLee 等人 (2017) 提出了基于区域的多专家卷积神经网络 (ME R-CNN)，利用了 Fast R-CNN 架构。ME R-CNN 从选择性和详尽的搜索中生成兴趣区域 (RoI)。它也使用 per-RoI 多专家网络而不是单一的 per-RoI 网络。每个专家都是来自 Fast R-CNN 的全连接层的相同架构。5.5 深度残差网络He 等人 (2015) 提出的残差网络 (ResNet) 由 152 层组成。ResNet 具有较低的误差，并且容易通过残差学习进行训练。更深层次的 ResNet 可以获得更好的性能。在深度学习领域，人们认为 ResNet 是一个重要的进步。5.5.1 Resnet in ResnetTarg 等人 (2016) 在 Resnet in Resnet (RiR) 中提出将 ResNets 和标准卷积神经网络 (CNN) 结合到深层双流架构中。5.5.2 ResNeXtXie 等人 (2016) 提出了 ResNeXt 架构。ResNext 利用 ResNets 来重复使用分割-转换-合并策略。5.6 胶囊网络Sabour 等人 (2017) 提出了胶囊网络 (CapsNet)，即一个包含两个卷积层和一个全连接层的架构。CapsNet 通常包含多个卷积层，胶囊层位于末端。CapsNet 被认为是深度学习的最新突破之一，因为据说这是基于卷积神经网络的局限性而提出的。它使用的是一层又一层的胶囊，而不是神经元。激活的较低级胶囊做出预测，在同意多个预测后，更高级的胶囊变得活跃。在这些胶囊层中使用了一种协议路由机制。Hinton 之后提出 EM 路由，利用期望最大化 (EM) 算法对 CapsNet 进行了改进。5.7 循环神经网络循环神经网络 (RNN) 更适合于序列输入，如语音、文本和生成序列。一个重复的隐藏单元在时间展开时可以被认为是具有相同权重的非常深的前馈网络。由于梯度消失和维度爆炸问题，RNN 曾经很难训练。为了解决这个问题，后来许多人提出了改进意见。Goodfellow 等人 (2016) 详细分析了循环和递归神经网络和架构的细节，以及相关的门控和记忆网络。Karpathy 等人 (2015) 使用字符级语言模型来分析和可视化预测、表征训练动态、RNN 及其变体 (如 LSTM) 的错误类型等。J´ozefowicz 等人 (2016) 探讨了 RNN 模型和语言模型的局限性。5.7.1 RNN-EMPeng 和 Yao(2015) 提出了利用外部记忆 (RNN-EM) 来改善 RNN 的记忆能力。他们声称在语言理解方面达到了最先进的水平，比其他 RNN 更好。5.7.2 GF-RNNChung 等 (2015) 提出了门控反馈递归神经网络 (GF-RNN)，它通过将多个递归层与全局门控单元叠加来扩展标准的 RNN。5.7.3 CRF-RNNZheng 等人 (2015) 提出条件随机场作为循环神经网络 (CRF-RNN)，其将卷积神经网络 (CNN) 和条件随机场 (CRF) 结合起来进行概率图形建模。5.7.4 Quasi-RNNBradbury 等人 (2016) 提出了用于神经序列建模和沿时间步的并行应用的准循环神经网络 (QRNN)。5.8 记忆网络Weston 等人 (2014) 提出了问答记忆网络 (QA)。记忆网络由记忆、输入特征映射、泛化、输出特征映射和响应组成。5.8.1 动态记忆网络Kumar 等人 (2015) 提出了用于 QA 任务的动态记忆网络 (DMN)。DMN 有四个模块:输入、问题、情景记忆、输出。5.9 增强神经网络Olah 和 Carter(2016) 很好地展示了注意力和增强循环神经网络，即神经图灵机 (NTM)、注意力接口、神经编码器和自适应计算时间。增强神经网络通常是使用额外的属性，如逻辑函数以及标准的神经网络架构。5.9.1 神经图灵机Graves 等人 (2014) 提出了神经图灵机 (NTM) 架构，由神经网络控制器和记忆库组成。NTM 通常将 RNN 与外部记忆库结合。5.9.2 神经 GPUKaiser 和 Sutskever(2015) 提出了神经 GPU，解决了 NTM 的并行问题。5.9.3 神经随机存取机Kurach 等人 (2015) 提出了神经随机存取机，它使用外部的可变大小的随机存取存储器。5.9.4 神经编程器Neelakantan 等人 (2015) 提出了神经编程器，一种具有算术和逻辑功能的增强神经网络。5.9.5 神经编程器-解释器Reed 和 de Freitas(2015) 提出了可以学习的神经编程器-解释器 (NPI)。NPI 包括周期性内核、程序内存和特定于领域的编码器。5.10 长短期记忆网络Hochreiter 和 Schmidhuber(1997) 提出了长短期记忆 (Long short - Short-Term Memory, LSTM)，克服了循环神经网络 (RNN) 的误差回流问题。LSTM 是基于循环网络和基于梯度的学习算法，LSTM 引入自循环产生路径，使得梯度能够流动。Greff 等人 (2017) 对标准 LSTM 和 8 个 LSTM 变体进行了大规模分析，分别用于语音识别、手写识别和复调音乐建模。他们声称 LSTM 的 8 个变种没有显著改善，而只有标准 LSTM 表现良好。Shi 等人 (2016b) 提出了深度长短期记忆网络 (DLSTM)，它是一个 LSTM 单元的堆栈，用于特征映射学习表示。5.10.1 批-归一化 LSTMCooijmans 等人 (2016) 提出了批-归一化 LSTM (BN-LSTM)，它对递归神经网络的隐藏状态使用批-归一化。5.10.2 Pixel RNNvan den Oord 等人 (2016b) 提出像素递归神经网络 (Pixel-RNN)，由 12 个二维 LSTM 层组成。5.10.3 双向 LSTMW¨ollmer 等人 (2010) 提出了双向 LSTM(BLSTM) 的循环网络与动态贝叶斯网络 (DBN) 一起用于上下文敏感关键字检测。5.10.4 Variational Bi-LSTMShabanian 等人 (2017) 提出了变分双向 LSTM（Variational Bi-LSTM），它是双向 LSTM 体系结构的变体。Variational Bi-LSTM 使用变分自编码器 (VAE) 在 LSTM 之间创建一个信息交换通道，以学习更好的表征。5.11 谷歌神经机器翻译Wu 等人 (2016) 提出了名为谷歌神经机器翻译 (GNMT) 的自动翻译系统，该系统结合了编码器网络、解码器网络和注意力网络，遵循共同的序列对序列 (sequence-to-sequence) 的学习框架。5.12 Fader NetworkLample 等人 (2017) 提出了 Fader 网络，这是一种新型的编码器-解码器架构，通过改变属性值来生成真实的输入图像变化。5.13 超网络Ha 等人 (2016) 提出的超网络（Hyper Networks）为其他神经网络生成权值，如静态超网络卷积网络、用于循环网络的动态超网络。Deutsch(2018) 使用超网络生成神经网络。5.14 Highway NetworksSrivastava 等人 (2015) 提出了高速路网络（Highway Networks），通过使用门控单元来学习管理信息。跨多个层次的信息流称为信息高速路。5.14.1 Recurrent Highway NetworksZilly 等人 (2017) 提出了循环高速路网络 (Recurrent Highway Networks，RHN)，它扩展了长短期记忆 (LSTM) 架构。RHN 在周期性过渡中使用了 Highway 层。5.15 Highway LSTM RNNZhang 等人 (2016) 提出了高速路长短期记忆 (high - Long short Memory, HLSTM) RNN，它在相邻层的内存单元之间扩展了具有封闭方向连接 (即 Highway) 的深度 LSTM 网络。5.16 长期循环 CNNDonahue 等人 (2014) 提出了长期循环卷积网络 (LRCN)，它使用 CNN 进行输入，然后使用 LSTM 进行递归序列建模并生成预测。5.17 深度神经 SVMZhang 等人 (2015) 提出了深度神经 SVM(DNSVM)，它以支持向量机 (Support Vector Machine, SVM) 作为深度神经网络 (Deep Neural Network, DNN) 分类的顶层。5.18 卷积残差记忆网络Moniz 和 Pal(2016) 提出了卷积残差记忆网络，将记忆机制并入卷积神经网络 (CNN)。它用一个长短期记忆机制来增强卷积残差网络。5.19 分形网络Larsson 等人 (2016) 提出分形网络即 FractalNet 作为残差网络的替代方案。他们声称可以训练超深度的神经网络而不需要残差学习。分形是简单扩展规则生成的重复架构。5.20 WaveNetvan den Oord 等人 (2016) 提出了用于产生原始音频的深度神经网络 WaveNet。WaveNet 由一堆卷积层和 softmax 分布层组成，用于输出。Rethage 等人 (2017) 提出了一个 WaveNet 模型用于语音去噪。5.21 指针网络Vinyals 等人 (2017) 提出了指针网络 (Ptr-Nets)，通过使用一种称为「指针」的 softmax 概率分布来解决表征变量字典的问题。

@Wu 发表于2022-05-30 15:47:43 2022-05-30 15:47:43 最后回复可爱又积极 2022-05-30 16:32:35
179 1

深度学习神经网络
[其他] 适合新手的深度学习综述（4）--深度学习方法

本文转载自机器之心。深度神经网络在监督学习中取得了巨大的成功。此外，深度学习模型在无监督、混合和强化学习方面也非常成功。4.1 深度监督学习监督学习应用在当数据标记、分类器分类或数值预测的情况。LeCun 等人 (2015) 对监督学习方法以及深层结构的形成给出了一个精简的解释。Deng 和 Yu(2014) 提到了许多用于监督和混合学习的深度网络，并做出解释，例如深度堆栈网络 (DSN) 及其变体。Schmidthuber(2014) 的研究涵盖了所有神经网络，从早期神经网络到最近成功的卷积神经网络 (CNN)、循环神经网络 (RNN)、长短期记忆 (LSTM) 及其改进。4.2 深度无监督学习当输入数据没有标记时，可应用无监督学习方法从数据中提取特征并对其进行分类或标记。LeCun 等人 (2015) 预测了无监督学习在深度学习中的未来。Schmidthuber(2014) 也描述了无监督学习的神经网络。Deng 和 Yu(2014) 简要介绍了无监督学习的深度架构，并详细解释了深度自编码器。4.3 深度强化学习强化学习使用奖惩系统预测学习模型的下一步。这主要用于游戏和机器人，解决平常的决策问题。Schmidthuber(2014) 描述了强化学习 (RL) 中深度学习的进展，以及深度前馈神经网络 (FNN) 和循环神经网络 (RNN) 在 RL 中的应用。Li(2017) 讨论了深度强化学习 (Deep Reinforcement Learning, DRL)、它的架构 (例如 Deep Q-Network, DQN) 以及在各个领域的应用。Mnih 等人 (2016) 提出了一种利用异步梯度下降进行 DNN 优化的 DRL 框架。van Hasselt 等人 (2015) 提出了一种使用深度神经网络 (deep neural network, DNN) 的 DRL 架构。

@Wu 发表于2022-05-30 15:44:06 2022-05-30 15:44:06 最后回复可爱又积极 2022-05-30 16:01:33
177 1

深度学习神经网络
[其他] 适合新手的深度学习综述（3）--最新进展

深度架构的演变人工神经网络 (ANN) 已经取得了长足的进步，同时也带来了其他的深度模型。第一代人工神经网络由简单的感知器神经层组成，只能进行有限的简单计算。第二代使用反向传播，根据错误率更新神经元的权重。然后支持向量机 (SVM) 浮出水面，在一段时间内超越 ANN。为了克服反向传播的局限性，人们提出了受限玻尔兹曼机（RBM），使学习更容易。此时其他技术和神经网络也出现了，如前馈神经网络 (FNN)、卷积神经网络 (CNN)、循环神经网络 (RNN) 等，以及深层信念网络、自编码器等。从那时起，为实现各种用途，ANN 在不同方面得到了改进和设计。Schmidhuber (2014)、Bengio (2009)、Deng 和 Yu (2014)、Goodfellow 等人 (2016)、Wang 等人 (2017) 对深度神经网络 (DNN) 的进化和历史以及深度学习 (DL) 进行了详细的概述。在大多数情况下，深层架构是简单架构的多层非线性重复，这样可从输入中获得高度复杂的函数。

@Wu 发表于2022-05-30 15:41:47 2022-05-30 15:41:47 最后回复 QGS 2022-05-30 16:15:52
237 2

深度学习神经网络

上滑加载中

推荐直播

0.5

基于开源鸿蒙+海思星闪开发板：嵌入式系统开发实战（Day1）
2025/03/29 周六 09:00-18:00

华为开发者布道师

本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用，涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容，旨在帮助学员全面掌握相关技术并进行实际操作
回顾中
华为云软件开发生产线（CodeArts）1月&2月新特性解读
2025/03/18 周二 19:00-20:00

阿星华为云高级产品经理

不知道产品的最新特性？没法和产品团队建立直接的沟通？本期直播产品经理将为您解读华为云软件开发生产线1月&2月发布的新特性，并在直播过程中为您答疑解惑。
回顾中
基于能力图谱的openGauss项目闯关
2025/03/20 周四 19:00-20:30

华为开发者布道师

想成为顶级数据库开发者吗？本次直播将从银行业务系统的数据库设计出发，带你逐步掌握openGauss的建库表、数据封装、密态技术、性能调优及AI应用。通过实战案例，全面展示openGauss的强大功能，助你提升技能，为未来的职业发展打下坚实基础。立即报名，开启你的数据库进阶之旅！
回顾中
基于开源鸿蒙+海思星闪开发板：嵌入式系统开发实战（Day1）
2025/03/29 周六 09:00-18:00

华为开发者布道师

本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用，涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容，旨在帮助学员全面掌握相关技术并进行实际操作
回顾中
华为云软件开发生产线（CodeArts）1月&2月新特性解读
2025/03/18 周二 19:00-20:00

阿星华为云高级产品经理

不知道产品的最新特性？没法和产品团队建立直接的沟通？本期直播产品经理将为您解读华为云软件开发生产线1月&2月发布的新特性，并在直播过程中为您答疑解惑。
回顾中

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript

开发者空间

了解空间

工作台

开发工具

实战案例

空间活动

空间论坛

开发平台

软件开发生产线 CodeArts

AI平台ModelArts

数据治理中心 DataArts Studio

数字内容生产线 MetaStudio

精选服务

云数据库 GaussDB

云数据库 RDS for MySQL

MapReduce服务 MRS

数据仓库服务 DWS

分布式缓存服务Redis版

分布式消息服务 DMS

华为云实时音视频 SparkRTC

媒体处理 MPC

主机迁移服务 SMS

对象存储迁移服务 OMS

云消息服务 KooMessage

云手机服务 KooPhone

企业搜索服务 KooSearch

云地图服务 KooMap

更多开放能力

开发工具

API生态

CodeArts API

API Explorer

Terraform Explorer

KooCLI

API 中心

SDK 中心

开发服务

Codelabs

DevStar

低代码平台Astro

CodeArts IDE

Huawei Cloud Toolkit

Classroom

开发资源

开源镜像站

开源资源

开发语言

开发实践

入门精选

分发资源

企业应用中心

企业通用专区

教育专区

华为应用专区

政务云专区

硬件云服务商城

医疗健康专区

跳蚤市场

华为云开发者日

直播专区

开发者精品活动

DTSE Tech Talk

加入HCDE

加入HCDG

加入HCSD

加入HCWD

鲁班会

沃土云创计划·企业

沃土云创计划·高校

沃土云创计划·个人

沃土云创计划·开源共创

博客

论坛

专题

开发者榜单

学习路径

在线课程

动手实验

考试认证

培训服务