• [问题求助] Atlas200DK开发者套件能否通过typec连接无线网卡?
    最近正在做移动机器人的开发,原先是使用typec连接PC,然后通过ssh进行通信,但是这样是有线的。想问一下,typec接口能否插一个usb转换器,然后再插无线wifi,通过无线wifi和路由器连接,然后PC用ssh连到板子上。请问这样是否可行,如果可以的话,是否需要驱动什么的,或者系统中需要什么配置?是否已经有教程实现出来了?谢谢!
  • [算子开发] 算子原型定义,输入参数的类型选择
    TensorDot算子的输入参数中dims默认值为int = 2, 也可以输出Tuple或者ListIntInt,请问定义的时候怎么办呢?选择ATTR呢?还是REQUIRED_ATTR呢?
  • [API使用] 算子使用ops.composite.GradOperation
    我想问一下MindSpore这个链接中这个ops.composite.GradOperation算子和mindspore官网的mindspore.ops.GradOperation是一个算子吗,我好像在官网上没找到ops.composite.GradOperation。为什么前面多了一个composite呢
  • [问题求助] 请问acl/acl_tdt.h文件位于哪个软件包?
    这几天在构建支持tensorflow 2.6.5版本的镜像,需要编译tf_adapter_2.x,报fatal error: acl/acl_tdt.h: No such file or directory查阅CMakeLists.txt文件发现该文件应该位于/usr/local/Ascend/runtime下面,但是我的环境下(已经安装了nnae和tfplugin)并没有此文件想知道这个文件是哪个软件包里带的?​​​tf_adapter_2.x · Ascend/tensorflow - 码云 - 开源中国 (gitee.com)
  • [MindX SDK] Atlas200 DK mxManufacture SDK安装失败问题求助
    1、安装环境Ubuntu 18.04.5 LTS,x86_64Python 3.7.5Ascend-cann-nnrt_3.3.0.alpha001_linux-x86_64.run*Ascend-cann-toolkit_3.3.0.alpha001_linux-aarch64.run*Ascend-cann-toolkit_3.3.0.alpha001_linux-x86_64.run*MindStudio_2.0.0-beta3_linux.tar.gz2、问题Installing the SDK component...ms_check_platform /home/myl/下载/Ascend-mindxsdk-mxmanufacture_2.0.2.1_linux-x86_64.run x86_64 /home/myl/下载/Ascend-mindxsdk-mxmanufacture_2.0.2.1_linux-x86_64.runInstalling the compiler version of devtoolset-7 ...valid acl path(/usr/local/Ascend/ascend-toolkit/latest/acllib/lib64), continue the installation...valid acl path(/usr/local/Ascend/ascend-toolkit/latest/acllib/lib64), continue the installation...Install SDK failed.3、另外尝试过其他版本SDK都失败Ascend-mindxsdk-mxmanufacture_2.0.2.1_linux-aarch64.run*Ascend-mindxsdk-mxmanufacture_2.0.2.1_linux-x86_64.run*Ascend-mindxsdk-mxmanufacture_2.0.3.6_linux-x86_64.run*Ascend-mindxsdk-mxmanufacture_2.0.3_linux-x86_64.run*
  • [问题求助] Atlas200 DK mxManufacture SDK安装失败问题求助
    1、安装环境Ubuntu 18.04.5 LTS,x86_64Python 3.7.5Ascend-cann-nnrt_3.3.0.alpha001_linux-x86_64.run*Ascend-cann-toolkit_3.3.0.alpha001_linux-aarch64.run*Ascend-cann-toolkit_3.3.0.alpha001_linux-x86_64.run*MindStudio_2.0.0-beta3_linux.tar.gz2、问题Installing the SDK component...ms_check_platform /home/myl/下载/Ascend-mindxsdk-mxmanufacture_2.0.2.1_linux-x86_64.run x86_64 /home/myl/下载/Ascend-mindxsdk-mxmanufacture_2.0.2.1_linux-x86_64.runInstalling the compiler version of devtoolset-7 ...valid acl path(/usr/local/Ascend/ascend-toolkit/latest/acllib/lib64), continue the installation...valid acl path(/usr/local/Ascend/ascend-toolkit/latest/acllib/lib64), continue the installation...Install SDK failed.3、另外尝试过其他版本SDK都失败Ascend-mindxsdk-mxmanufacture_2.0.2.1_linux-aarch64.run*Ascend-mindxsdk-mxmanufacture_2.0.2.1_linux-x86_64.run*Ascend-mindxsdk-mxmanufacture_2.0.3.6_linux-x86_64.run*Ascend-mindxsdk-mxmanufacture_2.0.3_linux-x86_64.run*
  • [Atlas300] 【Atlas 300I Pro】使用npu-smi info命令报错
    硬件:Atlas 300I Pro操作卡操作系统:Ubuntu20.04,内核5.4.0-26 generic问题描述:使用npu-smi info 指令,出现dcmi module initialize failed, ret is -8010。在之前按照驱动->固件的顺序安装,安装成功且npu-smi info已正常显示。什么都没干,过了5分钟以后再使用npu-smi info就报错了。
  • [调试调优] mindspore计算梯度时显示设备内存不足
    两个网络模型,第一个网络模型固定参数仅用于输出,第二模型用于训练,其中有两个输出(有对应的真实标签),已附代码;训练时报错# RuntimeError: Device(id:0) memory isn't enough and alloc failed, kernel name: Gradients/Default/gradExtractImagePatches/ScatterNd-op631, alloc size: 90636521472B.
  • [其他问题] 鲲鹏+昇腾+MindSpore+Python开发Web Service用什么框架比较好啊?
    鲲鹏+昇腾+MindSpore+Python开发Web Service用什么框架比较好啊?求指导。有鲲鹏+昇腾+MindSpore+Python开源的Web Service项目吗?感谢!
  • [MindX SDK] 城市道路交通预测
    MindX SDK -- 城市道路交通预测参考设计案例1 案例概述1.1 概要描述本项目代码地址为:https://gitee.com/ascend/mindxsdk-referenceapps/tree/master/contrib/STGCN交通预测属于时间序列问题的一种,给定前t个时刻的历史数据,来预测未来一个或多个时刻。本案例预测的是交通速度,基于STGCN,一个用于交通预测的神经网络框架,对给定t-M+1到t时刻的历史数据,预测t+1到t+H的速度。在SZ-Taxi数据集上的测试精度可以达到 MAE 2.81 | RMSE 4.29。该模型在SZ-Taxi数据集上无具体目标精度可以参考,此精度值为官方认可值。1.2 特性及适用场景模型的原始训练是基于SZ-Taxi数据集训练的,读取的图为深圳罗湖区156条主要道路的交通连接情况。因此对于针对罗湖区的自定义交通速度数据(大小为N×156,N>12),都能给出具有参考价值的未来一定时段的交通速度,从而有助于判断未来一段时间内道路的拥堵情况等。1.3 STGCN模型介绍论文地址:https://arxiv.org/pdf/1709.04875.pdfGitHub模型地址:cid:link_4针对之前交通预测模型采用的CNN卷积网络只适用于规则的网格结构数据,不能对图进行建模,STGCN的框架首次将图卷积应用到交通预测问题上,由多个时空卷积模块组成,每个模块的结构如三明治,有两个门控序列卷积层和中间的一个空间图卷积模块。原论文的模型架构图,如下所示。​整个架构可以概括为:输入-> ST-Conv Block -> ST-Conv Block-> Output Block->输出。训练使用的数据集为SZ-Taxi数据集获取地址:https://github.com/lehaifeng/T-GCN/tree/master/data数据集简介:为2015年1月1日至1月31日深圳出租车轨迹。选择罗湖区156条主要道路作为研究区域,实验数据主要包括两部分:一个是一个156×156的,描述了道路之间的空间关系,每一行表示一条道路,矩阵中的值表示道路之邻接矩阵间的连接性:另一个是特征矩阵,描述了每条道路上的速度随时间的变化,每一行代表一条路,每一列是不同时段道路上的交通速度。每15min计算一次每条路上的车速。需要注意的是数据集中的sz_speed.csv文件中的第一行数据为异常数据,训练和推理时请手动删除。1.4 实现流程模型训练-->模型转换-->模型推理1.4.1 模型训练我们选择的训练模型如下:模型类型模型名称参考链接PytorchSTGCNcid:link_4需要参照GitHub项目中的README.md和requiremments.txt文件配置训练所需环境。为训练SZ-Taxi数据集,主要需要修改两个部分:1、stgcn.py部分(1)训练参数如下:'learning_rate': 0.001,'epochs': 1000,'batch_size': 8,'gamma': 0.95,'drop_rate': 0.5,'weight_decay_rate': 0.0005(2)将数据集放到'data/sz-taxis/'目录下(如果没有自行创建)后增加args.dataset == 'sz-taxis'2、dataloader.py部分(1)load_adj()读取邻接矩阵部分改为my_data = np.genfromtxt('data/sz-taxis/sz_adj.csv', delimiter=',') # 邻接矩阵路径smy_data = sp.csr_matrix(my_data)adj = smy_data.tocsc()并且增加elif dataset_name == 'sz-taxis':n_vertex = 156(2)load_data()train的划分改为:train = vel[: len_train + len_val]注意:将SZ-Taxi数据集中的sz_adj.csv和sz_speed.csv文件放在'data/sz-taxis/'目录下(如果没有自行创建),运行STGCN模型GitHub仓库中的main.py文件即可开始训练。训练好的pth文件连接如下:https://mindx.sdk.obs.cn-north-4.myhuaweicloud.com/mindxsdk-referenceapps%20/contrib/STGCN/stgcn_sym_norm_lap_45_mins.pth1.4.2 模型转化主要流程为pth->onnx->om1、pth转化为onnx模型调用的是Pytorch中的onnx库,在训练项目的主目录下新建python文件,按照如下内容编写代码。模型路径和输入大小根据实际情况修改。转换好的onnx文件连接如下:https://mindx.sdk.obs.cn-north-4.myhuaweicloud.com/mindxsdk-referenceapps%20/contrib/STGCN/stgcn10.onnx2、onnx文件转om文件使用的是ATC工具,参考如下:cid:link_0指令如下:atc --framework=5 \--model="${input_path}" \--input_shape="actual_input_1:64,1,12,156" \--output="${output_om_path}" \--enable_small_channel=1 \--log=error \--soc_version=Ascend310 \--op_select_implmode=high_precision \--output_type=FP32参数说明:参数说明model_pathonnx文件路径。output_model_name生成的om模型文件名,自动添加.om后缀。--framework原始框架类型--input_shape输入数据的shape--output转换后输出的om模型存放路径以及名称。--enable_small_channel是否使能small channel的优化。--log日志级别。--soc_version模型转换时指定芯片版本。项目中已写好转换脚本convert_om.sh,可根据实际路径修改。运行指令:bash convert_om.sh [model_path] stgcn10参数说明:model_path:onnx文件路径须自行输入。stgcn10:生成的om模型文件名,转换脚本会在此基础上添加.om后缀。注:运行此脚本的话会直接在项目主目录下生成stgcn.om文件。2 软件方案介绍2.1 技术说明mxVision致力于简化昇腾芯片推理业务开发过程,降低使用昇腾芯片开发的门槛。SDK采用模块化的设计理念,将业务流程中的各个功能单元封装成独立的插件,通过插件的串接快速构建业务。mxVision主要功能如下:快速构建推理业务:SDK提供了以昇腾芯片功能为基础的功能插件,通过修改流程编排配置文件,可使用户快速构建推理业务。用户可通过API调用,向构建完成的推理业务发送请求,得到推理结果Json字符串或者原始数据结构。自定义功能插件:当基础功能插件无法满足业务需求时,通过SDK提供的插件开发工具和业务逻辑开发基础库,用户可自行开发新插件,适配完整推理业务。2.2 项目方案架构介绍基于MindX SDK的城市道路交通预测模型的推理流程为:首先读取已有的交通速度数据集(csv格式)通过Python API转化为protobuf的格式传送给appsrc插件输入,然后输入模型推理插件mxpi_tensorinfer,最后通过输出插件mxpi_dataserialize和appsink进行输出。本系统的各模块及功能如下表所示:序号子系统功能描述1数据输入调用pythonAPI的SendProtobuf()函数和MindX SDK的appsrc输入数据2模型推理调用MindX SDK的mxpi_tensorinfer对输入张量进行推理3结果输出调用MindX SDK的mxpi_dataserialize和appsink以及pythonAPI的GetProtobuf()函数输出结果3 开发环境准备3.1 环境依赖说明推荐系统为ubuntu 18.04,环境依赖软件和版本如下表:软件名称版本mxVision2.0.4Python3.9CANN5.1.RC13.2 环境搭建在编译运行项目前,需要设置环境变量:. ${SDK安装路径}/set_env.sh. ${CANN安装路径}/set_env.sh3.2.1 依赖安装CANN软件包获取地址:cid:link_2SDK官方下载地址:cid:link_3我的安装步骤是本地下载好对应版本的安装包然后上传到服务器,接着执行如下指令:1、设置可执行权限chmod +x *.run2、安装./ *.run --install3.2.2 开发环境搭建本次开发使用的IDE为MindStudio,具体安装步骤请参考官方安装教程中的《安装操作(Windows)》章节:https://support.huaweicloud.com/devg-mindstudio304/atlasms_02_0020.html3.2.3 工程创建新建SDK项目​新建好后根据如下目录创建文件夹├── data # 数据目录,存放测试集或者需预测的数据集├── stgcn10.om # 转化得到的om模型├── pipeline│ └── stgcn.pipeline├── main.py # 展示推理精度├── predict.py # 根据输入的数据集输出未来一定时段的交通速度├── README.md├── convert_om.sh # onnx文件转化为om文件├── results # 预测结果存放4 编译与运行4.1 pipeline编排Pipeline文件编排是python版SDK最主要的推理开发步骤,可以通过MindStudio中Ascend-MindX SDK Pipeline功能进行可视化编写各插件的功能说明可以参考官网插件的整体介绍:cid:link_1​​点击Save As进行保存。保存之后可以通过代码进行修改​在MindStudio的工具目录下选择Deployment-Upload to,可以将本地代码同步上传到服务器​4.2 运行提前将需要的数据集放在主目录下的data文件夹中。4.2.1 运行main.py获得推理精度运行main.py可以在sz_speed.csv的测试集上获得推理精度,指令如下:python main.py [image_path] [result_dir] [n_pred]参数说明:image_path:验证集文件,如“data/sz_speed.csv”result_dir:推理结果保存路径,如“results/”n_pred:预测时段,如9例如: python main.py data/sz_speed.csv results/ 9注意:sz_speed.csv文件的第一行数据为异常数据,需要手动删除最后sz_speed.csv测试集的推理预测的结果会保存在results/predictions.txt文件中,实际数据会保存在results/labels.txt文件中。推理精度会直接显示在界面上:MAE 2.81 | RMSE 4.294.2.2 运行predict.py获得预测交通速度如果需要推理自定义的数据集(行数大于12行,列数为156列的csv文件),运行predict.py,指令如下:python predict.py [image_path] [result_dir]参数说明:image_path:验证集文件,如“data/sz_speed.csv”result_dir:推理结果保存路径,如“results/”例如: python predict.py data/sz_speed.csv results/会在results文件夹下生成代表预测的交通速度数据prediction.txt文件这是通过已知数据集里过去时段的交通速度数据预测未来一定时间内的交通速度,无标准参考,所以只会输出代表预测的交通速度数据的prediction.txt文件,而没有MAE和RMSE等精度。另外和main.py的运行指令相比少一个n_pred参数,因为已在代码中定义了确定数值,无需额外输入。当我们输入的是100×156的自定义交通速度数据,格式为csv文件时,输出结果参考如下:​预测结果为88×156的交通速度数据,保存在results文件夹下predict.txt文件中​​5 指标验证5.1 性能测试1、将完整的sz_speed.csv,放在data文件夹目录下2、执行python predic.py data/data_100.csv results/输入数据:2976×156的交通速度数据,格式为csv文件输出结果:​每组sdk平均运行时长122902ms。5.2 精度测试1、将sz_speed.csv文件放在data文件夹目录下2、执行python main.py data/sz_speed.csv results/ 9参考结果如下:输入数据:sz_speed.csv划分的测试集部分,占总数据集的15%,共437行,大小437×156输出结果:精度为 MAE 2.81 | RMSE 4.296 常见问题1、服务器上进行推理的时候出现coredump因为服务器上安装了好几个版本的mxVision,使用RC2版本的时候出现了这个问题,2.0.4版本的时候就可以了,是版本不匹配导致的。运行前可以先运行一下对应版本的set_env.sh
  • [安装] win11下mindspore安装失败
    参照在技术手册命令报错后在官网选择重新选择安装设置如下仍出现报错如下:请问如何解决呢?非常感谢
  • [执行问题] 训练模型时内存爆炸,并且速度很慢
    平台:昇腾ModelartsAscend: 1*Ascend910 | CPU:24核96GB镜像:mindspore1.7.0-cann5.1.0-py3.7-euler2.8.3模型训练很慢,所需时间很长。并且内存使用率会慢慢增长至100%,内存爆炸
  • [问题求助] 制卡出问题了,怎么才能制卡,求助急!
    SD卡制卡日志重新清理磁盘重做好几次了,问题都是这个,我感觉是不是卡的问题,或者权限不足不能修改?
  • [问题求助] 关于动态shape的问题
    运行脚本: cid:link_1atc --model=offline_encoder.onnx --framework=5 --output=offline_encoder --input_format=ND --input_shape_range="speech:[1~64,1~1500,80];speech_lengths:[1~64]" --log=error --soc_version=$1导出的模型,在执行:cid:link_2 ret = acl.mdl.execute(self._model_id, self._input_dataset, self._output_dataset)时报错:Execute model failed for acl.mdl.execute error 500002这个动态shape 的模型 之前在size = acl.mdl.get_output_size_by_index(self._model_desc, i) 得到的size 是0,然后 acl.rt.malloc的时候报错,在size 处给了一个较大的值,if size == 0:size = 20000000在文档:https://support.huawei.com/enterprise/zh/doc/EDOC1100234054/efb6af6处查阅到:总体约束: 不支持动态shape的输入,例如:NHWC输入为[?,?,?,3]多个维度可任意指定数值。模型转换时需指定固定数值。请问 动态shape 输入现阶段是否支持?需要修改转换模型的 命令,还是需要修改acl的推理代码?二、软件版本:-- CANN 版本 6.00.RC1.alpha002--Pytorch 版本: 1.10.2--Python 版本 3.9.12--操作系统版本 openEuler release 20.03如需更多信息,请指出,我将第一时间上传,感谢!
  • [问题求助] 按照样例操作,执行bash sample_build.sh的时候,编译出错,新人求指导
    正在学习Atlas 200 DK,用了分设环境,CANN是6.0.RC1,固件与驱动版本是1.0.13.alpha,目前卡在开发环境,试了两个C++的检测样例,都是成功模型转换,但在运行提供的bash sample_build.sh编译的时候,都报同样的错,想请教一下有经验的大佬