-
【功能模块】【sophon-ml-kernel_2.11-1.1.0.aarch_64.jar包】不能下载【操作步骤&问题现象】机器学习算法软件包中介绍的sophon-ml-kernel_2.11-1.1.0.aarch_64.jar包,没有下载权限,不能下载https://support.huaweicloud.com/fg-kunpengbds/kunpengbdsspark_06_0005.html【截图信息】【日志信息】(可选,上传日志内容或者附件)
-
【功能模块】Atlas200DK调用算子出现kernel error【操作步骤&问题现象】1、2、【截图信息】【日志信息】(可选,上传日志内容或者附件)
-
【功能模块】运行代码为:https://www.mindspore.cn/doc/api_python/zh-CN/r1.0/mindspore/mindspore.ops.html#mindspore.ops.CTCLoss【操作步骤&问题现象】import mindspore import numpy as np from mindspore import Tensor from mindspore.ops import operations as P from mindspore.ops import composite as C from mindspore.ops import functional as F inputs = Tensor(np.random.random((2, 2, 3)), mindspore.float32) labels_indices = Tensor(np.array([[0, 0], [1, 0]]), mindspore.int64) labels_values = Tensor(np.array([2, 2]), mindspore.int32) sequence_length = Tensor(np.array([2, 2]), mindspore.int32) ctc_loss = P.CTCLoss() output = ctc_loss(inputs, labels_indices, labels_values, sequence_length)问题:[ERROR] RUNTIME(105206)kernel task happen error, receive aicpu failed msg, aicpu error code=0x2.[ERROR] RUNTIME(105206)aicpu kernel execute failed, device_id=1, stream_id=515, task_id=6, fault so_name=libaicpu_kernels.so, fault kernel_name=CTCLoss【截图信息】【日志信息】(可选,上传日志内容或者附件)cat /usr/local/Ascend/driver/version.info Version=20.1.0 ascendhal_version=2.1.0 aicpu_version=1.0 tdt_version=1.0 log_version=1.0 prof_version=2.0 dvppkernels_version=1.0 tsfw_version=1.0 mmpa_version=1.0 required_firmware_firmware_version=1.0mindspore版本:1.0.1python版本:3.7.6
-
【功能模块】【操作步骤&问题现象】1、出现下面警告2、配置如下: parser = argparse.ArgumentParser(description='MindSpore LeNet Example') parser.add_argument('--device_target', type=str, default="Ascend", choices=['Ascend', 'GPU', 'CPU'], help='device where the code will be implemented (default: CPU)') args = parser.parse_args() context.set_context(mode=context.GRAPH_MODE, device_target=args.device_target) # context.set_context(mode=context.PYNATIVE_MODE, device_target=args.device_target) dataset_sink_mode = not args.device_target == "CPU"警告如下:[WARNING] DEVICE(26509,python):2020-11-27-17:27:59.694.791 [mindspore/ccsrc/runtime/device/ascend/kernel_select_ascend.cc:552] SelectKernelInfo] The node [kernel_graph_1:equivdout{[0]: ValueNode<Primitive> Cast, [1]: [CNode]62}] cannot find valid TBE kernel info, try to get aicpu kernel info【截图信息】【日志信息】(可选,上传日志内容或者附件)
-
我使用ascend训练作业在model中设置 'drop_connect'参数则有如下报错信息:RuntimeError: mindspore/ccsrc/backend/kernel_compiler/kernel_query.cc:90KernelQueryAll] NotExistsError Failed to obtain operator info,Please check whether the operator info is registered,Op full name:Default/network-TrainOneStepCell/network-WithLossCell/_backbone-GenEfficientNet/blocks-BlockBuilder/layer-SequentialCell/0-SequentialCell/0-DepthwiseSeparableConv/Dropout-op132Node Type:Dropout, Node DebugString: kernel_graph_1:equivdout{[0]: ValueNode<Primitive>Dropout, [1]: ValueNode<Tensor> Tensor(shape=[128, 1, 1, 1], dtype=Float32, value= [...])}如果不设置 drop_connect参数则无报错信息请问是什么原因,谢谢!
-
运行环境:GPUMindspore:1.0.0CUDA:10.1【问题】运行resnet50(和googlenet)时报错kernel_build_client.h:Response is empty,但是相同代码改成运行alexnet,lenet等没有出现这种问题。感觉似乎没有配置上的错误,却经常出现kernel build为空的情况。
-
你们,我们自己需要修改kernel的配置,所以新编出来的kernel image的大小会超过0xB00000,放到200模块上加载时提示大小超限,请问如何解除这个限制?谢谢!
-
按照官方手册安装了Ubuntu18.04.1,并升级kernel到4.15.0-99更新后发现这个版本的kernel会导致xwindows操作特别卡顿如果升级kernel到4.15.0-122就没有问题了,但这个版本又无法安装Atlas300的driver。请问有什么方法能解决这个冲突问题?
-
【操作步骤&问题现象】我们进行kernel二次开发编译得时候,需要源码包,如下图:但文档中提供得下载页面中没有这个包,请问哪里可以下载到,具体版本为1.73.5.1;Ascend310-source-20.0.RC1- minirc.tar.gz【截图信息】qingboy_adlink 发表于2020-10-15 14:07:37 2020-10-15 14:07:37 最后回复 xiaoyifan6 2020-10-16 11:14:491073 3
-
【操作步骤&问题现象】200DK进行kernel二次开发编译得时候,需要源码包,如下图:但文档中提供得下载页面中没有这个包,请问哪里可以下载到,版本为1.73.5.1;【截图信息】
-
python的有些库不好安装,我会在terminal中进行安装,使用terminal切换到对应环境安装库,打开对应环境的.ipynb中能导入相应库吗?
-
【功能模块】图算融合,GPU (NVIDIA-GV100) 验证https://www.mindspore.cn/tutorial/zh-CN/master/advanced_use/graph_kernel_fusion.htmlcontext.set_context(mode=context.GRAPH_MODE, device_target="GPU") context.set_context(save_graphs=True) context.set_context(enable_graph_kernel=True)【操作步骤&问题现象】1、使用mindspore repo中的gpu dockerfile建立运行环境2、改造链接中的例子,使用GPU作为device_target3、在GPU/docker环境中测试,并且得到一组.dot/.ir等文件4、发现没有生成例子当中的文件(hwopt_d_fuse_basic_opt_end_graph_0.dot/hwopt_d_composite_opt_end_graph_0.dot),观察其他生成的dot/ir文件,测试用例中的add/mul并没有融合附图:8_validate.dot.png
-
课程文档链接:https://nbviewer.jupyter.org/github/huaweicloud/ModelArts-Lab/blob/master/notebook/DL_video_object_segmentation/object_segmentation.ipynb为什么装完模块后要restart?按理说不需要这样做啊另一个问题:课程文档后面还有一个需要到terminal中执行命令的步骤,如下图所示:ipynb中不是有魔法命令吗?应该可以直接在ipynb中执行linux命令啊,为什么要专门去terminal中执行?
-
1.Notebook发生kernel died或者OOM后Notebook发生kernel died或者OOM后,按照教程,删除core.*文件,环境restart,还是会报错,如下:ResourceExhaustedError: OOM when allocating tensor with shape[7,7,256,1024] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc [[Node: mrcnn_class_conv1/kernel/Assign = Assign[T=DT_FLOAT, use_locking=true, validate_shape=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](mrcnn_class_conv1/kernel, mrcnn_class_conv1/random_uniform)]] Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info.2.当代码执行超过内存时,notebook环境会默认重启,重启后重新执行代码会报错,一般只能重建notebook环境,这种情况应该怎么办?
上滑加载中
推荐直播
-
OpenHarmony应用开发之网络数据请求与数据解析
2025/01/16 周四 19:00-20:30
华为开发者布道师、南京师范大学泰州学院副教授,硕士研究生导师,开放原子教育银牌认证讲师
科技浪潮中,鸿蒙生态强势崛起,OpenHarmony开启智能终端无限可能。当下,其原生应用开发适配潜力巨大,终端设备已广泛融入生活各场景,从家居到办公、穿戴至车载。 现在,机会敲门!我们的直播聚焦OpenHarmony关键的网络数据请求与解析,抛开晦涩理论,用真实案例带你掌握数据访问接口,轻松应对复杂网络请求、精准解析Json与Xml数据。参与直播,为开发鸿蒙App夯实基础,抢占科技新高地,别错过!
回顾中 -
Ascend C高层API设计原理与实现系列
2025/01/17 周五 15:30-17:00
Ascend C 技术专家
以LayerNorm算子开发为例,讲解开箱即用的Ascend C高层API
回顾中
热门标签