• [问题求助] 【机器学习算法软件包产品】【sophon-ml-kernel_2.11-1.1.0.aarch_64.jar包】不能下载
    【功能模块】【sophon-ml-kernel_2.11-1.1.0.aarch_64.jar包】不能下载【操作步骤&问题现象】机器学习算法软件包中介绍的sophon-ml-kernel_2.11-1.1.0.aarch_64.jar包,没有下载权限,不能下载https://support.huaweicloud.com/fg-kunpengbds/kunpengbdsspark_06_0005.html【截图信息】【日志信息】(可选,上传日志内容或者附件)
  • [问题求助] 【Atlas200DK】kernel error
    【功能模块】Atlas200DK调用算子出现kernel error【操作步骤&问题现象】1、2、【截图信息】【日志信息】(可选,上传日志内容或者附件)
  • [调试调优] 【mindspore产品】【ops功能】ctc_loss出现kernel task happen eror
    【功能模块】运行代码为:https://www.mindspore.cn/doc/api_python/zh-CN/r1.0/mindspore/mindspore.ops.html#mindspore.ops.CTCLoss【操作步骤&问题现象】import mindspore import numpy as np from mindspore import Tensor from mindspore.ops import operations as P from mindspore.ops import composite as C from mindspore.ops import functional as F inputs = Tensor(np.random.random((2, 2, 3)), mindspore.float32) labels_indices = Tensor(np.array([[0, 0], [1, 0]]), mindspore.int64) labels_values = Tensor(np.array([2, 2]), mindspore.int32) sequence_length = Tensor(np.array([2, 2]), mindspore.int32) ctc_loss = P.CTCLoss() output = ctc_loss(inputs, labels_indices, labels_values, sequence_length)问题:[ERROR] RUNTIME(105206)kernel task happen error, receive aicpu failed msg, aicpu error code=0x2.[ERROR] RUNTIME(105206)aicpu kernel execute failed, device_id=1, stream_id=515, task_id=6, fault so_name=libaicpu_kernels.so, fault kernel_name=CTCLoss【截图信息】【日志信息】(可选,上传日志内容或者附件)cat /usr/local/Ascend/driver/version.info Version=20.1.0 ascendhal_version=2.1.0 aicpu_version=1.0 tdt_version=1.0 log_version=1.0 prof_version=2.0 dvppkernels_version=1.0 tsfw_version=1.0 mmpa_version=1.0 required_firmware_firmware_version=1.0mindspore版本:1.0.1python版本:3.7.6
  • [执行问题] 【MindSpore】【运行时警告】GRAPH_MODE 下警告Cannot find valid TBE kernel inf
    【功能模块】【操作步骤&问题现象】1、出现下面警告2、配置如下:    parser = argparse.ArgumentParser(description='MindSpore LeNet Example')    parser.add_argument('--device_target', type=str, default="Ascend", choices=['Ascend', 'GPU', 'CPU'],                        help='device where the code will be implemented (default: CPU)')    args = parser.parse_args()    context.set_context(mode=context.GRAPH_MODE, device_target=args.device_target)    # context.set_context(mode=context.PYNATIVE_MODE, device_target=args.device_target)    dataset_sink_mode = not args.device_target == "CPU"警告如下:[WARNING] DEVICE(26509,python):2020-11-27-17:27:59.694.791 [mindspore/ccsrc/runtime/device/ascend/kernel_select_ascend.cc:552] SelectKernelInfo] The node [kernel_graph_1:equivdout{[0]: ValueNode<Primitive> Cast, [1]: [CNode]62}] cannot find valid TBE kernel info, try to get aicpu kernel info【截图信息】【日志信息】(可选,上传日志内容或者附件)
  • [执行问题] 【mindpsore】【Ascend训练作业】Op kernel_graph_1:equivdout{[0]: ValueNod
    我使用ascend训练作业在model中设置    'drop_connect'参数则有如下报错信息:RuntimeError: mindspore/ccsrc/backend/kernel_compiler/kernel_query.cc:90KernelQueryAll] NotExistsError Failed to obtain operator info,Please check whether the operator info is registered,Op full name:Default/network-TrainOneStepCell/network-WithLossCell/_backbone-GenEfficientNet/blocks-BlockBuilder/layer-SequentialCell/0-SequentialCell/0-DepthwiseSeparableConv/Dropout-op132Node Type:Dropout, Node DebugString: kernel_graph_1:equivdout{[0]: ValueNode<Primitive>Dropout, [1]: ValueNode<Tensor> Tensor(shape=[128, 1, 1, 1], dtype=Float32, value= [...])}如果不设置 drop_connect参数则无报错信息请问是什么原因,谢谢!
  • [执行问题] Mindspore 执行resnet50报错kernel_build_client.h:Response is empty
    运行环境:GPUMindspore:1.0.0CUDA:10.1【问题】运行resnet50(和googlenet)时报错kernel_build_client.h:Response is empty,但是相同代码改成运行alexnet,lenet等没有出现这种问题。感觉似乎没有配置上的错误,却经常出现kernel build为空的情况。
  • [Atlas200] 【atlas200】【kernel加载】kernel大小在xloader里面被限制为0xB00000,如何增大它?
    你们,我们自己需要修改kernel的配置,所以新编出来的kernel image的大小会超过0xB00000,放到200模块上加载时提示大小超限,请问如何解除这个限制?谢谢!
  • [Atlas300] 【Atlas300】【环境搭建】1.73版环境搭建问题
    按照官方手册安装了Ubuntu18.04.1,并升级kernel到4.15.0-99更新后发现这个版本的kernel会导致xwindows操作特别卡顿如果升级kernel到4.15.0-122就没有问题了,但这个版本又无法安装Atlas300的driver。请问有什么方法能解决这个冲突问题?
  • [Atlas200] 【kernel二次开发】如何获取源码包:Ascend310-source-20.0.RC1- minirc.tar.gz
    【操作步骤&问题现象】我们进行kernel二次开发编译得时候,需要源码包,如下图:但文档中提供得下载页面中没有这个包,请问哪里可以下载到,具体版本为1.73.5.1;Ascend310-source-20.0.RC1- minirc.tar.gz【截图信息】
  • [Atlas200] 【kernel二次开发】如何获取源码包:Ascend310-source-20.0.RC1- minirc.tar.gz
    【操作步骤&问题现象】200DK进行kernel二次开发编译得时候,需要源码包,如下图:但文档中提供得下载页面中没有这个包,请问哪里可以下载到,版本为1.73.5.1;【截图信息】
  • [开发环境] notebook中用terminal安装的库会同步到同环境的kernel 中吗?
    python的有些库不好安装,我会在terminal中进行安装,使用terminal切换到对应环境安装库,打开对应环境的.ipynb中能导入相应库吗?
  • [算子编译] 请问Graph Kernel Fusion(图算融合)支持GPU吗
    【功能模块】图算融合,GPU (NVIDIA-GV100) 验证https://www.mindspore.cn/tutorial/zh-CN/master/advanced_use/graph_kernel_fusion.htmlcontext.set_context(mode=context.GRAPH_MODE, device_target="GPU") context.set_context(save_graphs=True) context.set_context(enable_graph_kernel=True)【操作步骤&问题现象】1、使用mindspore repo中的gpu dockerfile建立运行环境2、改造链接中的例子,使用GPU作为device_target3、在GPU/docker环境中测试,并且得到一组.dot/.ir等文件4、发现没有生成例子当中的文件(hwopt_d_fuse_basic_opt_end_graph_0.dot/hwopt_d_composite_opt_end_graph_0.dot),观察其他生成的dot/ir文件,测试用例中的add/mul并没有融合附图:8_validate.dot.png
  • [问题求助] atlas 200 dk的Linux kernel在哪下载?
    在atlas 200 dk的文档 外围设备驱动接口部分里说明SDK发布的Kernel及文件系统,请问这个1.3.0.0对应的Linux的kernel在哪里下载?我在发布的mini_developerkit里面看到有编译好的,但是并没有内核源码。
  • [开发环境] 实战营第六章6.3课程为什么要在pip安装模块后要restart kernel?
    课程文档链接:https://nbviewer.jupyter.org/github/huaweicloud/ModelArts-Lab/blob/master/notebook/DL_video_object_segmentation/object_segmentation.ipynb为什么装完模块后要restart?按理说不需要这样做啊另一个问题:课程文档后面还有一个需要到terminal中执行命令的步骤,如下图所示:ipynb中不是有魔法命令吗?应该可以直接在ipynb中执行linux命令啊,为什么要专门去terminal中执行?
  • [问题求助] 【实战营提问】Notebook发生kernel died或者OOM后,删除core.*文件或者restart后,执行程序会报错
    1.Notebook发生kernel died或者OOM后Notebook发生kernel died或者OOM后,按照教程,删除core.*文件,环境restart,还是会报错,如下:ResourceExhaustedError: OOM when allocating tensor with shape[7,7,256,1024] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc  [[Node: mrcnn_class_conv1/kernel/Assign = Assign[T=DT_FLOAT, use_locking=true, validate_shape=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](mrcnn_class_conv1/kernel, mrcnn_class_conv1/random_uniform)]] Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info.2.当代码执行超过内存时,notebook环境会默认重启,重启后重新执行代码会报错,一般只能重建notebook环境,这种情况应该怎么办?
总条数:168 到第
上滑加载中