-
有没有cann20.2版本对应euler基础镜像。500小站升级了cann20.2的固件。网页部署镜像失败。想知道网页部署都挂载了哪些设备,哪些文件夹,默认环境变量值。
-
问题现象在部署在线服务时,部署失败。进入在线服务详情页面,“事件”页签,提示“failed to pull image, retry later”,同时在“日志”页签中,无任何信息。解决方法出现此问题现象,通常是因为您部署的模型过大导致的。解决方法如下:精简模型,重新导入模型和部署上线。购买专属资源池,在部署上线为在线服务时,使用专属资源池进行部署。
-
dockerhub上有两个notebook的镜像:mindspore/minimal-notebook和mindspore/base-notebook,但里面都是python3.8,似乎装不了mindspore。能不能提供下能运行教程中的notebook的镜像?
-
DockerHub上未找到arm64架构的opentsdb镜像。需要通过Dockerfile手动编译构建镜像,步骤可参考如下:1、docker安装参考鲲鹏平台Boostkit虚拟化使能套件安装部署dockerhttps://support.huaweicloud.com/instg-kunpengcpfs/kunpengdocker_03_0003.html2、Opentsdb Docker镜像制作1、修改Dockfile文件(可根据自己的需求进行修改,参考附件章节)vim Dockerfile2、files目录下是构建镜像时需要加载配置文件、运行脚本(可根据自己的需求进行修改,参考附件章节)3、创建镜像docker build -t kp/opentsdb-arm64:2.4.0 . --build-arg http_proxy=http://192.168.1.100:1111 --build-arg https_proxy=http://192.168.1.100:1111(其中http_proxy为代理,如果可以直接连外网则不需要配置)4、运行容器docker run -dp 4242:4242 --name opentsdb kp/opentsdb-arm64:2.4.03、使用Opentsdbhttp://your-serverIP:4242/4、附件Dockfile文件以及构建镜像时需要加载配置文件、运行脚本(参考PeterGrace/opentsdb-docker进行了修改),详见附件。5、参考:http://opentsdb.net/docs/build/html/resources.htmlhttps://github.com/PeterGrace/opentsdb-dockerhttps://blog.csdn.net/qq_20466211/article/details/109203567https://bbs.huaweicloud.com/forum/thread-77859-1-1.htmlhttps://www.jb51.net/article/106483.htm
-
## 1 简介 本指导主要介绍如何快速构建容器形态下的MindStudio+MindX SDK开发环境,所形成的docker镜像可在Ascend Driver版本为20.2的Atlas800-3000上快速部署容器开发环境。 ## 2 软件栈 | 软件 | 版本 | 说明 | 获取方式 | | :-----------------: | -------------------------------------------------------- | ------------------------------------------------------------ | ------------------------------------------------------------ | | mxManufacture | 20.2.0 | mxManufacture软件包 | [获取链接](https://ascend.huawei.com/zh/#/software/mindx-sdk/sdk-detail) | | MindStudio | 2.0.0-beta3 | MindStudio软件包 | [获取链接](https://ascend.huawei.com/#/software/mindstudio/download) | | matplotlib | 3.3.3 | Matplotlib 是 Python 的绘**。 它可与 NumPy 一起使用,提供了一种有效的 MatLab 开源替代方案 | [获取链接](https://files.pythonhosted.org/packages/7b/b3/7c48f648bf83f39d4385e0169d1b68218b838e185047f7f613b1cfc57947/matplotlib-3.3.3.tar.gz) | | Ascend-CANN-toolkit | 20.2.0 | Ascend-cann-toolkit开发套件包 | [获取链接](https://ascend.huawei.com/zh/#/software/cann/commercial) | | Docker基础镜像 | Ubuntu 18.04.5 LTS (Bionic Beaver) | docker内操作系统基础镜像 | docker hub | | Docker | Docker version 19.03.6, build 369ce74a3c | Docker | apt-get install docker-ce docker-ce-cli containerd.io | | Ascend Driver | 20.2.0 | Ascend310芯片驱动 | [获取链接](https://ascend.huawei.com/#/hardware/firmware-drivers?tag=commercial) | | 宿主机操作系统 | Ubuntu 18.04.1 LTS (GNU/Linux 4.15.0-29-generic aarch64) | 宿主机操作系统 | Ubuntu官网获取 | ## 3 制作步骤 ### 3.1 编写Dockerfile 编写Dockerfile如下,实际使用时可直接拷贝,Dockerfile为镜像制作的主要控制脚本。 ``` FROM ubuntu:18.04 WORKDIR /root # 设置代理,蓝区/公网无需 ENV http_proxy "http代理" ENV https_proxy "https代理" ENV no_proxy=127.0.0.1,.huawei.com,localhost,local,.local ARG ASCEND_BASE=/usr/local/Ascend ARG CANN_TOOLKIT_NAME=Ascend-cann-toolkit_20.2.rc1_linux-aarch64.run ARG MINDSTUDIO_NAME=MindStudio_2.0.0-beta3_linux.tar.gz COPY matplotlib-3.3.3.tar.gz /root COPY $CANN_TOOLKIT_NAME /root COPY $MINDSTUDIO_NAME /root #设置环境变量 ENV LD_LIBRARY_PATH=/usr/local/:/usr/local/lib/:/usr/lib/:$ASCEND_BASE/ascend-toolkit/latest/acllib/lib64:/usr/local/Ascend/driver/lib64:/usr/local/Ascend/add-ons/:$LD_LIBRARY_PATH ENV PYTHONPATH=$ASCEND_BASE/ascend-toolkit/latest/pyACL/python/site-packages/acl:$ASCEND_BASE/ascend-toolkit/latest/toolkit/python/site-packages:$PYTHONPATH ENV PATH=$ASCEND_BASE/ascend-toolkit/latest/toolkit/bin:/usr/local/python3.7.5/bin/:$PATH ENV PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=cpp RUN cp -a /etc/apt/sources.list /etc/apt/sources.list.bak \ && sed -i "s@http://.*ports.ubuntu.com@http://mirrors.huaweicloud.com@g" /etc/apt/sources.list \ && sed -i "s@https://.*ports.ubuntu.com@http://mirrors.huaweicloud.com@g" /etc/apt/sources.list \ && apt-get -y update \ # apt install 所需依赖库 && DEBIAN_FRONTEND=noninteractive apt-get install -y sudo wget gcc g++ cmake gdb vim libgdbm-dev \ && DEBIAN_FRONTEND=noninteractive apt-get install -y build-essential zlib1g zlib1g-dev libbz2-dev libsqlite3-dev openssl libssl-dev \ && DEBIAN_FRONTEND=noninteractive apt-get install -y libxslt1-dev libffi-dev unzip pciutils net-tools \ && DEBIAN_FRONTEND=noninteractive apt-get install -y pkg-config libglib2.0-dev libdbus-glib-1-dev openssh-server \ && DEBIAN_FRONTEND=noninteractive apt-get install -y gfortran libblas3 libblas-dev liblapack3 liblapack-dev libopenblas-dev m4 \ && DEBIAN_FRONTEND=noninteractive apt-get install -y openjdk-8-jdk openjfx \ && DEBIAN_FRONTEND=noninteractive apt-get install -y xterm firefox xdg-utils fonts-droid-fallback fonts-wqy-zenhei \ && DEBIAN_FRONTEND=noninteractive apt-get install -y fonts-wqy-microhei fonts-arphic-ukai fonts-arphic-uming gnome-keyring \ && DEBIAN_FRONTEND=noninteractive apt-get install -y libncursesw5-dev libncurses5-dev libfreetype6-dev libqhull-dev \ # system-profiling 依赖 && DEBIAN_FRONTEND=noninteractive apt-get install -y lsof ltrace net-tools iotop \ # 安装Python3.7.5 && wget --no-check-certificate https://mirrors.huaweicloud.com/python/3.7.5/Python-3.7.5.tgz \ && tar -zxvf Python-3.7.5.tgz \ && cd Python-3.7.5 \ && echo 'SSL=/usr/local/ssl'>>/root/Python-3.7.5/Modules/Setup.dist \ && echo '_ssl _ssl.c -DUSE_SSL -I$(SSL)/include -I$(SSL)/include/openssl -L$(SSL)/lib -lssl -lcrypto'>>/root/Python-3.7.5/Modules/Setup.dist \ && ./configure --prefix=/usr/local/python3.7.5 --enable-shared \ && make clean \ && make -j \ && make install \ && cp /usr/local/python3.7.5/lib/libpython3.7m.so.1.0 /usr/lib64 \ && cp /usr/local/python3.7.5/lib/libpython3.7m.so.1.0 /usr/lib \ # remove old link && rm -rf /usr/bin/python \ && rm -rf /usr/bin/pip \ && rm -rf /usr/bin/python3 \ && rm -rf /usr/bin/pip3 \ && rm -rf /usr/bin/python3.7 \ && rm -rf /usr/bin/pip3.7 \ && rm -rf /usr/bin/python3.7.5 \ && rm -rf /usr/bin/pip3.7.5 \ # add new link && ln -s /usr/local/python3.7.5/bin/python3 /usr/bin/python \ && ln -s /usr/local/python3.7.5/bin/pip3 /usr/bin/pip \ && ln -s /usr/local/python3.7.5/bin/python3 /usr/bin/python3 \ && ln -s /usr/local/python3.7.5/bin/pip3 /usr/bin/pip3 \ && ln -s /usr/local/python3.7.5/bin/python3 /usr/bin/python3.7 \ && ln -s /usr/local/python3.7.5/bin/pip3 /usr/bin/pip3.7 \ && ln -s /usr/local/python3.7.5/bin/python3 /usr/bin/python3.7.5 \ && ln -s /usr/local/python3.7.5/bin/pip3 /usr/bin/pip3.7.5 \ # 修复apt与python冲突问题 && apt-get -y remove --purge python3-apt \ && apt -y autoremove \ && apt-get -y install python-apt \ && rm -rf /usr/bin/lsb_release \ # 增加pip源 && mkdir ~/.pip \ && echo "[global]" >>~/.pip/pip.conf \ && echo "index-url=http://mirrors.tools.huawei.com/pypi/simple" >>~/.pip/pip.conf \ && echo "trusted-host=mirrors.tools.huawei.com" >>~/.pip/pip.conf \ # 安装python依赖 && sudo pip3.7 install --upgrade pip \ && sudo pip3.7 install grpcio \ && sudo pip3.7 install grpcio-tools \ && sudo pip3.7 install requests \ && sudo pip3.7 install gnureadline \ && sudo pip3.7 install numpy \ && sudo pip3.7 install decorator \ && sudo pip3.7 install pyyaml\ && sudo pip3.7 install pathlib2 \ && sudo pip3.7 install protobuf==3.11.3 \ && sudo pip3.7 install sympy==1.4.0 \ && sudo pip3.7 install pandas==1.1.5 \ && sudo pip3.7 install pillow==8.0.1 \ && sudo pip3.7 install xlrd==1.2.0 \ && sudo pip3.7 install cffi==1.12.3 \ && sudo pip3.7 install scipy coverage pylint psutil attrs absl-py # 编译安装matplotlib RUN cd /root \ && tar -zxvf matplotlib-3.3.3.tar.gz && cd matplotlib-3.3.3 \ && echo "[libs]" >>/root/matplotlib-3.3.3/setup.cfg \ && echo "system_freetype=true" >>/root/matplotlib-3.3.3/setup.cfg \ && echo "system_qhull=true" >>/root/matplotlib-3.3.3/setup.cfg \ && python3 -m pip install . \ # 需要重新创建python软连接 && rm -rf /usr/bin/python \ && rm -rf /usr/bin/pip \ && ln -s /usr/local/python3.7.5/bin/python3 /usr/bin/python \ && ln -s /usr/local/python3.7.5/bin/pip3 /usr/bin/pip \ # 创建HwHiAiUser用户 && groupadd -g 1000 HwHiAiUser && useradd -d /home/HwHiAiUser -m -u 1000 -g 1000 -s /bin/bash HwHiAiUser \ # system-profiling 依赖 && sudo pip3.7 install Django Django-sslserver six apscheduler requests \ && sed -i '/^root/a\HwHiAiUser ALL=(ALL:ALL) NOPASSWD: ALL' /etc/sudoers \ # install perf && apt-get install -y linux-tools-common linux-source libaudit-dev flex bison \ && cd /usr/src/ \ && tar -jxvf linux-source-4.15.0.tar.bz2 \ && cd /usr/src/linux-source-4.15.0/tools/perf \ && make \ && cp ./perf /usr/bin/perf \ # install CANN Toolkit and Mindstudio && cd /root \ && chmod 777 $CANN_TOOLKIT_NAME \ && ./$CANN_TOOLKIT_NAME --install \ && tar -zxvf $MINDSTUDIO_NAME \ # 配置sshd && 环境变量 && sed -i 's/#*PermitRootLogin prohibit-password/PermitRootLogin yes/g' /etc/ssh/sshd_config \ && sed -i 's/UsePAM yes/UsePAM no/g' /etc/ssh/sshd_config \ && echo 'ASCEND_BASE=/usr/local/Ascend'>>/etc/profile \ && echo 'export LD_LIBRARY_PATH=/usr/local/:/usr/local/lib/:/usr/lib/:$ASCEND_BASE/ascend-toolkit/latest/acllib/lib64:$ASCEND_BASE/driver/lib64:$ASCEND_BASE/add-ons/:$LD_LIBRARY_PATH'>>/etc/profile \ && echo 'export PYTHONPATH=$ASCEND_BASE/ascend-toolkit/latest/pyACL/python/site-packages/acl:$ASCEND_BASE/ascend-toolkit/latest/toolkit/python/site-packages:$PYTHONPATH'>>/etc/profile \ && echo 'export PATH=$ASCEND_BASE/ascend-toolkit/latest/toolkit/bin:/usr/local/python3.7.5/bin/:$PATH'>>/etc/profile \ && echo 'export PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=cpp'>>/etc/profile \ && service ssh start \ # clean && rm -rf /root/var \ && rm -rf /root/ide_daemon \ && rm -rf /root/$MINDSTUDIO_NAME \ && rm -rf /root/$CANN_TOOLKIT_NAME \ && rm -rf /root/Python-3.7.5* \ && rm -rf /root/matplotlib-3.3.3* \ && apt-get autoclean \ && apt-get clean \ && apt-get autoremove \ && rm -rf /var/cache/apt # 自启动sshd服务并且暴露22端口 EXPOSE 22 CMD ["/usr/sbin/sshd", "-D"] #拷贝业务推理程序压缩包、安装脚本与运行脚本 RUN cd /root ARG DIST_PKG=mxManufacture-for-sandbox.tar.gz COPY $DIST_PKG . RUN tar -xzf $DIST_PKG \ && rm $DIST_PKG #安装SDK依赖 RUN python3.7 -m pip install flask; \ apt -y install libgl1-mesa-glx # 取消代理,蓝区/公网无需 ENV http_proxy= ENV https_proxy= ENV no_proxy= ``` ### 3.2 准备镜像制作目录 #### 3.2.1 编写docker_build.sh脚本 docker_build.sh主要用于启动镜像制作,编写如下,实际使用时可直接拷贝。 ``` # 先停止正在运行的mindstudio_sdk容器 docker kill mindstudio_sdk docker rm mindstudio_sdk # 构建容器镜像,$1为镜像名与tag号 docker rmi -f $1 docker build -t $1 . ``` **注意:**其中$1为docker_build.sh的启动参数,用于指定的镜像名与tag号,以“:”相连,例如mindstudiosdksandbox:v0。 #### 3.2.2 编写docker_run.sh脚本 docker_run.sh主要用于启动容器,编写如下,实际使用时可直接拷贝。 ``` docker kill mindstudio_sdk docker rm mindstudio_sdk # 宿主机上的NPU设备,比如/dev/davinci0,/dev/davinci1,/dev/davinci2等 export device=/dev/davinci0 # X11需要设置的DISPLAY环境变量,即客户端IP export DISPLAY=$1:0 # 容器中的SSH端口(22)映射到主机的端口(20000),主机端口需要未被占用 export port0=20000 # 容器中sdk的服务端口(8765)主机的端口${portsdk},主机端口需要未被占用 export port1=8765 # 构建的MindStudio镜像名称及标签 export image_name=$2 # 运行的容器名称 export container_name=mindstudio_sdk # 启动容器 docker run -itd \ --device=${device} \ --device=/dev/davinci_manager \ --device=/dev/devmm_svm \ --device=/dev/hisi_hdc \ --cap-add=SYS_PTRACE --cap-add=SYS_ADMIN \ -v /sys/kernel/debug:/sys/kernel/debug \ -v /usr/local/Ascend/driver:/usr/local/Ascend/driver \ -v $HOME/.Xauthority:/root/.Xauthority \ -e DISPLAY=$DISPLAY \ -p ${port0}:22 \ -p ${port1}:8765 \ --name ${container_name} \ ${image_name} # 进入容器 docker exec -it mindstudio_sdk bash ``` **注意:**其中$1与$2均为docker_run.sh的启动参数,$1指定客户端IP,$2指定启动镜像,如mindstudiosdksandbox:v0。 #### 3.2.3 打包mxManufacture-for-sandbox.tar.gz 将mxManufacture软件包与其所需的模型、sample code、测试图片放至同一目录,运行如下命令,打包生成mxManufacture-for-sandbox.tar.gz。 ``` tar -czf mxManufacture-for-sandbox.tar.gz Ascend-mindxsdk-mxmanufacture_2.0.1.b021_linux-aarch64.run [模型文件] [sample code] [测试图片] [...] ``` #### 3.2.4 镜像制作目录准备完成 最后将如上Dockerfile、脚本与软件包放至同一目录,完成docker镜像制作目录,如下:  ## 4 制作镜像 在镜像制作目录中运行如下命令,启动镜像制作。 ``` bash docker_build.sh mindstudiosdksandbox:v0 . ``` **注意:**最后的.代表本次执行的上下文路径,请不要遗漏,当出现“**Successfully built**”表示镜像构建成功。 镜像构建完成后,执行以下命令查看镜像信息。 ``` docker images ``` 显示示例: ``` REPOSITORY TAG IMAGE ID CREATED SIZE mindstudiosdksandbox v0 af75563c2427 6 hours ago 10.9GB ``` ## 5 启动容器&MindStudio 在镜像制作目录中运行如下命令,启动容器。 ``` bash docker_run.sh 客户端IP> mindstudiosdksandbox:v0 ``` 可以看到在容器内/root目录下有如下内容。  在/root目录下运行如下命令,启动MindStudio。 ``` cd MindStudio/bin/ ./MindStudio.sh ```  ## 6 保存MindStudio+MindX SDK容器镜像 退出容器,返回镜像制作目录,运行如下命令,保存MindStudio+MindX SDK容器镜像。 ``` docker save mindstudiosdksandbox:v0 -o docker-image-mindstudiosdksandbox-v0.tar.gz ```
-
我希望在Ascend910上使用Pytorch训练自己的模型,但是目前遇到几个问题:1. ECS中没有找到购买910的服务器的地方2. modelart中的镜像只支持mindspore和tensorflow,没有看到pytorch3. modelart自定义镜像文档中没有看到自定义910镜像的文档,只有自定义GPU镜像的文档。https://support.huaweicloud.com/engineers-modelarts/modelarts_23_0085.html没有910的指导
-
FileBeat镜像更新延迟,没有最新的7.10.X,希望可以同步最新的过来,谢谢
-
1.起因客户的代码环境均是在本地,包括gitlib仓库也是部署在本地;客户希望通过本地IDE环境,在线下实现代码开发,并通过Maven的maven-docker-plugin插件,实现本地容器镜像封装,同时推送容器镜像到华为云SWR镜像仓库,尽可能的实现发布流程自动化;但是在实现的时候,往华为云上推送镜像时,一直出错,无法成功推送;插件推送时,报错信息如下:[INFO] Pushing swr.cn-east-2.myhuaweicloud.com/busyfan/my-web:1.0The push refers to repository [swr.cn-east-2.myhuaweicloud.com/busyfan/my-web][WARNING] Failed to push swr.cn-east-2.myhuaweicloud.com/busyfan/my-web:1.0, retrying in 10 seconds (1/5).[INFO] Pushing swr.cn-east-2.myhuaweicloud.com/busyfan/my-web:1.0The push refers to repository [swr.cn-east-2.myhuaweicloud.com/busyfan/my-web][WARNING] Failed to push swr.cn-east-2.myhuaweicloud.com/busyfan/my-web:1.0, retrying in 10 seconds (2/5).[INFO] Pushing swr.cn-east-2.myhuaweicloud.com/busyfan/my-web:1.0The push refers to repository [swr.cn-east-2.myhuaweicloud.com/busyfan/my-web][WARNING] Failed to push swr.cn-east-2.myhuaweicloud.com/busyfan/my-web:1.0, retrying in 10 seconds (3/5).[INFO] Pushing swr.cn-east-2.myhuaweicloud.com/busyfan/my-web:1.0The push refers to repository [swr.cn-east-2.myhuaweicloud.com/busyfan/my-web][WARNING] Failed to push swr.cn-east-2.myhuaweicloud.com/busyfan/my-web:1.0, retrying in 10 seconds (4/5).[INFO] Pushing swr.cn-east-2.myhuaweicloud.com/busyfan/my-web:1.0The push refers to repository [swr.cn-east-2.myhuaweicloud.com/busyfan/my-web][WARNING] Failed to push swr.cn-east-2.myhuaweicloud.com/busyfan/my-web:1.0, retrying in 10 seconds (5/5).[INFO] Pushing swr.cn-east-2.myhuaweicloud.com/busyfan/my-web:1.0The push refers to repository [swr.cn-east-2.myhuaweicloud.com/busyfan/my-web]Failed to push swr.cn-east-2.myhuaweicloud.com/busyfan/my-web:1.0, retrying in 10 seconds (5/5).Failed to execute goal com.spotify:docker-maven-plugin:1.2.2:build (default-cli) on project docker-plugin122: Exception caught2.对比测试整了快一天了,死活是调试不通,一直以为是自己的配置文件有问题,各种查文档,各种改配置,都快崩溃了;快下班的时候,突然想着,要不往hub.docker.com上推送一下试试看,没马想竟然一下子就推送成功了......实在没想到是华为云SWR平台有问题啊。。。找到问题所在就好办了,换到华东-上海一地域,也是一下子就推送成功了,了然。插件版本华为-华东-上海一华为-华东-上海二hub.docker.com0.4.13推送成功推送成功推送成功1.2.2推送成功推送失败推送成功上表是各种测试后的结果;因为日常默认使用的地域就是(华东-上海二),所以就被抗了一天时间;没想到会是SWR平台的问题,是因为前几天使用0.4.13版本的插件,是能成功的。3.pom.xml(华东-上海二) <plugin> <groupId>com.spotify</groupId> <artifactId>docker-maven-plugin</artifactId> <version>0.4.13</version> <!-- <version>1.2.2</version> --> <configuration> <!-- 镜像名称,由两部分组成: 1. 地域endpoint:swr.cn-east-2.myhuaweicloud.com 2. 该地域内创建的组织名称:busyfan --> <imageName>swr.cn-east-2.myhuaweicloud.com/busyfan/my-web:1.0</imageName> <dockerHost>http://192.168.10.84:2375</dockerHost> <baseImage>java:8</baseImage> <entryPoint>["java", "-jar", "/${project.build.finalName}.jar"]</entryPoint> <resources> <resource> <targetPath>/</targetPath> <directory>${project.build.directory}</directory> <include>${project.build.finalName}.jar</include> </resource> </resources> <serverId>busyfan</serverId> </configuration> </plugin>个人猜测,大概是因为(华东-上海二)目前已经不开放给新用户使用了,所以该地域的很多服务,已经不怎么更新了;所以这就算是个BUG了吧。
-
【问题描述】使用singularity方式创造ubuntu镜像安装MindSpore ,出现 cudaSetDevice failed, ret[999], unknown error 问题原生操作系统: CentOS Linux release 7.4.1708 (Core)singularity版本: 3.5.2镜像操作系统: ubuntu 18.04.5 LTS (Bionic Beaver) 镜像源: docker://nvidia/cuda:10.1-cudnn7-devel-ubuntu18.04在镜像操作系统安装MindSpore1.1.1 按照安装步骤安装成功,使用样例程序验证报错:[ERROR] DEVICE(11474,python):2021-04-01-01:26:20.266.013 [mindspore/ccsrc/runtime/device/gpu/cuda_driver.cc:244] set_current_device] cudaSetDevice failed, ret[999], unknown error[ERROR] SESSION(11474,python):2021-04-01-01:26:20.266.099 [mindspore/ccsrc/backend/session/gpu_session.cc:97] Init] GPUSession failed to set current device id.Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/opt/anaconda3/envs/python3.7/lib/python3.7/site-packages/mindspore/ops/primitive.py", line 186, in __call__ return _run_op(self, self.name, args) File "/opt/anaconda3/envs/python3.7/lib/python3.7/site-packages/mindspore/common/api.py", line 75, in wrapper results = fn(*arg, **kwargs) File "/opt/anaconda3/envs/python3.7/lib/python3.7/site-packages/mindspore/ops/primitive.py", line 525, in _run_op output = real_run_op(obj, op_name, args)RuntimeError: mindspore/ccsrc/backend/session/gpu_session.cc:97 Init] GPUSession failed to set current device id.【截图信息】请问有大神知道这个是什么原因吗?该怎么解决呢?
-
【功能模块】ECS, IMS【操作步骤&问题现象】1、我看ECS(鲲鹏)支持创建银河麒麟V10桌面版操作系统,于是在OBS上传了ISO镜像:Kylin-Desktop-V10-Release-Build1-20200710-2-arm64.iso 2、接着在镜像的操作里面点击“安装服务器”3、临时ECS创建成功后,点击远程登陆 4、参照:文档首页 > 镜像服务 IMS > 用户指南> 创建私有镜像> 通过ISO文件创建Linux系统盘镜像> 安装Linux操作系统 在界面上选择Install***之后,没有进入类似的安装配置界面,一直停留在“黑屏”。5、寻求技术支持后,华为工程师用我共享的镜像验证过,也是一样的问题。工单编号:TS2021032700126、我另外上传了Kylin-Server-10-SP1-Release-Build04-20200711-arm64、Kylin-Server-10-SP1-Release-Build19-20210319-aarch64,服务版镜像都安装成功并可正常使用。【截图信息】无【日志信息】(可选,上传日志内容或者附件)无
-
云道mindspore自定义镜像不能使用mindspore进行多卡训练。hccl无法初始化,可能是IP配置文件的IP是192.168开头的内网IP导致?基础镜像地址:D910+ME版本包查看 - 深度学习服务团队 - 3ms知识管理社区 (huawei.com)roma:swr.cn-north-4.myhuaweicloud.com/modelarts-job-dev-image/mindspore-ascend910-cp37-euleros2.8-aarch64-training:1.2.0-3.1.2-roma
-
论文《MIRROR-GENERATIVE NEURAL MACHINE TRANSLATION》概述如下:本文提出一种镜像生成式的翻译模型,通过共享隐语义空间对两种不同的语言进行建模,并通过回译的方法来提高翻译的质量。同时该模型也可以利用非平行双语语料数据来训练隐语义空间,提高翻译句子的流畅性,提高了低资源语言之间的翻译质量。训练神经机器翻译模型(NMT)需要大量的并行运算语料库,对于许多语言对来说都是稀缺的。然而,原始非平行语料库通常很容易获得。现有的方法没有充分利用非平行双语资料在训练或解码方面的潜力。在本文中,作者提出了镜像生成NMT(MGNMT),一个统一的体系结构它同时集成了源到目标的翻译模型源代码翻译模型和两种语言模型。翻译模型和语言模型共享相同的潜在语义空间,因此两种语言模型都是翻译方向可以更有效地从非并行数据中学习。另外,翻译模型和语言模型可以在解码过程中协同工作。作者的实验结果表明,所提出的MGNMT的性能在各种语言对和场景中的都优于其他类似的方法,包括资源丰富的以及资源不足的情况。地址:https://iclr.cc/virtual/poster_HkxQRTNYPH.html
-
昇腾镜像仓库的ascend-mindspore-x86镜像缺少cann toolkit不能运行mindsporeascend-mindspore-x86镜像只安装了cann nnae,mindspore需要用到atc包,而atc包只在cann toolkit包里。能否重新更新一下ascend-mindspore-x86镜像和ascend-mindspore-arm镜像?另外我自己在镜像安装cann的驱动报错,如何解决呢?
-
在制作适配300-3010卡的docker镜像时,按文档步骤无法找到制作镜像所需文件。如下图所示,在指示路径下找不到 preinstall.sh 和 postinstall.sh文档。麻烦指导下,谢谢!文档路径:https://support.huaweicloud.com/instg-container-image202/atlasdo_03_0013.html
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签