- 问题描述: 如下图,其实此时服务已经倒计时结束,但是状态显示在 运行中 。只有刷新才能正常显示 [图片] - 刷新之后 [图片] 建议方案: 倒计时结束显示正常的运行状态 问题描述: 如下图,其实此时服务已经倒计时结束,但是状态显示在 运行中 。只有刷新才能正常显示 [图片] - 刷新之后 [图片] 建议方案: 倒计时结束显示正常的运行状态
- 问题描述: 在完成云端实验《使用ModelArts中开发工具学习Python(高级)》时,按照教程打开创建的NoteBook时失败,总是显示启动失败,会自动停止,如图所示: [图片] 选择启动也是会自动停止,无法进行云端实验,不知道为什么? 想查看消费信息,检查是否欠费,但显示没有权限,我使用的不是免费体验规格,教程中也为说要使用免费体验规格。 建议方案: 优化实验环境,确保实验可以正常进行,不会出现这种非实验操作者因素导致的实验无法进行。 问题描述: 在完成云端实验《使用ModelArts中开发工具学习Python(高级)》时,按照教程打开创建的NoteBook时失败,总是显示启动失败,会自动停止,如图所示: [图片] 选择启动也是会自动停止,无法进行云端实验,不知道为什么? 想查看消费信息,检查是否欠费,但显示没有权限,我使用的不是免费体验规格,教程中也为说要使用免费体验规格。 建议方案: 优化实验环境,确保实验可以正常进行,不会出现这种非实验操作者因素导致的实验无法进行。
- 问题描述: 进入ModelArts,点击‘开发环境’-notebook 点‘创建’ 按提示录入信息,并提交 创建成功,此时可以看到该创建的notebook已在‘启动中'状态 启动完成后,转为‘运行中’的状态 因为notebook是按‘运行中’的状态收费,是否启动运行该notebook,应有用户的明确指令 而且创建的步骤里,也没有任何提示,告诉用户创建成功后会自动启动 [图片] 建议方案: 创建成功后,不要自动启动 如果创建成功后必须自动启动,应在创建过程中有提示,告知用户该信息 问题描述: 进入ModelArts,点击‘开发环境’-notebook 点‘创建’ 按提示录入信息,并提交 创建成功,此时可以看到该创建的notebook已在‘启动中'状态 启动完成后,转为‘运行中’的状态 因为notebook是按‘运行中’的状态收费,是否启动运行该notebook,应有用户的明确指令 而且创建的步骤里,也没有任何提示,告诉用户创建成功后会自动启动 [图片] 建议方案: 创建成功后,不要自动启动 如果创建成功后必须自动启动,应在创建过程中有提示,告知用户该信息
- 问题描述: 在“费用中心”总览中没有显示正在消费的项目。 虽然"资金管理"中有“收支明细”,而打开“费用中心”时,不够直接显示正在消费的项目,可以提醒用户及时关/调设置。 建议方案: 在“费用中心”总览中设置“正在消费”,提醒用户关注费用的及时变化 问题描述: 在“费用中心”总览中没有显示正在消费的项目。 虽然"资金管理"中有“收支明细”,而打开“费用中心”时,不够直接显示正在消费的项目,可以提醒用户及时关/调设置。 建议方案: 在“费用中心”总览中设置“正在消费”,提醒用户关注费用的及时变化
- 问题描述: 我在modelarts运行mindspore平台附件的主运行程序gpt2_dataset_errtest_model.py内 开头增加: context.set_context(mode=context.GRAPH_MODE, device_target="Ascend") context.set_context(device_id=device_id) 然后程序就会出错提示device0 被占用,这个问题如何解决,代码见我的附件 注释掉context.set_context(device_id=device_id)或者 注释掉 context.set_context(mode=context.GRAPH_MODE, device_target="Ascend") 任一句程序都是可以通过的,这个问题太奇怪了,对用户使用来说完全摸不着头脑,调试了N天才发现这个错误位置 后有网友指出是手动指定device_id就会报错,但官方的文档和例子都没有在这块好好说明一下,而这两句是很基本和重要的系统配置语句 那为什么看了官方的几个example:sample_for_cloud,transformer和bert都是完全一样或者类似手动指定device_id的呢,我也是按着例子学的 对我很重要的问题,就是因为这个我的gpt2模型一直无法通过运行,而且靠猜测调试了很久,才定位到这句话出问题,但定位到了,也不知错误原因,模型简化后附上附件 打印错误提示如下: xmask=[[1 0 1 0] [1 0 1 0] [1 0 1 0] [1 0 1 0]] ds.get_dataset_size=16 ds.output_shapes=[[4, 4], [4, 4]] [ERROR] UTILS(163,python):2020-08-15-06:31:42.435.319 [mindspore/ccsrc/utils/context/ms_context.cc:216] OpenTsd] Device 0 is occupied, open tsd failed, status = 16986314. Traceback (most recent call last): File "/home/work/user-job-dir/data_err_model/gpt2_dataset_errtest_model.py", line 117, in <module> netwithloss = GPT2NetworkWithLoss(None, True) File "/home/work/user-job-dir/data_err_model/gpt2_dataset_errtest_model.py", line 60, in __init__ super(GPT2NetworkWithLoss, self).__init__(auto_prefix=False) File "/usr/local/ma/python3.7/lib/python3.7/site-packages/mindspore/nn/cell.py", line 71, in __init__ init_backend() RuntimeError: mindspore/ccsrc/utils/context/ms_context.cc:216 OpenTsd] Device 0 is occupied, open tsd failed, status = 16986314. [Modelarts Service Log]Training end with return code: 1 [Modelarts Service Log]2020-08-15 06:31:43,745 - ERROR - FMK of device7 (pid: [163]) has exited with non-zero code: 1 [Modelarts Service Log]2020-08-15 06:31:43,745 - INFO - Begin destroy FMK processes [Modelarts Service Log]2020-08-15 06:31:43,745 - INFO - FMK of device7 (pid: [163]) has exited 建议方案: context.set_context(device_id=device_id) 这句话的意义是什么,什么情况下要加,或者不加,例子基本都有加这一项配置,为什么会导致系统崩溃 麻烦能在帮助文档上好好说说系统配置的问题,特别是这种几乎各个模型都要的项目配置 问题描述: 我在modelarts运行mindspore平台附件的主运行程序gpt2_dataset_errtest_model.py内 开头增加: context.set_context(mode=context.GRAPH_MODE, device_target="Ascend") context.set_context(device_id=device_id) 然后程序就会出错提示device0 被占用,这个问题如何解决,代码见我的附件 注释掉context.set_context(device_id=device_id)或者 注释掉 context.set_context(mode=context.GRAPH_MODE, device_target="Ascend") 任一句程序都是可以通过的,这个问题太奇怪了,对用户使用来说完全摸不着头脑,调试了N天才发现这个错误位置 后有网友指出是手动指定device_id就会报错,但官方的文档和例子都没有在这块好好说明一下,而这两句是很基本和重要的系统配置语句 那为什么看了官方的几个example:sample_for_cloud,transformer和bert都是完全一样或者类似手动指定device_id的呢,我也是按着例子学的 对我很重要的问题,就是因为这个我的gpt2模型一直无法通过运行,而且靠猜测调试了很久,才定位到这句话出问题,但定位到了,也不知错误原因,模型简化后附上附件 打印错误提示如下: xmask=[[1 0 1 0] [1 0 1 0] [1 0 1 0] [1 0 1 0]] ds.get_dataset_size=16 ds.output_shapes=[[4, 4], [4, 4]] [ERROR] UTILS(163,python):2020-08-15-06:31:42.435.319 [mindspore/ccsrc/utils/context/ms_context.cc:216] OpenTsd] Device 0 is occupied, open tsd failed, status = 16986314. Traceback (most recent call last): File "/home/work/user-job-dir/data_err_model/gpt2_dataset_errtest_model.py", line 117, in <module> netwithloss = GPT2NetworkWithLoss(None, True) File "/home/work/user-job-dir/data_err_model/gpt2_dataset_errtest_model.py", line 60, in __init__ super(GPT2NetworkWithLoss, self).__init__(auto_prefix=False) File "/usr/local/ma/python3.7/lib/python3.7/site-packages/mindspore/nn/cell.py", line 71, in __init__ init_backend() RuntimeError: mindspore/ccsrc/utils/context/ms_context.cc:216 OpenTsd] Device 0 is occupied, open tsd failed, status = 16986314. [Modelarts Service Log]Training end with return code: 1 [Modelarts Service Log]2020-08-15 06:31:43,745 - ERROR - FMK of device7 (pid: [163]) has exited with non-zero code: 1 [Modelarts Service Log]2020-08-15 06:31:43,745 - INFO - Begin destroy FMK processes [Modelarts Service Log]2020-08-15 06:31:43,745 - INFO - FMK of device7 (pid: [163]) has exited 建议方案: context.set_context(device_id=device_id) 这句话的意义是什么,什么情况下要加,或者不加,例子基本都有加这一项配置,为什么会导致系统崩溃 麻烦能在帮助文档上好好说说系统配置的问题,特别是这种几乎各个模型都要的项目配置
-
【功能建议】modelarts部署的日志 预审不通过问题描述: 日志刷新出来太慢太慢,,,,,,,这个改起来应该很简单吧 建议方案: 问题描述: 日志刷新出来太慢太慢,,,,,,,这个改起来应该很简单吧 建议方案:
-
【产品缺陷】modelart的使用文档 预审不通过问题描述: modelart的使用文档极其难读。 建议方案:新版的modelart需要更新旧版的文档。 问题描述: modelart的使用文档极其难读。 建议方案:新版的modelart需要更新旧版的文档。
- 问题描述: 在ModelArts切换到新版,然后下面如图显示错乱,页面并没有进行过缩放,屏幕分辨率为1366*768,浏览器为chrome [图片] [图片] 建议方案:调整页面 问题描述: 在ModelArts切换到新版,然后下面如图显示错乱,页面并没有进行过缩放,屏幕分辨率为1366*768,浏览器为chrome [图片] [图片] 建议方案:调整页面
- 问题描述: ModelArts新旧版切换按钮时而显示,时而不显示,大部分时间是不显示的,如图 [图片][图片] 建议方案:修复bug 问题描述: ModelArts新旧版切换按钮时而显示,时而不显示,大部分时间是不显示的,如图 [图片][图片] 建议方案:修复bug
- 问题描述: ModelArts 统一集成OBS操作、减少用户对OBS感知和界面切换。 建议方案: 数据集等相关页面建议集成OBS创建桶和数据上传的操作,一方面简化用户反复切换服务界面操作、另一方面通过平台屏蔽存储概念简化使用 问题描述: ModelArts 统一集成OBS操作、减少用户对OBS感知和界面切换。 建议方案: 数据集等相关页面建议集成OBS创建桶和数据上传的操作,一方面简化用户反复切换服务界面操作、另一方面通过平台屏蔽存储概念简化使用
- 问题描述: 1、模型导入时间过久建议优化。 1M多文件,导入、构建到正常花了18分钟, [图片] 建议方案: 建议优化,同时对于时间过久建议提供进度查询 问题描述: 1、模型导入时间过久建议优化。 1M多文件,导入、构建到正常花了18分钟, [图片] 建议方案: 建议优化,同时对于时间过久建议提供进度查询
- 问题描述: 在使用ModelArts的AI市场的YOLOv3_Resnet18算法(Ascend 910训练版本,最新发布的第11版本)存在Bug,当我使用我发布的数据集训练时,总是在执行一定时间(1小时以内)无故报错,导致运行失败,但是同等条件下,只是换为了第10版算法就能成功运行了。 而我的同学同样使用该算法的第11版本,同等条件下,只是只用了我的部分数据集就能够正常训练,没用问题,并能得到.pb模型,也能部署到Ascend 310上。 这就很奇怪,是因为我的数据集太大了(不到11000张图片,我同学使用的是从我的不到11000张图片中选出的不到9000张图片),所以失败了? 但是这个数据集,使用第10版算法是可以的,目前已正常运行了3个多小时。 建议方案: 个人认为ModelArts的AI市场的YOLOv3_Resnet18算法(Ascend 910训练版本,最新发布的第11版本)存在Bug,当数据集在11000张图片及以上时,无故训练报错,希望能优化改进一下。 问题描述: 在使用ModelArts的AI市场的YOLOv3_Resnet18算法(Ascend 910训练版本,最新发布的第11版本)存在Bug,当我使用我发布的数据集训练时,总是在执行一定时间(1小时以内)无故报错,导致运行失败,但是同等条件下,只是换为了第10版算法就能成功运行了。 而我的同学同样使用该算法的第11版本,同等条件下,只是只用了我的部分数据集就能够正常训练,没用问题,并能得到.pb模型,也能部署到Ascend 310上。 这就很奇怪,是因为我的数据集太大了(不到11000张图片,我同学使用的是从我的不到11000张图片中选出的不到9000张图片),所以失败了? 但是这个数据集,使用第10版算法是可以的,目前已正常运行了3个多小时。 建议方案: 个人认为ModelArts的AI市场的YOLOv3_Resnet18算法(Ascend 910训练版本,最新发布的第11版本)存在Bug,当数据集在11000张图片及以上时,无故训练报错,希望能优化改进一下。
-
【产品缺陷】ModelArts界面问题 预审不通过问题描述: [图片] 昨天还正常,但今天通过公测申请后,进来这个界面 建议方案: 问题描述: [图片] 昨天还正常,但今天通过公测申请后,进来这个界面 建议方案:
- 问题描述: 在ModelArts的数据集管理中,可以自行创建数据集,同时可以选择上传图片,直接加数据到数据集中,也可以先上传到桶中,直接从OBS桶下载,但是无法在标注界面或数据集界面下载特定图片,这就不太好: 比如我想下载某张或某些标签的图片做处理,这无法在数据集界面做到,如图所示,而如果从OBS桶下载,无法对想要的图片进行选择。 不太方便。 [图片] 建议方案: 在数据集界面增加下载图片或下载某类标签图片的选项。 问题描述: 在ModelArts的数据集管理中,可以自行创建数据集,同时可以选择上传图片,直接加数据到数据集中,也可以先上传到桶中,直接从OBS桶下载,但是无法在标注界面或数据集界面下载特定图片,这就不太好: 比如我想下载某张或某些标签的图片做处理,这无法在数据集界面做到,如图所示,而如果从OBS桶下载,无法对想要的图片进行选择。 不太方便。 [图片] 建议方案: 在数据集界面增加下载图片或下载某类标签图片的选项。
-
【用户体验】ModelArts 未采纳问题描述: 做学习作业时候,开发环境需要收费28元/小时,希望在使用开发环境的时候,旁边有个实时的消费金额【使用时间*28¥/h】。 [图片] 建议方案: 免费的开发环境需要72个小时后自动回收资源,最好在创建时间旁边的加个“回收时间”的提示! 问题描述: 做学习作业时候,开发环境需要收费28元/小时,希望在使用开发环境的时候,旁边有个实时的消费金额【使用时间*28¥/h】。 [图片] 建议方案: 免费的开发环境需要72个小时后自动回收资源,最好在创建时间旁边的加个“回收时间”的提示!
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签