- 场景描述:华为云maas服务,贵阳一没有上线Qwen3-VL-235B-A22B和GLM-4.6-357B模型 建议方案:建议上线Qwen3-VL-235B-A22B和GLM-4.6-357B模型 场景描述:华为云maas服务,贵阳一没有上线Qwen3-VL-235B-A22B和GLM-4.6-357B模型 建议方案:建议上线Qwen3-VL-235B-A22B和GLM-4.6-357B模型
- 场景描述:https://www.huaweicloud.com/ai/token-service.htmlhttps://support.huaweicloud.com/price-modelarts/price-modelarts-0047.html你这里tokens的套餐包有一个问题,第一个链接中存在新老共享的标签,但是在第二个链接里并未展现出来。建议方案:明确新老共享标签内容,例如在功能页中添加deepseekV3或者R1套餐包里面支持的具体模型,对应maas平台里商用服务的模型名称 场景描述:https://www.huaweicloud.com/ai/token-service.htmlhttps://support.huaweicloud.com/price-modelarts/price-modelarts-0047.html你这里tokens的套餐包有一个问题,第一个链接中存在新老共享的标签,但是在第二个链接里并未展现出来。建议方案:明确新老共享标签内容,例如在功能页中添加deepseekV3或者R1套餐包里面支持的具体模型,对应maas平台里商用服务的模型名称
- 场景描述:ModelArts Studio通过API调用大模型,频繁弹出敏感信息提示,对消费者用户已经达到了几乎不可用的状态。 建议方案:调整ModelArts Studio通过API调用大模型的审查策略。 场景描述:ModelArts Studio通过API调用大模型,频繁弹出敏感信息提示,对消费者用户已经达到了几乎不可用的状态。 建议方案:调整ModelArts Studio通过API调用大模型的审查策略。
- 场景描述:华为modelarts的在线推理-商用服务-内置服务中的在线推理功能,无意义的审核过于严格,对话中经常发生“contain sensitive infomation”,以至于批处理业务(比如逐段翻译小说)非常难以完成,而rag业务中(不管是互联网搜索,还是本地资料rag),又都非常容易遇到原始素材被误判为敏感词汇导致阻断。敏感度之高令人发指,昨天用来做文本OCR后翻译(含有错别字),5.75%的阻断报错率(185 of 3200)。 建议方案:建议下调敏感度,或者关闭,或者给用户关闭的页面。目前华为的服务,速度是最好的,但阻断太过以至于无法舒服的使用。如果说其他第三方(例如deepseek官方)只是慢,华为则是(无法提供预期的服务)功能失效。 而且付费用户都是实名用户,也有银行卡信息,真遇到问题可以走报警等渠道,而非让用户每次使用都提心吊胆。你阻断的这些信息,并没有真的阻断到什么,也阻断不了一点,只会让你用户流失。最近风风火火上了不少模型,不就是想把用户留下来么?你打算再靠过敏的机制再把用户赶走么?我已经在寻找速度比较快的其他第三方了,快忍不了了。请考虑,谢谢。 场景描述:华为modelarts的在线推理-商用服务-内置服务中的在线推理功能,无意义的审核过于严格,对话中经常发生“contain sensitive infomation”,以至于批处理业务(比如逐段翻译小说)非常难以完成,而rag业务中(不管是互联网搜索,还是本地资料rag),又都非常容易遇到原始素材被误判为敏感词汇导致阻断。敏感度之高令人发指,昨天用来做文本OCR后翻译(含有错别字),5.75%的阻断报错率(185 of 3200)。 建议方案:建议下调敏感度,或者关闭,或者给用户关闭的页面。目前华为的服务,速度是最好的,但阻断太过以至于无法舒服的使用。如果说其他第三方(例如deepseek官方)只是慢,华为则是(无法提供预期的服务)功能失效。 而且付费用户都是实名用户,也有银行卡信息,真遇到问题可以走报警等渠道,而非让用户每次使用都提心吊胆。你阻断的这些信息,并没有真的阻断到什么,也阻断不了一点,只会让你用户流失。最近风风火火上了不少模型,不就是想把用户留下来么?你打算再靠过敏的机制再把用户赶走么?我已经在寻找速度比较快的其他第三方了,快忍不了了。请考虑,谢谢。
- 场景描述:想在云上体验一下qwen3模型,模型广场上都是一些老模型,qwen3系列的模型没有。https://console.huaweicloud.com/modelarts/?region=cn-north-9&locale=zh-cn#/model-studio/square[图片] 建议方案:支持qwen3系列模型,比如qwen3-30B-A3B、qwen3-32B、qwen3-Embedding-4b、qwen3-rerank-4b等模型。 场景描述:想在云上体验一下qwen3模型,模型广场上都是一些老模型,qwen3系列的模型没有。https://console.huaweicloud.com/modelarts/?region=cn-north-9&locale=zh-cn#/model-studio/square[图片] 建议方案:支持qwen3系列模型,比如qwen3-30B-A3B、qwen3-32B、qwen3-Embedding-4b、qwen3-rerank-4b等模型。
- 场景描述:进入ModelArts Studio->在线推理->选择任意模型右侧的调用说明->在弹出的调用说明文档中,点击调用示例代码右上方的复制按钮-> 复制出来的内容是带有HTML格式的,不能直接使用,需要手动删除多余HTML标签后才能在代码或命令行中使用!复制出来的内容示例:```curl -X POST "<b>https://api.modelarts-maas.com/v1/chat/completions</b>" \ -H "Content-Type: application/json" \ -H "Authorization: Bearer <b>MAAS_API_KEY</b>" \ -d '{ "model": "<b>openpangu-pro-moe-72b</b>", "messages": [ {"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "你好"} ] }'```建议方案:复制操作应当给予用户开箱即用的效果,不要带额外的格式标签! 场景描述:进入ModelArts Studio->在线推理->选择任意模型右侧的调用说明->在弹出的调用说明文档中,点击调用示例代码右上方的复制按钮-> 复制出来的内容是带有HTML格式的,不能直接使用,需要手动删除多余HTML标签后才能在代码或命令行中使用!复制出来的内容示例:```curl -X POST "<b>https://api.modelarts-maas.com/v1/chat/completions</b>" \ -H "Content-Type: application/json" \ -H "Authorization: Bearer <b>MAAS_API_KEY</b>" \ -d '{ "model": "<b>openpangu-pro-moe-72b</b>", "messages": [ {"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "你好"} ] }'```建议方案:复制操作应当给予用户开箱即用的效果,不要带额外的格式标签!
- 场景描述:时习知调用华为云Qwen3算力资源做知识问答,同一个问题,白天有时候输出时间超过3分钟(正常1分钟内输出完毕)。涉及如下服务Qwen3-235B-A22B-32KQwen3-32B-32K 建议方案:具体问题是什么原因导致的?是否有其他优化方案或优化套餐可购买。 场景描述:时习知调用华为云Qwen3算力资源做知识问答,同一个问题,白天有时候输出时间超过3分钟(正常1分钟内输出完毕)。涉及如下服务Qwen3-235B-A22B-32KQwen3-32B-32K 建议方案:具体问题是什么原因导致的?是否有其他优化方案或优化套餐可购买。
- 官网 DeepSeek-R1-32K-0528 模型对应的【模型介绍】是错的吧,0528版本跟openPangu有啥关系[图片] 官网 DeepSeek-R1-32K-0528 模型对应的【模型介绍】是错的吧,0528版本跟openPangu有啥关系[图片]
-
【产品缺陷】大模型流式输出不完整 预审不通过场景描述: 我想请问一下,调用华为云的deepseek模型,流式输出的时候,为什么会返回不完整的json字符流。导致流数据取值总是失败。[图片]就是data: 后面的json字符串有缺失 建议方案:优化 场景描述: 我想请问一下,调用华为云的deepseek模型,流式输出的时候,为什么会返回不完整的json字符流。导致流数据取值总是失败。[图片]就是data: 后面的json字符串有缺失 建议方案:优化
-
【产品缺陷】maas 服务链接异常 预审不通过场景描述:[图片]华东二,见到 maas 的免费token提升,给了跳转贵阳一的链接。但这个链接指向的是华东二。链接目的错误。请验证下。这也太随意了。 建议方案: 场景描述:[图片]华东二,见到 maas 的免费token提升,给了跳转贵阳一的链接。但这个链接指向的是华东二。链接目的错误。请验证下。这也太随意了。 建议方案:
- 场景描述:选择模型体验-文本对话,只要回答中有涉及markdown(```code```) 代码等,黑色背景时,随打字机效果吐答案不断刷新时,黑色背景一会黑一会白,很闪眼睛,建议优化,等待回答期间完全不能待在会话里,要切走标签。。。。 建议方案:修复 场景描述:选择模型体验-文本对话,只要回答中有涉及markdown(```code```) 代码等,黑色背景时,随打字机效果吐答案不断刷新时,黑色背景一会黑一会白,很闪眼睛,建议优化,等待回答期间完全不能待在会话里,要切走标签。。。。 建议方案:修复
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签