• [执行问题] [Mindspore][Gradoperation]mindspore复合函数求导
    【功能模块】mindspore.ops.GradOperation【操作步骤&问题现象】我想实现如下所示的一个函数可是在华为的官方实现中,只有mindspore.ops.GradOperation,我有两个问题:第一个我怎么去求这个复合函数的二阶导f(interpolate(x))?第二个是我怎么控制Tensor是否进行反向传播?pytorch可以这样控制for p in self.D.parameters(): p.requires_grad = Falsemindspore应该怎么设置呢?set_grad(requires_grad=False)是否可以控制呢【软硬件信息】Ascend910APython3.7.5mindspore1.1.1gcc7.3.0【日志信息】(可选,上传日志内容或者附件)
  • [问题求助] ping 192.168.0.2 success . ssh HwHiAiUser@192.168.0.2 refused
    https://gitee.com/ascend/tools/blob/master/makesd/for_1.0.9.alpha/README_CN.mdA200dk-npu-driver-20.2.0-ubuntu18.04-aarch64-minirc.tar.gzAscend-cann-nnrt_3.3.0.alpha001_linux-aarch64.runI make SD Card successfully ,but ssh connection refused.
  • [调优经验] 浅谈MindSpore之一:训练性能为何能够近似线性提升
           萌新一枚,之前断断续续使用了一段时间的MindSpore框架,在和伙伴们交流的过程中,很多人发现MindSpore相比于tensorflow/pytorch在训练性能上有着近乎线性的提升,而且是在昇腾芯片上才表现出来,遂一直好奇这其中的个中缘由。最近看了《昇腾AI处理器架构与编程》这本书后,茅塞顿开,恍然大悟。奥秘藏在MindSpore精妙设计与昇腾芯片达芬奇架构上面。今天就来简单探讨下。达芬奇架构        昇腾AI处理器的计算核心主要由AI Core构成,负责执行标量、向量和张量相关的计算密集型算子。AI Core采用了达芬奇架构,其基本结构如图1所示。包括了三种基础计算资源:矩阵计算单元(Cube Unit)、向量计算单元(Vector Unit)和标量计算单元(Scalar Unit)。这三种计算单元从名字上就可以看出,分别对应了张量、向量和标量三种常见的计算模式。此外,在矩阵计算单元和向量计算单元内部还提供了不同精度、不同类型的计算模式。AI Core中的矩阵计算单元目前支持INT8和FP16的计算;向量计算单元目前支持FP16和FP32以及多种整型熟的计算。图1 AI Core架构图      为了配合AI Core中数据的传输和搬运,围绕着三种计算资源还分布式地设置了一系列片上缓冲区,比如用来放置整体图像特征数据、网络参数以及中间结果地输入缓冲区(Input Buffer, IB)和输出缓冲区(Output Buffer, OB),以及提供一些临时变量地高速寄存器单元。       在AI Core中,IB之后设置了一个存储转换单元(Memory Transfer Unit, MTE)。这是达芬奇架构地特色之一,主要目的是为了以极高地效率实现数据格式的转换。比如我们使用的GPU要通过矩阵计算来实现卷积,首先要通过Img2col的方法把输入的网络和特征数据以一定格式排列起来,这一步在GPU中是通过软件来实现的,效率比较低下。达芬奇架构采用了一个专门的存储转换单元来完成这一过程,通过固化的硬件电路可以在很短时间内完成整个转置过程。由于类似转置计算在深度神经网络中出现频繁,这种定制化电路模块设计可以提升AI Core的执行效率,从而实现不间断的卷积运算。    计算单元      计算单元是AI Core中提供强大算力的核心单元,主要包含矩阵计算单元、向量计算单元、标量计算单元和累加器。      矩阵计算单元 & 累加器             矩阵计算单元和累加器主要完成矩阵相关计算。常见的深度神经网络算法大量的使用了矩阵计算,达芬奇架构对矩阵计算进行了深度的优化与定制。如图2表示矩阵A和矩阵B相乘C=A×B,其中M是矩阵A的行数,K是A的列数以及B的行数,N是矩阵B的列数。图2 矩阵乘法示意图       (1) CPU计算        传统CPU中计算矩阵乘法的典型代码如代码1所示:for (int m=0;n<;m++)   for (int n=0;n<N;n++)     for (int k=0;k<K;k++)       c[m][n] += A[m][k]*B[k][n];代码1 CPU计算矩阵乘法       该程序用三个循环进行一次完整的矩阵乘法计算,如果在一个CPU上执行需要M×K×N个时钟周期才能完成,当矩阵非常庞大时执行过程极为耗时。       而且在CPU计算过程中,矩阵A是按照行扫描,矩阵B按照列扫描,而矩阵存储一般是按行连续存储,而内存读取是具有很强的数据局部特征的,即当读取内存中某个数时会打开内存中相应的一整行并且把同一行中所有数读取出来,这种内存读取方式对矩阵A很友好而对B却显得很不友好,为此需要将B的存储方式转成按列存储。因此在矩阵计算中往往通过改变某个矩阵的存储方式来提高效率。      (2)GPU计算       在深度神经网络中实现计算卷积过程,关键的步骤是将卷积运算转化为矩阵计算。在CPU中大规模矩阵计算往往成为性能瓶颈,而矩阵计算在深度学习中又极为重要。为了解决这个矛盾,GPU采用通用矩阵乘法(GEMM)的方式来实现矩阵乘法。例如实现一个16×16矩阵与另一个16×16矩阵的乘法,因为需要同时计算16×16组向量的乘加运算,需要安排256个并行线程,每个线程都可以独立计算完成结果矩阵中的一个输出点。假设每个线程在一个时钟周期内可以完成一次乘加运算,而每组向量乘运算需要16次乘加运算,则GPU完成整个矩阵计算需要16个时钟周期,这个时延是传统GPU无法避免的瓶颈。而昇腾AI处理器针对这个问题做了深度优化。      (3)昇腾计算       达芬奇架构在AI Core中特意设计了矩阵计算单元作为昇腾AI处理器的核心计算模块。通过精巧设计的定制电路和极致的后端优化手段,矩阵计算单元可以用一条指令完成两个16×16矩阵的相乘运算(因M=K=N=16,标记为16^3,这也是Cube名称的由来),等同于在极端时间内进行了16^3=4096个乘加运算,并且可实现FP16的运算精度。如图3所示,矩阵计算单元完成C=A×B的矩阵运算时,会事先将矩阵A按行存放在IB中,同时将矩阵B按列存放在IB中,通过矩阵计算单元计算后得到的结果矩阵C按行存放在OB中。在矩阵相乘运算中,矩阵C的第一元素由矩阵A的第一行的16个元素和矩阵B的第一列的16个元素通过矩阵计算单元子电路进行16次乘法和15次加法运算得出。图3 矩阵计算单元计算示意图       矩阵计算单元中共有256个计算子电路,可以由一条指令并行完成矩阵C的256个元素计算,即大致一个时钟周期就可以完成一个矩阵乘法。笼统的说,N个矩阵乘法运算只需N条指令,这正比例资源关系自然就解释了MindSpore在昇腾处理起上的训练性能成线性提升的原因。       在有关矩阵的处理上,通常在进行完一次矩阵乘法后还需要和上次结果进行累加,以实现类似C=A×B+C的运算。矩阵计算单元的设计上也考虑到了这种情况,为此专门在计算单元后面增加了一组累加器单元,可以实现将上次中间结果与当前结果累加,总共累加次数可由软件控制,并在累加完成之后将结果写入OB中,在卷积计算过程中,累加器可以完成加偏置的累加计算。       矩阵计算单元这以空间换时间的设计理念,可以快速完成16×16的矩阵相乘,但当超过16×16大小的矩阵利用该单元进行计算时,则需要市事先按照特定数据格式进行矩阵的存储,并在计算过程中以特定的分块方式进行数据的读取。而这种切割分块操作,昇腾从软硬件两方面都做了设计,MindSpore从软件架构上实现了自动最优分割的接口化设计(具体是如何设计的这里先挖个坑,后续再填坑),而在硬件上的优化设计,如图4所示。矩阵A展示的切割和排序方式称作“大Z小Z”,直观地看就是矩阵A地各个分块之间按照行的顺序排序,称为“大Z”方式;而每个块的内部数据也是按行排列,称为“小Z”方式。与之形成对比的是矩阵B的各个分块之间按行排序,而每个块的内部按列排序,称为“大Z小N”的排序方式。按照矩阵计算的一般法则,昇腾AI处理器内部专用电路可以实现将如此排列的A、B矩阵相乘之后得到矩阵C,而矩阵C会呈现出各个分块之间按照列排序,而每个块内部按照行排序的格式,称为“大N小Z”的排列方式。图4 存储格式的要求      向量计算单元      未完待续......
  • [问题求助] 【昇腾CANN系列教程-环境部署(Atlas200DK)产品】【课程1.2节】vim下载失败怎么办
    【功能模块】环境部署【操作步骤&问题现象】1、1.2节2、vim 下载失败按网站上解决办法,apt-get remove vim-common apt-get install vim 也不行【截图信息】【日志信息】(可选,上传日志内容或者附件)
  • [问题求助] Atlas200dk对字符识别模型推理得出结果全部是一个
    我使用mind studio将pb模型转化成om模型后加载到atlas200dk进行推理结果得出的结果都是一样的结果。经过我自己初步分析图像预处理没有问题,问题应该在图像预处理的结果与模型不匹配,目前我没有办法去验证并且改写该部分,希望有人能够给予我指导,万分感谢!我的pb原始模型输入有两个,一是一张[1,784]的灰度图二是keep_drop为1.0 工程链接https://pan.baidu.com/s/1Y6Jyi0hhnVtyQD4k9eBniA 提取码1234 模型链接https://pan.baidu.com/s/1S03UmSpsa1_siV9b8cXDjQ 提取码1234 模型链接
  • [主题讨论] 【一周AI资讯】20210327:召集最强的智,昇腾计算产业射出一支「穿云箭」
    盘点本周AI科技热点热点一:超越卷积、自注意力机制:强大的神经网络新算子involution本文是对我们CVPR 2021被接收的文章 Involution: Inverting the Inherence of Convolution for Visual Recognition的介绍,同时也分享一些我们对网络结构设计(CNN和Transformer)的理解。我们的贡献点简单来讲:(1)提出了一种新的神经网络算子(operator或op)称为involution,它比convolution更轻量更高效,形式上比self-attention更加简洁,可以用在各种视觉任务的模型上取得精度和效率的双重提升。(2)通过involution的结构设计,我们能够以统一的视角来理解经典的卷积操作和近来流行的自注意力操作。论文链接:https://arxiv.org/abs/2103.06255代码和模型链接:https://github.com/d-li14/involution 原文链接:https://www.jiqizhixin.com/articles/2021-03-26-6 热点二:ImageNet「众包」成就伟大数据集,「昇腾众智」创新AI开发模式作为人工智能社区群策群力的早期形式,「众包」成就了 ImageNet 等一批成功的数据集,也加快了整个社区的发展进程。但要构建人工智能技术开发生态,仅靠「众包」是不够的。2009 年,由知名科学家李飞飞发起,来自全球 167 个国家近 5 万名工作者以众包的方式,通过三年合作努力,完成了日后触发人工智能领域发展浪潮的伟大数据集 ImageNet。数据规模巨大,标注错误极低,ImageNet 发布十余年以来,已成为淬炼图像处理算法不断升级的试金石。2010-2017 连续开展八年的 ImageNet 全球挑战赛,推动了物体识别平均准确率等 AI 领域关键指标不断提升,更让深度学习算法自 2012 年在此舞台之上大放异彩,进一步引发了人工智能领域的革命。众所周知,ImageNet 包含 1500 万张带标注的图像,工程十分浩大。帮助李飞飞完成这一壮举的,是当时刚刚兴起的社区概念——众包。可以说,众包一直在人工智能领域扮演着重要角色,一定程度上加快了这一领域的历史进程。 原文链接:https://www.jiqizhixin.com/articles/2021-03-26-7 热点三:AI技术赋能半导体先进制造!聚时科技:不做简单的国产替代2021年3月17日至19日,半导体行业盛会SEMICON China在上海新国际博览中心隆重举办,展会吸引了几乎国内外全部半导体领域的顶级技术提供商参展。聚时科技携国内外首套全深度学习驱动的半导体引线框架缺陷检测系统-“聚芯2000”亮相N5主展厅,同时推出多款产品:包括通用芯片2D/3D检测与量测-聚芯3000、晶圆级缺陷分析ADC-聚芯5000。在展会上,聚时科技的聚芯系列产品获得了行业高度关注与好评。聚时科技创始人兼CEO郑军博士在SEMICON China展会上表示,在半导体缺陷分析与视觉检测领域,聚时科技定位清晰,即目前所有产品都是针对国产空白与行业空白。2021年春节之后到现在,聚芯2000市场表现强劲,一季度订单数量已逾数十台。伴随最近中国半导体制造产能的拉动,聚芯2000市场需求持续提升。截至目前为止,中国国内产能排名前四位的生产商都已经成为聚芯2000的客户。在本次SEMICON展会上,聚芯2000还实现了客户现场订单。聚芯2000客户名单的迅速放大,充分验证了聚芯2000的AI创新价值。 原文链接:https://www.jiqizhixin.com/articles/2021-03-25-8 热点四:召集最强的智,昇腾计算产业射出一支「穿云箭」“一支穿云箭,千军万马来相见”。 昇腾计算产业2021年的一个大动作,就是号召各路人才一起加入昇腾众智计划。2018年,华为AI战略首出江湖,算力硬件切入,登场很“硬核”。与此同时,昇腾计算产业基础软件生态的伏笔,已悄然埋下。2020年,昇腾计算产业中的硬件产品首次“让”出C位,软件平台全面铺开。“更柔软”的昇腾计算产业,让人们看到了不一样的AI产业观:平台一起定义、软件一起开发、工具一起维护,无论你是开发者,还是寻求AI加持的企业,在昇腾计算基础软硬件的平台上,都能快速便捷地使用AI。而首次面世的昇腾众智计划到底能给行业带来什么?对于昇腾计算产业来说,“生态”又有什么样的特殊意义?昇腾众智计划是什么?古人云:“三人行,必有我师焉”。这就是昇腾众智计划的要义,华为云与计算BG总裁余承东提出:“最强的智,是众智”。即聚集聪明的大脑,一起“干大事”。“三人”,主要面向的是在企业、高校、科研所等组织的开发团队。聚在一起要做什么?即通过项目合作的方式,基于昇腾基础软硬件平台开发算子、网络模型及行业参考设计等,共同完成项目。再细化拆分来看,昇腾众智计划其实是“三步走”:一个培养、一个发展和三个创新。首先,“一个培养”的对象就是人才。具体来说,就是把高校的算子及模型开发课程,和学科建设结合起来,给开发人才提供支持。“一个发展”是建设与发展开放的平台。这一步要建立基于昇腾社区、MindSpore开源社区,与其他开源、开放社区之间的紧密联系和合作,构建高校、科研机构、企业、产业和开源社区等组织技术专家的交流平台。最后,“三个创新”是指公开征集的三种类型项目:·异构计算架构CANN算子·主流深度学习网络模型·行业参考设计项目 原文链接:https://www.qbitai.com/2021/03/22535.html 热点五:如何借助AI语义分析技术,提升保险企业服务水平?保险“电网销”的融合是近些年和未来很长一段时间内的行业发展趋势。以人身保险为例,从保险行业协会最新发布的统计数据来看,2020年“电网销”融合更紧密的互联网渠道累计实现规模保费2110.8亿元,较2019年同比增长13.6%;而纯电销渠道累计实现规模保费136亿元,较上一年下降了 22.5%。其实,“电网销”融合之所以成为趋势,原因在于结合了两者的优势:先借助互联网实现客户的广泛触达和初步需求验证,再借助电话和企业微信等方式进行一对一沟通和深入需求挖掘,以实现需求为导向的销售。因此,对于保险公司而言,在新的趋势之下,对于人工坐席的要求变得更高了,而不是更低了。所以,保险公司传统上面临的挑战更加棘手:人工坐席的人员流动性大、培训不足,整体业务水平和专业素质难满足客户需求。为了应对这些挑战,最近一年多以来,行业里出现了全新的解决方案:通过为人工坐席提供辅助和增强方案,帮助员工发挥更大的潜能,提升员工产能。很多保险公司由此实现了业务再增长。与过往的解决方案相比,新一代的人工坐席辅助和增强方案,不仅仅提供软件工具,而是深入业务流程,启动阶段从最佳实践挖掘到实时辅助,执行阶段从实时辅助到执行报表,提供完整的解决方案闭环。 原文链接:https://www.jiqizhixin.com/articles/2021-03-24-3 热点六:特斯拉全自动驾驶系统上线了,车主:堪比没驾照的「马路杀手」自去年 10 月起,特斯拉的「全自动驾驶」(FSD)的 Autopilot 更新 Beta 版已开始向一些用户推出,车主可通过 OTA 方式下载到最新 FSD beta 版软件。据特斯拉官网介绍,FSD 全称为 Full Self-Driving,顾名思义能够使特斯拉电动车实现完全的自动驾驶功能。由于这一功能还处在早期阶段,特斯拉只向极少数车主进行了推送。汽车的硬件配置也是限制条件之一——只有搭载了 HW 3.0(含 FSD 芯片,单芯片算力达到 72TOPS)的车型才有资格被选中。当然,这些配置也有相应的价格:目前在国内购买 Tesla Model 3 时用户可以选购「FSD 自动驾驶套件」,价格为 64000 元,但此 FSD 还只是一个基础版,并不是处在测试过程中的「全自动驾驶」,前者仅支持自动泊车、自动辅助变道、自动辅助导航驾驶以及智能召唤等功能,不会对交通信号灯和停车标志做出反应,也不能在城市街道中自动驾驶。 原文链接:https://www.jiqizhixin.com/articles/2021-03-23-6 热点七:广阔天地大有作为!为什么说AI会率先在田埂上崛起?目前智慧农业正处于价值洼地,农业科技企业也吸引了越来越多的资本目光。中国企业正以其脚踏实地的精神和把家搬到生产现场的觉悟,专注技术、深入市场、敬畏用户,在智慧农业领域发挥后来优势,加速发展,在不远的将来,中国企业必将引领全球新农业技术发展。机器人天然的工业属性,给了很多人AI应用将最先落地工业场景的直观印象。然而,工业场景其实并不是AI最好的生长土壤。非智能的机器在生产活动中,一直充当着「肌肉」的角色,作为人类手、脚的延申,帮助人类劳动,但非智能机器只能做简单且完全重复的劳动。人工智能为机器赋予了大脑和感知能力,AI机器人不再只是人类的肌肉,而是自己「有手、有脚」,甚至有「五官和大脑」,可以帮助人们完成很多需要智慧和技巧的工作。 原文链接:https://www.jiqizhixin.com/articles/2021-03-21-2总结:每周七个小热点,帮助各位了解最新科技资讯。欢迎大家阅览评论哦,也可以留言发表您的关注点,我们根据大家的关注点,推送更多您喜欢的资讯。
  • [行业动态] 【3月26日 AI 快讯】召集最强的智,昇腾计算产业射出一支「穿云箭」
    产业发力高性能图计算,海致科技&清华共启院士专家工作站,郑纬民任首席科学家中国工程院院士郑纬民教授、清华大学计算机科学与技术系以及海致科技联合发起「克至难,图智远」海致高性能图计算院士专家工作站筹备启动活动。2021/03/25 19:26原文链接AI技术赋能半导体先进制造!聚时科技:不做简单的国产替代聚时科技聚焦于用深度学习赋能半导体先进制造,携半导体缺陷检测与分析产品亮相SEMICON China 2021,彰显国产替代硬实力。2021/03/25 18:34原文链接NVIDIA收购ARM受抵制?RISC-V将崛起?近几周,亚马逊设备团队发布了数个RISC-V工程师的职位空缺,透露出研发非ARM架构产品的强烈意愿。这也使人联想到RISC-V的开源优势是否会在ARM收购计划的变数中迸发能量,未来RISC-V能否成为代替ARM的可选项,或者是在物联网、车联网等领域异军突起,开辟全新的应用模式。2021/03/25 18:24原文链接国内医学论文造假又起风波,Nature重磅发文打击泛滥的「论文工厂」Nature 发文起底论文工厂以及中国医生学术造假乱象。2021/03/25 14:36原文链接英特尔CEO:希望跟苹果和解,代工苹果自研芯片“英特尔与苹果之间正在进行的竞争是 ‘有趣的’。”2021-03-25 12:04:56原文链接入门英特尔 AI 100 Connect Day 大消费专场︱大消费变革背后的 AI 创新“AI+大消费”的技术背景下,共同探讨大消费变革背后的创新和产业落地。2021/03/25 17:41原文链接矩阵元获批“上海市分布式隐私人工智能技术创新中心”矩阵元全资子公司上海阵方科技有限公司将承担“上海市分布式隐私人工智能技术创新中心”的建设工作。2021/03/25 14:21原文链接刷题太遭罪怎么办?这个算法基地专为小白量身打造,还带动画你需要的经典算法汇总,有人帮你整理好了。2021/03/25 14:18原文链接百分点数据科学实验室:产品生命周期管理创新应用落地实践百分点数据科学实验室基于产品生命周期理论在多个行业的落地实践,总结了如何准确把握产品生命周期的四个阶段及识别方法论。2021/03/25 14:13原文链接百分点认知智能实验室:基于不完全标注样本集的信息抽取实践信息抽取技术被广泛应用于众多场景中,能够帮助我们将海量内容自动分类、提取和重构。本文主要介绍百分点认知智能实验室基于不完全标注样本集的信息抽取实践。2021/03/25 14:12原文链接工程实现图深度学习复杂研究性质任务太头疼?这个新工具包帮你应对来自德州农工大学的姬水旺教授团队开发了首个面向复杂研究任务的图深度学习工具包,旨在让研究者在复杂图深度学习任务的算法开发上能够轻松使用常用数据集和评估指标与通用基准进行比较。2021/03/25 14:40原文链接理论时隔两年,黑洞又有了新照片,还是高清的仔细一看,黑洞竟是这个样子。2021/03/25 14:16原文链接其他55w快充+骁龙768G,iQOO Z3售价1699元起没想到快充已经降到了这个价位了……2021-03-25 21:24:03原文链接召集最强的智,昇腾计算产业射出一支「穿云箭」大动作:昇腾众智计划2021-03-25 18:05:03原文链接解魔方神器开源:摄像头看一眼,就能还原全步骤Python+OpenCV2021-03-25 16:47:03原文链接我不是人:一年发论文180篇,横跨多个学科领域,获99次引用法国学者反对职称评价制度2021-03-25 15:28:28原文链接中金:汽车芯片将处于自动驾驶浪潮的制高点中金研报称,未来汽车的终局,是实现自动驾驶的智能终端。2021-03-25 12:22:52原文链接AI前线一边疯狂吐槽一边主动求和解,苹果和英特尔的“爱恨情仇”“嘴炮”一时爽,事后悔断肠?2021-03-25 15:55原文链接快讯核桃编程C轮系列融资2亿美元,独立自研图形化编程工具NUTS正式发布3月25日,少儿编程教育行业领导者核桃编程宣布完成新一轮融资,C轮系列融资额约 2亿美元。这是迄今为止少儿编程行业金额最高的一笔融资,同时创造中国在线教育C轮融资额高点。本轮融资由KKR、元璟资本、高瓴创投领投,源码资本、华兴新经济基金等机构继续跟投,凡卓资本担任本轮融资独家财务顾问。据悉,核桃编程的本轮融资将“All in教育科技”,在AI教学产品建设、优质师资储备与教研体系等方面进行持续投入,不断提升用户的体验与服务品质。不仅如此,核桃编程还推出了自主研发的少儿编程图形化编程工具“NUTS”,将全面接入各类少儿编程赛事。2021-03-25 15:24原文链接
  • [问题求助] Atlas200dk对pb模型转om失败不成功
    我用mindstudio的模型转化工具转化我的pb模型(minst数据集识别),但是一直转化不成功。第一个图是我原始pb模型的输入。图二三是模型转化工具的参数。图三是报错日志。有没有大佬帮我看看问题在哪里 472815472816472817472818
  • [安装] 昇腾镜像仓库的ascend-mindspore-x86镜像缺少cann toolkit不能运行mindspore
    昇腾镜像仓库的ascend-mindspore-x86镜像缺少cann toolkit不能运行mindsporeascend-mindspore-x86镜像只安装了cann nnae,mindspore需要用到atc包,而atc包只在cann toolkit包里。能否重新更新一下ascend-mindspore-x86镜像和ascend-mindspore-arm镜像?另外我自己在镜像安装cann的驱动报错,如何解决呢?
  • [问题求助] 面向昇腾有类似GPU DeepStream的流数据推理引擎吗
    如题。
  • [Atlas200] 【Atlas 200】供货是否充足?能否提供基于昇腾310芯片做二次开发的支持?
    1.     基于昇腾310芯片做二次开发,是否可以提供相应的支持?2.     单个昇腾310芯片的价格?3.     供货是否充足?
  • [问题求助] 昇腾310算子
    【操作步骤&问题现象】1、基于MindX SDK设计,进行pytorch模型转换OM文件时。模型需要使用BatchNorm3d算子,昇腾310暂时无法支持,该如何选择?
  • [算子开发] 【昇腾CANN社区版(20.1)】【DSL接口】te.lang.cce.concat 的使用方式?
    用 DSL 开发算子的过程中发现 `te.lang.cce.concat` 正如[文档](https://support.huaweicloud.com/odevg-Inference-cann/atlaste_07_0060.html)中所说仅能单独使用,如果和其它接口一起使用在用 atc 编译时出现以下错误: ```shell ATC start working now, please wait for a moment. ATC run failed, Please check the detail log, Try 'atc --help' for more information EB0000: Compile operator failed, cause: Check failed: scope != "global" (global vs. global) : , Traceback (most recent call last): [bt] (8) /home/HwHiAiUser/Ascend/ascend-toolkit/20.1.rc1/x86_64-linux/atc/lib64/libtvm.so(tvm::NodeFunctor*)>::operator()(tvm::runtime::ObjectRef const&, tvm::ir::StmtFunctor*) const+0x52) [0x7fd67ff2da42] [bt] (7) /home/HwHiAiUser/Ascend/ascend-toolkit/20.1.rc1/x86_64-linux/atc/lib64/libtvm.so(tvm::codegen::CodeGenC::VisitStmt_(tvm::ir::SeqStmt const*)+0xa1) [0x7fd67ff3b561] [bt] (6) /home/HwHiAiUser/Ascend/ascend-toolkit/20.1.rc1/x86_64-linux/atc/lib64/libtvm.so(tvm::NodeFunctor*)>::operator()(tvm::runtime::ObjectRef const&, tvm::ir::StmtFunctor*) const+0x52) [0x7fd67ff2da42] [bt] (5) /home/HwHiAiUser/Ascend/ascend-toolkit/20.1.rc1/x86_64-linux/atc/lib64/libtvm.so(+0x10aa171) [0x7fd67ff5d171] [bt] (4) /home/HwHiAiUser/Ascend/ascend-toolkit/20.1.rc1/x86_64-linux/atc/lib64/libtvm.so(tvm::codegen::CodeGenC::VisitStmt_(tvm::ir::AttrStmt const*)+0x1d8) [0x7fd67ff48048] [bt] (3) /home/HwHiAiUser/Ascend/ascend-toolkit/20.1.rc1/x86_64-linux/atc/lib64/libtvm.so(tvm::NodeFunctor*)>::operator()(tvm::runtime::ObjectRef const&, tvm::ir::StmtFunctor*) const+0x52) [0x7fd67ff2da42] [bt] (2) /home/HwHiAiUser/Ascend/ascend-toolkit/20.1.rc1/x86_64-linux/atc/lib64/libtvm.so(+0x10a9335) [0x7fd67ff5c335] [bt] (1) /home/HwHiAiUser/Ascend/ascend-toolkit/20.1.rc1/x86_64-linux/atc/lib64/libtvm.so(+0x10978a4) [0x7fd67ff4a8a4] [bt] (0) /home/HwHiAiUser/Ascend/ascend-toolkit/20.1.rc1/x86_64-linux/atc/lib64/libtvm.so(dmlc::LogMessageFatal::~LogMessageFatal()+0x45) [0x7fd67f7e5055] File "/usr1/workspace/CANN_Version_C10_One@3/CODE/tuscany/train/tensor_engine/src/codegen/codegen_cce.cc", line 878 TVMError: [EB0000] Check failed: scope != "global" (global vs. global) : E40009: Compile op[CvtColorNv12ToRgb] failed, oppath[/home/HwHiAiUser/projects/tbe-models/build/ops/op_impl/custom/ai_core/tbe/custom_impl/cvt_color_nv12_to_rgb], optype[CvtColorNv12ToRgb], taskID[4]. Please check the op's compilation error message. ``` 现在我需要在算子开发过程中将多个 tensor 的最后一维连接起来,怎么才能使 `te.lang.cce.concat` 可用或者有什么其它可替代的方式?
  • [问题求助] 【昇腾产品】【HCC.功能】请问aclrtSynchronizeStream可以针对某个hccl通信group进行么?
    请问aclrtSynchronizeStream可以针对某个hccl通信group进行么?应用场景是我们可能有两个hccl group在分别进行通信操作,我们希望在某个时间点等其中某一个group操作完成,而不依赖第二个group。
  • [Atlas300] 昇腾310服务器 pb转om mode=3测试合法 mode=0转换失败
    【功能模块】ATC转换功能【操作步骤&问题现象】1、文档里所说的是否合法该作何理解?2、这种情况的成因是什么呢?算子不支持吗?如何在本地的日志里看出现问题的原因?【日志信息】(可选,上传日志内容或者附件)日志见附件pb文件如下:链接:https://pan.baidu.com/s/1KkCfI3JX8f5jjif0MXrCGw 提取码:vf5b