• [Atlas200] 【200加速模块产品】【模型支持功能】请问一下atlas200加速模块EP模式是否支持pytorch的模型
    【功能模块】1、请问一下atlas200加速模块EP模式是否支持pytorch的模型2、如果支持使用哪个版本能够支持?
  • [调试调优] 【众智】【文档书写】反向算子在撰写设计文档时网上找不到的Tensorflow/PyTorch实现分析
    【功能模块】 请问哪里可以找到反向算子的Tensorflow/PyTorch实现代码,pytorch上只有正向的算子实现 【截图信息】 这是参考文档里的反向函数实现代码 ![image.png](https://bbs-img.huaweicloud.com/data/forums/attachment/forum/202106/02/2206326itffcqds2dngzea.png)
  • [其他] PyTorch和TensorFlow的比较
    Lua语言太小众,是Torch的发展瓶颈。facebook用python将torch带出来后,就丑小鸭变天鹅了~PyTorch本质上是Numpy的替代者,而且支持GPU、带有高级功能,可以用来搭建和训练深度神经网络。如果你熟悉Numpy、Python以及常见的深度学习概念(卷积层、循环层、 SGD等),会非常容易上手PyTorch。而TensorFlow可以看成是一个嵌入Python的编程语言。你写的TensorFlow代码会被Python编译成一张图,然后由TensorFlow执行引擎运行。很多新手就会因为这个增加的间接层而困扰。也正是因为同样的原因,TensorFlow有一些额外的概念需要学习,例如会话、图、变量作用域(variable scoping)、占位符等。另外还需要更多的样板代码才能让一个基本的模型运行。所以TensorFlow的上手时间,肯定要比PyTorch长。pytorch的计算图是动态的,可以根据计算需要实时改变计算图,对比静态的 Tensorflow, 它能更有效地处理一些问题。当然TensorFlow2.0之后,也支持动态图了~所以,大家都在发展,不进则退呀~
  • [网络迁移] 自定义pytorch网络训练失败
    CANN版本:5.0.1硬件: 910A单卡自定义pytorch脚本训练时报错。复现方式:解压附件中的压缩包,执行命令:python3 train_offline.py报错信息:TransposeDTraceback (most recent call last):  File "train_offline.py", line 121, in <module>    train_fn(data_path, device)  File "train_offline.py", line 88, in train_fn    value, pov_hidden = critic_net(pov, vector, one_hot_action)  File "/home/ma-user/miniconda3/envs/TensorFlow-1.15.0/lib/python3.7/site-packages/torch/nn/modules/module.py", line 651, in __call__    result = self.forward(*input, **kwargs)  File "/home/ma-user/miniconda3/envs/TensorFlow-1.15.0/lib/python3.7/site-packages/torch/nn/modules/module.py", line 54, in __call__    return self.func(*args, **kwargs)  File "/home/ma-user/work/test_mine_rl/rlrl/critic_net.py", line 41, in forward    lstm_out, _ = self.lstm1(l1out_cat)  File "/home/ma-user/miniconda3/envs/TensorFlow-1.15.0/lib/python3.7/site-packages/torch/nn/modules/module.py", line 651, in __call__    result = self.forward(*input, **kwargs)  File "/home/ma-user/miniconda3/envs/TensorFlow-1.15.0/lib/python3.7/site-packages/torch/nn/modules/rnn.py", line 570, in forward    self.dropout, self.training, self.bidirectional, self.batch_first)  File "/home/ma-user/miniconda3/envs/TensorFlow-1.15.0/lib/python3.7/site-packages/apex/amp/wrap.py", line 257, in wrapper    arg, fp16_weight_buf, fn, verbose)  File "/home/ma-user/miniconda3/envs/TensorFlow-1.15.0/lib/python3.7/site-packages/apex/amp/utils.py", line 222, in new_synthesize_flattened_rnn_weights    w_fp16.copy_(w_fp32)RuntimeError: Run:/root/pytorch/aten/src/ATen/native/npu/utils/OpParamMaker.h:280 NPU error,NPU error code is:145000THPModule_npu_shutdown success.
  • [问题求助] 华为pytorch1.5.0不能运行两个问题
    1、ubuntu1804 x86主机,cann5.0.2,驱动21.0.1,固件1.77.22.6.220。310推理卡。环境变量LD_LIBRARY_PATH添加了/home/laizewei/Ascend/ascend-toolkit/latest/fwkaclib/lib64,里面有libhccl.so。还是报找不到2、云道主机。cann20.2.0 ,910训练卡。mindspore可以训练推理,但是华为pytorch1.5.0运行就报错了推理报错如下[ERROR]device_count,/usr1/workspace/PyTorch_Apex_Daily_c20tr5/CODE/c10/npu/NPUFunctions.h:48:"get device count of NPU failed"另外反馈下华为pytorch资料文档太少了。很多报错没有文档注明什么原因造成的。要么就是注明不清楚。比如如下文档。红框处说明有歧义,哪个环境变量?PATH,LD_LIBRARY_PATH,PYTHONPATH还是什么?
  • [其他] pytorch的介绍
    PyTorch的前身是Torch,其底层和Torch框架一样,但是使用Python重新写了很多内容,不仅更加灵活,支持动态图,而且提供了Python接口。它是由Torch7团队开发,是一个以Python优先的深度学习框架,不仅能够实现强大的GPU加速,同时还支持动态神经网络。PyTorch既可以看作加入了GPU支持的numpy,同时也可以看成一个拥有自动求导功能的强大的深度神经网络。除了Facebook外,它已经被Twitter、CMU和Salesforce等机构采用优点PyTorch是相当简洁且高效快速的框架设计追求最少的封装设计符合人类思维,它让用户尽可能地专注于实现自己的想法与google的Tensorflow类似,FAIR的支持足以确保PyTorch获得持续的开发更新PyTorch作者亲自维护的论坛 供用户交流和求教问题入门简单 PyTorch是一个开源的Python机器学习库,基于Torch,用于自然语言处理等应用程序。2017年1月,由Facebook人工智能研究院(FAIR)基于Torch推出了PyTorch。它是一个基于Python的可续计算包,提供两个高级功能:1、具有强大的GPU加速的张量计算(如NumPy)。2、包含自动求导系统的深度神经网络。
  • [问题求助] 【Atlas200产品】【深度学习框架功能】现在实现了百分之多少的pytorch?
    三个问题:1、目前提供的PyTorch算子,大约现在实现了百分之多少的PyTorch? 2、我看目前pytorch官网的版本到1.8.1了,那咱们实现的这个pytorch对标的是哪个版本的pytorch呢?3、caffe、tensorflow,pytorch可在昇腾处理器的所有系列都能用吧?这三个框架都可以用在Atlas200(昇腾310)吗?
  • [其他] PyTorch、TensorFlow最新版本对比,2021年了你选谁?
    自深度学习重新获得公认以来,许多机器学习框架层出不穷,争相成为研究人员以及行业从业人员的新宠。从早期的学术成果 Caffe、Theano,到获得庞大工业支持的 PyTorch、TensorFlow,许多研究者面对大量的学习框架不知该如何选择?机器学习框架。Tensorflow / Keras 和 PyTorch 是迄今为止最受欢迎的两个主要机器学习库。TensorFlow 由谷歌团队开发,于 2015 年发布。而 PyTorch 则由 Facebook 的团队开发,并于 2017 年在 GitHub 上开源。为了充分发挥不同机器学习框架的优势,许多机器学习从业者对不同框架进行了比较,通过对比优缺点,以选择最适合自己的框架。 在本文中,我们将从以下两个方面对机器学习库(PyTorch 1.8 和 Tensorflow 2.5)进行比较:最新发行版本中的新增功能;使用哪个以及为什么。Tensorflow 2.x VS Pytorch 1.8Tensorflow 2.xTensorFlow 1 和 TensorFlow 2.x 之间有很多变化。第一个是 Tensorflow.js. 的发布。随着 Web 应用程序越来越占主导地位,在浏览器上部署模型的需求大大增加。借助 Tensorflow.js,你可以使用 Node 在浏览器中运行现有的 python 模型、重新训练现有的模型,并使用 Javascript 完全构建和训练模型(不需要 python)。Tensorflow 2.x 中的另一个版本是 Tensorflow Lite,一个轻量级库,用于在移动和嵌入式设备上部署模型。这是因为移动和 Web 应用程序是两种最主要的应用程序类型。使用 Tensorflow Lite,你可以简单地将现有模型转换为「compressed flat buffer」,然后将 buffer 加载到移动设备或任何其他嵌入式设备中。这期间发生的主要优化过程是将 32 位浮点值转换成 8 位,这更适合于嵌入式设备(更少的内存使用)。此外还包括 Tensorflow Extended(TFX)的发布,它是用于部署生产 ML pipeline 的端到端平台。其在机器学习的 3 个最重要领域(web 应用程序、移动应用程序和生产管理)方面做得很好。机器学习生产 pipeline 仍需要大量研究和开发。TFX 可以应对经典的软件生产挑战,例如可扩展性、可维护性和模块化。此外,它还可以帮助解决机器学习的特定挑战,例如持续在线学习、数据验证,数据管理等。PyTorch 1.8与 Tensorflow Lite 相似,PyTorch 改进了其现有的 Pytorch Mobile。该框架可以量化、跟踪、优化和保存适用于 Android 和 iOS 的模型。此外还发布了 Pytorch Lite Interpreter 的原型,该原型可减小移动设备上二进制运行时的大小。此外,还通过更具体的错误处理和 pipeline 并行为分布式训练提供了更多支持。Pytorch Profiler 用于分析 APP、模型的执行时间、执行流程、内存消耗等。尽管 Pytorch lightning 不是 PyTorch 1.8 的一部分,但还是值得一提。Pytorch lightning 已发布,可以使编码神经网络更加简单。可以将其视为 Pytorch 的 Keras,使用广泛,其中的原因可归结为 Keras 显著的改进了 Tensorflow,因为它使实现模型变得更加容易和快捷。在 Pytorch 中,Pytorch lightning 起到了相同的作用。该如何选择?从本质上讲,这两个库都是相当不错的,它们在性能和功能上非常接近。总的来说,两个库之间的编码风格有所不同。PyTorch 以其 OOP(面向对象编程)风格而闻名。例如,当创建自定义模型或自定义数据集时,你很可能会创建一个新类,该类继承默认的 PyTorch 库,然后在进行代码调整。尽管 OOP 以某种方式为代码提供了一种结构,但就代码行数而言,会使代码变得很长。另一方面,当使用 Tensorflow 时,你很可能会使用 Keras。例如在进行 Kaggle 比赛时(监督学习图像分类、目标检测、图像分割、NLP 等任务),可以发现 Keras 的代码实现比 PyTorch 短。作为初学者 / 中级人员,这是非常不错的选择,因为你不必花费大量时间阅读和分解代码行。在某些情况下,需要在特定的机器学习领域中寻找特定的模型。例如,当进行目标检测比赛时,想要实现 DETR(Facebook 的 Data-Efficient transformer),结果发现大部分资源都是用 PyTorch 编写的,因此在这种情况下,使用 PyTorch 更加容易。另外,PyTorch 的代码实现更长,因为它们涵盖了许多底层细节。这既是优点也是缺点。当你是初学者时先学习低层级的细节,然后再使用更高层级的 API(例如 Keras)非常有帮助。但是,这同时也是一个缺点,因为你会发现自己迷失于许多细节和相当长的代码段中。因此,从本质上讲,如果你的工作期限很紧,最好选择 Keras 而不是 PyTorch。原文链接:https://towardsdatascience.com/pytorch-vs-tensorflow-2021-d403504d7bc3
  • [问题求助] 【Atlas200产品】【深度学习框架】pytorch,caffe,tensorflow算子,哪个是目前开发的主力?
    权威专家们您好,我现在仍然有点疑惑,因为我属于深度学习的研究初期,又想用咱们的Atlas200这个平台,所以就需要确认下咱们对pythorch,caffe,tensorflow,哪个框架支持的是比较全的?算子清单我看了,但是因为我对三个框架不熟,所以也分辨不出来哪个框架比较全?pytorch算子个数是最多的,这能说明,咱们现在主要集中开发pytorch吗??那是不是也意味着如果我们用Atlas200跑深度学习,用pytorch更好?哪一个框架是目前研发的主要开发对象? 希望专家们能给一些建议!
  • [问题求助] 【Atlas产品】【安装功能】请问有对应Ascend 310的PyTorch吗?
    请问有对应Ascend 310的PyTorch吗?或者说有对应Ascend 310的PyTorch安装版本吗?如果有的话,应用是训练,还是推理?应该只能推理吧,调用PyTorch推理吗?
  • [算子开发] 【Atlas产品】【ATC功能】Pytorch Resize算子如何和ATC的Resize算子进行匹配?
    【功能模块】CANN【操作步骤&问题现象】1、onnx模型转为om,成功2、om使用ACL部署运行,结果与原Pytorch结果相差很大,怀疑是Resize算子功能不匹配【截图信息】【日志信息】(可选,上传日志内容或者附件)
  • [问题求助] Ascend 服务器上使用pytorch时报错误代码507033
    错误信息:>>> torch.npu.current_device()Traceback (most recent call last):  File "<stdin>", line 1, in <module>  File "/home/lzr/anaconda3/envs/mmlab/lib/python3.7/site-packages/torch/npu/__init__.py", line 152, in current_device    _lazy_init()  File "/home/lzr/anaconda3/envs/mmlab/lib/python3.7/site-packages/torch/npu/__init__.py", line 94, in _lazy_init    torch._C._npu_init()RuntimeError: Initialize:../c10/npu/sys_ctrl/npu_sys_ctrl.cpp:44 NPU error, error code is 507033Error信息出现在调用torch.npu.current_device()的时候,并给出了error code 507033。具体如下截图所示:【主要操作步骤】1、安装CANN 开发环境:https://support.huawei.com/enterprise/zh/doc/EDOC1100192223/19e6ec772、安装PyTorch 框架:https://support.huawei.com/enterprise/zh/doc/EDOC1100192231/7e916fdf
  • [其他问题] 一个环境中如果既安装了Pytorch,又安装了MindSpore,是否在一个Python文件中可以混用两个框架的语法呢?
    一个环境中如果既安装了Pytorch,又安装了MindSpore,是否在一个Python文件中可以混用两个框架的语法呢?
  • [执行问题] loss不收敛,一直徘徊
    【功能模块】【操作步骤&问题现象】1、将原来的pytorch模型,重新用mindspore写了一遍,最后两个模型对比,结构,参数,以及需要训练的参数个数都一模一样,所设置的参数,初始化都一样 .       在pytorch上面可以很明显看到Loss变化, 而mindspore上loss一直上下波动(基本趋于稳定)       下面截图中,图1,2,3 为mindspore    ,图4,5,6 为pytorch2、附件中 RAS.py和ResNet50 为pytorch     resnet50.py , model.py  loss.py 为mindspore【截图信息】【日志信息】(可选,上传日志内容或者附件)
  • [问题求助] 【昇腾高校】【Pytorch适配】Pytorch适配包无法下载
    https://www.hiascend.com/software/ai-frameworks/commercial这个链接中的Pytorch适配包需要到support网站下载,普通用户无法下载,导致高校教学场景无法使用。