- 开发者
- Atlas
#Atlas#
- 在上一篇《Atlas性能调优之瓶颈分析》中,主要阐述在性能出现瓶颈,业务无法增加时,通过哪些工具和方法,统计和观测性能数据,确定瓶颈点,从而方便进一步进行优化。 本文将详细描述使用Matrix框架的时候如何进行流程编排,搭建高性能应用。基本概念MatrixMatrix运行于操作系统之上,业务应用之下。屏蔽操作系统差异,为应用提供统一的标准化接口。Matrix具有多节点调度能力和多进程管理,... 在上一篇《Atlas性能调优之瓶颈分析》中,主要阐述在性能出现瓶颈,业务无法增加时,通过哪些工具和方法,统计和观测性能数据,确定瓶颈点,从而方便进一步进行优化。 本文将详细描述使用Matrix框架的时候如何进行流程编排,搭建高性能应用。基本概念MatrixMatrix运行于操作系统之上,业务应用之下。屏蔽操作系统差异,为应用提供统一的标准化接口。Matrix具有多节点调度能力和多进程管理,...
- Atlas人工智能计算平台,提供端、边、云的全场景AI解决方案,以强大的算力助力客户开启AI未来并加速企业智能化进程。为更好的发挥硬件算力,负载更多的业务流量,从今天开始将陆续推出性能分析、优化相关文章,助力用户在Atlas平台上进行软件开发、调优。本文主要阐述在性能出现瓶颈,业务无法增加时,通过哪些工具和方法,统计和观测性能数据,确定瓶颈点,从而方便进一步进行优化。 性能检查方法npu-... Atlas人工智能计算平台,提供端、边、云的全场景AI解决方案,以强大的算力助力客户开启AI未来并加速企业智能化进程。为更好的发挥硬件算力,负载更多的业务流量,从今天开始将陆续推出性能分析、优化相关文章,助力用户在Atlas平台上进行软件开发、调优。本文主要阐述在性能出现瓶颈,业务无法增加时,通过哪些工具和方法,统计和观测性能数据,确定瓶颈点,从而方便进一步进行优化。 性能检查方法npu-...
- 3月6日昇腾AI直播首秀,直播互动拿礼品! 3月6日昇腾AI直播首秀,直播互动拿礼品!
- 3月份昇腾直播大show,小伙伴们快来预约参与吧! 3月份昇腾直播大show,小伙伴们快来预约参与吧!
- 如何在Atlas 200 DK上编写(Python)并部署一个人脸识别应用?谭院长又来解惑啦! 如何在Atlas 200 DK上编写(Python)并部署一个人脸识别应用?谭院长又来解惑啦!
- 问题现象描述问题现象:在C30B896版本,安装完驱动后,使用npu-smi工具查询芯片,出现文件找不到情况,如下图:根本原因分析1、/lib64/目录下缺少npu-smi工具所依赖的动态链接库。结论、解决方案及效果结论:1、 如果执行npu-smi工具,提示“No such file or directory”,说明/lib64/目录下缺少ld-linux-aarch64.so.1文件,... 问题现象描述问题现象:在C30B896版本,安装完驱动后,使用npu-smi工具查询芯片,出现文件找不到情况,如下图:根本原因分析1、/lib64/目录下缺少npu-smi工具所依赖的动态链接库。结论、解决方案及效果结论:1、 如果执行npu-smi工具,提示“No such file or directory”,说明/lib64/目录下缺少ld-linux-aarch64.so.1文件,...
- 问题现象描述问题现象:用户在自制的Atlas200 SOC系统版上运行程序失败,在运行IDE-daemon-client命令时,发生错误,如下图所示:关键过程、根本原因分析关键过程:查看IDE-daemon-client的log信息,即查看/var/log/syslog,得到该命令的错误信息如下如所示:根据以上的错误信息,命令运行失败的原因是SSL握手失败,SSL握手失败的原因一般有:1.时... 问题现象描述问题现象:用户在自制的Atlas200 SOC系统版上运行程序失败,在运行IDE-daemon-client命令时,发生错误,如下图所示:关键过程、根本原因分析关键过程:查看IDE-daemon-client的log信息,即查看/var/log/syslog,得到该命令的错误信息如下如所示:根据以上的错误信息,命令运行失败的原因是SSL握手失败,SSL握手失败的原因一般有:1.时...
- 问题现象描述问题现象:模型输入数据尺寸是1000*128*7*7(NCHW),4个fc算子组成的网络模型,模型处理时延将近600ms。关键过程、根本原因分析关键过程:1. 为了测试模型推理时延,需要构造模型推理的工程,准备数据集和模型文件。2. 在程序里面进行打点处理,以便计算模型处理时延。图1-1 程序加点计算时延3. 打开日志查看模型处理时间,包括模型的数据输入、推理和数据输出耗时。4.... 问题现象描述问题现象:模型输入数据尺寸是1000*128*7*7(NCHW),4个fc算子组成的网络模型,模型处理时延将近600ms。关键过程、根本原因分析关键过程:1. 为了测试模型推理时延,需要构造模型推理的工程,准备数据集和模型文件。2. 在程序里面进行打点处理,以便计算模型处理时延。图1-1 程序加点计算时延3. 打开日志查看模型处理时间,包括模型的数据输入、推理和数据输出耗时。4....
- 问题现象描述问题现象:业务调试过程中,程序出现double free异常,日志报错如下:关键过程、根本原因分析关键过程:1、 使用HIAI_DMalloc接口为host侧的输入文件申请内存,如下所示: 2、 通过SendData函数发送数据结构体到device侧。3、 由于传入的buffer是智能指针,会自动释放一次内存。 4、 HIAI_DMalloc申请的... 问题现象描述问题现象:业务调试过程中,程序出现double free异常,日志报错如下:关键过程、根本原因分析关键过程:1、 使用HIAI_DMalloc接口为host侧的输入文件申请内存,如下所示: 2、 通过SendData函数发送数据结构体到device侧。3、 由于传入的buffer是智能指针,会自动释放一次内存。 4、 HIAI_DMalloc申请的...
- 2019年8月开始接触到华为Atlas方案,实验室之前一直以FPGA、DSP为主,从我进实验室后开始逐渐进行SoC的开发,包括Xilinx MPSoC、Hisilicon Hi3559A等方案。 2019年8月开始接触到华为Atlas方案,实验室之前一直以FPGA、DSP为主,从我进实验室后开始逐渐进行SoC的开发,包括Xilinx MPSoC、Hisilicon Hi3559A等方案。
- 数字视觉预处理模块作为昇腾AI软件栈中的编解码和图像转换模块,为神经网络发挥着预处理辅助功能。当来自系统内存和网络的视频或图像数据进入昇腾AI处理器的计算资源中运算之前,由于Davinci架构对输入数据有固定的格式要求,如果数据未满足架构规定的输入格式、分辨率等要求,就需要调用数字视觉处理模块进行格式的转换,才可以进行后续的神经网络计算步骤。功能架构数字视觉预处理对外提供6个模块,分别为视频... 数字视觉预处理模块作为昇腾AI软件栈中的编解码和图像转换模块,为神经网络发挥着预处理辅助功能。当来自系统内存和网络的视频或图像数据进入昇腾AI处理器的计算资源中运算之前,由于Davinci架构对输入数据有固定的格式要求,如果数据未满足架构规定的输入格式、分辨率等要求,就需要调用数字视觉处理模块进行格式的转换,才可以进行后续的神经网络计算步骤。功能架构数字视觉预处理对外提供6个模块,分别为视频...
- 功能简介昇腾AI处理器对网络执行层次进行划分,将特定功能的执行操作看做基本执行单位——计算引擎(Engine)。每个计算引擎在流程编排过程中对数据完成基本操作功能,如对图片进行分类处理、输入图片预处理及输出图片数据的标识等。计算引擎由开发者进行自定义来完成所需要的具体功能。通过流程编排器的统一调用,整个深度神经网络应用一般包括四个引擎:数据引擎,预处理引擎,模型推理引擎以及后处理引擎。数据引... 功能简介昇腾AI处理器对网络执行层次进行划分,将特定功能的执行操作看做基本执行单位——计算引擎(Engine)。每个计算引擎在流程编排过程中对数据完成基本操作功能,如对图片进行分类处理、输入图片预处理及输出图片数据的标识等。计算引擎由开发者进行自定义来完成所需要的具体功能。通过流程编排器的统一调用,整个深度神经网络应用一般包括四个引擎:数据引擎,预处理引擎,模型推理引擎以及后处理引擎。数据引...
- 为完成一个神经网络应用的实现和执行,昇腾AI软件栈在深度学习框架到昇腾AI处理器之间架起了一座桥梁,为神经网络从原始模型,到中间计算图表征,再到独立执行的离线模型提供了快速转化的捷径。昇腾AI软件栈围绕离线模型的生成、加载和执行,聚集了流程编排器、数字视觉预处理模块、张量加速引擎、框架管理器、运行管理器和任务调度器等功能块形成了一个完整的功能集群。流程编排器负责完成神经网络在昇腾AI处理器上... 为完成一个神经网络应用的实现和执行,昇腾AI软件栈在深度学习框架到昇腾AI处理器之间架起了一座桥梁,为神经网络从原始模型,到中间计算图表征,再到独立执行的离线模型提供了快速转化的捷径。昇腾AI软件栈围绕离线模型的生成、加载和执行,聚集了流程编排器、数字视觉预处理模块、张量加速引擎、框架管理器、运行管理器和任务调度器等功能块形成了一个完整的功能集群。流程编排器负责完成神经网络在昇腾AI处理器上...
- 昇腾AI软件栈提供了计算资源、性能调优的运行框架以及功能多样的配套工具,是一套完整的解决方案,可以使昇腾AI处理器发挥出极佳的性能。昇腾AI软件栈可以分为神经网络相关软件模块、工具链以及其它软件模块。· 神经网络软件主要包含了流程编排器(Matrix),框架管理器(Framework),运行管理器(Runtime)、数字视觉预处理模块(Digital Vision Pre-P... 昇腾AI软件栈提供了计算资源、性能调优的运行框架以及功能多样的配套工具,是一套完整的解决方案,可以使昇腾AI处理器发挥出极佳的性能。昇腾AI软件栈可以分为神经网络相关软件模块、工具链以及其它软件模块。· 神经网络软件主要包含了流程编排器(Matrix),框架管理器(Framework),运行管理器(Runtime)、数字视觉预处理模块(Digital Vision Pre-P...
- 背景:笔者和团队的小伙伴近期在进行数据治理/元数据管理方向的探索, 在接下来的系列文章中, 会陆续与读者们进行分享在此过程中踩过的坑和收获。1. Glossary(术语表) 介绍Atlas的术语表(Glossary)提供了一些适当的“单词”,这些“单词”能彼此进行关连和分类,以便业务用户在使用的时候,即使在不同的上下文中也能很好的理解它们。此外,这些术语也是可以映射到数据资产中的,比如:数据... 背景:笔者和团队的小伙伴近期在进行数据治理/元数据管理方向的探索, 在接下来的系列文章中, 会陆续与读者们进行分享在此过程中踩过的坑和收获。1. Glossary(术语表) 介绍Atlas的术语表(Glossary)提供了一些适当的“单词”,这些“单词”能彼此进行关连和分类,以便业务用户在使用的时候,即使在不同的上下文中也能很好的理解它们。此外,这些术语也是可以映射到数据资产中的,比如:数据...
上滑加载中
推荐直播
-
openEuler Summit 2024
2024/11/16 周六 09:30-12:00
华为讲师团
2024年11月15日-16日,我们将在北京中关村国际创新中心举办 操作系统大会&openEuler Summit 2024,本次大会旨在汇聚全球产业发展力量,邀请思想引领者、商业精英、技术专家、合作伙伴以及全球开源基金会等业界同仁,共同探讨操作系统产业发展方向和未来机遇,联合伙伴展示最新合作成果,分享数字化转型实践,以技术驱动创新不断激发新质生产力。
回顾中 -
华为云AI入门课:AI发展趋势与华为愿景
2024/11/18 周一 18:20-20:20
Alex 华为云学堂技术讲师
本期直播旨在帮助开发者熟悉理解AI技术概念,AI发展趋势,AI实用化前景,了解熟悉未来主要技术栈,当前发展瓶颈等行业化知识。帮助开发者在AI领域快速构建知识体系,构建职业竞争力。
去报名 -
华为云软件开发生产线(CodeArts)10月新特性解读
2024/11/19 周二 19:00-20:00
苏柏亚培 华为云高级产品经理
不知道产品的最新特性?没法和产品团队建立直接的沟通?本期直播产品经理将为您解读华为云软件开发生产线10月发布的新特性,并在直播过程中为您答疑解惑。
去报名
热门标签