-
近年来,无人机已被广泛应用于很多领域,它不仅可以完成很多的任务,包括轨迹规划、避障、巡航等,在民用、军事都有很广泛应用,而且还有降低成本、提高效率、减少损失等很多作用。 但是传统的无人机任务都采用飞控控制,需要人为操作。为了使无人机可以具备更广的适用性,或者从技术上来说拥有更好的泛化能力,深兰科学院尝试用强化学习来训练无人机做指定的任务。如果训练效果能够达到足够稳定的性能,则可以进一步实现商用目的。本文在此基础上,带大家简单了解一下强化学习的基础知识。 强化学习小课堂什么是强化学习? 1、强化学习 强化学习(Reinforcement Learning RL)也有很多其他名字,例如再励学习、增强学习、评价学习,是机器学习的范式和方法论之一,用于描述和解决智能体在与环境的交互过程中,通过学习策略以达成回报最大化或实现特定目标的问题。 上图为经典的强化学习结构图,从图片中可以看出,强化学习过程主要由4部分构成:智能体(agent)、观测到的状态(observation/state)、奖励(reward)和行为(action)。 一个强化学习的过程中,智能体获得从当前环境中观测到的状态,然后根据这一状态采取一定的行为或策略,同时,有一个评价系统来评价这个行为的好坏,并返回正/负奖励给到智能体。循环往复,直到完成整个任务,此为一次强化学习的交互。整个强化学习训练过程就是,智能体与环境不断的交互,最终会学习到合理的策略,让奖励最大或者达到某个任务(指定的状态)。 强化学习受行为主义心理学的启发,例如巴甫洛夫条件反射实验,训练摇铃小狗流口水。小狗看到吃的流口水、摇铃不流口水,实验中就采取摇铃并给狗喂狗粮的方法不停训练,最终即使在没有狗粮,只摇铃的情况下,小狗也会流口水。 强化学习与此类似,是让智能体在与环境交互的过程中,一旦选择对的行为则给予正奖励加强这种行为,在不断的训练过程中使得智能体选择最合适的行为,最终使得智能体的每一步都能选择合理的行为,从而达到整体任务奖励最大化,并完成任务。 2、深度强化学习 我们一般所说的强化学习其实是深度强化学习(Deep Reinforcement Learning DRL),深度强化学习是强化学习与深度学习结合的结果。顾名思义,就是将传统强化学习中的某一部分用深度学习来完成。 传统强化学习中的行为以及价值都是需要人为定义的,这也就是为什么传统强化学习起源较早,但是应用并不广泛的原因之一。而深度学习恰好将这一问题解决了,强化学习中的行为以及价值都用一个深度学习的网络来学习得到,这样不需要人为设定,使得强化学习可以广泛应用于很多领域。而传统强化学习无法解决的连续性动作的问题,深度强化学习也可以解决,使用对应的Actor-critic网络即可。 深度强化学习的分类,有很多种分类标准。 从智能体的个数上,可分为单智能体算法和多智能体算法;从是否基于模型的角度,可分为model-based和model-free;从训练时策略的选择,可分为on-policy和off-policy等等。 这里不一一展开,但在实际运用强化学习的时候,根据具体的任务或者项目,需要选择合适的深度强化学习算法。 强化学习可以解决什么问题? 这张图是2016年引起热议人工智能的AlphaGo事件,AlphaGo打败了围棋世界冠军李世石。AlphaGo作为一个智能体,就使用了深度强化学习技术进行了训练。在这一场景中,状态就是每一时刻的棋盘,行为就是下棋的动作,而评价系统会根据每一步棋的价值返回奖励。完成训练的AlphaGo在与李世石的比赛中,根据当前的棋盘选择最优的行为“下一步棋”,最终击败了李世石,这就是强化学习的一个具体应用。 智能体在不断与环境交互的过程中,会保留上次学习过的经验,下一轮与环境交互时,会选择奖励更大的行为,一般用来解决“智能体与环境交互时通过决策选择最好的行为”的这一类问题。
-
开源已成为重要的科技创新模式,国家创新发展和软件企业对开源人才提出迫切的需求,十四五规划纲要首次将“开源”列入其中。为激发开源创新活力,培养开源实践人才,助力开源生态建设,探索开源教育改革,在教育部高等学校软件工程专业教学指导委员会、计算机类专业教学指导委员会、科技部高技术研究发展中心等的推动和支持下,由国家自然科学基金委员会、中国软件行业协会、中国开源软件推进联盟、全国高等学校计算机教育研究会、国家示范性软件学院联盟、新一代人工智能产业技术创新战略联盟和绿色计算产业联盟等共同研究决定举办第四届“中国软件开源创新大赛”。大赛正顺利进行中,为了给参赛选手‘充电’,帮助选手更好的参加比赛并取得优异的成绩;同时让更多对MindSpore感兴趣的小伙伴对MindSpore的设计和开发流程有更好的了解,掌握MindSpore学习方法和学习渠道!6月29日MindSpore社区将在B站MindSpore官方账号为大家直播培训~培训主题:MindSpore全场景AI计算框架介绍及开发实践培训内容:1. AI计算框架的发展及挑战2. MindSpore及其关键创新点介绍3. MindSpore关键技术和特性介绍4. MindSpore开发实践及学习资源介绍5. MindSpore社区介绍 直播时间:6月29日19:00-20:00 直播地点:B站MindSpore官方感兴趣的小伙伴关注B站MindSpore官方~更多精彩等你来看!MindSpore官方资料 GitHub : https://github.com/mindspore-ai/mindsporeGitee:https : //gitee.com/mindspore/mindspore 官方QQ群 : 871543426 长按下方二维码加入MindSpore项目↓
-
人工智能(AI)和增强现实(AR)正在改变消费者的在线购物行为,且趋势正在迅速转变。有两个最新报告,帮助在线店家更好地了解AI和AR,且为购物者提供相关内容。 研究证明,AR支持消费者对品牌的期望,不仅让客户感到高兴,且积极影响购买决策。品牌在制定营销和参与策略时,需要考虑AR的实用性和广泛吸引力,相关数据对长期成功变得至关重要。 美国许多企业包括Snap、Publicis Media和Alter Agents等,发现AR与购买决策间的关联,根据AR体验的数据,增加产品展示和个性化,对整体购买决策有显著影响,购买的可能性增加70%以上。约四分之三的受访消费者表示,未来5年,AR将影响他们的购买决定;三分之二的人表示,在体验AR之后,他们更有可能购买。 同时,根据Octane AI最新发布的报告,购物者在网上购物期间正在寻找什么?约半数的人希望购买美容化妆品,61%的人正在寻找服装,约47%的人会寻找家居用品。至于在哪里寻找产品?88%的受访者在网上搜索或浏览,84%的人透过朋友推荐转向品牌;超过八成的人透过社群媒体发现品牌。Octane报告发现,71%的人“倾向于”分享个人讯息,以换取个人化推荐;53%的人更喜欢透过电子邮件进行品牌传播,12%的人透过简讯;24%的人不会上网购买未知品牌/产品,因为他们想要测试产品;9%的人表示,免费送货对他们的整体体验很重要,8%的人表示,产品评论很重要。转自:https://www.iothome.com/tech/AR-VR-MR/2021/0611/11722.html
-
近年来,人工智能技术与医疗健康领域的融合不断加深,以人工智能医疗发展最为迅速的美国为例,科技巨头和资本巨头都在积极布局智能医疗产业,大批专注细分领域的初创公司也蓄势待发。 IBM、谷歌、微软等科技巨头近年来都在布局人工智能医疗。例如IBM Watson能够快速筛选癌症患者记录,为医生提供可供选择的循证治疗方案;谷歌在糖尿病、神经性疾病诊疗和医疗器械的研究方面发力,谷歌deepmind与英国国家健康体系(NHS)合作共同开发新技术;微软发布了面向个人的健康管理平台,整合不同的健康及健身设备搜集的数据,苹果、脸谱等公司也通过设立医疗健康部门、开发医疗健康类应用、收购医疗健康类初创企业等方式,逐步踏入医疗健康行业。 除了科技巨头纷纷进场,初创公司也大批出现,专注智能医疗细分领域。仅2013年以来,美国至少有100家初创企业已小有成就,其中医疗影像与诊断成为初创公司业绩增长最快的领域。致力于药物研发的企业利用人工智能技术降低了药物开发成本;一些初创类企业运用人工智能技术,针对心血管病、糖尿病等特定病症制订了手机终端应用及可穿戴设备。 数据显示,全球人工智能风险投资已经从2012年的5.89亿美元,增至2016年的50多亿美元。预计到2025年,人工智能应用市场总值将达到1270亿美元,其中,医疗人工智能行业将占市场规模的五分之一。 我国人工智能医疗发展虽然起步稍晚,但是热度不减。数据显示,2017年中国人工智能医疗市场规模超过130亿元人民币,并有望在2018年达到200亿元人民币。 记者调查发现,目前我国人工智能医疗企业聚焦的应用场景集中在以下几个领域: 第一,基于声音、对话模式的人工智能虚拟助理。2018年6月21日,腾讯公司开放旗下首款人工智能医疗产品“腾讯觅影”辅诊平台,该辅诊引擎能辅助医生诊断、预测700多种疾病;广州市妇女儿童医疗中心主导开发的人工智能平台可实现精确导诊、辅助医生诊断。 第二,基于计算机视觉技术对医疗影像进行快速读片和智能诊断。腾讯人工智能实验室专家姚建华介绍,目前人工智能技术与医疗影像诊断的结合场景包括肺癌检查、糖网眼底检查、食管癌检查以及部分疾病的核医学检查、核病理检查等。中山大学中山眼科中心开发的糖尿病眼病快速诊断系统,能通过阅读影像资料快速出具人工智能诊断报告。 第三,基于海量医学文献和临床试验信息的药物研发。目前我国制药企业也纷纷布局人工智能领域,人工智能可以从海量医学文献和临床试验信息等数据中,寻找到可用的信息并提取生物学知识,进行生物化学预测,据预测该方法有望将药物研发时间和成本各缩短约50%。
-
众所周知,自动驾驶的汽车可以自行前进,而自行车是不能独立站着的。但近日B站网红up主稚晖君,也就是2020华为天才少年彭志辉,因骑车摔倒,运用AI独立研发了一辆自动驾驶的自行车! 用上激光雷达,自行车就能像扫地机器人那样自动规划路线,探索未知环境了。至此,这辆被稚晖君命名为“轩”的自动驾驶自行车终于算是初步完成了 “你已经是一辆成熟的自行车了,应该学会自己跑起来。” 相信不少人都有过这样的想法,但很显然,我们的自行车只是个“宝宝”,没法自己跑起来。不过对于普通人来说办不到的事,对于有些人来说却并不困难。 前几天,B站上就有一位UP主发布了自己“养大”自行车的视频,在经过四个月的“哺育”之后,他成功让一辆自行车自己跑起来了。他就是稚晖君,本名彭志辉,2020年华为“天才少年”计划签约者。  **一辆自动驾驶自行车,是如何诞生的?** 在视频中,稚晖君介绍了这辆自动驾驶自行车诞生的全过程。 首先他选择了一辆死飞(Fixed Gear,固定齿轮自行车)作为本体,并在CAD上建立了这辆自行车的3D模型,然后就是以这辆死飞的数字孪生为基础,设计一套改造方案。  为了让自行车能在静止和运动时保持平衡,稚晖君选择了使用角动量守恒的原理,在车座前方设置一个较大的无刷电机,控制动量轮的运作。同时他在后轮上方又设置了一个无刷电机,靠摩擦力来驱动后轮,让自行车实现前后移动,并在龙头上安装舵机控制转向。  在传感器方面,稚晖君为自行车安装了一个RGBD的深度相机、加速计、陀螺仪和激光雷达,用来探测周围环境和车辆自身的状况。而用来控制车辆自动驾驶的主控计算模块,则被他安置在了车座后方。 设计完成之后就是零件制作,那些对强度要求不高的零件,稚晖君使用了3D打印技术,而剩下的金属零件则是交给了“家里有厂”的朋友代为加工。  完成了硬件框架的搭建,下一步就是给自行车安上「脑子」,让它能够跑起来甚至自己认路。  「小脑」的框架是基于FreeRTOS,主要实现传感器的数据处理以及电机的控制算法,并通过一个小屏幕实时显示部分参数。  相对而言,「大脑」的软件框架就要复杂得多,除了基于昇腾的整个AI栈之外,稚晖君还使用了ROS(机器人操作系统),来实现消息分发、业务串流、SLAM等功能。  为了将这两个「脑子」整合到一起,稚晖君设计了一个四层的载版,通过总线把「大脑」和「小脑」连接起来。  “身体”和「脑子」已经就绪,接下来还差一个“心脏”,也就是驱动器。稚晖君使用了之前项目中设计的Ctrl-FOC矢量控制驱动器。这是一个超迷你双通道无刷电机驱动器,能够实现两路共100A的无刷电机FOC控制,同时还驱动了一个60KG舵机及一个散热风扇。 万事俱备,把上面所有的结构零件和电路整合起来,一辆自动驾驶自行车就诞生了。不过,目前阶段的自行车还远远没法上路,必须为它注入“灵魂”——调参。 稚晖君表示,这个车子的控制代码中有 50 多个重要参数,比如控制周期、反馈矩阵、PID 增益等。这些数字全部都要得到合理设置,才能使系统进入稳定且快速收敛的状态。电机功率、飞轮质量等物理参数的设置则需要有准确的数学模型来指导,否则一不小心就会“翻车”。  在历经九九八十一难得到模型以后,为了进一步验证模型的准确性,稚晖君又在游戏引擎Unity中进行了仿真,先让自行车能在仿真环境中自如行动,随后再迁移到现实环境当中。   现在,自行车已经能够维持自身静态和动态的平衡,也有了“自己行动”的能力,接下来就要引入自动驾驶技术了。  通过自行车搭载的RGBD深度相机,再结合AI算法,自行车就拥有了自动避障、自动跟随等功能。 再用上激光雷达,自行车就能像扫地机器人那样自动规划路线,探索未知环境了。 至此,这辆被稚晖君命名为“轩”的自动驾驶自行车终于算是初步完成了。 有类似想法的人,稚晖君并不是第一个。2016年,谷歌就拍摄了一段“自动驾驶自行车”的短片,虽然最后谷歌自曝那只是个愚人节玩笑,自行车的“自动驾驶”也是通过画面合成的,但还是让人们大开眼界。  2019年,清华大学发布了自主研发,同时也是世界首款异构融合类脑芯片。当时为了演示这款类脑芯片的性能,清华大学就制作了一款自动驾驶自行车,并因此登上《Nature》封面。稚晖君这次启动“轩”计划,就有致敬清华大学的因素在里面(虽然两者原理并不相同)。  除了本身的兴趣和致敬之外,稚晖君之所以会开启“轩”这个项目,也有自我提高,熟练新技能的目的——作为华为重金签约的天才少年,稚晖君之前接受过不少采访,他也透露过自己业余制作的各种项目是因为“比较喜欢在积累了一定程度的新知识和技能之后,构思一个项目把这些知识都用上并呈现出来。” 而对于稚晖君来说,加入华为天才少年计划,不仅是对自己能力的一种认可,同时也让个人爱好、公司价值、时代趋势达成了统一,而这对于稚晖君来说正是他最理想的工作状态
-
AI CPU 算子开发准备环境当中 Canndev源码下载 链接挂掉了还是需要申请才给开放?https://support.huaweicloud.com/aicpu_devg_community_beta/atlasaicpu_10_0014.html
-
在物联网操作系统的初期,由于碎片化的物联网应用以及多样化的物联网终端设备,促使物联网操作系统并没有像PC或手机操作系统一样,很快形成大一统,但这也意味这其背后隐藏的市场潜力不可估量。 物联网操作系统作为物联网时代战略的制高点,引来了众多企业的参与和布局。1980年RT操作系统的kernel诞生;到了1990年有了RT操作系统;2000年之后开源的Linux开始风行;2010年的Android主导了移动终端市场并辐射嵌入式应用;如今,物联网操作系统时代如约来临。 几乎以十年为一届的时代变革之风吹起了众多的科技企业,在操作系统生态建设的同时,也成就了伟大的科技公司。谷歌、苹果、微软等无一不是如此,在个人电脑走向千家万户时,微软抓住了机会,成为电脑操作系统霸主。在智能手机成为随身必备之物时,谷歌和苹果抓住了机会,成为手机操作系统的市场双雄。 然而,在物联网操作系统的初期,由于碎片化的物联网应用以及多样化的物联网终端设备,促使物联网操作系统并没有像PC或手机操作系统一样,很快形成大一统,但这也意味这其背后隐藏的市场潜力不可估量。近年来,国内“缺芯少魂”的掣肘之痛让物联网操作系统受到了越来越多的关注。 在此背景下,“2021高通人工智能&物联网开发技术开放日—重庆站”于近日圆满落幕。中科创达操作系统首席架构师刘寿永带来了主题为《智能物联网操作系统的挑战与实践》的精彩演讲,梳理了操作系统的发展历程以及未来趋势。 以下为演讲精华内容分享: 大家下午好,我是刘寿永,来自于中科创达软件股份有限公司。今天,我将和大家探讨一下针对复杂的物联网时代,智能操作系统所面临的挑战,尤其是现在。 首先,请允许我对中科创达做一个简单的介绍。中科创达作为智能操作系统提供商,创建于2008年,现在有8000多名员工,核心业务是面向移动智能终端、智能物联网、智能网联汽车推出系列解决方案、智能平台等产品。 回归到今天的分享,我想先给大家简单回顾一下整个操作系统的发展历程。 可以说,大家目前所用的操作系统最早都起源于UNIX。它最初的应用领域比较简单,基本是用于一些日常的作业,核心技术是分时共享。后来,经由C++语言重新编写了整个UNIX的编程接口后,便也可以支持这种高级语言,但UNIX之所以成功,最重要的是因为系统中的“一切都是文件”。 图源:百度百科 仅从桌面PC机出现开始算起的话,操作系统的发展大致分为三个阶段,第一阶段是以DOS为代表的磁盘操作系统时代;第二阶段是以Windows为代表的视窗操作系统时代;第三阶段是以安卓和iOS为代表的应用操作系统时代。 Mac OS及Windows的核心技术是图形用户接口及办公应用,80年代,随着个人PC逐渐盛行,由于Mac OS及Windows的用户界面引人入胜,所以其在私人电脑、用户交互方面较为成功。进入90年代后就属于Linux的时代了,随着Red Hat提供第一个操作系统的发行版以及开源运动、互联网服务的发展,Linux开始逐渐崛起。 随后,就是大家所熟知的iOS和Android,它们的核心技术主要是多点触摸以及应用商店,为用户提供了更好的移动互联网体验,这对每个消费者而言都意味着一次巨大的升级。 随着物联网的发展,操作系统进入了一个群雄割据的复杂时代,并没有一个固定的操作系统能在整个物联网时代占据主导地位。由于物联网设备千变万化,而且分布在世界的各个角落,其天然属性就是需要和云端的连接。所以,物联网OS的核心技术便是自然交互及端云融合,而其最主要的成功因素则要依靠人工智能技术以及平台间的开放合作。 在操作系统发展的不同阶段,每次变革前夕都需要迎接不同的挑战。在2008年前后的功能机时代,大屏设备尚未盛行,最大的挑战便是“如何构建一个移动互联网设备(MID)”;2010年前后的智能手机时代,其功能更为复杂,所以操作系统所面对的挑战是如何快速渗透到智能手机市场,并在满足海量需求的同时缩短上市时间;如今,步入AIoT时代后,物联网操作系统面临着碎片化严重、商务模式不清晰、纵向领域和横向平台缺乏连接、国际合作不充分、缺乏AIoT相关标准等挑战。 站在开发的角度,AIoT本身是一个非常“复杂的世界”,涉及底层算法、平台、终端设备等不同技术、不同领域的融合。 技术+行业=IoT 即通过技术与行业的融合来提供IoT解决方案,例如5G、边缘计算、人工智能、机器视觉赋能机器人、智慧零售、智能音箱等不同垂直领域。以智能音箱为例,实现自然语音交互不仅要为开发者提供SDK,还需要为第三方平台提供准入接口并融合语音识别算法。 软件+硬件=系统 软件时代,Windows可以通过售卖License授权盈利,但IoT时代,物联网OS在某种程度上必须要以硬件为载体。中科创达通过面向不同客户,分别提供智能模组、智能套件、智能中间件,形成一套智能融合系统,从而为不同层级的客户提供不同解决方案。 算法+工具=AI 过去,人们认为AI仅仅是一个算法,但中科创达除了可以为行业用户提供算法外,还可以根据企业需求为其提供诸如工业检测、LCD面板检测、工厂安全帽检测等工具,真正将AI赋能垂直领域。中科创达Model Farm可以提供AI开发的整个流程管理,包括数据标注、预训练模型、模型训练、模型转换到目标平台、在线模型测试等,拥有超过20个符合SOTA标准的预训练模型,支持量化训练及多种推理引擎,最重要的是支持零代码开发,加速算法交付周期。 中科创达于2018年就推出了工业视觉检测一站式解决方案——智慧工业ADC (Automatic Defect Classification)系统,包含缺陷自动化分类、新产品迭代数据清洗、业务作业员认证三个子系统,从作业员技能认证、数据集更新到新产品导入,贯穿工业检测的整个生命周期,有效帮助制造企业减少75%的工作量,产能提升35倍。相比人工检测,漏检率下降3%,准确率提升99%。 云+端=边缘 传统的边缘计算赋能是通过底层传感器接收数据后传输至边缘节点再发送至云端,但近年来,越来越多的云服务下沉至边缘,不同功能的各类边缘设备日益增多,算力分配问题逐渐凸显,未来,计算资源将成为重要资源。 计算+5G=应用 目前,用户对于5G所带来的差异化改变感触不深,主要是由于市场上尚未出现大量5G应用爆发。中科创达可以为开发者提供5G模块、开发套件及相关参考设计,还在5G切片领域形成了相关解决方案。典型的5G切片功能及场景有切片客户端管理,即切片控制、切片实例管理;通过FQDN、DNN、IP切片路由规则来管理切片网络;通过切片管理服务器通信,同步订阅切片信息;根据不同类型的商用网络,建立切片连接,并通过切片传输数据等。 设备+智能=机器人 整个机器人系统中包含了诸多软件系统,包括ROS、Android、物联网管理系统、端云融合系统等。目前,中科创达基于高通RB5平台、面向不同种类、功能的机器人开发了相关的参考设计及外围插件。 手机+虚拟化=云手机 云手机是指Android系统主要运行在云端,每一个Android都是一部手机,包括设备节点管理、用户和数据管理在内的管理系统主要运行在云端,控制引擎、虚拟传感器、多媒体编解码、虚拟网络等插件运行在SoC上。 最后,我把今天的分享做一个总结。 首先,未来的智能系统将是软件与硬件的融合,技术和行业的结合将推动未来数字化转型。 其次,随着云服务下沉,未来的算力将更加集中地部署在边缘节点,边缘算力网络将成为智能楼宇、智能家居等智能化行业的中心。 第三,未来,精准算法及自动化训练将促使AI开发越来越容易。 第四,5G将快速发展并赋能更多行业应用,例如XR、V2X、工厂等。 第五,以语音交互、手势交互、自然语言交互为代表的智能交互将逐渐取代传统的按键、触摸屏,成为新的交互模式。 第六,智能机器人将持续迭代,形式、功能更加多元化,从而赋能更多行业。 第七,虚拟化技术日益普及,促使设备使用、程序研发更加简单。 除了中科创达操作系统首席架构师刘寿永带来了精彩演讲外,来自高通公司以及中科创达的多位行业精英围绕人工智能、机器人、智能物联网、5G、毫米波技术等行业热点话题带了一系列专业分享,共同探讨了基于高通平台的开发经验、避坑指南及成功应用案例,深度探索行业发展趋势。 高通人工智能&物联网开发技术开放日·杭州站即将于6月24日盛大开幕,主题将覆盖5G 赋能下的智慧物联网、智能物联网操作系统开发、最新高通机器人开发平台、基于RB5的 VSLAM开发及DirectNN深度学习部署案例、高通骁龙移动平台的端侧及边缘AI产品开发、高通IoT及可穿戴平台的产品开发等一系列干货。
-
2021年,Python编程语言完成了三十年的发展,并变得较以往更加流行。在此周年庆贺之际,华为云社区博客发起“生长吧!不负盛夏,不负Python”有奖征文活动,以便大家更好地学习Python 以及更清晰自己对编程语言的学习规划。华为云社区第三期有奖征文“生长吧,不负盛夏,不负Python”开始啦!我们需要哪些主题的稿件?原则上,我们欢迎所有能帮助所有学习Python的人成长的文章!如基于自己的实际使用经验,分享对Python的技术分析、使用感受及在项目实战中的经验或踩坑指南等:你可以从以下几类主题和参考文章中,找到自己感兴趣的投稿方向:1、关于Python的基础知识,包括如何理解面向对象编程、Python变量与常量、缩进与注释、赋值与表达式相关的学习内容从零开始学python | 面向对象编程 Python:你需要知道的一切[Python从零到壹] 一.为什么我们要学Python及基础语法详解2、介绍Python的一些辅助工具,比如reqeusts、pyquery、BeautifulSoup等python爬虫总计+案例+常用工具Python不为人知的Requests模块效率3.Python部署相关,比如如何用mrs中的spark服务,将Python的开发服务部署上去在MRS上部署利用python开发的服务4.Python的基础语法用法相关:python not 关键字实例用法、format数字格式化、内置函数、如何传参等内容了解python not关键字实例用法Python学习笔记(十三)format()数字格式化 和 内置函数(25-52)5. 如何用Python实现一些功能,比如用python操作excel、用Python实现FTP文件定时自动下载、AI人脸识别等运营的Python指南 - Python 操作ExcelPython实现FTP文件定时自动下载的步骤连Python都不熟,我是如何跑通AI人脸识别的6.Python框架相关:Django、Flask、Scrapy、Diesel、Cubes、Pulsar等等Python框架有哪些?区别是什么?你将获得什么?我们会把收到的优质内容汇编成册,并注明原作者,积累行业口碑,开放给圈内开发者下载查阅,提供实践参考。对于贡献优质内容的作者,我们还将送出各项大礼!同时,在华为云站内外10+个技术社区醒目位置进行推荐,给与百万级流量资源。希望最终的这份《日渐崛起的Python》精选集,有你的署名。优质作者更可获得长期约稿和更多内容合作机会。评奖规则说明奖品评选依据 :文章投票数* 40%+专家评审打分*60%投票流程 :截稿后评审会选出15-30篇最优秀的文章到论坛进行投票。投票链接 :7月19日开启投票,更新投票链接。专家评分依据 :文章篇幅、技术含金量、排版美观度、阅读量、点赞、收藏等指标综合评分其他说明 :1、一二三等奖不能叠加。在哪里投稿?2、文章需要发表在社区博客; 是时候展现真正的技术了, 点击前往发布标题以 【生长吧!Python】结尾,例如:了解python not关键字实例用法丨【生长吧!Python】。文章末尾需加上活动名称及链接地址:【生长吧!Python】有奖征文火热进行中:https://bbs.huaweicloud.com/blogs/278897有哪些需要注意的1、文章内容需体现技术看点,图文并茂,建议字数在500字以上;2、文章要求为投稿人原创,凡转载或抄袭一经发现将取消参赛资格;3、文章须在华为云社区为首发,如华为云平台已有文章内容则视为稿件无效;4、稿件投稿后,华为云拥有该稿件的使用权、修改权等。快来华为云社区博客,一起和Python生长吧! 点击立即发布如果有任何问题,可添加华为云社区小助手微信号:bbs_huaweicloud,进行沟通咨询。添加微信时请备注:生长吧Python + 报名活动时使用的华为云昵称!扫码添加小助手:【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章
-
【功能模块】【操作步骤&问题现象】1、按照ModelArts AI市场算法HRNet使用指导进行操作,链接:https://bbs.huaweicloud.com/forum/forum.php?mod=viewthread&tid=93586&page=1%E3%80%822、进行到 3. 创建训练作业,出现状态:运行失败,截图和日志如下:【截图信息】【日志信息】(可选,上传日志内容或者附件)日志见附件log.txt
-
从乘车算法到使用人工智能机器人的客户服务,人工智能正在被用来改善现代的各种服务。 AIOps是智能化运维,它指的是一个多方面的技术平台,可以利用分析和机器学习来自动化和增强IT运营。 AIOps的工作原理是利用和收集来自一系列IT运营工具的大量多样化数据。它这样做是为了实时检测和应对问题,同时提供传统的历史分析。 如果使用得当,AIOps有多种好处,其中包括消除噪音和干扰。这意味着加快了问题的发现和服务问题的解决速度。 AIOps还可以消除信息孤岛,并为整个IT环境提供全面的可视化,包括基础设施、网络应用和存储。 1)员工。在实施AIOps时,重要的是要确保你有相关的技术人员,他们了解技术和如何应用于你的业务。你可能很幸运地雇用了已经熟悉这个概念的人。 然而,雇用更多的数据科学和自动化专家的人员将是有用的,即使他们是远程办公。 通过使用市场上最好的员工管理软件系统,可以更容易地找到适合这些特定角色的员工。 2)传播信息。最好的企业管理技巧之一,关于AIOps,是确保每个受影响的人都知道你打算做出的改变。不仅要通知你的用户社区,而且系统大修要影响的每个人也需要知道它将如何改变他们的角色。 例如,你可以通过举办网络研讨会或举办研讨会来传达这些变化,例如,如何理解系统的实施及其好处。 3)了解AIOps的功能。确保你了解系统的功能是什么,以及你通过实施系统希望得到什么结果。企业寻求的常见结果是异常检测、事件关联或警报和通知抑制。 强调寻求能够被员工快速登记的结果,让你的团队对其有效性产生信心。AIOps的实施应该是为了让你的企业更加成功,了解它们如何帮助企业是关键。 4)测试和监控。在较小的无足轻重的工作负载上配置和启动系统,会让你了解其可行性,而不会有造成损害的风险。如果为机器学习提供信息的配置需要长时间的工作,那么可能值得重新评估其对你的业务的有效性。 在这个阶段,IT操作员应该能够看到系统如何与收集到的数据进行交互,并就如何改进系统产生指导和分析。这是在扩展到更大的云规模数据集之前要实现的重要一步。 5)对系统进行指导。IT操作人员将能够定义某些可预测的常规功能,AIOps系统应该能够快速处理。给系统设置这些任务,不仅可以展示系统如何有效地完成补丁更新等任务,还可以展示系统如何为人类操作人员节省时间。 6)安装。假设各种测试场景的结果是有利的,你应该将系统部署到更广泛的网络中。如果您对您的AIOps系统是否值得使用仍然犹豫不决,您可以在初始阶段以测试模式运行系统。 这应该可以保证输出的结果是准确的,而且你的用户群对结果是满意的。此外,考虑一下将AIOps与数据质量软件相结合是否是个好主意。 这些软件可以帮助进行数据分析和数据挖掘。 7)评估和改进 一旦几个星期过去了,你和你的团队必须在实现你为系统引入设定的目标的背景下审查系统的有效性。这包括可衡量的指标,如登记系统错误的减少。这也意味着要进行调查并记录客户反馈。 一般来讲,AIOps应该意味着你可以从数据中提取更大的价值,改善服务。 总结 AIOps是一个不断发展的工具,它可以帮助您的企业节省时间和成本,并提高绩效。 然而,在没有实施经过深思熟虑和衡量的方法的情况下,不应期望它能立即带来效果。本文来源于【IT168评论】原文链接:http://net.it168.com/a2020/1231/6425/000006425317.shtml
-
2021年6月19日,由低码时代和RPA中国联合主办的「低代码应用与发展论坛」在北京The Future Hall成功举行。本次论坛以“低码时代·敏捷先行”为主题,聚焦低代码的实践与发展,共同探索如何利用低代码、AI、RPA创新技术,助力企业实现数字化转型升级。峰会现场聚集了200多位低代码领域的科技企业管理者,来自微软、SAP、华为、阿里、Treelab、明道云、智唐科技的分享嘉宾从产品、技术、市场、生态等多个维度,全面梳理了低代码在国内的应用发展路线图,并对低代码未来的发展给予了极高的期望。华为低代码资深技术专家、华为低代码一体化编排平台GDE架构师周明旺受邀发表主题演讲,介绍华为GTS低代码平台的探索与实践。低码时代、RPA中国创始人&CEO-郭政纲 低码时代、RPA中的创始人&CEO郭政纲在会议致辞中表示,低代码技术在国内的发展以及普及任重道远,但是未来可期。快速响应用户的需求,增加应对复杂应用场景的能力,是国内低代码产品的核心价值。除了敏捷性之外,成熟的AI技术可以提高业务系统的能力上限,RPA技术可以串联起各个业务,将系统之间打通,实现数据的流通,结合AI技术可以实现超级自动化。以RPA、AI和低代码三者为代表的前沿数字化理念和技术将会引领整个IT产业的升级,这也将会是整个toB领域长期重要的一个趋势。同时在今年的7-9月份,低码时代将联合各大低代码厂商及云计算平台共同举办“企智杯-低代码开发与设计大赛”。 华为低代码资深技术专家、华为低代码一体化编排平台GDE架构师-周明旺华为低代码资深技术专家、华为低代码一体化编排平台GDE架构师周明旺在《华为低代码平台实践,助力运营商数字化转型》的演讲中主要介绍了华为GTS低代码平台的探索与实践。华为GTS的低代码平台实际上是源自于华为GTS业务的数字化转型。在数字化转型的过程中,华为GTS业务面临缺乏统一的贯穿业务流、工具之间操作和数据存在断点、远程化人员作业模式比例较低、交付模式单一这几大挑战。基于此提出华为GTS的转型思路,即基于低代码平台使能敏捷迭代,让业务人员来参加开发,进行可持续的运营。华为的低代码平台在长期的探索与实践中经过了四个发展阶段:第一阶段,套件时代;第二阶段可配置业务包;第三阶段,基于云化的iPaaS平台;第四阶段,一体化的低代码开发。这也是整个华为GTS领域的低代码平台的最佳实践,基于电信领域各种知识和沉淀,以一体化的低代码开发平台ADC为基础,采用低门槛、无代码、低代码的开发能力,可信安全的开发框架和高效率的工具链来支撑上层的GTS各个产品,同时使能全员开发,加速业务创新,实现数字化的转型,这就是华为的整个低代码平台。华为低代码开发平台还包括以下几个关键点:第一,编程门槛降低;第二,系统高度集成;第三,效率提升;第四,经验可复制。微软大中华区商业应用事业部总经理-李威微软大中华区商业应用事业部总经理李威在《微软低代码应用平台-Power Platform》的演讲中着重介绍了微软低代码平台Power Platform的产品线。主要包括:1、用低代码/无代码的方式快速开发应用的Power Apps;2、快速开发流程和集成自动化的Power Automate;3、用低代码/无代码的开发方式开发可视化的数据展示平台Power Bi;4、快速开发对话机器人的Aower Virtual Agents。 谈及微软为什么重视低代码,李威表示主要有三点因素:1、随着数字化进程的加速发展,未来五年内将有超过5亿的数字化应用要被开发出来;2、与此相对应的是开发人员数量的短缺;3、新冠疫情的催化下,全球及中国企业员工的工作模式发生了巨大的变化,这样一种新的办公模式就需要有一种新的流程化和新的数字化方式来支持。微软的使命就是通过低代码和无代码工具帮助每个人都能成为Developer。 李威强调,低代码/无代码平台最大的魅力不在于开发全新独立运行的平台,而更多的意义是帮助企业在现有的IT系统上进行整合,包括跟企业各种各样可能存在的异构系统进行整合。大中华区SAP技术与创新解决方案负责人-陈泽平 大中华区SAP技术与创新解决方案负责人陈泽平在《低代码/无代码开发和全民自动化 - 企业韧性持久的未来》的演讲中表示,低代码开发平台是一个不可逆的趋势,是全面自动化非常好的一个向导。目前所有的公司都在尝试降低开发门槛,不仅是IT人员,甚至是平民也可以通过自己开发软件产品来帮助自己提升效率。其次,低代码平台后期的维护成本会逐渐降低,因为不需要IT人员在后期去花大量的时间进行相应的开发和维护,整体的应用成本可以降低5到10倍。谈及低代码平台的开发方式,陈泽平强调从核心业务流程的角度来讲要做标准化以及集成的应用程序,并且需要高数据的吞吐量,这个开发的应用技术和功能是非常强大的,所以建议还是由集团的IT去执行,不建议每个部门开发自己的应用,那样会使整个业务失去管控。SAP在产品的应用和设计方面是如何体现低代码/无代码开发的核心能力和价值呢?主要包括以下三个核心的方式:第一,全栈式的可视化编程;第二,全生命周期的管理;第三,低代码开发能力的扩展。最后陈泽平总结道,SAP的业务技术平台核心是分装了非常多的业务理解,再把这些业务理解分装了相应的API以及预置的机器人包、机器人的业务逻辑,这样开发效率有了极大的提升,同时这些业务知识也能够帮助IT人员快速去做一些业务创新,并且增强协同交互体验。 Treelab创始人兼CEO-何浚炫 Treelab创始人兼CEO何浚炫在《低代码如何赋能传统企业运营和提升产业协作效率》的演讲中分享了其做Treelab产品的初心。以传统服装行业所面临的业务流程复杂通病为切入点,谈到Excel在这个场景里面承担了轻量级的业务终端的作用,会导致大量的时间、人力成本的消耗。所以企业流程管理本质的协同效应和碎片化效应是非常难标准化的。他认为,未来在传统企业包括供应链、电商、零售、服务端等一定会有新品类的软件产品出现,该产品的复杂性将控制在Excel和ERP维度之间,可以很简单也可以很复杂,其拓展性和产品的应用性可以让业务人员在不需要花大量的培训和成本下使用起来。 关于企业未来的生产力工具,何浚炫认为,生产力工具在中国未来将会变成非常核心的一个赋能产业升级的能力,因为产业未来比拼的是精细化的运营和管理能力,所以该工具一定是一个以数据为导向的生产力工具,可以连接有价值的业务数据并且围绕着数据来去驱动管理。希望未来的生产力工具能够有能力把管理经验和自动化能力变成一个标准化的系统,可以承接各个不同的ERP和财务系统来赋能企业腰部力量。 阿里巴巴前端技术专家、Mobi 低代码业务前端负责人-汪凤震 阿里巴巴前端技术专家,Mobi 低代码业务前端负责人汪凤震在《探索低代码的未来》的演讲中以超前的理念向大家分享了其对低代码未来的研究探索。对于低代码的定义,汪凤震称其为HPApass。目前低代码在国内还处于爬坡的阶段,但是在未来拥有很大价值。谈到低代码的核心,从大视角看,主要包括SHS三位一体;软件系统;系统设计语言;人机交互;“好的设计”五个方面。汪凤震从十项原则方面对“好的设计”进行了主要阐述,并表示“好的设计实际上⽐劣质的设计要难得多,因为设计的最高境界是既看不到设计痕迹,却能够很好地满⾜用户需求。”对于低代码未来的展望,汪凤震表示,低代码的方向毋庸置疑,但是未来5年,低代码产品失败率依然会非常的高,预计有大量低代码产品会达不到所期望的预期,得不到广泛的肯定。在未来AI的加持下,通过不断结合AI智能辅助技术,低代码的体验会有明显提升。未来低代码的关键项包括1、完整的应用闭环能力;2、拥有较好的用户体验;3、赋能能力,即对现有开发流程的有力补充。明道云华北区域业务总监、北京分公司负责人-薛晨 明道云华北区域业务总监、北京分公司负责人薛晨在《零代码如何帮助大中小企业数字化转型》的演讲中,向大家介绍了明道云是如何去帮助大中小企业用零代码进行数字化转型的。对于中小型企业,第一点需要做企业核心的生产业务流程;第二点,中小企业需要的是一个既可以贴合现在的业务流程,又可以灵活调整、拓展,而且还不会很昂贵的企业软件的方案;第三点,做完全的零代码,才能让这样的企业自己实现自己的业务数字化系统,才能够彻底的改变企业软件的开发流程和人员构成的需要。而对于大型企业用零代码平台去提升和开发部署效率,完善核心业务系统的补充,非核心业务系统的替代,或者直接为新业务提供及时的支持,也是比较好的解决方案。他介绍了普华永道完整用零代码提供了房地产行业的税务精算系统;佛山地铁和北京地铁用零代码做了非常高频的安全管理和社会维保,佛山铁路投资集团还专门成立了零代码实验室,用零代码的方式推动企业内部的业务创新等案例。 最后薛晨表示,相对于传统的低代码开发的方式,零代码平台可以提升开发和部署效率,可以迎合业务的快速变化,可以克服数据孤岛问题,最重要是它能够让业务人员直接参与到系统的设计中去。相信凭借零代码的特点和优点,能够在大中小企业的数字化转型过程当中,提供有力的技术支持。从左至右依次为:智唐科技创始人&CEO朱垒磊、明道云北京分公司负责人薛晨、Treelab创始人兼CEO何浚炫、阿里巴巴前端技术专家汪凤震 在之后的人物对话圆桌论坛环节,由智唐科技创始人&CEO朱垒磊担任主持人,Treelab创始人兼CEO何浚炫、明道云北京分公司负责人薛晨、阿里巴巴前端技术专家汪凤震等嘉宾围绕《组织与模式的变革:从传统IT开发模式到低代码开发模式,变与不变》的主题,从投资、市场、技术、生态四个方面对低代码行业进行了深入解读。 参会专家及同仁均对本次论坛的成功召开为低代码行业带来的众多思考与成果分享表达了高度的肯定。同时低代码行业的发展也离不开低代码链条中的各类服务商和协作组织。2021年低码时代及RPA中国将继续与行业内的所有伙伴携手,一起做好低代码的市场普及工作,推进低代码在中国的生态建设和应用,为企业数字化转型落地赋能提速,为IT产业创新发展贡献我们的智慧和力量。 Reference:微信公众号-LowCode低码时代
-
本文是AI框架分析专栏的第六篇,总体目录参见:AI框架的演进趋势和MindSpore的构想:金雪锋:AI框架的演进趋势和MindSpore的构想zhuanlan.zhihu.com1 模型调试调优面临的挑战1.1 模型精度调优模型的精度调优是AI模型开发过程中必不可少的一步。导致精度问题产生的原因十分多样,包括数据集问题、超参设置问题、算法设计和实现问题、python编程问题等等。用户在模型调试时发现的异常现象,比如loss不收敛、梯度爆炸等,又往往处于问题的表层,很难判断问题的根因所在。以梯度消失为例,初始权重不合理、学习率设置不当、数据集未正确处理等都可能引起该异常,需要算法工程师不断积累经验、耗费大量时间进行定位。在算法复杂度日益变高的今天,构建强大易用的精度调优工具帮助算法工程师快速找到问题的根因,是提升网络开发效率的关键。1.2 模型性能调优大模型是当前深度学习领域研究的热点之一。模型的参数量和训练数据集的大小均以指数级的规模快速增长。以近期MindSpore和鹏城实验室共同发布的盘古-α模型为例,模型的参数量达到了2000亿,使用2K集群耗费数月时间进行训练。在这样的背景下,模型性能调优对减少训练时间和成本有着至关重要的意义。大模型的训练涉及数据并行、模型并行、pipeline并行、重计算、host-device并行等多种技术,简单的算子执行时间统计已经远远无法满足性能调优的需要。为不同训练规模、训练范式(强化学习等)的模型训练提供高效的性能调优工具,是对AI框架提出的全新诉求。2 MindInsight——MindSpore调试调优工具2.1 MindInsight介绍MindInsight为MindSpore提供了强大而易用的可视化调优调试能力,其中包括六大部分:训练看板:通过Summary接口,将MindSpore训练中的标量数据(loss、learning_rate等)、计算图、数据图、图像输入、张量、参数分布信息等记录到Summary文件,并在训练看板页面可视化。训练看板支持在页面实时观察不同step的数据变化情况。溯源与对比看板:模型溯源功能支持将同一模型多次训练时使用的参数进行分别记录,并统一在页面进行对比分析,得到各参数重要性和优化目标。对比看板支持将多次训练的标量统一展示,可快速分析不同的loss曲线等变化情况。调试器:调试器是为图模式训练提供的调试工具,可以用来查看分析计算图节点的中间结果,快速定位精度问题根因。Profiler: 在MindSpore模型训练过程中,可使用Profiler()接口将算子执行时间、集合通信时间等信息记录到profiling文件中,并通过Profiler页面从多个维度进行可视化分析,快速定位性能问题根因。模型转换:将ONNX格式的模型文件作为输入,可以转换生成MindSpore格式的网络定义脚本和模型权重文件,可直接基于脚本和权重文件在MindSpore进行模型fine tune或重训。模型解释:为用户提供对模型决策依据的解释,帮助用户更好地理解模型、信任模型,当模型出现错误时可以有针对性地进行改进。目前已构建了显著图可视化、解释方法评估、不确定性、反事实等模型解释能力。本文将聚焦MindInsight中调试器和Profiler两大特性,阐述MindInsight如何系统性地解决精度调优与性能调优的挑战。MindInsight功能的详细介绍可以参考使用可视化组件MindInsight - MindSpore master documentationwww.mindspore.cn2.2 调试器——自动化的模型精度调试工具AI模型的训练涉及数据处理、数据增强、模型构建、超参设置与调优等多个步骤,其中任何一个环节出现错误都可能导致模型的精度不理想。在模型训练出现异常时,算法工程师往往只能够观察到loss不收敛等现象,需要进一步分析网络中的中间结果定位根因。使用”print”等传统方式,并不能很高效地进行问题分析,其原因在于:a. 与传统的静态代码相比,AI模型中的参数和权重随着训练的进行不停发生变化,这意味着训练任务的分析可能涉及上百万规模的不断变化的张量,人工”print”的方式难以满足这种量级的分析诉求;b. 很多精度问题,如inf/nan、梯度爆炸等,具有“传染性”,找到首先出现这些问题的网络节点是定位问题的关键。令问题更加复杂的是,找到问题首现节点后,还需要更进一步地去定位问题的根因。例如,模型训练时出现Nan,可能是除零导致,需要进一步溯源分析上游节点的输出中是否有0存在。这对异常发现和上下文分析提出了更高的要求。一个好的模型精度调优工具,应该具备如下功能:数据获取:算法工程师可以方便地指定想要分析的信息(如梯度、权重),调优工具在训练过程中能够记录下相关数据数据。在图模式的训练中,由于模型中间节点的输出结果不会返回至Python层,调优工具需要结合框架构建数据获取的能力;自动诊断:算法工程能够指定异常监测条件(如梯度消失、权重无更新等),由调优工具自动化地对选定的数据进行分析,在监测条件触发时,返回首个满足条件的节点信息;可视化分析:支持实时/离线分析张量数据的统计信息和变化趋势,支持对异常点的上下文数据进行溯源分析。基于上述设计思路,MindInsight构建了强大易用的模型精度调试工具,即使算法工程师没有丰富的经验,也可以利用调试器快速对模型精度进行异常检测和分析。上图展示了调试器的页面,主要由以下部分组成:1. 节点列表:按命名空间层次化地将模型节点进行展开/聚合,用来选择训练时监测的节点。支持按照节点类型(梯度、权重、激活等)、节点名称进行快速筛选。可以切换逻辑卡号检测不同节点上的数据。2. 计算图:展示经过图优化后最终的执行图,同样支持按照命名空间展开/聚合,与左边的节点列表进行联动展示;3. 节点信息:选中计算图上某个节点,在右下方会展示该节点的详细信息,包括输入/输出张量(名称/Type/Shape/Value等)、输入/输出节点名称、堆栈信息(可以找到该节点对应脚本中哪一行代码)等。4. 张量检查视图:一些张量的维度过多,无法在主页展示,可以点击张量信息TAB页中的查看按钮,进入张量检查视图查看详细信息。用户可以选择不同的维度展示张量的不同切片,也可以通过最大值、最小值、平均值等信息对张量进行分析。通过张量关系图,可以得知当前张量是通过哪些张量计算出来的,以及影响到了哪些张量,方便用户快速对节点的上下文进行溯源分析。5. 监测点列表:为了对选中的节点进行自动化异常诊断,调试器中内置了丰富的条件判断函数,这些检测条件根据专家经验总结而来,能够覆盖大量常见的精度调优异常。一些典型的监测条件如下表所示:监测条件作用张量溢出 (Tensor Overflow)检查张量是否出现溢出权重未更新 (Weight Not Change)检查权重在不同的step间是否有更新权重初始值 (Weight Initialization)通过阈值判断权重初始值是否在合理范围权重变化过大/过小(Weight Change Large/Small)通过阈值判断权重变化是否过大/过小梯度爆炸/消失(Gradient Exploding/Vanishing)检查梯度值是否存在上溢/下溢激活值范围 (Activation Range)通过阈值判断激活值是否在合理范围对于需要使用阈值进行判断的监测条件,调试器会给出经验值设置推荐,算法工程师也可根据网络的特点进行自定义配置。6. 训练控制:调试器支持在线和离线两种模式。在线模式中,用户可以在训练过程中暂停训练,逐节点地分析该step的中间结果;离线模式下,用户可以先将张量数据保存至磁盘/对象存储,然后作为调试器的输入进行分析。调试器支持重设监测点对当前step的数据进行多次检查。7. 异常触发列表:调试器的监测规则被触发时,训练暂停,在异常触发List中,可以看到被触发的规则和触发该规则的节点。MindSpore调试器使用流程上图中给出了调试器的推荐工作流程:以Debug模式启动训练后,算法工程师首先在节点列表中选择训练时想要监测的张量,并设置相对应的异常检测规则,调试器会在训练过程中对监测张量进行采样和分析,并在异常触发后暂停训练;此时,可以在数据分析页面对触发监测规则的张量进一步分析(实时或离线),调试器也会给出相对应的建议帮助根因溯源。此外,MindInsight为用户提供了详细的精度调优方法论指导,详细内容可以参考:金雪锋:AI框架如何帮助开发者提升精度调优效率zhuanlan.zhihu.com。2.3 Profiler——支持万亿级参数模型可视化性能调优随着AI模型训练的数据集大小和参数量规模爆炸式增长,算法工程师越来越需要对模型进行细粒度地性能调优,以节省训练成本。当前AI模型的性能调优有比较高的门槛,主要体现在:1. 性能调优需要算法工程师对AI全栈软硬件有一定的了解,同时掌握算法和系统两方面的知识;2. AI框架提供了抽象的模型开发接口,算法工程师难以获得影响模型训练的关键信息(数据处理、算子性能、集合通信等待与计算、内存使用等),很多时候需要在代码中手动打点进行数据的收集、汇总与分析。Nsight/nvprof等工具虽然可以收集GPU kernel的执行性能,但却很难将其和high-level的code进行协同映射分析,指导用户进行代码层面的调优;3. 随着模型规模的不断增大,为了解决“内存墙”问题,使用了更多训练节点以及模型并行、pipeline并行等技术。集群训练调优需要收集更多更复杂的数据,对影响性能的多个指标综合进行考虑;4. 针对强化学习等新的训练范式,需要提供相对应的调试方法帮助算法工程师进行系统性的性能分析。为了解决以上问题,MindSpore构建了强大的可视化Profiler工具。用户无需进行代码打点,通过简单的API调用即可一次性地收集完整的全栈性能数据。Profiler会对收集到的数据进行自动分析挖掘,提取出其中的关键点,并在可视化页面给用户针对性的调优指导。用户可按照Top-Down的层次化分析方法,快速了解训练性能:1. 由迭代轨迹展开的单机性能分析上图展示了Profiler单卡性能分析页面,由如下部分组成:1)迭代轨迹:Profiler将整个耗时划分为三个阶段。迭代间隙表示训练获取数据的等待时间,前向+反向阶段表示计算耗时,迭代拖尾包括前反向计算结束到参数更新完成的时间。用户可以根据各阶段耗时比例,针对耗时占比较大的阶段在其他页面进一步分析。对于多卡场景,迭代轨迹还会展示通信算子耗时时长及其与计算算子的并行概览,让用户对于通信算子执行情况有整体的了解。2)数据准备:如果迭代间隙耗时占比较高,说明数据跟不上计算的处理速度,用户可以到数据准备页面,继续分析是数据处理速度慢,还是数据从Host发往Device性能较差。3)算子耗时统计排名:如果前向+反向阶段耗时占比较高,用户可以到该页面查看计算算子的耗时时长,分析是否有算子耗时不合理并针对耗时较长的算子做对应的优化。4)时间线:时间线中可以展示算子执行序、算子间的并行情况等信息,用户可以通过该页面详细分析各算子是如何执行的,对于集群场景,也可以分析通信算子与计算算子的并行情况。5)小助手:综合Profiling数据,对可能存在的性能瓶颈点提示用户重点关注。2. 由多机到单卡的集群性能分析对于集群场景,直接从单卡视角进行分析比较困难。尤其是大规模集群中,各个节点、链路的性能可能存在差异,性能下降的根因很难通过单卡的数据进行分析。Profiler以集群视角汇总了多项性能关键数据,并对多卡数据提供了排序、分析功能,用户可快速的从K级集群中找到慢节点、慢链路等,并从集群页面跳转到对应的单卡页面,进一步定界节点慢的原因,找到最小性能瓶颈点。以上图为例,图中展示了集群中所有节点的关键阶段耗时,对各阶段耗时做排序分析后可以快速地找到集群内的瓶颈节点。同时,可以点击对应节点的Details按钮(上图红框内),跳转到单卡页面,进行进一步的性能分析。针对集群性能分析中比较关键的集合通信操作,Profiler将其细分为通信等待(该芯片集合通信等待同步的时间)、通信耗时(集合通信数据传输与计算的时间)等阶段,方便用户判断通信算子主要耗时是在通信还是在等待。同时针对通信链路,Profiler提供了该链路上的通信数据量、通信耗时、链路类型等信息,用户可以观察集群中是否出现链路拥塞等问题。3. 资源使用分析训练过程中设备资源的使用情况也是用户非常关注的,比如芯片内存的占用和CPU/NPU的利用率。Profiler提供了模型在芯片侧内存使用情况的可视化,包括模型的内存分配概览(包括总可用内存、峰值内存等信息等)、模型运行过程中占用内存大小随执行顺序的变化以及每个执行算子的内存使用分解情况。用户可以根据内存信息来调试可能出现的OOM问题,对于模型并行、pipeline并行等集群训练,也可以根据内存信息调整算子或stage的切分。针对Host侧CPU利用率,Profiler会记录整机、当前进程以及数据处理算子占用的CPU利用率变化趋势,方便用户观察在训练过程中CPU利用率的变化情况。特别是大集群场景下,用户无法同时对上千个进程进行监控,此时CPU利用率的记录就显得格外重要(我们遇到过一个真实的案例,K级集群训练过程中性能不达标,最终发现是某一个进程对应的用户CPU利用率低导致数据处理性能跟不上芯片的计算速度)。同时,通过对数据处理算子占用CPU利用率的可视化,用户可以对数据处理算子的线程数做对应的调整,以充分发挥数据处理的并发能力,提高整个训练的端到端性能。4. 调优方法推荐Profiler虽然收集展示了详细的性能数据,算法工程师仍然需要具备丰富的经验,才能够根据这些数据定位到性能瓶颈的所在。为了降低性能调优的门槛,Profiler内置了丰富的专家规则对性能数据进行自动化分析,在“小助手”模块展示分析结果。例如,数据处理时间较长时,“小助手”中会展示当前哪个数据处理算子是性能瓶颈,并提示用户通过增加该算子的处理线程参数提示性能。在后续计划中,Profiler会进一步构建源码映射等能力,帮助用户快速找到需要修改的代码行;同时,会支持强化学习、多种并行策略等更多的场景,进一步提升Profiler的覆盖面;最后,Profiler也会在训练性能预测等方向进行探索,在训练前对关键的参数进行配置指导。转自文章链接:https://zhuanlan.zhihu.com/p/382078428转自作者:金雪锋感谢作者的努力与分享,侵权立删!
-
6月18日,以“创新普惠”为主题的华为云TechWave全球技术峰会(人工智能&数据)在上海举行,现场华为云分享技术创新、行业实践并发布了人工智能系列新品——智能流程机器人方案,帮助企业打造“AI数字员工”。新兴技术正在重塑千行百业生态,近年来,AI+自动化正在被越来越多的企业机构应用于工作场景之中,并成为趋势:一方面,AI技术可以将传统业务中的非结构化数据进行拆解;另一方面,机器人流程自动化(以下简称“RPA”)可以将基于规则、重复性的工作业务实现自动化。二者的有效结合可以更好地帮助企业实现智能自动化,帮助企业开启数字化大门。 具体来说,本次发布的智能流程机器人方案是将机器人流程自动化(RPA)与人工智能(AI)相结合,可以实现包含财务、税务、IT、商务、采购、HR、项目管理、薪酬管理等在内的复杂业务流程的自动化,最终帮助企业打造“AI数字员工”。 华为云深度融合OCR、NLP等AI技术与RPA、低代码能力,基于华为云ModelArts Pro开发套件与HiLens端云协同架构,实现0代码开发、端边云快速部署,从而打造将复杂业务流程自动化的智能应用,例如企业财务助手、金融营销助手、政务综合治理助手等,加速企业智能自动化转型。在华为云和银行的联创中,运用智能流程机器人方案进行银行提货单、信用证识别和自动录入,效率提升450倍,错误率降低90%。 作为华为云生态中的重要战略合作伙伴和RPA领域实践先行者,软通动力早已将双方共同合作的AI+RPA技术率先应用于内部提升流程效率、优化流程质量等方面,进行自身流程自动化实践。目前,软通动力已经在273个业务场景中使用了智能流程机器人方案,2020年处理200万+单据,处理效率提升6.5倍,年节约成本近880万元。 相信未来,华为云智能流程机器人方案将成为企业的得力助手,加速企业数字化转型。
-
从即日起截止至7月3日,WAIC 2021·黑客松报名开启!2天36小时巅峰对决,最强大脑、一触即发,打造开发者们专属的Coding赛场,MindSpore期待与你一起用代码改变世界。 世界人工智能大会(WAIC)是经国务院批准,国家发展改革委、科技部、工业和信息化部、国家互联网信息办公室、中国科学院、中国工程院等部委与上海市政府共同举办的顶级人工智能会议。2021 年大会继续秉持「智联世界」的理念,以「众智成城」为主题,促进全球人工智能创新思想、技术、应用、人才和资本的集聚和交流,推动全球科技的创新协同,助力打造人工智能世界级产业集群。本届大会将于 7 月 7 日 - 10 日在上海举办。世界人工智能大会黑客马拉松 是 WAIC 期间唯一的一场黑客松,由世界人工智能大会组委会办公室作为指导单位,由机器之心,MindSpore 开源社区,Waston Build 创新中心,六七八九集团主办,此次黑客松设计多道赛题,聚焦 AI 技术与应用热点问题。黑客松颁奖典礼将在 7 月 10 日举办的 WAIC· 开发者论坛上举行颁奖。MindSpore 开源社区赛道本赛道由华为 MindSpore 开源社区主办,每个赛道奖金分别为冠军: ¥5000、亚军:¥3000、季军:¥2000。赛题:基于 Volcano 容器批量计算平台进行MindSpore LeNet 模型训练旨在实现易开发、高效执行、全场景覆盖三大目标,其中易开发表现为 API 友好、调试难度低,高效执行包括计算效率、数据预处理效率和分布式训练效率,全场景则指框架同时支持云、边缘以及端侧场景。LeNet-5 是最早的卷积神经网络之一,主要用来进行手写字符的识别与分类。LeNet-5 通过巧妙的设计,利用卷积、参数共享、池化等操作提取特征,避免了大量的计算成本。在本次黑客松挑战赛中,挑战者需要使用 MindSpore 进行 LeNet-5 手写体识别模型训练。并需要把模型容器化后部署到 volcano 批处理系统中进行调度训练。参考网站https://github.com/volcano-sh/volcanohttps://volcano.sh/en/https://www.mindspore.cn/tutorial/zh-CN/master/introduction.html参赛要求1. 技术要求:熟悉 Python;熟悉 kubernetes 平台;对 MindSpore 和 LeNet 有一定了解 2. 团队要求:1-3 人 比赛时间报名时间:即日起开启线上报名,7 月 3 日截止线上报名决赛名单公布时间:决赛名单 7 月 4 日统一公布决赛时间:7 月 9 日 9:30-18:00比赛地点上海张江人工智能岛 21 号楼 4 楼(上海市浦东新区川和路 55 弄上科路 366 号)立即报名扫下方二维码或点击阅读原文即刻报名对MindSpore赛题有任何疑问,扫码加小助手(mindspore0328)入群咨询在此诚挚邀请全球的开发者们组团来战!欢迎大家参与MindSpore开源社区,成为AI开发者!MindSpore开源社区招聘进行中,详情戳下图了解!MindSpore官方资料 GitHub : https://github.com/mindspore-ai/mindsporeGitee:https : //gitee.com/mindspore/mindspore 官方QQ群 : 871543426 长按下方二维码加入MindSpore项目↓ 阅读原文
-
通过语音识别技术,在会议界面上实时呈现发言内容字幕,并实时翻译成英文。这对涉及跨国、跨语言开会场景非常有用。同时,可以区分发言人自动生成会议纪要,纪要可以导出后进行整理,无需手工记录,参会者可以轻松地聚焦会议讨论,同时也能获得完整的讨论记录。
hello word~/
发表于2021-06-22 11:10:44
2021-06-22 11:10:44
最后回复
hello word~/
2021-06-22 15:03:01
5013 2
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签