• [其他] 【活动已结束】AI开发平台ModelArts公测开启,你提意见,找BUG,我发礼品,谁敢来战!
    这是一个什么东西?一站式AI开发平台。有什么用?提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流不懂,意思就是很强“哦”有啥特别的吗?更快:上手快、训练快、上线快普惠:业务开发者、AI初学者、AI工程师 ModelArts服务11月13日正式开启公测,邀请想玩儿的你抢先体验,如果说现在的ModelArts是一座堡垒,期待你的火炮能炸穿我们的城墙,公测的时候,我们希望变的张皇失措,狼狈不堪,只要你有这样的信心来挑战我们的技术。我们用奖品来回归你所发现的BUG。今天你胆敢提出的意见都是对我们的挑战,开始你的吹毛求疵,我们无所畏惧!活动内容:在服务免费使用期间,将服务的BUG或者修改建议在本贴回复,即有机会获取惊喜大奖!领取公测资格之后,你可以在ModelArts上进行案例的实践,编码的实现或者进行数据的存储调用等各项基本操作,只要你能给出意见或者找出BUG,你就有机会拿走礼品。活动流程:注册华为云账号-免费申请公测资格-下载用户手册-使用服务-按格式回帖留言-等待获奖名单公布点我注册华为云获取ModelArts免费体验资格用户手册https://support.huaweicloud.com/usermanual-modelarts/modelarts_02_0001.html 具体操作也可操作ModelArts样例库ModelArts总览界面样例库活动时间:2018年11月13日--2018年12月12日 回贴规范:1、华为云账号2、进行的操作/截图3、优化意见/BUG 活动规则:1、用户参与次数不限,提供优化意见或者您在使用过程中遇到的bug2、中奖人员根据其提供的优化意见数量和质量进行评定,重复的意见和bug按留言顺序只取最先发布的为准。3、不符合活动要求或者非法信息发布,取消获奖资格4、活动结束后,奖励名单会在活动结束后的3个工作日内公布,奖品在5个工作日内发放。获奖玩家需要在公布名单后主动联系小编进行领奖,否则视为放弃领奖。 奖项:一等奖: 3名(二选一) 1、荣耀手环4 Running版(肆意红、茵草绿)两种佩戴,自由切换;专业跑步指导,足部佩戴,计算更准确;时尚双色腕带,快乐陪跑;50米防水,长续航。 2、 华为小天鹅蓝牙音箱(白色、香槟金、薄荷绿、洛可可粉)音触即发!会唱歌的“天鹅”,360°音效技术,音质更真实自然,简洁触控操作,多提示音选择,支持蓝牙免提通话。二等奖: 5名(二选一)1、 华为Colortooth多彩蓝牙耳机(石墨黑、萤石白)蓝牙4.1,智能降噪,高清音质。支持同时连接两部手机,智能语音状态提醒,智能省电,长久续航。2、BroadLink智能遥控黑豆RM mini3(黑色)黑豆Wi-Fi智能遥控,让普通空调变智能,个性化定制空调状态,远程开空调,一键启动空调、TV、机顶盒! 三等奖: 8名(二选一)1、 耐翔NAENY手机扩容U盘 安卓版 16GB存储(金色、银色)手机、平板、电脑三用!2、荣耀经典耳机 USB Type-c版(白色)具体中奖人数根据参与人数适当增减 请不要理会瑟瑟发抖的工程师,这是一个你向华为程序员挑战的机会。————————————————————————————————————————————————————————获奖名单公布:一等奖: 蓝书签 lishuimo二等奖:andyleung andyleung             7                 Zhd22             如云似海     linqitao三等奖:小修             xiaoxiu             ecstatic        ecstatic             charlieyu      charlieyu             pmandytian pmandytian             四年三班扛…   jwkjdj             Hero             HUAWEI_TX恭喜上述获奖人员,感谢您为ModelArts提出的宝贵意见,请尽快与我联系,私信我心仪的奖品+收获地址+手机号,我们会尽快为您发放奖品。
  • [技术干货] 一张图告诉你ModelArts有哪些黑科技
  • [热门活动] ModelArts公测活动,多重好礼相送!
    尊敬的用户您好:华为全栈AI解决方案中,面向AI开发者的一站式开发平台ModelArts强势开启公测。帮助0基础用户自动训练、创建和部署模型,管理全周期AI工作流。产品链接:http://t.cn/EyAGaBO公测期有多重好礼相送(礼品包邮):一重好礼:找bug,赢大礼挑战华为程序员,开始你的吹毛求疵!活动链接:http://t.cn/E217q8y活动时间:11月13日-12月12日 二重好礼:跑demo,快人一步每个工作日前5名完成demo测试的用户,获赠价值99元蓝牙音箱。每个工作日第6-10名完成demo测试的用户,获赠价值50元《极简人工智能》书籍。(请将操作结果输出截图私信华为云EI小助手3号,按发送时间排名)Demo操作指导:http://t.cn/ELOOOrN 三重好礼:0门槛,转发朋友圈每个工作日前10名将ModelArts公测图无分组转发至朋友圈的用户,每人获赠50元华为云通用代金券。(请将截图私信华为云EI小助手3号,按发送时间排名) 特别奖:2万体验大奖,等你拿分享活动到朋友圈点赞最多的10名用户,每人获赠2000元大数据/人工智能体验劵,有效期6个月。(请将点赞截图于活动截止前私信华为云EI小助手3号) 注意:【二重礼、三重礼、特别奖】活动时间为11月29日-12月12日。活动期间,我们将每日公布获奖名单,详见华为云社区论坛链接:http://t.cn/ELOKbFc奖品在活动结束后5个工作日内派发。请获奖用户主动联系华为云EI小助手3号进行领奖,否则视为放弃领奖。华为云EI小助手3号微信二维码
  • [技术干货] 斯坦福DAWNBench:华为云ModelArts深度学习训练全球最快
    近日,斯坦福大学发布了DAWNBenchmark最新成绩,在图像识别(ResNet50-on-ImageNet,93%以上精度)的总训练时间上,华为云ModelArts排名第一,仅需10分28秒,比第二名提升近44%。成绩证明,华为云ModelArts实现了更低成本、更快速度、更极致的体验。斯坦福大学DWANBench是用来衡量端到端的深度学习模型训练和推理性能的国际权威基准测试平台,相应的排行榜反映了当前全球业界深度学习平台技术的领先性。计算时间和成本是构建深度模型的关键资源,DAWNBench提供了一套通用的深度学习评价指标,用于评估不同优化策略、模型架构、软件框架、云和硬件上的训练时间、训练成本、推理延迟以及推理成本。 斯坦福大学DAWNBenchmark最新成绩作为人工智能最重要的基础技术之一,近年来深度学习也逐步延伸到更多的应用场景。随着深度学习模型越来越大,所需数据量越来越多,深度学习的训练和推理性能将是重中之重。华为云ModelArts将结合华为在AI芯片、硬件、云设施、软件和算法的全栈优势,打造更快的普惠的AI开发平台。斯坦福大学DAWNBenchmark网页链接:https://dawn.cs.stanford.edu/benchmark/ ✎下文将深入分析,华为云ModelArts如何做到性能极致——128块GPU,ImageNet训练时间10分钟。 深度学习已广泛应用模型增大、数据增长,深度学习训练加速的需求日益剧增近年来,深度学习已经广泛应用于计算机视觉、语音识别、自然语言处理、视频分析等领域,可服务于视频监控、自动驾驶、搜索推荐、对话机器人等场景,具有广阔的商业价值。为了达到更高的精度,通常深度学习所需数据量和模型都很大,训练非常耗时。例如:在计算机视觉中,如果我们在ImageNet[1]数据集上用1块P100 GPU训练一个ResNet-50模型, 则需要耗时将近1周。这严重阻碍了深度学习应用的开发进度。因此,深度学习训练加速一直是学术界和工业界所关注的重要问题,也是深度学习应主要用的痛点。Jeremy Howard等几位教授领衔的fast.ai当前专注于深度学习加速,在ImageNet数据集上用128块V100 GPU训练 ResNet-50模型的最短时间为18分钟。然而,最近BigGAN、NASNet、BERT等模型的出现,预示着训练更好精度的模型需要更强大的计算资源。可以预见,在未来随着模型的增大、数据量的增加,深度学习训练加速将变得会更加重要。只有拥有端到端全栈的优化能力,才能使得深度学习的训练性能做到极致。 [1] 文中所指的ImageNet数据集包含1000类个类别,共128万张图片,是最常用、最经典的图像分类数据集,是原始的ImageNet数据的一个子集。 华为云ModelArts创造新记录“极致”的训练速度华为云ModelArts是一站式的AI开发平台,已经服务于华为公司内部各大产品线的AI模型开发,几年下来已经积累了跨场景、软硬协同、端云一体等多方位的优化经验。ModelArts提供了自动学习、数据管理、开发管理、训练管理、模型管理、推理服务管理、市场等多个模块化的服务,使得不同层级的用户都能够很快地开发出自己的AI模型。图1.华为云ModelArts功能视图 在模型训练部分,ModelArts通过硬件、软件和算法协同优化来实现训练加速。尤其在深度学习模型训练方面,华为将分布式加速层抽象出来,形成一套通用框架——MoXing(“模型”的拼音,意味着一切优化都围绕模型展开)。采用与fast.ai一样的硬件、模型和训练数据,ModelArts可将训练时长可缩短到10分钟,创造了新的记录,为用户节省44%的时间。图2. 基于MoXing和ModelArts的训练速度提升 分布式加速框架MoXingMoXing是华为云ModelArts团队自研的分布式训练加速框架,它构建于开源的深度学习引擎TensorFlow、MXNet、PyTorch、Keras之上,使得这些计算引擎分布式性能更高,同时易用性更好。 高性能 MoXing内置了多种模型参数切分和聚合策略、分布式SGD优化算法、级联式混合并行技术、超参数自动调优算法,并且在分布式训练数据切分策略、数据读取和预处理、分布式通信等多个方面做了优化,结合华为云Atlas高性能服务器,实现了硬件、软件和算法协同优化的分布式深度学习加速。 图3.华为云MoXing架构图 易用:让开发者聚焦业务模型,无忧其他 在易用性方面,上层开发者仅需关注业务模型,无需关注下层分布式相关的API,仅需根据实际业务定义输入数据、模型以及相应的优化器即可,训练脚本与运行环境(单机或者分布式)无关,上层业务代码和分布式训练引擎可以做到完全解耦。从两大指标看MoXing分布式加速关键技术在衡量分布式深度学习的加速性能时,主要有如下2个重要指标:1吞吐量,即单位时间内处理的数据量;2收敛时间,即达到一定的收敛精度所需的时间。吞吐量一般取决于服务器硬件(如更多、更大FLOPS处理能力的AI加速芯片,更大的通信带宽等)、数据读取和缓存、数据预处理、模型计算(如卷积算法选择等)、通信拓扑等方面的优化,除了低bit计算和梯度(或参数)压缩等,大部分技术在提升吞吐量的同时,不会造成对模型精度的影响。为了达到最短的收敛时间,需要在优化吞吐量的同时,在调参方面也做调优。如果调参调的不好,那么吞吐量有时也很难优化上去,例如batch size这个超参不足够大时,模型训练的并行度就会较差,吞吐量难以通过增加计算节点个数而提升。对用户而言,最终关心的指标是收敛时间,因此MoXing和ModelArts实现了全栈优化,极大缩短了训练收敛时间。•在数据读取和预处理方面,MoXing通过利用多级并发输入流水线使得数据IO不会成为瓶颈;  • 在模型计算方面,MoXing对上层模型提供半精度和单精度组成的混合精度计算,通过自适应的尺度缩放减小由于精度计算带来的损失;• 在超参调优方面,采用动态超参策略(如momentum、batch size等)使得模型收敛所需epoch个数降到最低;•在底层优化方面,MoXing与底层华为自研服务器和通信计算库相结合,使得分布式加速进一步提升。测试结果对比,用数据说话一般在ImageNet数据集上训练ResNet-50模型,当Top-5精度≥93%或者Top-1 精度≥75%时即可认为模型收敛。我们测试的模型训练收敛曲线如下图所示。此处Top-1和Top-5精度为训练集上的精度,为了达到极致的训练速度,训练过程中采用了额外进程对模型进行验证,最终验证精度如表1所示(包含与fast.ai的对比)。图4(a)所对应的模型在验证集上Top-1 精度≥75%,训练耗时为10分06秒;图4(b)所对应的模型在验证集上Top-5 精度≥93%,训练耗时为10分58秒。图4. ResNet50 on ImageNet训练收敛曲线(曲线上的精度为训练集上的精度) MoXing与fast.ai的训练结果对比未来展望——更快的普惠AI开发平台华为云ModelArts致力于为用户提供更快的普惠AI开发体验,尤其在模型训练这方面,内置的MoXing框架使得深度学习模型训练速度有了很大的提升。正如前所述,深度学习加速属于一个从底层硬件到上层计算引擎、再到更上层的分布式训练框架及其优化算法多方面协同优化的结果,具备全栈优化能力才能将用户训练成本降到最低。后续,华为云ModelArts将进一步整合软硬一体化的优势,提供从芯片(Ascend)、服务器(Atlas Server)、计算通信库(CANN)到深度学习引擎(MindSpore)和分布式优化框架(MoXing)全栈优化的深度学习训练平台。并且,ModelArts会逐步集成更多的数据标注工具,扩大应用范围,将继续服务于智慧城市、智能制造、自动驾驶及其它新兴业务场景,在公有云上为用户提供更普惠的AI服务。目前华为云ModelArts已经在公测中扫描二维码立即体验~
  • [其他] 转载 --- @对AI开发感兴趣的你,现场挑战从零打造AI应用模型
    近日,斯坦福大学发布 DAWNBenchmark 最新成绩,在图像识别(ResNet50-on-ImageNet,93% 以上精度)的总训练时间上,华为云 ModelArts 排名第一,仅需 10 分 28 秒,比第二名提升近 40%。在这个汇聚谷歌、亚马逊 AWS、fast.ai 等高水平队伍的国际权威深度学习模型基准平台上,华为云 ModelArts 第一次参加国际排名,便实现了低成本、快速又极致的 AI 开发体验,其海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成以及端 - 边 - 云模型按需部署能力,更是体现了当前中国业界深度学习平台技术的领先性。那么为什么 ModelArts 能在图像识别的训练时间上取得如此优异的成绩?开发者该如何借助 ModelArts 将 AI 快速落地到应用场景中?你又是否想成为首批掌握“世界第一”深度学习平台技能开发的人?机会来了!12 月 20 日,一批技术大牛和专家将在北京发起一场「基于 ModelArts 平台的 AI 开发实战」现场挑战 Workshop!力求在尽量短的时间内让开发者快速上手ModelArts 平台开发必备技能,学习从 0 到 1 打造一款 AI 应用模型,为繁荣 AI 开发者生态尽一份力量。只要你对 AI 开发、ModelArts 平台感兴趣,或想在指定时间内测验并展现自己在 AI 开发方面的水平,那就不要错过这场想想都无比刺激的比拼。现场还有数位国内顶尖级技术专家亲临现场答疑、指导!不说十年难遇,至少莫失良机。(或点击阅读原文即可免费报名)时间:12 月 20 日(周四) 14:00-18:00地点:北京·国际会议中心费用:全!程!免!费!1不仅面向 AI 攻城狮,零编程基础的应用开发者也可以来!本次 Workshop 将齐聚对 AI 技术、ModelArts 开发平台感兴趣的工程师们,提供所有人开放的交流平台,让大家共同在实操中更快成长,在动手中切磋如何更好地在具体业务中落地 AI 技术。Tips1:参会者可独立(或组队)完成基于 ModelArts 平台的 AI 开发实践,通过动手体验及问题交流,快速上手 ModelArts 平台 AI 开发必备技能。Tips2: 如果你想说,自己并没有深入了解过 ModelArts 开发平台,且编程基础不够好,但就是对 AI 兴趣参加,该怎么办?没关系!我们也送上免费锦囊——60 分钟 Demo 课程。Demo: 针对日常办公用品的图像分类场景,演示如何用 ModelArts 自动学习,从数据上传到数据标注,启动训练,发布模型冰验证测试,演示自定义图像分类模型的操作(数据上传、数据标注、查看模型、迭代模型、发布服务、测试验证等)。2想挑战吗?Workshop 实战命题提前知本次动手实操环节共设两项实践命题,最快的时间完成准确率达到要求的模型,并且发布成模型服务预测截图给出预测结果,技术专家将在最后的评选环节根据实践效果的高底进行依次排序。场景 1: 要开一家网红面包店,主打 AI 自动收款:客户自助选择面包放在托盘上,托盘放到指定柜台位置,摄像头拍照,照片发送到 AI 系统识别出面包类型与数量,发给店内的软件,软件自动生成订单,生成二维码显示在柜台上的屏幕上供客户扫码付款(或自动启动 POS 机扫描客户手机屏幕显示的付款码)。我们需要收集各种面包的照片,使用 ModelArts 自动学习快速训练一个检测面包类型,并部署为服务,再和店内系统(HiLens、自动收款)集成为端云协同的解决方案。本次只实践云上训练和测试的内容,店内系统不在本次实践范围。场景2:在华为云 ModelArts 平台如何使用预置算法 Faster_RCNN_ResNet_v1_50 对预置的云宝数据集进行训练,快速构建云宝图像识别应用。更改数据集即可推广到其它场景。这个场景中,会使用到市场、数据集、训练作业、部署服务等多个功能。操作步骤分为 3 部分,分别是:1) 准备数据:在 ModelArts 市场预置数据集中找到预置算法对应的云宝数据,并根据该原始数据集保存为自己私有的云宝数据集。2) 训练模型:使用创建的云宝数据集,对预置的 Faster_RCNN_ResNet_v1_50 模型重训练,得到新模型。3) 部署模型:管理训练作业创建的模型并进行发布,部署为在线预测服务,并对该模型服务进行测试。如何打分:从有用、独到、易用、性价比高等方面,有专家团体共同打分3想见AI大神吗?专家团队集体上阵指导本次开发现场将提供网络环境,参会者只需携带可连接互联网的 PC 设备,提前申请华为云账号并且实名认证通过,并申请华为云 ModelArts 公测并通过(账户需要充值 5 元哦)。此外,参与现场指导的国内顶尖级技术大牛将组成专家团,实时解答各位在实操过程中遇到的疑难问题,并加入到会后与大家进行的 90 分钟的深度交流中。4想参加吗?如何报名 Workshop时间参与嘉宾13:00-14:00签到、动手环境准备14:00-15:00Demo 演示AI 开发专家15:00-16:30参会者动手实践,专家巡场并解答问题讲师和 AI 开发专家16:30-18:00自由交流本次 Workshop 采取限额审核制,报名需审核通过后参加,活动现场不接受空降。在阅读原文参与免费报名后,如通过相应审核,InfoQ 工作人员将于赛前进行一对一通知。也可添加微信小助手小 Q 君(ID:geekbang111)进行咨询或报名,添加时请备注:ModelArts Workshop 实战营;现场限额 200 人,名额先报先得哟~
  • [其他] 【12.20】AICon ModelArts WorkShop现场实践用户活动贴。
    华为云 Workshop 现场Demo操作文档V0.1.pdf( 预览 )12.20AiCon_ModelArts_Data.rar本次动手实操环节共设两项实践命题,最快的时间完成准确率达到要求的模型,并且发布成模型服务预测截图给出预测结果,技术专家将在最后的评选环节根据实践效果的高底进行依次排序。场景 1: 要开一家网红面包店,主打 AI 自动收款:客户自助选择面包放在托盘上,托盘放到指定柜台位置,摄像头拍照,照片发送到 AI 系统识别出面包类型与数量,发给店内的软件,软件自动生成订单,生成二维码显示在柜台上的屏幕上供客户扫码付款(或自动启动 POS 机扫描客户手机屏幕显示的付款码)。我们需要收集各种面包的照片,使用 ModelArts 自动学习快速训练一个检测面包类型,并部署为服务,再和店内系统(HiLens、自动收款)集成为端云协同的解决方案。本次只实践云上训练和测试的内容,店内系统不在本次实践范围。场景2:在华为云 ModelArts 平台如何使用预置算法 Faster_RCNN_ResNet_v1_50 对预置的云宝数据集进行训练,快速构建云宝图像识别应用。更改数据集即可推广到其它场景。这个场景中,会使用到市场、数据集、训练作业、部署服务等多个功能。操作步骤分为 3 部分,分别是:1) 准备数据:在 ModelArts 市场预置数据集中找到预置算法对应的云宝数据,并根据该原始数据集保存为自己私有的云宝数据集。2) 训练模型:使用创建的云宝数据集,对预置的 Faster_RCNN_ResNet_v1_50 模型重训练,得到新模型。3) 部署模型:管理训练作业创建的模型并进行发布,部署为在线预测服务,并对该模型服务进行测试。更多内容请下载附件data.zip
  • [问题求助] 请问华为:可否解释一下原理,ModelArts是基于什么开源AutoML库来构建的?
    请问华为:可否解释一下原理,ModelArts是基于什么开源AutoML库来构建的?华为本身又作了哪些上云的应用适配设计?
  • [教程] @你不容错过的ModelArts主打视频
  • [技术干货] 华为云EI ModelArts实战全记录
    现如今 AI 技术、概念火爆、落地应用更是繁多,但开发呢?是否困难?到底有多痛?             据了解,大部分 AI 开发者的工作时间并不长,并且十有八九可能不是“科班出身”。从编写的教材、录制的课程中就可以看出,所有的教学都不可避免地带有很强的的学术性,即便有意避免研究导向,仍然离产业界的需求相去甚远。并且随着新一波人工智能的热潮,人们发现手里的数据多了,电脑运算的更快了,但实际上,这些 AI 开发者使用的工具并不顺手。为帮助开发者更深入地了解 AI 开发,快速上手 AI 开发必备技能,12 月 20 日的AIcon活动上,华为云举办了一场以「基于 ModelArts 平台的 AI 开发实战」为主题的现场挑战 Workshop!现场由来自华为云EI深度学习服务团队负责人为开发者讲解了 ModelArts 的 相关技术与应用,帮助开发者学习如何从 0 到 1 打造一款 AI 应用模型。ModelArts——更快的普惠 AI 开发平台ModelArts 是面向 AI 开发者的一站式开发平台,提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成,以及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期 AI 工作流。同时,ModelArts 能够在 AI 开发全生命周期中,从原始数据、标注数据、训练作业、算法、模型、推理服务等,提供全流程可视化管理。支持千万级模型、数据集以及服务等对象的管理,无需人工干预,自动生成溯源图,选择任一模型就可以找到对应的数据集、参数、模型部署在哪里。其中最实用的训练断点接续功能、训练结果比对功能,在华为内部开发者中也颇受欢迎。简单来说,ModelArts 的特点是“四快”:✎数据管理快——让数据准备效率百倍提升想象一下,如果你的老板给了你 10 万张无标签的图片,并要求你为这些数据打上标签。你该怎么办呢?许多公司都在数据的大海里遨游,不论是交易数据、物联网传感器产生的海量数据、安全日志,还是图像、语音数据等等,这些都是未标注的数据。正如华为云EI深度学习服务团队负责人所说,“当前做 AI 开发,最让开发者头疼的就是数据的采集和数据的处理。曾有开发者吐槽,光是数据准备就要占掉整体开发时间的 70%。”那么,为什么数据的处理这么难?效率为什么这么低呢?人工智能界有一个说法:“有多少人工就有多少智能。”因为目前实现人工智能的主要方法是机器学习(目前火热的深度学习也是机器学习的一部分),而机器学习中目前大部分应用都是有监督的学习,即需要大量的“标注样本”去训练人工智能算法模型。例如图像识别任务中,必须有大量已经标注好的图片,比如一张猫的图片,狗的图片等,你必须明确的告诉 AI 算法,这些图片里面是什么东西,它再从中去学习出相应的“知识”。所以,AI 并不像传统想象的那样,丢一堆数据给 AI 算法,AI 算法就能够从中学习到各种有用的知识。而是背后有大量的人工在标注数据。而 ModelArts 在数据管理方面,会将数据进行预处理,用 AI 的数据去标注数据,即自动化标注和半自动化标注。ModelArts 可对数据采样和筛选,预标注,缩减需要标记的数据量,降低工作量。目前, ModelArts 已经在自动驾驶领域有非常多的应用,包括人车模型、信号灯模型等等,这些模型在自动驾驶的场景里面,可以快速地提升数据处理的效率,实时地处理数据。在未来,ModelArts 也将面向通用计算机的其他领域。✎训练快——模型训练耗时减低一半在模型训练部分,ModelArts 通过硬件、软件和算法协同优化来实现训练加速。尤其在深度学习模型训练方面,华为 将分布式加速层抽象出来,形成一套通用框架——MoXing(“模型”的拼音,意味着一切优化都围绕模型展开)。采用与 fast.ai 一样的硬件、模型和训练数据,ModelArts 可将训练时长可缩短到 10 分钟,创造了新的纪录,为用户节省 44% 的时间。MoXing 是华为云 ModelArts 团队自研的分布式训练加速框架,它构建于开源的深度学习引擎 TensorFlow、MXNet、PyTorch、Keras 之上,使得这些计算引擎分布式性能更高,同时易用性更好。MoXing 内置了多种模型参数切分和聚合策略、分布式 SGD 优化算法、级联式混合并行技术、超参数自动调优算法,并且在分布式训练数据切分策略、数据读取和预处理、分布式通信等多个方面做了优化,结合华为云 Atlas 高性能服务器,实现了硬件、软件和算法协同优化的分布式深度学习加速。有了 MoXing 后,上层开发者可以聚焦业务模型,无需关注下层分布式相关的 API,只用根据实际业务定义输入数据、模型以及相应的优化器即可,训练脚本与运行环境(单机或者分布式)无关,上层业务代码和分布式训练引擎可以做到完全解耦。另外,衡量分布式深度学习框架加速性能时,主要看吞吐量和收敛时间。在与吞吐量和收敛时间相关的几个关键指标上,华为云 ModelArts 都做了精心处理:在数据读取和预处理方面,MoXing 通过利用多级并发输入流水线使得数据 IO 不会成为瓶颈;• 在模型计算方面,MoXing 对上层模型提供半精度和单精度组成的混合精度计算,通过自适应的尺度缩放减小由于精度计算带来的损失;• 在超参调优方面,采用动态超参策略(如 momentum、batch size 等)使得模型收敛所需 epoch 个数降到最低;• 在底层优化方面,MoXing 与底层华为自研服务器和通信计算库相结合,使得分布 式加速进一步提升。那么,在 MoXing 一系列的优化之后,实际效果如何?以国际权威成绩来参考:“在斯坦福大学发布 DAWNBenchmark 最新成绩中,在图像识别(ResNet50-on-ImageNet,93% 以上精度)的总训练时间上,华为云 ModelArts 排名第一,仅需 10 分 28 秒,比第二名提升近 40%。”在这个汇聚谷歌、亚马逊 AWS、fast.ai 等高水平队伍的国际权威深度学习模型基准平台上,华为云 ModelArts 第一次参加国际排名,便实现了低成本、快速又极致的 AI 开发体验,其海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成以及端 - 边 - 云模型按需部署能力,更是体现了当前中国业界深度学习平台技术的领先性。✎上线快——一键部署到云、端、边,支持各种上线场景现如今,纵观整个 AI 产业,不仅仅是云,还会有边和端都需要部署的场景。然而,在 AI 规模化落地的场景下,模型部署会非常复杂,需要写代码集成到应用系统,维护、更新。例如在智慧交通领域,更新后的模型,需要一次性同时部署到各种不同规格、不同厂商的摄像头上,这是一项非常耗时、费力的巨大工程。对于此类场景,ModelArts 可以一键推送模型到所有边缘、端的设备上,云上的部署还支持在线和批量推理,满足大并发和分布式等多种场景需求。开发者可以在 ModelArts 上获得一些高并发、自动弹性伸缩的特性。能够根据用户制定的策略,自动调整云服务器的计算资源,跟随用户的业务需求变化。在业务需求下降时自动减少云服务器,节约资源和成本;在业务需求高峰时自动增加云服务器,保证业务平稳健康运行。✎上手快——自动学习,零 AI 基础构建模型ModelArts 具备自动学习功能,支持模型的自动设计与自动调参等,能够帮助开发者提升开发效率、快速上手。为什么需要自动学习?AI 开发有两大类,第一类为 AI 认知服务,比如图像识别和 OCR 等,这一类门槛很低,但灵活性差,只支持特定类型。当不满足需求时,只能定制一个模型,周期非常长费用也比较高。第二类就是找 AI 的算法工程师、算法专家,去做自己的模型;还有一类就是那些直接用 AI 的框架自己写代码以及自己训练数据,这一类的门槛较高,灵活度也很高。而自动学习就是希望能够打破这两者,既有一定的定制化的能力,又能够降低 AI 定制化模型的门槛,不需要写代码,用户可以定制化自己的模型的特点。首先,在自动深度学习里面,关键的技术是能够做到多维度下的模型的架构自动设计,包含模型的元学习,涉及一些训练指标,还有推动网络涉及的推理速度和监控等。另外还包括一些元学习的训练参数的自动配置、模型训练的参数配置及搜索等。另外,由于深度学习向计算机视觉输入原始数据,整个特征工程是在神经网络里面做的,而机器学习需要很多算法工程师去识别哪些特征是对业务是起正向作用的,所以自动机器学习的关键技术,就是高效自动特征工程和自动调参。除此之外,据华为云EI深度学习服务团队负责人介绍,华为云 ModelArts 还有一个特色,就是面向应用开发者。对于有经验的开发者,可以在 ModelArts 上自行编写并导入算法代码,核心组件 MoXing SDK 支持丰富的模型库、优化算法和各类工具库;支持自动超参数调优;包含训练 - 验证 - 预测 - 模型导出的整套框架;开发者只需要编写一套代码就能自动实现单机及分布式化。对于编程苦手却想快速生成模型的 AI 初学者,ModelArts 也预置了能够覆盖大部分常用应用场景的算法模型(如 RestNet_50、Faster_RCNN、SegNet_VGG_16 等,未来还将上线更多算法模型),所有预置模型的基于开源数据集训练,模型精度领先。只需配置数据路径 / 日志输出路径和 Hyper Parameter 自动选择设置就可以一键启动训练。 ModelArts应用实例:金融票据 OCR 识别金融票据,包括银行承兑票据和商业承兑票据,目前银行承兑票据占了 90% 以上的票据市场份额,金融票据 OCR 识别工作重点在于银行票据的识别。对于业界普通 OCR 软件,在金融票据领域识别准确率不高,对于现有一些针对金融票据做过优化的 OCR,识别准确率也算达到 90%。由于金融票据金额不低,对于 OCR 识别要求很高,而金融票据难点在于票据格式多样且差别细微等。另外,票据模型开发训练难点包括数据标注、模型训练、调参和部署上都有较多难点,对于 AI 开发水平要求很高,需要非常资深的 AI 专家进行繁琐和长时间对于票据 AI 进行不断训练。通过 ModelArts 助力金融票据 OCR 识别的实战。多位 ATN 社区使用者使用后认为:ModelArts 适合 AI 的初学者,通过数据集的分类,可自动学习,无需调参等操作;适用于迁移学习;线上部署便利,逐步集成更多的数据标注工具,扩大应用范围。后续,华为云 ModelArts 将进一步整合软硬一体化的优势,提供从芯片(Ascend)、服务器(Atlas Server)、计算通信库(CANN)到深度学习引擎(MindSpore)和分布式优化框架(MoXing)全栈优化的深度学习训练平台。华为云 ModelArts 会逐步集成更多的数据标注工具,扩大应用范围,将继续服务于智慧城市、智能制造、自动驾驶及其它新兴业务场景,在公有云上为用户提供更普惠的 AI 服务。
  • [技术干货] 华为云ModelArts做到性能极致!128块GPU,ImageNet训练时间10分钟
    ModelArts实现了更少资源、更低成本、更快速度、更极致的体验。128块GPU,ImageNet训练时间从18分钟降至10分钟!ModelArts已开放免费体验,欢迎试用!深度学习已广泛应用模型增大、数据增长深度学习训练加速的需求日益剧增近年来,深度学习已经广泛应用于计算机视觉、语音识别、自然语言处理、视频分析等领域,可服务于视频监控、自动驾驶、搜索推荐、对话机器人等场景,具有广阔的商业价值。作为人工智能最重要的基础技术之一,深度学习也逐步延伸到更多的应用场景,如智能制造、智慧交通等。但是,为了达到更高的精度,通常深度学习所需数据量和模型都很大,训练非常耗时。例如,在计算机视觉中,如果我们在ImageNet[1]数据集上用1块V100 GPU训练一个ResNet-50模型, 则需要耗时将近1周。这严重阻碍了深度学习应用的开发进度。因此,深度学习训练加速一直是学术界和工业界所关注的重要问题,也是深度学习应主要用的痛点。Jeremy Howard等几位教授领衔的fast.ai当前专注于深度学习加速,在ImageNet数据集上用128块V100 GPU训练 ResNet-50模型的最短时间为18分钟。然而,最近BigGAN、NASNet、BERT等模型的出现,预示着训练更好精度的模型需要更强大的计算资源。可以预见,在未来随着模型的增大、数据量的增加,深度学习训练加速将变得会更加重要。只有拥有端到端全栈的优化能力,才能使得深度学习的训练性能做到极致。[1] 文中所指的ImageNet数据集包含1000类个类别,共128万张图片,是最常用、最经典的图像分类数据集,是原始的ImageNet数据的一个子集。华为云ModelArts——创造新记录,“极致”的训练速度华为云ModelArts是一站式的AI开发平台,已经服务于华为公司内部各大产品线的AI模型开发,几年下来已经积累了跨场景、软硬协同、端云一体等多方位的优化经验。ModelArts提供了自动学习、数据管理、开发管理、训练管理、模型管理、推理服务管理、市场等多个模块化的服务,使得不同层级的用户都能够很快地开发出自己的AI模型。华为云ModelArts功能视图在模型训练部分,ModelArts通过硬件、软件和算法协同优化来实现训练加速。尤其在深度学习模型训练方面,我们将分布式加速层抽象出来,形成一套通用框架——MoXing(“模型”的拼音,意味着一切优化都围绕模型展开)。采用与fast.ai一样的硬件、模型和训练数据,ModelArts可将训练时长可缩短到10分钟,创造了新的记录,为用户节省44%的成本。基于MoXing和ModelArts的训练速度提升分布式加速框架MoXingMoXing是华为云ModelArts团队自研的分布式训练加速框架,它构建于开源的深度学习引擎TensorFlow、MXNet、PyTorch、Keras之上,使得这些计算引擎分布式性能更高,同时易用性更好。高性能MoXing内置了多种模型参数切分和聚合策略、分布式SGD优化算法、级联式混合并行技术、超参数自动调优算法,并且在分布式训练数据切分策略、数据读取和预处理、分布式通信等多个方面做了优化,结合华为云Atlas高性能服务器,实现了硬件、软件和算法协同优化的分布式深度学习加速。华为云MoXing架构图易用:让开发者聚焦业务模型,无忧其他在易用性方面,上层开发者仅需关注业务模型,无需关注下层分布式相关的API,仅需根据实际业务定义输入数据、模型以及相应的优化器即可,训练脚本与运行环境(单机或者分布式)无关,上层业务代码和分布式训练引擎可以做到完全解耦。从两大指标看 MoXing分布式加速关键技术在衡量分布式深度学习的加速性能时,主要有如下2个重要指标:吞吐量,即单位时间内处理的数据量;收敛时间,即达到一定的收敛精度所需的时间。吞吐量一般取决于服务器硬件(如更多、更大FLOPS处理能力的AI加速芯片,更大的通信带宽等)、数据读取和缓存、数据预处理、模型计算(如卷积算法选择等)、通信拓扑等方面的优化,除了低bit计算和梯度(或参数)压缩等,大部分技术在提升吞吐量的同时,不会造成对模型精度的影响。为了达到最短的收敛时间,需要在优化吞吐量的同时,在调参方面也做调优。如果调参调的不好,那么吞吐量有时也很难优化上去,例如batch size这个超参不足够大时,模型训练的并行度就会较差,吞吐量难以通过增加计算节点个数而提升。对用户而言,最终关心的指标是收敛时间,因此MoXing和ModelArts实现了全栈优化,极大缩短了训练收敛时间。在数据读取和预处理方面,MoXing通过利用多级并发输入流水线使得数据IO不会成为瓶颈;在模型计算方面,MoXing对上层模型提供半精度和单精度组成的混合精度计算,通过自适应的尺度缩放减小由于精度计算带来的损失;在超参调优方面,采用动态超参策略(如momentum、batch size等)使得模型收敛所需epoch个数降到最低;在底层优化方面,MoXing与底层华为自研服务器和通信计算库相结合,使得分布式加速进一步提升。测试结果对比,用数据说话一般在ImageNet数据集上训练ResNet-50模型,当Top-5精度≥93%或者Top-1 精度≥75%时即可认为模型收敛。我们测试的模型训练收敛曲线如下图所示。此处Top-1和Top-5精度为训练集上的精度,为了达到极致的训练速度,训练过程中采用了额外进程对模型进行验证,最终验证精度如下表所示(包含与fast.ai的对比)。图(a)所对应的模型在验证集上Top-1 精度≥75%,训练耗时为10分06秒;图(b)所对应的模型在验证集上Top-5 精度≥93%,训练耗时为10分58秒。未来展望--更快的、更普惠的AI开发平台华为云ModelArts致力于为用户提供更快的普惠AI开发体验,尤其在模型训练这方面,内置的MoXing框架使得深度学习模型训练速度有了很大的提升。正如前所述,深度学习加速属于一个从底层硬件到上层计算引擎、再到更上层的分布式训练框架及其优化算法多方面协同优化的结果,具备全栈优化能力才能将用户训练成本降到最低。后续,华为云ModelArts将进一步整合软硬一体化的优势,提供从芯片(Ascend)、服务器(Atlas Server)、计算通信库(CANN)到深度学习引擎(MindSpore)和分布式优化框架(MoXing)全栈优化的深度学习训练平台。并且,ModelArts会逐步集成更多的数据标注工具,扩大应用范围,将继续服务于智慧城市、智能制造、自动驾驶及其它新兴业务场景,在公有云上为用户提供更普惠的AI服务。目前华为云ModelArts已经在火爆公测中,欢迎大家试用
  • [问题求助] ModelArts.0207 : 该用户不能访问OBS服务,或用户上传的AK/SK不可用。
    换了好几个秘钥都是这样
  • [问题求助] ModelArts如何提供海量数据的预处理功能?
    ModelArts如何提供海量数据的预处理功能?
  • [教程] ModelArts视频合集,介绍视频、操作视频应有尽有!
     直接点击图片,即可进入视频播放页面。 更多视频链接:https://support.huaweicloud.com/modelarts_video/index.html
  • [公告] 华为云ModelArts服务于2019年01月30日00:00(北京时间)转商通知
    尊敬的华为云客户:华为云计划于2019/01/30 00:00(北京时间)将ModelArts正式转商用。服务正式商用后,服务将于2019/01/30 00:00(北京时间)正式开始收费,支持按需计费和包周期计费,具体价格请参考该服务的计费详情页。华为云在此提醒您,如果您不再需要使用该服务,请勿调用服务,以免产生费用。更多关于ModelArts的产品介绍,请您点击了解。如您在使用过程中有宝贵意见,欢迎您拨打华为云服务热线:4000-955-988与我们联系。感谢您对华为云的支持!
  • [技术干货] ModelArts运行TensorFlow开源代码mnist
    本文以手写体数字识别为例,介绍如何在ModelArts平台训练原生的TensorFlow的代码。TensorFlow官方提供的训练手写体数字识别模型的代码,源码位置:https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/tutorials/mnist/mnist_with_summaries.py基本流程包含以下步骤:1.    准备数据:通过ModelArts市场预置数据集创建自动学习所需数据集版本。2.    代码调试:通过ModelArts开发环境调试代码,成功后创建训练作业。3.    训练模型:创建训练作业进行模型训练。准备数据通过ModelArts市场预置数据集创建自动学习所需数据集版本,具体操作如下:步骤 1     登录“ModelArts”管理控制台,在“全局配置”界面添加访问秘钥。步骤 2     返回“ModelArts”管理控制台,单击左侧导航栏的“市场”。 切换到ModelArts市场的“数据集”页面,找到数据集“Mnist-Data-Set”。步骤 3     进入到该预置数据集“Mnist-Data-Set”的详情页面,执行“导入到我的数据集”操作,输入“桶名”,本例中为“mnist-example”,点击确定,完成创建,页面会跳转到“数据管理>数据集”页面进行创建。步骤 4     在“ModelArts”管理控制台的“数据管理>数据集”页面查看直到mnist数据集(Mnist-Data-Set)创建完成,数据详细信息完全加载。步骤 5     在数据集目录页面获取创建的mnist数据集的桶信息mnist-example/mnist/。请参考下图。代码调试在Modelarts开发环境界面对代码进行调试,以防代码无法直接运行需要多次创建训练作业。操作步骤如下:步骤 1     下载模型训练脚本文件mnist_with_summaries.py。将脚本文件上传至华为云OBS桶 (假设OBS桶路径为:/mnist-example/codes/)。步骤 2    在“开发环境”界面,单击左上角的“创建”, “名称”和“描述”可以随意填写,本例中名称为“mnist”;“镜像类型”选择TF-1.8.0-python27或TF-1.8.0-python36,“存储位置”选择/mnist-example/codes/,任务提交成功后返回Notebook列表。步骤 3    状态显示为“运行中”时表示创建成功,点击名称“mnist”进入Notebook界面,点击右上角的“new”->“Python2”, 并打开mnist_with_summaries.py文件将代码复制到cell框中。步骤 4    数据存储在obs中,需要在原生tensorflow代码中配置ak,sk,才可以访问。在代码中添加:步骤 5   创建训练作业时,训练作业界面的训练数据集路径是以train_url参数传入,训练输出路径以train_url传入,脚本的参数改动部分如下 :   代码修改完成后点击上方的“run”按钮,程序即可运行。SimpleClient.rar训练模型操作步骤如下:训练作业中,原生tensorflow代码中无需配置ak,sk,可去除配置ak,sk代码(保留亦无影响)。步骤 1    在“训练作业”界面,单击左上角的“创建”, “名称”和“描述”可以随意填写;“数据来源”请选择“数据集”Mnist-Data-Set{或者“数据的存储位置”(本例中为mnist-example/mnist)};“算法来源”请选择“常用框架”,“AI引擎”选择“TensorFlow";“代码目录”请选择型训练脚本文件mnist_with_summaries.py所在的OBS父目录(/mnist-example/codes/);“启动文件”请选择“train_mnist.py”;“训练输出位置”请选择一个路径(例如/mnist-example/log/)用于保存输出模型和预测文件,参考下图填写训练作业参数。步骤 2    参数确认无误后,单击“立即创建”,完成训练作业创建。步骤 3    在模型训练的过程中或者完成后,通过创建TensorBoard作业查看一些参数的统计信息,如loss, accuracy等。在“训练作业”界面,点击TensorBoard,再点击“创建”按钮,参数“名称”可随意填写,“日志路径”请选择步骤3中“训练输出位置”参数中的路径(/mnist-example/log/),或者直接进入训练作业界面点击作业名称,点击右上角的“创建TensorBoard”。训练作业完成后,即完成了模型训练过程。如有问题,可点击作业名称,进入作业详情界面查看训练作业日志信息。
总条数:1364 到第
上滑加载中