• [其他] ModelArts企业级人工智能平台
    ModelArts企业级人工智能平台特点高效的行业算法:领先人工智能技术结合行业专家经验,构建出优质高效的行业预置算法,行业AI应用开发者仅需少量标注数据,就能获得高精度的AI应用;领先的AI开发平台:底层依托一站式AI开发管理平台ModelArts提供的领先算法技术,保证AI应用开发的高效和推理结果的准确,同时减少人力投入。简单的流程式开发:用户可借助预置的行业工作流,轻松完成AI应用项目开发以及持续迭代;灵活的工作流编排:针对特定的行业、场景,开发者可根据自身需求对行业工作流进行灵活编排,实现AI应用开发;丰富的开放生态:基于华为云开放生态,用户可以在AI市场中分享及获取、购买所需行业AI工作流,高速高效实现AI行业落地。面向物流、石油、零售、金融、医疗、交通等行业场景,华为云基于领先算法及行业知识,首批推出了ModelArts Pro文字识别、视觉、自然语言处理、知识图谱等开发套件及端云协同多模态AI应用开发套件HiLens,快速响应不同行业、不同场景的定制需求,让AI变得触手可及。
  • [近期热门] 万物莫不相异?万物皆可相通
    凡物莫不相异”,是十七世纪哲学家莱布尼茨提出的著名论断。这句至理名言,却为难了今天的物联网从业者们。在物联网领域内,设备的差异表现为协议不同和数据模型不同。不同的设备,因其行业作用、实时性、可靠性等要求不同,会采用不同的通讯协议,设备生产厂家还会按需求定义出不同的私有协议。同时,即使是同一类设备,厂家在做设备联接时,会按照不同的格式来定义设备数据,造成同一类设备被系统读取的模式也不一样。这些差异点,往往会导致物联网项目交付周期长达半年乃至一年之久。这时候,一个既能覆盖多种设备协议,又能给出标准化模型定义的物联网平台就变得至关重要。协议广覆盖 – 夯实万物互联的基础对繁杂协议的匹配,则是实现万物互联的基础。举个“栗子”,智慧城市作为物联网的典型代表,覆盖水务、消防等不同场景,涉及设备成千上万。将这些性格迥异的设备纳入一个平台,打破他们之间的通讯壁垒,是项目商们头疼不已的问题。华为云IoT支持丰富的物联网协议,能覆盖30+行业及子场景中的不同设备,并与业内主流芯片模组商合作,在设备侧进行SDK预集成,实现设备上电即上云,让设备侧的开发周期缩短到分钟级,为万物的极简互联打造了夯实的基础。物模型标准化 – 统一万物互联的语言万物的互联,本质是数据的交流,而数据交流的基础就是物模型。比如智慧城市中,有安防摄像头、交通违章摄像头等不同功能的摄像头。当每个摄像头被定义的数据模型不一样时,则需要给每个摄像头配备其对应的子系统用于监控,造成设备和系统的“孤岛”,还增加了项目成本。这时候,就需要一款通用的“语言”、也就是物模型,来解决设备之间、设备与系统之间的数据交流问题。从去年起,华为云IoT加入信通院主导的物模型特设组,携手制定标准,发布标准物模型400多个,覆盖园区、工业等主流行业。基于标准物模型,统一万物交流的语言,将物联网项目集成周期从月级缩短到天级。一站式流量管理 – 联接的最后一公里设备联接后开始传递数据,而在智慧零售、智能穿戴、共享经济等领域中,自动售货机、智能手表、共享单车等设备会随着使用地点的变化改变位置。这类设备往往会采用物联网卡2/3/4G的通讯模式,对本地运营商信号强弱依赖很高。设备厂商需从多家运营商购买物联网卡来满足其通讯诉求,多个账号、多种流量套餐造成管理成本增加。华为云IoT提供的全球SIM联接服务,与国内外主流运营商联动,面向设备厂商提供一站式的流量管理能力,其eSIM的空中写卡能力,无需人工现场换卡,远程即可实现设备的按需自主选网,给万物互联提供强有力的联接保障。先哲说,万物莫不相异,而在今天,万物也可相通。华为云IoT将持续构筑海纳百川的联接能力,携手伙伴一起,加速行业智能升级。
  • [应用开发] 【MDC300】【AI推理程序】dto_perception无法输出推理结果
    【功能模块】【操作步骤&问题现象】1、按照官方给定得AI示例程序dto_perception完成1910s交叉编译,用的是hiai_demo生成的libssd.so2、输出以下object address0xaaaaf4202fd0model size hw(300, 300)image size hw(1080, 1920)model_file : ./model/demo_ssd.ommodel_name : demo_ssdmodel_type : 0model_manager.Init begin!model_manager.Init end!Camera 0 DataReceived!!!Camera 0 Image size is: ( 1920, 1080 )Camera 0 DataReceived!!!Camera 0 Image size is: ( 1920, 1080 )Camera 0 DataReceived!!!Camera 0 Image size is: ( 1920, 1080 )Camera 0 DataReceived!!!Camera 0 Image size is: ( 1920, 1080 )......3、然后就一直是Camera 0 DataReceived!!!  Camera 0 Image size is: ( 1920, 1080 )循环,无论怎么调整相机视角都输出为空
  • [互联网] 涨姿势,看车联网业务背后的承载网黑科技!
    Long long time ago,在20世界30年代,无人驾驶这个想法已经首次出现,但受当时所处的时代与科技所困,只能是愿望很美好,现实很残酷。80多年后的今天,借助于5G技术,我们对无人驾驶已经有了清晰规划。有了无人驾驶,你可以边开车边打电话,边开车边刷抖音,边开车边吃鸡... ...总之,解放你的双手。车联网、无人驾驶如此美好,引无数运营商竞折腰。全球运营商、汽车制造商相继发布相关业务愿景,并组织系列测试。在北京验证车联网此前,中国联通北京市分公司、中国铁塔北京市分公司、百度和华为公司携手合作,在稻香湖进行了5G自动驾驶业务验证。本次验证创新采用5G无线网络和IP RAN做端到端网络回传承载,实现自动驾驶远程援助等场景。众所周知,高大上的车联网业务对网络的要求也非常苛刻,包括无线网、IP RAN承载网、核心网在内的端到端网络必须具备大带宽、低时延的能力。尤其是连接无线和核心网的纽带— —IP RAN承载网,更应该未雨绸缪做好准备。那么承载网络有什么黑科技支撑车联网呢?首先是大带宽在车联网业务中,需要收集车辆、周边环境等多个信息并上传到中心处理,数据量非常庞大。因此,IP RAN承载网面临带宽挑战,尤其是海量接入层设备。4G时代IP RAN接入层以GE/10GE为主,面向5G,华为创新性地引入50GE作为下一代高性价比组网技术。50GE基于25GE器件,采用新一代PAM4编码技术提升2倍编码效率,实现带宽加量不加价,匹配车联网带来的大带宽需求。其次是低时延5G车联网的时延要求小于5ms,时延是4G网络的十分之一。承载网要保证低时延,首先要保证网络中的其他业务在突发时不影响车联网业务。因此,华为IP RAN创新采用FlexE实现网络切片,将车联网等低时延业务单独一个分片承载。FlexE采用类似SDH的时隙隔离技术,在一个物理管道上建立多个切片,实现不同切片间严格隔离,就像公交车专用车道一样零抢占,从而保证车联网业务的低时延。所以,简单来说,IP RAN针对5G车联网业务的两个关键技术就是:高性价比50GE接入环,端到端网络切片。老铁,你get了么?更多信息,请关注华为5G+X 联创营:https://developer.huaweicloud.com/techfield/5g.html5G云市场:https://marketplace.huaweicloud.com/markets/5GtoB/AI云市场:https://marketplace.huaweicloud.com/markets/ai/机器视觉云市场:https://marketplace.huaweicloud.com/markets/holosensstore/index.htmlIOT云市场:https://marketplace.huaweicloud.com/markets/iot/混合云云市场:https://marketplace.huaweicloud.com/markets/hcs/鲲鹏云市场:https://marketplace.huaweicloud.com/markets/kunpeng/
  • [互联网] Cloud X可能打开魔盒,成为5G时代杀手级应用!
    伴随移动产业的不断演进从2G、3G、到4G一个个杀手级应用(Killer Application)应运而生成为时代的宠儿比如短信业务之于2G微信、Facebook等之于3G抖音等视频类业务之于4G5G已来,下一个杀手级应用在哪里?运营商的新蓝海在哪里?华为Wireless X Labs认为,在5G初期Cloud X有望成为5G时代的杀手级应用。X可以是PC,可以是Gaming、AR/VR,或者更多。云电脑Cloud PC它是一种应用、一种消费升级,也是一种新商业模式。从应用角度讲,云电脑实现了带宽换计算、带宽换存储。家里久置不用的台式机、笔记本统统可以退休,手机实现投屏,随时随地实现PC功能。这和当今最火的分时租赁消费模式又如出一辙:需要时申请资源,退出时大部分资源释放留给他人。在网联过程中GUI完全通过互动视频流形式呈现,因此网络质量会成为业务使用的基础。要想不卡顿地完成基本的PPT写作,10Mbps的稳定带宽是必不可少的。如果是做视频、图形渲染,更需要百兆带宽推波助澜。或许很多人会有疑问,PC是过去式,5G的介入又会掀起多大涟漪呢?不妨把目光放长远些:从1958年第一个电子游戏到如今最新的XBOX和PlayStation游戏主机,他们谱写了无数玩家心中端游(主机游戏、PC游戏,非手游或页游)的编年史。而在60年后的5G来临前夕,端游的编年史可能会开启一个新篇章—云游戏(Cloud Gaming)。云游戏Cloud Gaming它比Cloud PC更高级,要在云端完成本地的、复杂的渲染计算,通过网络实时反馈游戏画面。玩家只需要一种输入输出设备(传统的鼠标键盘或是无线手柄),以及一块屏幕,就能享用。这既实现端游的跨平台适配问题,又降低游戏者的门槛,玩家只需体验游戏就好。端游的内容大多是画面精美、故事性完整、体验丰富的3A大作,玩家往往具备双倍于手游的付费意愿。2009~2010年间,从云游戏平台出现,经过一轮的炒作、淘沙,期间可能得益于云技术的成熟、成本降低以及网络能力的提升,现在可能跨越裂谷,冲击商业成功。以中国市场的云游戏平台格来云为例。为了满足实时性需求,720p 30fps的游戏需要10Mbps以上的带宽,20ms的时延。这还不仅仅是端游的降维体验,要真正发挥端游的魅力,2K~4K、60fps的图像必不可少。如此,100~200Mbps+20ms的SLA保障网络,是游戏愉悦以及持续付费的关键。成为杀手业务的关键—新商业模式以上Cloud PC、Cloud Gaming的基本模式都是通过网络连端和云,实现所谓的瘦客户端+宽管道+云应用的新业务。从体验需求到技术匹配,5G的低时延、大带宽的eMBB特性,可保障的网络,以及运营商贴近边缘的架构等都是实现Cloud+Something业务的基础,这也正好是我们试图进入的体验经营模式典型特征。我们把这类业务和商业模式统称为Cloud X,他可以是5G初期正在萌芽的Cloud PC和Cloud Gaming,也可以是我们一直在探索的Cloud AR和VR。运营商在Cloud X模式中,可以从参与到基本的连接体验,扩展到云的IaaS:甚至直接集成各类云端运行的应用— —犹如一个小程序的入口,Cloud X的logo下各种5G的新业务魔盒,从此打开。5G可能开启一个全新的云网协同时代,通过运营商的云端能力和体验保障的连接,产生新的价值。更多信息,请关注华为5G+X 联创营:https://developer.huaweicloud.com/techfield/5g.html5G云市场:https://marketplace.huaweicloud.com/markets/5GtoB/AI云市场:https://marketplace.huaweicloud.com/markets/ai/机器视觉云市场:https://marketplace.huaweicloud.com/markets/holosensstore/index.htmlIOT云市场:https://marketplace.huaweicloud.com/markets/iot/混合云云市场:https://marketplace.huaweicloud.com/markets/hcs/鲲鹏云市场:https://marketplace.huaweicloud.com/markets/kunpeng/
  • [其他] 深度解读华为云智能企业云应用平台
    企业应用上云的过程中,智能云基础设施极大提升了资源获取与运维的效率,但应用自身的开发、部署与运维仍然繁琐与低效。同时,人工智能,边缘计算,区块链等新技术正逐渐进入企业核心业务流程,企业应用需快速和新技术结合产生更大商业价值。针对这些需求,华为云推出智能企业云应用平台,其构建在智能云基础设施之上,提供一个应用底座和三个创新解决方案,为企业业务创新保驾护航。一个应用底座:全栈云原生应用开发与管理,敏捷高效,快速DevOps全栈云原生应用开发与管理包括容器、微服务框架、云中间件、压测、APM等系列产品,涵盖应用开发、编译、构建、部署、测试、发布、上线、运维等应用全生命周期管理,让客户更聚焦自己的业务逻辑,敏捷开发与运维。首先是容器,华为云推出GPU共享型高性能AI容器,通过深度优化K8S容器调度引擎,能够为容器中的AI计算任务分配更细粒度的GPU资源,实现多个AI计算任务共享GPU,在部分AI计算如推理类场景中能够实现更高的资源利用率,从而大幅降低AI计算成本,让大家用得起AI。AI容器承载于裸金属之上,加上100G网络能力,让GPU充分发挥大规模并行计算的优势,深度学习的训练比传统GPU加速性能提升3-5倍,让大家用得好AI。支持业界主流的GPU和深度学习框架,与华为自己的AI芯片和EI学习、推理平台结合有更大幅的性能提升和成本降低。对于微服务,企业客户更关注自身业务的安全隔离,为此华为推出专享版微服务引擎,为每个租户提供物理级隔离的服务注册、配置和治理,单租户管理规模10倍提升,让企业客户用得放心。云化分布式应用的运维是个难题,华为云已经发布的APM可以实时监控并管理企业应用性能和故障,帮助企业快速解决分布式架构下问题定位和性能瓶颈分析难题,改善用户体验。在此基础上,华为突破了从端(Mobile/Brows)到云应用(Server)的分布式调用链追踪技术,可以通过全链路跟踪快速还原问题现场,分钟级定位代码性能瓶颈,让客户用得省心。三个创新解决方案:智能边缘云,ROMA和区块链服务智能边缘云IEF,边云协同,云的能力向边延伸据IDC统计预测,到2020年将会有超过500亿的设备和终端联网,其中超过50%的数据需要在网络边缘侧分析、处理与存储。所以云数据中心的架构不再是全球若干个集中的数据中心,中心云+边缘云更加符合工业世界的需要。基于边缘云服务,可以通过中心云建模分析与边缘云实时决策的结合,实现高质量、高性能、实时的处理。华为智能边缘平台IEF将云的能力向边延伸,在边缘侧融合了计算、网络、存储、应用服务和AI能力,就近提供边缘智能服务。华为云与边缘服务基于同一平台、生态一致, 应用和服务构建一次,随处可运行。华为云IEF Service对边缘上的应用和服务进行统一的部署和管理,在边缘上提供从芯片、网络、边缘设备到服务全栈能力,同时,平台着力构建一个开放的生态,除了华为自身的边缘硬件如智能小站之外,还支持第三方边缘节点、设备和第三方服务的接入。企业业务集成平台ROMA,连接IT与OT,打通应用和数据孤岛企业的数字化要求企业实现广泛的开放和连接,这里连接包含多个层面:1.连接IT与OT,将IT数据和物理设备数据融合,消除数据鸿沟,打通数据价值边界2.连接应用和数据,打通数据孤岛,让信息自由流动3.连接云上云下,打通公有云和私有云甚至多云,打通企业能力边界4.连接生态伙伴,建立企业API经济和生态,依靠生态链联合创新和共享价值以华为自己的流程与IT系统为例,需要连接8个区域,170+个国家,1100+个应用,100+个生态伙伴,数十万设备。为提高连接和集成效率,华为打造了ROMA集成平台,用于自身的企业IT应用,现在以云服务的形式提供给我们的客户。ROMA支持海量数据接入,多协议、多厂商,支持千万级活跃设备,数据接入之后进行数据转换与调度,支持20+种数据源灵活转换,如各种关系型数据库,NoSQL数据库,存储,消息,API等,支持可视化路由及规则设计,简单易用。通过ROMA集成云上云下、多IT系统、外部客户与伙伴,在云端统一管理,极大提升集成效率。区块链服务BCS,链接价值,使能企业可信交易区块链技术对于企业建立对等的可信交易,同时保护自己的数据隐私,极具价值。华为是区块链技术的先行者之一,华为不仅大力投入开源社区推动区块链技术发展, 同时致力于可商用的区块链平台的建设,帮助企业客户在华为云上快速、高效的搭建企业级区块链行业应用。华为云区块链服务于10月10号正式商用,基于华为云全栈安全能力,通过分层加密、国密支持、同态加密和零知识证明等安全技术,全面保护区块链系统的账户、节点、账本和数据,确保用户和交易信息安全。华为云区块链可以同时在线上线下部署,也可以与第三方区块链互通,通过新推出的Fabric JDBC,可以让企业像使用数据库一样使用区块链,降低使用门槛。华为云区块链服务将致力于安全,交易性能,多链平台互通等方向上持续寻求突破,和合作伙伴与客户一起,通过区块链构建可信数字经济的基石。
  • [其他] 华为EI和HiAI概览
    企业智能(EI)• 企业有供应、制造、仓储、物流、推荐、风控等各子系统,场景非常复杂,华为的实践,就是把AI,与这些生产系统相结合,发生化学反应,让AI单点技术的进步,变成促进企业生产系统的进步,因为AI本身不是产品,需要与业务场景结合,才是有价值的。• 企业的生产+AI,我们叫EI(Enterprise Intelligence),EI就是企业的数据与算法、算力结合的实践。华为做为一个企业,不仅涵盖了 供应、制造、仓储、物流、报关等大多数制造业的典型过程,而且华为手机的电商平台,也覆盖了营销推荐、实时风控等子系统。• 在华为EI的实践过程中发现,有两个挑战,几乎每个场景都遇到:1)数据,通常不是非常小、也不是非常大,是选择传统的抽样模型,还是用深层网络模型,用哪一个投入产出最优? 实践后发现,有的生产系统,如供应链装箱,用统筹最优解算法最合适,而图片勘察、计算机视觉验收类,用深层网络模型最优。2)深层网络模型本身,模型调优很费力,具体又有两方面,第一是人的要求,要很有耐心、很细致、类似工匠精神的专家,第二是,要有随时可以获得的、强大的计算力,尤其在多任务并行时的稳定性、层数到一定深度后,还容易出现内存溢出等。• 在这张片子上的场景,都已经过华为自身实践、且有实际效果的服务,如智能装箱……• 现在这些服务,以华为云服务的方式开放出来,让更多的企业,可以站在华为实践过的肩膀上,使用AI,而不需要操心刚讲的两大问题,直接调用相应的服务API。华为云EI企业智能整体解决方案华为云EI服务华为EI服务• EI大数据提供:数据接入服务,云数据迁移,实时流计算服务,MapReduce服务,数据湖探索,表格存储服务等。• EI基础平台:ModelArts,深度学习服务,机器学习服务,慧眼HiLens,图引擎服务,视频接入服务。• 对话机器人:智能问答机器人,任务型对话机器人,智能质检,定制化对话机器人服务。• 自然语言处理:自然语言处理基础,内容审核-文本,语言理解,语言生成,定制自然语言处理,机器翻译服务。• 语音交互:语音识别,语音合成,实时语音转写。• 视频分析:视频内容分析,视频编辑,视频质量检测,视频标签,视频背景音乐识别。EI基础平台• ModelArts助力华为自动驾驶平台,高效管理AI数据处理流程,包括采集、筛选、混合标注和数据溯源,大大缩减了数据处理时间。利用分布式集群训练,提升了模型训练效率。40T原始数据处理从8000人天缩短到80人天,AI模型开发周期从数月缩短到数周。• 深度学习服务:DLS(Deep Learning Service)是基于华为云强大高性能计算提供的一站式深度学习平台服务,内置大量优化的神经网络算法模型,以兼容、便捷、高效的品质帮助用户轻松使用深度学习技术,通过灵活调度按需服务化方式提供模型训练、评估与预测。• 慧眼HiLens:HiLens端云协同AI平台为个人开发者、企业和设备生产厂商提供了一整套安全可靠的一站式人脸识别、视频分析、语音、文字识别等基础技能开发、部署和管理服务。• 图引擎服务:GES(Graph Engine Service)是针对以“关系”为基础的“图”结构数据,进行查询和分析的服务。广泛应用于社交关系分析、营销推荐、舆情分析、防欺诈等场景。• 批处理服务(Batch Service)是一种用于运行大规模并行批处理作业的分布式云计算服务。支持海量任务的自动调度、资源管理和数据加载,可广泛应用于深度学习、基因检测、视频分析等大规模并行计算场景。• 并行高效支持大规模的并行批处理作业,自动高效完成资源调度、任务发放和数据加载。• 便捷易用结合华为云上已有服务,提供丰富便捷的作业调度方法,方便用户快速实现已有流程上云,无需复杂编程即可配置云上负载。• 完全托管自动完成资源管理,数据加载和作业调度,用户可将批处理计算中的资源调度和流程调度完全托管给批处理服务。• 成本控制无需软硬件资本投资和人工运维,通过免费的批处理服务,可以直接使用云上资源,按需动态分配资源,按资源实际使用量计费。EI大数据• 智能数据平台• 智能数据平台面向企业数字化运营诉求,提供一站式智能数据管理能力,帮助企业快速构建从数据接入到数据分析的端到端智能数据系统,消除数据孤岛,统一数据标准,加快数据变现,实现数字化转型。• 提供包括异构数据接入、融合智能计算、数据分析服务、可视化数据开发治理能力,帮助各行各业企业构建数字化运营能力,加快数据变现。• 优势• 一站式数据管理:可视化数据建模,支持行业主题数据模型快速构建。• 智能ETL:标准SQL融合AI能力,快速实现非结构化数据标准化。• 开放兼容:所有组件完全兼容开源接口,已有业务无缝迁移。文字识别• 文字识别(Optical Character Recognition),就是将图片或扫描件中的文字识别成可编辑的文本。可代替人工录入,提升业务效率。支持身份证、驾驶证、行驶证、发票、英文海关单据、通用表格、通用文字等场景文字识别。• 用户认证识别:降低用户实名认证成本,准确快速便捷。• 财务报销审核:用于公司员工发票报销,票据自动识别,节省人工录入成本,提升效率。• 金融保险:用户申请保险报销,需提供身份证、报销单、医疗单据等纸件材料。通过OCR服务可实现信息的自动录入和审核校对,提升效率。• 海关单据电子化:很多公司都存在海外业务,通用OCR服务可实现海关单据数据自动结构化和电子化,提升效率和录入信息准确度。图像识别• 图像识别(Image Recognition),基于深度学习技术,可准确识别图像中的视觉内容,提供数万种物体、场景和概念标签,具备目标检测和属性识别等能力,帮助客户准确识别和理解图像内容。• 场景分析:图像的内容标签缺乏,导致用户检索效率较低。图像标签功能可准确识别图像内容,提高检索效率和精度,从而使得个性化推荐、内容检索和分发更为有效。• 智能相册:基于图像识别出的数万个标签,智能相册可以自定义分类,比如“植物”、“美食”、“工作”等类别。方便用户管理相册,带来良好体验。• 目标检测:在建筑施工现场,基于定制化的图像识别目标检测系统,可实时监测现场人员是否佩戴安全帽,以降低安全风险。• 图像搜索:海量图片库的搜索较为麻烦。基于图像标签的图像搜索技术,不管用户输入关键字,还是输入一张图像,都可以快速搜索到想要的图像。内容审核 Moderation• 内容审核(Content Moderation),基于图像、文本、视频检测技术,可自动检测涉黄、广告、涉暴、涉政等内容,帮助客户降低业务违规风险。• 内容审核:不合规内容的识别和处理是UGC类网站的重点工作,基于内容检测,可以识别并预警用户上传的不合规内容,帮助客户快速定位处理,降低业务违规风险。• 视频直播:在互动直播场景中,成千上万个房间并发直播,人工审核所有直播内容几乎不可能。基于图像检测能力,可对所有房间内容实时监控,识别可疑房间并进行预警。• 清晰度检测:某些业务场景需要用户上传照片,而照片的清晰度将影响后续业务处理。基于图像清晰度检测技术,可以自动对图像的清晰度进行判断并量化,减少二次上传。• 构图评价:某些业务场景需要用户上传高质量照片,而倾斜、变形、构图差的照片将影响后续业务处理。基于构图评价技术,可以对构图质量进行判断,减少二次拍摄和上传。交通智能体• 优势:• 数据全面和深入挖掘,全面融合互联网、交通大数据,深入挖掘大数据价值。• 全域协同与人车协同计算,实现整个区域的交通流量最大化,区域内车辆等待时间最小化。协调车辆和行人的通行需求,实现车辆、行人有序通行。• 实时信号灯调度,业内首家实现了交通智能体和信号管控平台的安全通讯接口标准制定。• 精确车辆行车轨迹预判,精准预测车辆的行车轨迹需求,提前规划通行路线。• 全时段:交通事件7x24小时全域、全时段感知。• 智能:区域协同信号优化。• 完备:关键拥堵点识别、关键拥堵路径识别、拥堵扩散分析。• 预测:人群密度预测,掌握人群迁移大交通规律。• 精准:交通路况7x24小时全面、精准掌握。• 便捷:实时信号灯调度,按需放行。• 可视:提交通态势大屏,所见即所得。• 精细:重点车辆管控,精细化管理。园区智能体• 从人防到智防:基于人工智能的智能防护,减轻安保人员压力。• 从刷卡到刷脸:刷脸无感通行,自动打卡,再也不怕忘带卡。• 从担心到安心:强大失物追踪分析能力,智能让员工和业主更加放心。• 应用实践:• 园区门禁:利用人脸检测和识别技术精确识别来访者的身份,快速返回识别结果;实现门禁更高的通行吞吐率、园区的自动化管理。• 安全区域监控:通过入侵检测、徘徊检测、遗留物检测等技术可实现对受控区域进行监控;保障园区的生活生产安全。• 智慧停车:通过车辆车牌识别、轨迹跟踪服务实现园区车辆出入管控、线路管控、车辆违停管理、停车位管理等。工业智能体• 三大转变:• 从人工经验到数据智能:基于数据挖掘分析,从数据中获取提升效率和产品质量的新经验。• 从数字化到智能化:智能分析能力,成为企业数字化的新动力。• 从产品生产到产品创新:企业内从产品设计到销售的数据协同,以及产业链上下游数据协同,创造新的竞争优势。• 应用实践:• 产品质量优化提升:基于客户的反馈、互联网点评分析、竞争对手分析、维修记录、售后历史数据,进行分类分析,发现产品关键问题,指导新产品设计改善,提升产品质量。• 智能设备维护:预测性维护,根据系统过去和现在的状态,采用时间序列预测、神经网络预测和回归分析等预测推理方法,预测系统将来是否会发生故障,何时发生故障,发生故障类型,可以提升服务运维效率,降低设备非计划停机时间,节约现场服务人力成本。• 生产物料预估:基于历史物料数据,对生产所需物料进行准确分析预估,降低仓储周期,提升效率。深度算法优化,基于业界时间序列算法模型,并结合华为供应链深度优化。汽车智能体• 三大转变:• 从事后发现到实时监控:车辆状态和位置实时监控,降低安全隐患,减少成本浪费。• 从人防到智防:AI为安全驾驶和乘车安全保驾护航。• 从人工到智能:智能规划、智能机器人解放双手。• 应用实践:• 生物钥匙:通过红外摄像头及基于边缘和云端的深度学习能力,通过对车主正面面部图像的3D建模,完成人脸识别和活体检测,精确识别驾驶员的身份,完成车主信息的快速匹配。• 电子围栏:实时判断车辆位置是否在指定区域,超出区域进行告警。• 实时路径规划:利用高效近似图算法,实时进行站点估算和规划;基于规划的站点进行实时路径规划,满足加班车、企业拼车、物流配送等场景。• 智能对话机器人:基于深度学习和知识图谱的自然语言理解平台,提供精准的智能问答,使能销售助理、保养推荐、故障问答、车险营销等场景。ModelArts• 自动学习:自动学习功能可以根据标注数据自动设计模型、自动调参、自动训练、自动压缩和部署模型,不需要代码编写和模型开发经验。• 端-边-云:端-边-云分别指端侧设备、华为智能边缘设备、华为云。• 在线推理:在线推理是对每一个推理请求同步给出推理结果的在线服务(Web Service)。• 批量推理:批量推理是对批量数据进行推理的批量作业。• Ascend芯片:Ascend芯片是华为设计的高计算力低功耗的AI芯片。• 数据准备效率百倍提升,内置AI数据框架,通过自动预标注和难例集标注相结合,提升数据准备效率。• 训练耗时大幅度降低,提供华为自研MoXing高性能分布式框架采用级联式混合并行,梯度压缩,卷积加速等核心技术,大幅度降低模型训练耗时。• 支持将模型一键部署到端,边,云各种设备和场景下,可以同时满足高并发,端边轻量化多种需求。• 匠心打造全流程管理,提供数据,训练,模型,推理整个AI开发周期全流程可视化管理,并且支持训练断点重启,训练结果比对和模型溯源管理。• AI市场,支持数据和模型共享,可帮助企业提升团队内AI开发效率,也帮助开发者实现知识到价值的变现。ModelArts产品优势• 企业级:支持海量数据的预处理和版本管理,支持端、边、云多场景模型部署,实现AI开发全流程的可视化管理,提供AI共享平台,帮助企业构筑内外部AI生态。• 智能化:支持模型自动设计,可根据部署环境和推理速度要求,自动训练出模型,支持图像分类和物体检测场景的自动建模,支持结构化数据自动特征工程和自动建模。• 高性能:自研MoXing深度学习框架,提升算法开发效率和训练速度,优化深度模型推理中GPU的利用率,加速云端在线推理,可生成在Ascend芯片上运行的模型,实现高效端边推理。• 数据准备效率百倍提升,40TB数据处理:8000人天->80人天。• 模型训练耗时大幅度降低,算法优化,计算快,简化调参,典型RestNet-50网络下,1000GPU集群,训练加速比0.8。• 模型一键部署到云,边,端。• AI模型部署:边缘推理,在线推理,批量推理。• 用AI方式加速AI开发过程——自动学习:UI向导,自适应训练。• 快亦有道——匠心打造全流程管理:开发流程自动可视化,训练断点重启,训练结果轻松比对。• AI共享——帮开发者实现AI资源复用:企业内共享,达到效率提升。AI共享平台(数据,模型,应用),外部市场(开放生态)。ModelArts功能介绍• 数据治理:支持数据筛选、标注等数据处理,提供数据集版本管理,特别是深度学习的大数据集,让训练结果可重现。• 极“快”致“简”模型训练:自研的MoXing深度学习框架,更高效更易用,大大提升训练速度。• 云边端多场景部署:支持模型部署到多种生产环境,可部署为云端在线推理和批量推理,也可以直接部署到端和边。• 自动学习:支持多种自动学习能力,通过“自动学习”训练模型,用户不需编写代码即可完成自动建模、一键部署。• 可视化工作流:使用GES(图引擎服务)统一管理开发流程元数据,自动实现工作流和版本演进关系可视化,进而实现模型溯源。• AI市场:预置常用算法和常用数据集,支持模型在企业内部共享或者公开共享。ModelArts应用• 图像识别,视频分析,语音识别,异常检测。• 适用场景:• 图像识别:准确识别图片中的物体分类信息,比如动物识别、品牌Logo识别、车型识别等。• 视频分析:准确分析视频中的关键信息,比如人脸识别、车辆特征识别的场景应用。• 语音识别:让机器理解语音信号,协助处理语音信息,适用于智能客服问答、智能助手等。• 产品推荐:根据客户本身属性和行为特征等,为客户提供个性化的业务推荐。• 异常检测:在网络设备运行中,用自动化的网络检测系统,根据流量情况实时分析,预测可疑流量或可能发生故障的设备。• 未来将会在数据增强,模型训练速度,弱监督学习等方面持续发力,将进一步提升AI模型开发效率。ModelArts开发类型• 所有的均建议搭配:对象存储服务OBS。• 零基础建模:• 面向对象:业务开发者:有AI应用诉求,但无AI开发能力,不熟悉AI开发语言框架,无法自己建模。• 特性:提供自动学习功能,可根据标注数据自动设计模型、自动调参、自动训练、自动压缩和部署模型,不需要代码编写和模型开发经验,即可实现零基础构建AI模型。• 支持场景:当前自动学习支持快速创建图像分类、物体检测和预测分析模型,新模型类型不断增加中。• 快速建模:• 面向对象:AI初学者,具备基础AI能力,缺乏完整AI开发能力,能够使用常用AI开发框架和开源工具进行简单模型创建。• 特性:ModelArts预置了多种已经训练好的算法,您可以上传自己的业务数据,根据业务选择对应的预置算法,并进行重训练,无需编写代码即可快速生成模型,并进行模型部署。• 支持场景:预置图像分类、物体检测和图像分割三种类型的算法,您可以基于实际应用需求,选择对应模型创建训练作业,从而得到您需要的模型。新预置模型不断扩展中。• 标准模型开发:• 面向对象:AI工程师和专家,具备完整的AI开发能力,多年AI开发经验,具备丰富的模型开发和调优能力。• 特性:ModelArts集成了Jupyter Notebook,您可以通过创建开发环境,自行编写模型训练代码和调测,然后使用编写好的训练代码创建训练作业,进行模型的训练和部署。 ModelArts支持数据集、训练作业及模型的多版本管理,还提供了数据集、训练作业、模型及服务演进过程溯源图,实现AI开发工作流可视化,让您轻松管理AI开发流程,提升AI开发效率。• 支持场景:支持深度学习和传统机器学习的自定义模型开发和部署。HUAWEI HiAI• HiAI是面向移动终端的AI能力开放平台,构建三层AI生态:服务能力开放、应用能力开放和芯片能力开放。端芯云结合的三层开放平台为用户和开发者带来更多的非凡体验。• 芯:优化原声特性,芯片能力开放 - 轻松获得NPU加速让性能最佳。• 端:APP智能化,应用能力开放 - 让App更加智慧强大。• 云:提供按需服务,服务能力开放 - 让服务主动找到用户。HiAI Foundation概述• HiAI Foundation API是移动计算平台中的人工智能计算库,该计算库面向人工智能应用程序开发人员,让开发者便捷高效地编写在移动设备上运行的人工智能应用程序。HiAI Foundation API将作为统一的二进制文件发布。这组API主要作用是通过HiAI异构计算平台来加速神经网络的计算,当前仅支持在Kirin SoC上运行。使用HiAI Foundation API,开发人员可以专注于开发新颖的AI应用程序,而不用关注针对计算的性能调优。HiAI Foundation API集成到Kirin SOC芯片上,为开发者提供基于移动设备的运行环境和调试工具,开发者可以在移动设备中运行神经网络模型,调用HiAI Foundation API进行加速计算。HiAI Foundation API无需安装,使用移动设备默认镜像即可支持相关集成、开发和验证。HiAI Foundation功能介绍• 主要功能:• 提供常用的人工智能业务功能API,可在移动设备上高效运行。• 提供了一个与处理器硬件无关的加速API,应用厂商和开发者可以在HiAI异构加速系统上加速模型计算、算子计算。• 基本功能:• 支持模型编译、模型加载、模型运行、模型销毁等AI模型管理接口。• 支持基本的算子计算接口,包括卷积、池化、全链接等接口。HiAI Foundation技术介绍• 支持针对神经网络模型运算的专用AI指令集,可以用最少的时钟周期高效并行执行更多的神经网络算子。• 通过工具可以把神经网络各种算子,比如卷积、池化、激活、全链接等离线编译成NPU的专用AI指令序列,同时将数据和权重重新摆放,指令与数据融合在一起生成离线执行模型。在离线编译的时候,可以把前后层(卷积、Relu、Pooling)能够融合的算子进行层间融合,这种方式可以减少DDR的读写带宽,提升性能。• 能够把神经网络模型中的相关数据(Batch、 Channel、 Height、 Width)以最高效的方式重新摆放,特别是Feature Map的通道数据,在做卷积运算的时候,对于通道相关联的计算效率会得到大幅提升。• 支持稀疏化模型加速。在不损失计算精度的前提下,对权重进行置零稀疏优化,NPU可以跳过系数为零的乘加运算,极大地提高了计算效率,同时也降低了带宽。HiAI Foundation执行介绍• 将标准的神经网络模型(Caffe等)编译转换为离线模型,编译的主要目的是对网络配置进行优化,生成优化后的目标文件,即离线模型,离线模型是序列化的存储在磁盘上,这样,神经网络前向计算时,可以直接使用优化后的目标文件进行计算,速度更快。• HiAI Foundation支持多种智能平台框架,包括Caffe、Tensorflow等,使用不同的智能平台框架,第三方需要在接口中指出本次计算需要使用的具体的智能平台框架,其他接口和参数无需修改。HiAI Foundation支持绝大部分模型和神经网络算子,并持续优化与完善。HiAI DDK概述• HiAI API集成在使用Kirin SoC芯片的android系统上,开发者可以在集成环境中运行神经网络模型,调用HiAI API进行加速计算。• HiAI DDK(Device Development Kit)是海思发布的人工智能计算SDK,该SDK面向人工智能应用程序开发人员和机器学习算法人员,通过使用HiAI DDK,可以更好的提升移动端机器学习模型运行速度。• DDK包说明• app_source为Android demo app的源码。(提供了从输入前处理到模型加载、模型前向计算、前向计算结果后处理、模型卸载、时间统计等一系列sample code示例,同时提供了同步,异步方式的sample code。)• DDK为HiAI开放的SDK。• Document为开发参考文档。• tools为Caffe/Tensorflow离线转换工具以及算子兼容性评估及分割工具。HiAI Engine• HUAWEI HiAI Engine为应用能力开放,轻松将多种AI能力与App集成,让App更加智慧强大。应用能力开放包括:• 1. CV引擎:CV,即计算机视觉,计算机能够模拟人的视觉系统感知周围环境,判断、识别、理解空间组成。能力包括图像超分、人脸识别、物体识别等。• 2. ASR引擎:ASR,即自动语音识别,将人的声音转化为文本,便于计算机进一步进行解析理解。能力包括语音识别、语音转换等。• 3. NLU引擎:NLU,即自然语言理解,与ASR有机结合,让计算机理解人的声音或文本,进行沟通或自然的动作。能力包括分词、文本的实体识别、情感偏向分析,机器翻译等。HiAI Service• 快服务智慧平台:聚合开发者的内容和服务,为华为终端产品提供第三方的直达服务。• 小艺对话开发平台:端到端地为开发者提供对话服务的开发、测试和部署的平台。快服务智慧平台介绍• 华为快服务智慧平台,是华为终端提供的面向开发者的原子化服务接入和分发平台。快服务智慧平台接入开发者的内容和服务,通过统一的服务分发策略,向华为泛终端(手机、平板、智能音箱、PC等)和终端上的媒体入口(如:手机上的华为智能助手、全局搜索、智慧视觉等)提供服务;实现服务一点接入,全场景和多入口精准分发。• 通过华为快服务智慧平台,为终端用户带来更便捷和高质量服务用户体验的同时,也可以基于华为终端的超级入口和海量用户,为开发者引入高流量。• 华为快服务智慧平台的业务架构如下所示:• 快服务(Ability),是连接用户意图与原子化服务之间的桥梁,开发者在快服务智慧平台的开发者门户定义服务,用户可以在华为的各个终端和媒体入口来使用快服务。• 例如:某开发者可以提供每日天气查询、空气质量查询等天气信息服务。开发者在华为快服务智慧平台上将天气信息注册成为快服务,用户在华为泛终端上就可以通过语音或者卡片查看天气相关信息。• 华为快服务包括直达应用类服务(APP Ability)、卡片类服务(Card Ability)、内容接口类服务(Content Ability)、对话类服务(Conversation Ability)四种类型。快服务分类• 意图(Intent):用于表达用户想要达成的目标或完成的任务,比如:打车、查看天气等。快服务智慧平台中,意图有唯一标识和一个或多个描述意图的参数,并且和开发者的服务进行关联。• 开发者在注册快服务的时候,需要选择以下几种触发方式来对意图实例化:• 关键词触发:用户通过文本关键词表达意图,当用户的意图表达和快服务定义的关键词或意图匹配后会触发该快服务;例如:用户在负一屏通过文本搜索百科。• 语音触发:用户通过语音表达意图,当用户的意图表达和快服务定义的关键词匹配后会触发该快服务;例如:用户通过语音助手查询天气。• 图片触发:用户通过相机拍照识别等方式表达意图,当用户的意图表达和快服务关联的意图匹配后触发该快服务;例如:用户通过智慧识屏来识别花的名称。• 扫一扫触发:用户通过扫描二维码、条码等方式表达意图,当用户的意图表达和快服务关联的意图匹配后触发该快服务。• 事件触发:开发者定义的基于时间、地理位置等事件意图触发规则,当事件发生时触发快服务,来满足用户的意图。例如:航班延误事件发生时触发通知,让用户及时了解航班动态信息,满足用户的航班查询意图。快应用• 对于终端用户:快应用是一种新型免安装应用。不仅具有安卓应用体验好、功能强的优点,还具备HTML5网页自动更新、占用内存少的便捷。用户可以将喜欢的快应用添加至桌面,方便再次访问。• 对于开发者:快应用是一种基于行业标准开发的新型免安装应用,使用前端技术开发成本低,可以调用设备能力用户体验好。拥有十大手机厂商的助力,获取新客成本低、留存率高。快应用服务场景• 应用市场首页专区和活动页:华为应用市场,可以从“快应用”专区进入,或者点击顶部活动区图片,进入精选快应用专区。• 应用市场、快应用中心、游戏中心搜索:在应用市场、快应用中心和游戏中心的搜索框中输入对应的关键字,点击搜索到快应用的“打开”。• 快应用管理和快应用中心:• 打开华为应用市场,选择“管理”页签,选择“快应用管理”进入“快应用中心”,可快速访问使用过的快应用(“快应用中心”可以添加至桌面)。• 长按快应用,可以将该快应用添加到桌面、置顶、分享、管理其权限和数据以及将快应用从“快应用中心”删除。• 添加到桌面网页跳转快应用:无论网页在社交平台还是在浏览器中,都可以通过发送一个分享链接打开快应用或快应用中的某一个页面,并可添加到桌面留存。
  • [行业动态] 华为云EI,让人工智能无所不及
    华为第十六届全球分析师大会在中国深圳召开。在“让Cloud无处不在,让AI无所不及”的主题论坛上,华为云EI服务产品部总经理贾永利发表了《让AI无所不及》的主题演讲,分享了华为全栈全场景AI在使能企业智能化转型过程的创新解决方案及相关行业实践。全栈全场景AI解决方案让智能无所不及当前,AI的应用正在从企业单个业务场景复制推广到更多部门,从先行者的小范围探索到行业企业的全面布局,与此同时,与AI相关的技术发展和演进速度也非常之快,新的AI算法不断刷新已有纪录,计算框架也不断出现。在发展迅猛的趋势之下,企业在探索和使用AI的过程中也遇到了非常多的困惑。针对AI应用当中的各种痛点,在2018全联接大会上,华为公司正式发布全栈全场景AI解决方案,为客户提供了从底层AI芯片、AI框架到应用使能的能力;面向政府、企业与开发者,提供全栈AI解决方案华为云EI。未来,基于华为昇腾(Ascend)系列AI芯片及多核ARM芯片“鲲鹏920”,华为云将更加以优质的能效表现,帮助客户进一步提升AI开发、数据处理的性价比与服务体验。华为云ModelArts:更快的普惠AI开发平台未来,随着数据模型的增大、海量数据预处理能力要求的增加,全生命周期管理加速将变得更加重要,只有拥有端到端全栈的优化能力,才能够帮助用户快速创建和部署模型,管理全生命周期 AI 工作流。华为云ModelArts一站式AI开发平台应运而生。ModelArts从设计之初便着眼于不同层级的AI开发者,从数据科学家、算法工程师,甚至AI初学者,都可以通过统一的平台对AI模型/工作流进行全生命周期管理。ModelArts可以帮助用户进行包括AI开发和运行阶段管理在内的全生命周期管理,在数据处理、模型训练、模型管理、模型部署、AI市场等各个环节提供更为快速有效的解决方案。接下来,华为云还将持续把华为2012实验室、EI产品部等在内的AI前沿的算法和理论研究,例如:小样本训练能力、半监督学习能力、神经网络自动搜索能力等,逐步产品化,并开放给开发者。具体来说,首先,数据处理在AI开发过程中极为关键,在项目中占得比例有时甚至超过进行训练的时间,同时往往消耗大量成本进行标注,ModelArts系统化的对这个过程进行了设计,提供了数据集版本管理、半自动标注等多个功能,针对不同项目,该阶段的人力消耗能够节约50%-80%。在模型训练部分,ModelArts通过硬件、软件和算法协同优化来实现训练加速。自研的深度学习框架——MoXing,可以自动将开发者的单机程序,转化为大规模分布式训练程序;提供超参的自动化调试优化;提供神经网络自动化搜索能力,帮助开发者自动化实现模型训练,大幅提升算法开发效率和训练速度,节约训练成本。而在模型管理方面,通过图引擎统一管理开发流程元数据,自动实现工作流和版本演进关系可视化,进而实现模型溯源、精度追踪;在模型部署方面,ModelArts可以一键将AI模型部署为在线推理服务或边缘推理服务。面向边缘推理场景,ModelArts可以自动对模型的适配进行优化,比如神经网络蒸馏,模型的压缩、枝剪等处理,让AI模型能够更好的适配边缘部署环境。瞄准三大行业AI落地场景,各领域合作已见成效贾永利表示,华为云EI通过在十余行业,大量的项目探索,总结了行业AI技术落地的关键路径。他表示,AI行业落地的关键在于找准场景,华为云EI针对海量重复场景、专家经验场景及多域协同三类场景,致力于实现效率提升、专业传承和突破极限,助力各行业智能化升级。在典型的海量重复场景——物流行业,每年货物破损不计其数,多数由于人为操作不当所导致。针对物流货物的运输、安检场景,华为云EI利用了视觉技术,帮助德邦快递实现了全面的自动化检测,节省了大量的时间成本和人力成本,有效减少了货物损耗。在此之前,德邦快递利用13,000路视频,使用人工观看,每人每天最多4倍速度观看8路摄像头,人力消耗预计达400人以上。针对多域协同场景,华为云帮助某机场解决航班靠桥率、旅客靠桥率、步行距离、地服消耗、滑行冲突率多等问题,实现核心指标靠桥率较人工提升了 5%,冲突率较人工降低10%,全面提升了指挥员工作效率和机场运行效率。而被优化机场全年由于停机位分配等原因,需要搭乘摆渡车的旅客数量,减少了250万。在任何行业里,专家都是非常宝贵且稀少的资源,在医疗领域更是如此,这也为专家经验场景提供了最为适合落地的基础。在大会现场,金域医学CIO李映华,就金域医学与华为云EI在医疗领域的创新成果进行了分享。他介绍道,目前金域医学与华为云已经围绕大数据、AI等多个方面开展了合作,例如借助深度学习等AI技术对海量病理切片及专家标注数据进行学习、训练,所产生的深度神经网络模型将可以辅助病理医生更加高效、及时、准确地对患者的病理切片进行诊断。在双方目前的合作当中,基于金域医学高年资细胞病理医生的专业标注以及华为云EI视觉团队的高效率、高质量的网络模型构建与训练,项目已取得了阶段性的突破,宫颈癌细胞学AI辅助筛查的敏感度超过99%,可媲美专家水平。AI技术红利加速释放,构建更全生态无论对于哪个行业,在AI落地过程中开发者都是一个关键要素。面向合作伙伴,华为云EI提供了市场营销策划、解决方案使能、联合创新Lab等多种支持计划,使能合作伙伴繁荣AI开发能力。面向开发者、高校和科研机构,华为在2018全联接大会发布了沃土AI开发者使能计划。通过沃土AI开发者使能计划,搭建一个技术交流、人才培养、机遇共创的通道。另外,开发者还可以借助ModelArts快速开展创新活动。以上海交通大学为例,借助ModelArts,学生在短时间内将传统竞赛赛车,改造为具备AI能力的自动驾驶赛车。改造后的赛车可以对红绿灯、障碍物、车道等环境进行识别,并且能够对特定目标进行跟随。同时,通过端云协同AI应用开发平台HiLens,用户可以更加方便管理海量的终端类设备,与ModelArts无缝互通。例如,深圳海雀科技通过HiLens开发的AI技能,将AI模型下发至其研发的家庭安防摄像头,让原本普通的摄像头变得更加智能。不仅AI开发过程变得更高效快捷,华为云还希望以更好的AI技术和生态,助力更多的企业和开发者更好地利用和分享他们的AI能力,从而构建更全的生态系统。开发者可以通过2019年3月最新发布的ModelArts的AI市场将AI模型、数据集进行共享和发布,也可以从市场获取基础数据集、模型进行更进一步的开发。此外,Atlas200开发者套件、HiLens wit深度学习摄像机等开发者套件也即将在5月份正式商用。目前,华为云正持续AI场景化落地应用,继续在“云+AI”进行探索与实践,助力把数字世界带入每个人、每个家庭、每个组织,从而构建万物互联的智能世界。
  • [其他] 让AI照进各行各业:华为云的普惠AI之道
    “过去是车看灯,读秒数通行。现在是灯看车,读车数放行。”在北京海淀区上地三街,在AI算法的帮助下,路口交通管理实现了实时在线决策和信号配时优化。上地三街这个过去著名的拥堵点,现在车流主方向(东西方向)平均延误减少15.2%,平均车速提升了15%,支路的平均延误时间降低了10%~20%。其实,这只是华为云普惠AI智能变革的冰山一角。如何让AI像电力、互联网一样,成为各行业企业的基本生产力,一直是华为云的目标。在普惠AI的道路上,华为云有什么独特的心法?借2018高交会契机,华为云中国区总裁洪方明向趣味科技详解了华为云的普惠AI之道 。AI要落地,先拆除三大门槛2015年兴起的这波AI浪潮,与以往AI浪潮的最大区别就是AI技术开始走出实验室,走向产业与生活,帮助人们解决现实世界中的问题。这场变革中,谁把AI用得最早、最好,谁受益最大。在华为看来,AI是一组技术集合,是一种新的通用技术(GPT)。它并不简单的是一个独立的产品,更不是一个封闭的系统。AI将成为电力、互联网一样的基本生产力,使众多行业效率得到指数级提升。这是华为云做普惠AI的出发点。洪方明认为,在将AI这种生产力释放到各行各业的过程中,企业面临着三大门槛:第一:“慢”,AI开发效率低,标注、训练、部署整个过程非常耗时;第二:“贵”,AI基础资源,尤其是算力稀缺且昂贵;第三:“缺”,AI人才的短缺,中国的AI人才缺口就超过500万人。这三点组成了“资源”、“应用”和“人才”三大门槛,极大限制了AI的行业落地进程。随着AI的日益普及,AI即将变成越来越多行业最核心的基础设施之一。然而这三大门槛却有越来越严峻的态势,算力依旧稀缺,人才缺口依旧是很多企业面临的瓶颈。AI技术发展与行业落地的巨大落差,让普惠AI成了各行业最迫切的需求。普惠AI,让企业用得起、用得好,用得放心那么,究竟如何让企业用的起,用的好AI,同时还要用的放心?在10月份举行的华为全联接大会上,华为云首次提出了全栈全场景AI解决方案,以普惠AI的方式,走出了一条AI行业落地之路。具体来说,针对“贵”和“慢”的问题,华为云通过公有云将AI技术模板化,以全栈全场景的形式全面部署在云、边、端。全栈指包括芯片、芯片使能、训练和推理框架和应用使能在内的技术全堆栈;全场景指包括公有云、私有云、边缘计算、物联网行业终端以及消费类终端的部署环境。针对企业对AI人才的焦虑,华为云推出一系列举措降低企业使用AI的门槛。比如,即取即用的AI功能和API接口、开放的开发平台可以让企业定制化开发自己的AI能力。华为云丰富的行业落地经验,还将通过行业预集成方案的形式直达各行业企业,让更多企业享受AI成功落地的成果。在安全性方面,华为云是国内惟一全平台、全节点、全服务通过PCI-DSS安全认证的云服务平台,为企业提供安全无忧的AI云服务。2017年,华为云携手客户与合作伙伴已经打造了超过200个AI项目,涵盖政务、交通、制造、物流、互联网等8大行业。全栈全场景AI解决方案成了华为云快速落地的助推器。华为云EI,行业变革的智能引擎“预计2025年,全球AI市场空间将达到3800亿美金,其中90%来自于政企市场。未来,政企市场将是云化、智能化的主场,我们在座的每一位都是这场变革的主角。”本届高交会上,洪方明再次强调了政企市场的关键性。当华为云AI以普惠的方式应用于解决各个行业的细分场景,华为将这种行业AI解决方案称为EI,即企业智能。华为云EI提供“云-边-端”三位一体的全栈协同智能服务,管理多种服务的一站式协同开发平台。此外,华为云EI还将统一AI开发语言,通过类SQL就可以实现AI业务的开发及编排。这些解决方案,都将极大降低AI应用开发门槛。比如,通过对分布式训练的调度算法、分布式梯度压缩深度优化,华为云让AI在亿级图片规模下的模型训练时间,已经从原来的30天缩短至小时级。而华为云的客户只需要将标注好的数据加载至华为云EI深度学习服务,即可快速自动训练出定制化模型。华为云EI不仅能帮企业实现降本增效,还将助力企业的商业模式创新和智能化转型。在物流行业,华为云EI对九州医药通的拣货员进行路径规划部署后,拣选效率提升近30%,派送车辆的调度效率也提升了5倍。在工业制造领域,油气公司采用华为云EI的故障预测和定位模型后,实现了对油气管道平台的故障概率预判与准确定位,使设备的宕机率下降了25%。在智慧园区管理方面,华为云EI将电子围栏和视频系统联动,节省了30%-40%的保安人力,并通过图像监控与能耗设备关联,做到无人区域照明、空调的自动关闭,将园区综合能耗降低了10%。在采用了华为云EI服务后,上海市政府“一网通办”政务服务平台能够通过智能客服实现与用户的多轮对话,并主动进行办事推荐,提升了市民满意度。虽然已经在普惠AI的大道上狂奔,但华为云“平台+生态”的长久战略不变,“上不碰应用、下不碰数据、不做股权投资”的三不原则也不变。洪方明强调,这些基本原则是华为云对生态的态度,是华为云的基因。“华为云聚焦ICT基础设施,提供一块数字化、智能化的‘黑土地’,这块‘黑土地’上可以‘玉米’、‘大豆’、‘高粱’、‘花生’、‘土豆’……,让各个伙伴的内容、应用、云在上面生长,形成共同的力量面向客户。”一项划时代的新技术,从诞生到成为水电煤一样的基础设施,需要一个漫长的发展过程。让所有企业都用得起、用得好,用得放心的,华为云的普惠AI无疑在尽力缩短这一历史进程。
  • [行业动态] 【人工智能】揭秘华为云EI:华为人工智能发展路线与BAT大不相同
    人工智能风口成最强“风口”,各大科技巨头和创业公司纷纷抢位。就中国科技业四大巨头:阿里、腾讯、百度、华为而言,前三家谈AI很多,华为则比较低调。通过研究,笔者发现华为人工智能发展路线与BAT大不相同:BAT更多聚焦消费互联网AI应用,而随着Cloud2.0 时代到来,华为AI(华为云EI企业智能 )更多聚焦产业互联网领域的应用,以AI技术使能企业发展(企业+AI),让企业更智能。凭借多年来在企业级IT市场的行业经验积累,以及强大的AI技术实力,开放华为自身应用AI的经验和能力,华为更有可能在用AI使能企业的赛道上走的更远,华为云EI将作为一项核心使能服务驱动企业、行业迈向智能世界。任正非透露华为人工智能主攻方向人工智能风口以至,这应该已经没有什么争议,就中国科技业四大巨头:阿里、腾讯、百度、华为而言,前三家实际上都已经在不同场合谈过很多次自己的AI战略重点,比如阿里正在把人工智能渗透到交易业务的方方面面,腾讯要围绕游戏、社交、内容三大场景,Make AI Everywhere;百度有百度大脑和无人车,只有华为比较低调,对人工智能谈论不多,提起华为的人工智能,很多人还主要是停留在Mate10和荣耀人工智能手机这样的消费终端产品。然而,就在最近,华为的人工智能在企业级市场布局曝光提速,种种迹象表明,除了AI手机,水面之下,华为在人工智能领域实际上有大想法,早有明确方向。最深刻的印象来自10月份的一封经过任正非签发的、主送全体员工,全公开的华为总裁办邮件。邮件内容是一篇题为《一杯咖啡吸收宇宙能量,一桶浆糊粘接世界智慧》的文章,记录了任正非十月份访问加拿大四所高校校长座谈会,以及在公司员工座谈会上的讲话,里面有大篇幅关于人工智能的内容,显示任正非对华为AI布局的深谋远虑,巨大投入,在讲话中,任正非甚至提到华为已经考虑过万一AI泡沫破灭怎么办?在这些谈话中,总结起来,任正非一共对人工智能谈了三点意见:首先,直面人工智能存在的争议,但明确人工智能的发展“无论人们接受不接受,社会都会客观前进”,“我也担心人工智能对人的价值观产生破坏。但是我们挡不住人类社会前进的步伐。”华为一定要发展人工智能,“现在华为公司在人工智能的投资上也是极大的。”第二,在人工智能的研发中,必须让AI坐实,不能“虚化”,“否则在产品人工智能开发上,不成熟,就不敢冒昧的投入数千人。”在这里实际上表达了两层意思,一是华为已经在人工智能领域投入数千人力,二是坐实不虚化。第三,华为人工智能的主攻方向有两个,一,大量的是解决我们管理中重复性劳动的自动化问题,降低了管理的成本,也避免人做重复工作,因审美疲劳而犯的低级错误,我们在这个世界上的生存能力就更强了;二,是对于不确定性事情的模糊性识别和智能化处理。主攻方向明确之后,华为的人工智能研究被分为三个部分,第一部分是基础理论研究;第二部分是做使能器来改造华为的流程管理,“这个使能工程不对外,只全对内”;第三部分就是做人工智能相关的产品,对外赋能。据华为消费者业务CEO余承东在前不久的世界互联网大会介绍,为了应对数据洪峰对ICT行业冲击,诺亚方舟实验室2012年6月的正式成立,是华为正式投入AI基础研究的最鲜明信号。华为在诺亚方舟实验室进行人工智能算法的研究、管理AI的技术合作、识别AI主要应用场景和需求管理等。诺亚方舟的上层组织就是神秘的“2012实验室”,是华为的总研究院,包括中央硬件工程学院、海思、研发能力中心、中央软件院等。与最近很火的阿里达摩院不同,华为2012实验室已经运作七年,做得多说的少,对外很是低调神秘。从内部应用到对外开放使能,华为云EI企业智能面世根据任正非的华为AI战略,由于华为的人工智能工程主要是建立在其自身遍布全球的业务和网络存量上,以前是“不对外,全对内”,所以对于华为的AI技术到底详情如何,外界一直知之不详。但最近,却多了两个重要外部观察窗口,一个是华为手机在AI应用方面的进展,包括去年发布的AI手机荣耀Magic、华为Mate 9、华为Mate 10,开启终端AI商业化元年,这一块报道已多;而另外一个则是华为EI(Enterprise Intelligence)企业智能服务的面世与上线。华为云EI和华为AI手机,可以看做华为人工智能战略的云侧和端侧,华为认为Mobile AI=On-Device AI + Cloud AI,构建芯、端、云协同发展人工智能。华为AI手机针对消费者市场,而华为EI则是针对企业级市场,其基础为华为云,目标是将各类AI单点技术与企业生产系统产生化学反应,让企业更智能。在本质上,华为EI就是要把任正非所提到华为多年来在内部通过AI解决华为公司内部生产、物流、供应链、终端等领域问题,所积累的一些相关的能力、知识和方法分享给更多企业,帮助企业实现智能化。可以从华为EI所推出的三类企业智能云服务看到华为这部分AI能力的组成,它包括:EI基础平台服务,比如深度学习服务、图引擎服务等;通用服务,如大数据、视觉认知、语音语义、人脸识别、图像识别和内容检测等;行业场景解决方案,比如智能水务、智能制造、智能电力、智能交通、智能金融、智能零售等30个企业智能服务。华为EI的推出可以说是完全顺应任正非人工智能战略的指导,也是在把华为在人工智能领域最擅长的技术和能力积累对外开放和输出。按照一般认知,当前的人工智能可以分为两种,一种是强人工智能,一种是弱人工智能。强人工智能是研究如何通过模拟人的思维和模拟人细胞构成的一个方向,这个领域目前也没有太大突破。而弱人工智能则是指将人工智能技术用于提高人类工作效率,这才是华为AI的长项,也是目前人工智能商业化的主流方向。为了对外输出华为所积累的AI能力,华为以华为云为基础推出了华为云EI企业智能服务,并从诺亚方舟实验室整合大批人力加入EI业务。华为的人工智能到底能做什么?从哪里来?EI的推出使华为成为科技界少有的能用AI技术对2B市场使能的科技公司,但华为的人工智能到底能做什么,和阿里、百度的对外赋能有什么区别?在上周的一次采访中,两位从诺亚方舟调入EI团队的技术带头人,向微天下揭开了华为AI的部分“神秘面纱”。由于立足内部应用,华为投入AI研发的初衷与互联网巨头有很大不同。它不是纯粹的探讨技术“无人区”,而首先是解决内部实际问题,与实业紧密结合,这使得华为切入AI的时间线非常早,涉及AI业务的团队非常多,从事AI研发的人力也非常多,他们分头为各个业务部门服务,比如手机、芯片、媒体、操作系统等等,但应用最多的却是任正非提到的两大条线:解决华为内部运作的自动化问题和华为的业务服务问题,比如,华为供应链的智能装箱、物流和路径规划,以及报关、发票、风控、营销、网络安全等场景。结果就是不经意间,华为有了企业中最多的AI使用场景,如任正非所说,“世界上还有哪个公司有这么大的业务量和数据量与我们比拼?”这就决定了,在华为EI所推出的三类企业智能云服务中,其中通用服务领域并不是华为的最长项,在对外赋能时,华为态度开放,与伙伴合作借助外力发挥各自优势,比如科大讯飞的语音、码隆科技的图片等。华为EI的长项是基础平台服务和行业场景服务,有世界领先的AI能力。BAT更多聚焦消费互联网AI应用,而随着Cloud2.0 时代到来,华为云EI 更多聚焦产业互联网领域的应用,以此支撑华为云产业互联网领导者品牌。比如华为云端到端的智能APIs服务。华为公司每年有180万以上的订单,大概会形成30万~50万规模的物流单,怎么实现从始发点货物的供货预估——货物的装箱管理——运输到目的区域的分发——最后一公里的客户配送,这就需要有一系列智能化的技术支撑。基于仓储的优化,这对于大型企业是比较重要的。现在仓储都分为几级,华为公司在海外布局了大概5个的集散中心,全球发货到集散中心之后,如何把货物进行比较好的布放以及取货顺序的安排,这个就需要有人工智能的算法在里面。集装箱装箱,要考虑类似于如何在一个最小的空间里面最大利用这些空间等问题。装箱也有一些规则,比如说形状、重量、是否怕压,这些都有一系列的算法去解决。在华为公司的全球仓储管理方面,通过应用华为云EI服务能提升20%的分拣装箱效率,应用EI实现智能装箱,根据物品特征提供最佳装箱方案,而且做到集装箱3D仿真可视,整体利用率提升6%,物流使用EI做路径规划可节省例外开销成本30%。OCR识别(Optical Character Recognition,光学字符识别),比如说企业的票据、发票、文本,怎么通过自动化的方法录入,包括一些纸质单据的传递,其实它也需要利用一些人工智能技术。原来的方法可能做得不太准,最近有了深度学习和其它的人工智能技术之后,识别率大大提高了。以前,华为供应链需要大量人员手工录入海关报关单据,手工录入系统效率低,使用华为云OCR服务以后,华为已经实现海关报关单据自动化 ,录入效率提升10倍,减少200+海关报关专职人员,并对报关信息进行大数据分析,完成分析预测,节省千万美金报关风控成本。华为云OCR服务,在比如数字及表格识别的有些场景准确率超过98%,这个准确率在商用领域是极高的,可以帮助企业可以大大节省人力,将人从枯燥的重复工作中解脱出来。还有风控等......华为具有庞大的体量,在实际内部运作中必须要解决这些问题,而华为又有足够的投入和足够的技术实力,再加上丰富的使用场景,终于形成华为有别于BAT的人工智能使能路线。还有一些重要场景发生在华为的产品服务过程中。比如,解决华为全球巨大的网络存量的网络维护、故障诊断与处理的能力的提升;使网络规划与优化从被动走向主动等;就像任正非所说,华为给全球30亿人口提供通信服务,提供设备的网络存量约一万亿美元,这些网络每年故障发生上百万次,在这一过程中,人工智能被用来帮助预测和预防故障。这些能力,都通过华为云EI企业智能服务向外界输出。由于这些AI能力是形成与华为自身的制作业实践中,这使得华为的AI使能具备双重属性,一重是赋能AI,另外一重则是利用AI技术使能工业4.0和智能制造。在华为云EI企业智能服务的对象中,还有一个特殊群体,那就是政务部门,比如深圳交警就在9月与华为联合启动“深圳城市交通大脑项目”,使用华为云EI企业智能来推进智能交通,在11月的2017世界智慧城市博览会上,该项目从全球300多个城市中脱颖而出,荣获2017世界智慧城市博览会唯一一个平安城市大奖。据悉,深圳城市交通使用了华为云EI视频识别和强化学习功能,将在深圳实现交通信号灯根据路况自动化调节。不惧泡沫破灭的务实化AI发展路线华为云EI企业智能服务的推出有鲜明的华为特色和任正非特色,体现出华为对AI的务实态度,综合起来就是这样一些原则:人工智能不能遍地跑;华为云坚持“不做应用、不碰数据、不做股权投资”;人工智能会不断推动人类进步。重复工作自动化,模糊判别智能化,是华为努力的方向。这些原则之下,就是华为人工智能的聚焦投入:要急用先行小步快跑,要聚焦在确定性业务、人工消耗大的项目,“不要铺开一个很广泛的战线。不要遍地都是智能化,这会形成全面开花没有结果的盲动,就有可能满盘皆输”;“先纵向打好歼灭战,旗开得胜后再横向扩张”。在这个战略的基础上,任正非才提出,即便未来AI泡沫破灭,也能实现华为AI大发展的策略。据悉,目前已经有不少企业客户对华为云EI服务非常感兴趣,例如:制造业、车联网、节能、城市交通、医药零售等行业场景,均有项目在运作中。医药零售行业巨头九州通正在应用华为云EI改善物流路线规划等业务,一步步朝着智能的九州通迈进;深圳城市交通正在使用华为云EI实现城市信号灯自动调节,城市交通将更智能……凭借多年来在企业级IT市场的行业经验积累,以及强大的AI技术实力,开放华为自身应用AI的经验和能力,华为更有可能在用AI使能企业的赛道上走的更远,华为云EI将作为一项核心使能服务驱动企业、行业迈向智能世界。
  • [Atlas800] AI CPU资源占用率低
    在Atlas800上推理的时候,通过npu-smi info watch查看npu使用情况的时候,AI CPU的资源占用率一直都在1%或者2%,请问这种情况是正常的吗?如果有问题,请问该从什么地方着手解决呢?
  • [行业动态] 【2月24日 AI 快讯】1.8万元起,三百万人抢购:华为折叠旗舰Mate X2发布了,将首发鸿蒙系统;
    今日共有8条快讯,全文 642字 产业优必选科技谭欢博士荣获IEEE RAS青年科学家奖春节期间,IEEE机器人与自动化协会公布了2021年度获奖名单,优必选科技联席首席技术官谭欢博士荣获政府/行业类青年科学家奖(Early Government or Industry Career Award in Robotics and Automation),是该奖项自1999年创办以来,中国内地工业界单位背景的首位获奖者。2021/02/23 15:05原文链接1.8万元起,三百万人抢购:华为折叠旗舰Mate X2发布了,将首发鸿蒙系统四月份,华为的新老机型就要全部升级鸿蒙OS了。2021/02/23 14:39原文链接毅力号登陆火星真实视频公开,我们还听到了火星的风声!真实视频让我们看到尘土飞扬的火星,听到了火星的风声。2021/02/23 14:36原文链接入门用技术致敬每一位妈妈,B站up主用AI还原李焕英老照片动态影像「从我有记忆开始,妈妈就是中年妇女的模样,所以我会忘记,她也曾是花季少女。」2021/02/23 14:59原文链接理论全监督语义分割训练新范式「像素对比学习」,苏黎世联邦理工等出品一种新的、全监督语义分割训练范式「像素对比学习」。2021/02/23 14:55原文链接微软拓扑量子计算梦碎?三年前Nature研究有误,未发现马约拉纳费米子微软量子团队报以厚望的「马约拉纳费米子」研究竟然是错误的!这篇2018年发表在Nature上的文章遭到了质疑。2021/02/23 14:33原文链接其他清华软件定义芯片团队成果入选固态电路顶会ISSCC 2021通过挖掘量化后CNN模型权值大量冗余的特征,提出一种能够显著减少冗余权值造成冗余乘操作的优化方法,降低了硬件功耗2021-02-23 23:12:01原文链接MIT一招霸气颠覆传统:勇敢换导师,成本我买单,学生沸腾了马上要学术自由了2021-02-23 13:04:24原文链接
  • [行业动态] 【2月23日 AI 快讯】无缝折叠屏仅售一万八,买到就赚到!华为Mate X2来了
    产业39%!机器人国产化未能实现「中国制造2025」目标「中国制造2025」设定到2020年,本土机器人制造商要占据供应国内市场一半,到2025年达到70%。根据深圳高工产业研究公司数据,去年中国企业制造的机器人占国内市场的39%左右,与竞争对手日本和德国的技术差距依然存在。2021/02/22 16:48原文链接国企数字化调查:四成企业自评低于全球平均水平,数据质量成主要障碍藏在111家国企背后的数字化四大发现2021/02/22 16:39原文链接英伟达让GPU挖矿效率减半,显卡却未必更好抢比特币已经冲上 5.6 万美元的时代里,英伟达的限制可能还不够。2021/02/22 15:02原文链接上汽集团大举进军芯片产业,借道地平线打通上下游今日,Auto Byte从可靠渠道获悉,上汽集团在“中国芯”方面将有重要动作。2021/02/22 12:13原文链接工程实现、动态展示多种社区发现算法,这个Python库助你发现网络图的社区结构一个用于发现网络图中社区结构的 Python 库。2021/02/22 14:57原文链接理论 这张“毅力号火星照片”,AI P过不光上了色,还将像素提高了6倍以上2021-02-22 12:58:52原文链接其他无缝折叠屏仅售一万八,买到就赚到!华为Mate X2来了新春理财手机。2021-02-22 23:43:48原文链接AI面试官也太好骗了!用书架图片做视频背景,能提高15%好感度这也行?2021-02-22 13:13:14原文链接黑湖智造完成近5亿元C轮融资,创造中国工业软件新里程碑本轮融资由淡马锡(Temasek)领投,华兴新经济基金(Huaxing Growth Capital)、光速中国(Lightspeed China Partners)以及包括金沙江创投(GSR Ventures)、BAI资本(BAI Capital)、GGV纪源资本(GGV Capital)、真格基金(ZhenFund)在内的所有老股东跟投。2021-02-22 10:50:33原文链接
  • [其他] 人工智能如何可能制造危险?
    大多数研究人员认为,一个超智能AI不可能产生人类的情感,如爱或恨。他们也认为人们没有理由期望AI有意识地趋善向恶。在AI如何成为风险的问题上,专家认为有两种情况最有可能发生:AI被设计执行毁灭性任务:自驱动武器(autonomous weapon)是为杀戮而生的人工智能系统。若落入恶人手中,这些武器简简单单就能造成大量伤亡。此外,AI军备竞赛也可能无意中引发AI战争,导致大量伤亡。为了避免被敌对势力从中阻挠,这些武器的“关闭”程式将被设计得极为复杂,所以人们可能对这种局面失去控制。这种风险虽然也存在于狭义AI(narrow AI)中,但随着AI智能和自驱动水平的提高,风险也会跟着增长。AI被用来执行有益的任务,但它的执行过程可能是破坏性的:当AI的目标同我们的目标没有完全对应时,这就有可能发生。这当然并非易事。试想,如果你召唤一辆智能车将你以最快速度送到机场,它可能不顾一切地严格遵从你字面意义上的指令,即使以你并不希望的方式——你可能因超速而被直升机追逐或呕吐不止。如果一个超智能系统的任务是一个雄心勃勃的地球工程项目,它带来的负作用可能是对生态系统的破坏,并把人类试图阻止它的行为视为一个必须解决的威胁。以这些例子来看,我们对高级AI的担忧并非在于其可能产生恶意,而是它可能达到的能力。超智能AI将非常善于完成其目标,如果这些目标不与我们的目标形成一致,我们麻烦就大了。正比如,你可能并非对蚂蚁深恶痛绝,也没有踩死蚂蚁的恶意,但如果你负责水电绿色能源项目,而项目开发的所在地区有一个蚁丘会因为大水而被淹没,那只能说是算蚂蚁倒霉罢了。人工智能安全研究的一个关键目的就是要避免将人类置于和这些蚂蚁同样的位置。作者:智言科技链接:https://zhuanlan.zhihu.com/p/29994571来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
  • [数据加载及处理] 【转载】MindSpore大V博文之架构系列(五)——AI框架中数据处理的挑战与解决思路
    本文是AI框架分析专栏的第五篇,总体目录参见:AI框架的演进趋势和MindSpore的构想:金雪锋:AI框架的演进趋势和MindSpore的构想zhuanlan.zhihu.com数据处理其实在AI的训练和推理中占了很大的比重,但是业界在这一块的分析比较少,本文期望通过MindSpore实践给大家一些参考。AI框架中的数据处理在构建深度学习模型时,数据处理是我们最先面临的挑战。任务开始之前,由于数据量受限,或者为了得到更好的结果,通常需要进行数据增强操作,来获得能使网络受益的数据输入。典型的训练数据处理流程如下图所示:加载:指从各种异构存储中将训练数据加载到内存中,加载时涉及数据的访问、解析等处理;Shuffle:训练一般是多个epoch,通过shuffle打乱数据集不同epoch的数据排序,防止训练过拟合。如果数据集支持随机访问,则只需按不同顺序随机选择数据就可以非常有效地进行混洗shuffle。如果数据集不支持随机访问(或仅部分随机访问像多个文件对象),那么一个子集的数据可以加载到一个特殊的混洗缓冲区shuffle buffer中。map:完成训练数据的处理,包括图像类数据增强、Text类分词等处理。其中,数据增强是一种创造有着不同方向的“新”数据的方法,一是从有限数据中生成“更多数据”,二是防止过拟合。batch:训练时一般都是使用mini-batch的方式,即一个批次训练少量数据;batch算子负责构造一个批次的数据发送给训练;repeat:可以通过repeat的方式增加训练的总数据量;一次repeat就是加载一遍整个训练集。模型在进行推理时,同样会涉及到数据处理,典型的过程如下图所示:推理过程的数据处理,将一张图片进行解码、缩放、中心截图、归一化、通道变换等操作后,送入模型中进行推理并得到结果。与训练相比,推理时的数据转换基本一致,不同的是推理时一般加载单样本进行处理,而非数据集。本文将重点分析AI框架在数据处理时面临的挑战以及MindSpore的解决思路。难点与挑战2.1 数据处理的高效性当前各AI框架的数据处理主要利用CPU运算,训练则利用GPU/AI芯片,两者是并行的。理想情况下,应该在每轮迭代开始前,就准备好完成增强之后的数据,保持训练过程持续地进行。然而在实际的训练中,很多时候数据处理成为了阻碍性能提升的瓶颈:或是因为从存储中读取数据的速度不足(I/O bound),或是因为数据增强操作效率过低(CPU bound)。根据黄氏定律,GPU/AI芯片的算力每一年会提升一倍,相比于即将失效的摩尔定律,AI芯片的算力提升速度会远大于CPU。模型迭代计算效率的不断提升,对数据处理也提出了更高的要求:数据处理过程必须足够高效,才能够避免GPU/AI芯片因为等待训练数据而空闲。2.2 数据处理的灵活性数据处理的灵活性挑战主要体现在以下两个方面:数据集种类繁多,难以统一目前已知常用的开源数据集有几百种,每种由不同的组织/机构来产生,有各自的格式与组织方式。根据深度学习任务的不同,每种类型的输入也有自身的特点。以图像为例,其包含类型、长、宽、大小等属性信息,每张训练图像被标记成某一个类别,这些图像及其对应类别的列表数据被用来进行分类等训练;以音频为例,通过训练可以直接将语音转换为文字,进一步作为智能AI的输入,完成语义理解及指令性操作。在数据集加载时,如何支持种类繁多的图像、文本、音频、视频格式,屏蔽IO差异并将其映射到内存结构中进行下一步处理,是AI框架重点需要解决的问题。数据增强算法非常灵活,需要框架提供足够易用的接口来支持用户定制数据处理过程例如CV类场景,图像作为网络的输入,需要保证一定的一致性(如:大小、通道数、归一化等),也需要有一定的泛化能力(如:镜像、旋转、混合、颜色变换等),才能使训练得到的模型具有更好的精度。研究已经证明,采用不同的数据处理逻辑,训练得到的模型精度会有明显的不同。以resnet50和ssd为例,数据处理过程对比如下:其中既涉及到经典的数据处理逻辑,又包含了用户自定义的处理过程。AutoML和动态shape等场景,也对数据处理的灵活性提出了更高要求。所以,提供更多、更灵活的数据处理机制,也是框架需要重点考虑的。2.3 端云统一训练导出的模型,在推理时如何高效进行数据处理:网络训练生成的模型文件中,记录了训练时的计算图及权重信息,但是数据处理过程往往没有统一存储到模型中,这就导致AI工程师在使用模型进行推理时,需要重新编写数据处理代码,十分不便。端侧资源受限,需要提供更轻量化的数据处理方式:在端侧场景下,CPU和内存资源往往比较少,在提供数据处理的能力时,要求API尽可能简单、轻便,以最少的资源占用获得最快的执行效率。同时,需要AI框架提供的库尽可能的小。所以,使用云化场景提供的数据处理机制(启动慢、资源占用大)就不是特别适用。如何在不同的场景下提供最合适的数据处理方法是AI框架面临的挑战。典型的云侧场景与端侧场景资源对比如下:资源云侧端侧CPU100+核4核-8核内存250G-750G3G-8GDeviceGPU/Ascend910CPU/Ascend310MindSpore设计思考3.1 设计目标与思路MindSpore的设计中,充分考虑了数据处理的高效性、灵活性以及在不同场景下的适配性。整个数据处理子系统分为以下模块:API:数据处理过程在MindSpore中以图的形式表示,称为“数据图”。MindSpore对外提供Python API来定义数据图,内部实现图优化和图执行。整个数据加载和预处理的流程实现为多步并行流水线(data processing pipeline),包括:Adaptor:将上层语言(如Python)构建的数据图,转换为下层可执行的C++数据图(Execution tree)Optimizer:数据图优化器Runtime:运行优化后Execution tree的执行引擎数据集算子(dataset operators):Execution tree中的某个节点,对应数据处理流水线中的一步具体操作,比如从文件夹加载训练数据的ImageFolder算子,做各种数据增强的Map算子,Repeat算子等。数据增强算子(data augmentation operators):也可称为tensor算子,是对某个tensor变换的,比如Decode,Resize,Crop,Pad等,通常是被dataset operator中的Map算子调用。数据增强后的结果,通过队列和前向反向计算系统相连。下面将介绍这套子系统如何达到极致的数据处理性能。3.2 极致的处理性能多段pipeline流水线:相比于业界其他框架,MindSpore采用了多段并行流水线(multi-stage parallel pipeline)的方式来构建数据处理pipeline。这种架构一方面可以更加细粒度地规划CPU等计算资源的使用,另一方面天然支持各段使用异构硬件进行流水处理,从而提高数据处理过程的吞吐量。如上图所示,每个数据集算子(inline除外)都包含一个输出Connector:由一组阻塞队列和计数器组成的保序缓冲队列。每当一个数据集算子完成一块缓存数据的处理,这个算子会将这块缓存推送到自身的输出Connector。下游的数据集算子会从上游的输出Connector里取出缓存进行后续处理。这种机制的优势包括:数据集加载、map、batch等操作以任务调度机制来驱动,每个操作的任务互相独立,上下文通过Connector来实现Pipeline;每个操作均可以实现细粒度的多线程/多进程并行加速。数据框架为用户提供调整算子线程数/多进程处理的接口,可以灵活控制各个节点的处理速度,进而实现整个数据处理Pipeline性能最优;Connector支持用户对其大小进行设置,在一定程度上可以有效的控制内存的使用率,适用于不同网络对于数据处理速度的要求。在这种数据处理机制下,对输出数据进行保序处理是保证训练精度的关键。保序意味数据处理流水线运行时,同样顺序的原始数据输入,需要保证数据处理完成后,得到同样顺序的数据输出。MindSpore采用轮询算法来保证多个线程数据处理的有序性:在上面的数据处理pipeline示例中,保序操作发生在下游map操作(4并发)的取出操作(单线程执行)中,其以轮询的方式取出上游队列中的数据。Connector内部有两个计数器expect_consumer_记录已经有多少个consumer从queues_中取了数据,pop_from_记录了哪个内部阻塞队列将要进行下一次取出。expect_consumer_以consumer个数取余,而pop_from_以producer个数取余。在expect_consumer_再次为0时,说明所有的local_queues_已经都处理上一批任务,然后继续下一批任务分配及处理,进而实现了上游至下游map操作的多并发保序处理。数据处理与计算过程pipeline数据pipeline会不断地进行数据处理,并把处理后的数据发送到device侧的缓存;当一个step执行结束后,会直接从device的缓存中读取下一个step的数据。数据处理:负责将数据集处理成网络需要的输入,并传递给发送队列中,保证数据处理的高效取可;发送队列Queue:维护数据列队,保证数据处理与网络计算过程互不影响,实现桥梁的作用;网络计算:从发送队列中获取数据,用于迭代训练。以上三者各司其职,相互独立,构筑整个训练过程中Pipeline。这样,只要数据队列不为空,模型训练就不会因为等待训练数据而产生瓶颈。缓存技术当数据集的size较大时,无法全部加载到memory cache,此时训练中的部分数据需要从磁盘读取,可能会遇到I/O瓶颈,增大每个epoch的cache命中率就显得尤为关键。传统的缓存管理策略采用LRU策略,没有考虑深度学习数据的读取特点:在不同的epoch之间数据是重复读取的,而在同一个epoch中随机读取。每条数据的读取概率都是相同的,因此哪个数据被缓存并不是最重要的,已经cache的数据在被使用之前不被换出更加重要。针对这个特点,我们使用了一个简单高效的缓存算法:数据一旦被缓存,就不会从cache中被换出。在数据图优化的过程中,会根据流水线结构自动生成缓存算子,既可以缓存原始数据集,也可以缓存数据增强处理后的结果。3.3 灵活的定制能力整个数据处理pipeline中,用户往往需要特定的处理逻辑,这些处理逻辑有其特殊性,无法固化到框架中。因此,框架需要具备开放的能力,让用户能够订制不同的数据处理逻辑。MindSpore提供了灵活的数据集加载方式、丰富的数据处理算子、自动数据增强、数据动态Shape、数据处理Callback等机制等供开发人员在各种场景使用。灵活的数据集加载方式针对数据集种类繁多、格式与组织各异的难题,MindSpore提供了三种不同的数据集加载方式:1)如果用户使用常用数据集,那么可以使用MindSpore内置的API接口直接进行加载。MindSpore实现了包括CelebADataset、Cifar10Dataset、CocoDataset、ImageFolderDataset、MnistDataset、VOCDataset等数据集的C++ IO Reader加载,在保证性能的同时,实现了数据集的开箱即用。2)用户将数据集转换为MindSpore数据格式,即MindRecord,然后通过MindSpore的API进行加载。MindRecord可以将不同的数据集格式归一化,有聚合存储、高效读取、快速编解码、灵活控制分区大小等多种优势。3)如果用户已经有自己数据集的Python读取类,那么可以使用MindSpore的GeneratorDataset API调用该类实现数据集加载。这种方式可以快速集成已有代码,改动最小,但因为是Python IO Reader,需要额外关注数据加载性能。通过Python层自定义、C层插件的方式支持更多算子MindSpore内置了丰富的数据处理算子。这些算子可以分为C层以及Python层,C层算子能提供较高的执行性能;Python层算子可以很方便集成第三方包完成数据处理的功能,但是性能较低,好处是易开发易使用。MindSpore支持用户扩展自定义的数据处理算子,用户可以开发C层算子代码,编译后以插件的形式注册到MindSpore的数据处理中进行调用。支持自动数据增强策略MindSpore提供了基于特定策略自动对图像进行数据增强处理的机制:通过基于概率或者回调参数的数据增强策略,可以实现算子自动选择执行,达到训练精度提升的目的。例如对 ImageNet 数据集,自动数据增强最终搜索出的方案包含 25 个子策略组合,每个子策略包含两种变换,针对每幅图像都随机的挑选一个子策略组合,然后以一定的概率来决定是否执行子策略中的每种变换。这些策略包括:RandomSelectSubpolicy - 多批概率算子,随机选择其中一批执行RandomChoice - 多个算子选择其中一个执行RandomApply -基于某个概率执行这批算子通过自动数据增强操作,在ImageNet数据集上可以提升1%左右的训练精度。支持动态shapeMindSpore通过 per_batch_map支持用户自定义控制输出不同Shape的训练数据,满足网络需要基于不同场景调整数据Shape的诉求。用户自定义数据Shape生成逻辑udf,如:第n个step生成shape为(x,y,z,...)的数据;通过batch(…, per_batch_map=udf)将第一步定义的逻辑生效,最终得到不同Shape训练数据。Callback机制让数据处理更加灵活通过callback机制实现根据训练结果动态调整数据增强的逻辑,为数据增强过程提供更灵活的操作。MindSpore支持用户基于数据处理提供的DSCallback(包含epoch开始、step开始、step结束、epoch结束等)实现自己的数据增强逻辑UDF,并将其添加至map操作中,以实现更灵活的数据增强操作。3.4 端云统一架构数据图与计算图的统一MindIR是MindSpore基于图表示的函数式IR,其最核心的目的是服务于自动微分变换。自动微分采用的是基于函数式编程框架的变换方法,因此IR采用了接近于ANF函数式的语义。推理数据图典型的场景为:数据集样本大小缩放、中间截图、归一化、通道变换。我们将推理数据图以子图的方式保存至生成的模型文件(MindIR)中,那么在推理时,可以通过统一的接口加载模型中数据处理流程,自动进行数据处理得到模型需要的输入数据,简化用户的操作,提升易用性。轻量化的数据处理云侧训练时,可以被使用的资源往往比较充裕,数据处理Pipeline在运行过程中是会占用比较多系统资源(CPU和内存),以ImageNet为例,训练过程中CPU占用20%,内存占用30-50G,这显然在端侧是不可被接收的,并且数据处理Pipeline在初始化时启动会慢些,这也不适用于端侧需要快速启动、多次训练/推理的前提条件。故:MindSpore基于现有数据处理算子,提供一套更轻量化、更适用于端侧的API,解决云化场景数据处理Pipeline不适用于端侧的问题。MindSpore基于Pipeline调整架构,支持数据处理单算子独立使用(Eager Mode),支持各种场景推理,提供给AI开发人员更大的灵活性;同时,将Pipeline轻量化,实现基于Pull Base的轻量化pipeline,减少资源占用并且处理速度快。通过上述两种方法,MindSpore保证了统一的数据处理架构支撑多种不同的应用场景。未来计划在未来,MindSpore将继续完善数据处理的易用性,提供更丰富的算子和内置数据集。与此同时,探索大规模数据处理的加速技术,包括:资源自适应分配当前各数据增强算子使用的处理线程数目由用户手工配置,对用户的调优经验要求极高。通过自适应判断Pipeline瓶颈,由框架给各个数据增强算子合理分配CPU资源,可以在训练过程中动态优化数据处理性能,免去用户繁琐的调优过程。异构硬件加速当前的数据处理Pipeline操作在CPU执行,一旦出现瓶颈,带来AI芯片/GPU等待空闲,用户无法充分利用所有硬件的计算能力。MindSpore期望构建用户无感知的异构硬件资源调度能力:通过监测硬件资源使用,完善Ascend/GPU上的数据处理算子,采用代价模型自适应地将数据处理任务调度至合适的资源,实现异构硬件的充分利用。分布式缓存当前如GPT-3等网络的训练需要使用超大规模数据集,这些数据难以在本地存储,直接从OBS读取会受网络IO限制而影响性能。与此同时,在AutoML场景下,用户经常在集群中运行同一类模型的多个作业(只是超参设置不同),每个作业独立进行数据加载和处理效率极低。MindSpore期望构建分布式缓存能力,加速这些场景下的数据处理。广告时间(参与MindSpore开源社区,成为AI开发者):https://gitee.com/mindspore/mindspore (二维码自动识别)MindSpore官网:https://www.mindspore.cn/MindSpore论坛:https://bbs.huaweicloud.com/forum/forum-1076-1.html代码仓地址:Gitee-https://gitee.com/MindSpore/MindSporeGitHub-https://github.com/MindSpore-ai/MindSpore官方QQ群: 871543426转自文章链接:https://zhuanlan.zhihu.com/p/352487023转自作者:金雪锋感谢作者的努力与分享,侵权立删!
总条数:6468 到第
上滑加载中