• [互联网] Cloud X可能打开魔盒,成为5G时代杀手级应用!
    伴随移动产业的不断演进从2G、3G、到4G一个个杀手级应用(Killer Application)应运而生成为时代的宠儿比如短信业务之于2G微信、Facebook等之于3G抖音等视频类业务之于4G5G已来,下一个杀手级应用在哪里?运营商的新蓝海在哪里?华为Wireless X Labs认为,在5G初期Cloud X有望成为5G时代的杀手级应用。X可以是PC,可以是Gaming、AR/VR,或者更多。云电脑Cloud PC它是一种应用、一种消费升级,也是一种新商业模式。从应用角度讲,云电脑实现了带宽换计算、带宽换存储。家里久置不用的台式机、笔记本统统可以退休,手机实现投屏,随时随地实现PC功能。这和当今最火的分时租赁消费模式又如出一辙:需要时申请资源,退出时大部分资源释放留给他人。在网联过程中GUI完全通过互动视频流形式呈现,因此网络质量会成为业务使用的基础。要想不卡顿地完成基本的PPT写作,10Mbps的稳定带宽是必不可少的。如果是做视频、图形渲染,更需要百兆带宽推波助澜。或许很多人会有疑问,PC是过去式,5G的介入又会掀起多大涟漪呢?不妨把目光放长远些:从1958年第一个电子游戏到如今最新的XBOX和PlayStation游戏主机,他们谱写了无数玩家心中端游(主机游戏、PC游戏,非手游或页游)的编年史。而在60年后的5G来临前夕,端游的编年史可能会开启一个新篇章—云游戏(Cloud Gaming)。云游戏Cloud Gaming它比Cloud PC更高级,要在云端完成本地的、复杂的渲染计算,通过网络实时反馈游戏画面。玩家只需要一种输入输出设备(传统的鼠标键盘或是无线手柄),以及一块屏幕,就能享用。这既实现端游的跨平台适配问题,又降低游戏者的门槛,玩家只需体验游戏就好。端游的内容大多是画面精美、故事性完整、体验丰富的3A大作,玩家往往具备双倍于手游的付费意愿。2009~2010年间,从云游戏平台出现,经过一轮的炒作、淘沙,期间可能得益于云技术的成熟、成本降低以及网络能力的提升,现在可能跨越裂谷,冲击商业成功。以中国市场的云游戏平台格来云为例。为了满足实时性需求,720p 30fps的游戏需要10Mbps以上的带宽,20ms的时延。这还不仅仅是端游的降维体验,要真正发挥端游的魅力,2K~4K、60fps的图像必不可少。如此,100~200Mbps+20ms的SLA保障网络,是游戏愉悦以及持续付费的关键。成为杀手业务的关键—新商业模式以上Cloud PC、Cloud Gaming的基本模式都是通过网络连端和云,实现所谓的瘦客户端+宽管道+云应用的新业务。从体验需求到技术匹配,5G的低时延、大带宽的eMBB特性,可保障的网络,以及运营商贴近边缘的架构等都是实现Cloud+Something业务的基础,这也正好是我们试图进入的体验经营模式典型特征。我们把这类业务和商业模式统称为Cloud X,他可以是5G初期正在萌芽的Cloud PC和Cloud Gaming,也可以是我们一直在探索的Cloud AR和VR。运营商在Cloud X模式中,可以从参与到基本的连接体验,扩展到云的IaaS:甚至直接集成各类云端运行的应用— —犹如一个小程序的入口,Cloud X的logo下各种5G的新业务魔盒,从此打开。5G可能开启一个全新的云网协同时代,通过运营商的云端能力和体验保障的连接,产生新的价值。更多信息,请关注华为5G+X 联创营:https://developer.huaweicloud.com/techfield/5g.html5G云市场:https://marketplace.huaweicloud.com/markets/5GtoB/AI云市场:https://marketplace.huaweicloud.com/markets/ai/机器视觉云市场:https://marketplace.huaweicloud.com/markets/holosensstore/index.htmlIOT云市场:https://marketplace.huaweicloud.com/markets/iot/混合云云市场:https://marketplace.huaweicloud.com/markets/hcs/鲲鹏云市场:https://marketplace.huaweicloud.com/markets/kunpeng/
  • [其他] 深度解读华为云智能企业云应用平台
    企业应用上云的过程中,智能云基础设施极大提升了资源获取与运维的效率,但应用自身的开发、部署与运维仍然繁琐与低效。同时,人工智能,边缘计算,区块链等新技术正逐渐进入企业核心业务流程,企业应用需快速和新技术结合产生更大商业价值。针对这些需求,华为云推出智能企业云应用平台,其构建在智能云基础设施之上,提供一个应用底座和三个创新解决方案,为企业业务创新保驾护航。一个应用底座:全栈云原生应用开发与管理,敏捷高效,快速DevOps全栈云原生应用开发与管理包括容器、微服务框架、云中间件、压测、APM等系列产品,涵盖应用开发、编译、构建、部署、测试、发布、上线、运维等应用全生命周期管理,让客户更聚焦自己的业务逻辑,敏捷开发与运维。首先是容器,华为云推出GPU共享型高性能AI容器,通过深度优化K8S容器调度引擎,能够为容器中的AI计算任务分配更细粒度的GPU资源,实现多个AI计算任务共享GPU,在部分AI计算如推理类场景中能够实现更高的资源利用率,从而大幅降低AI计算成本,让大家用得起AI。AI容器承载于裸金属之上,加上100G网络能力,让GPU充分发挥大规模并行计算的优势,深度学习的训练比传统GPU加速性能提升3-5倍,让大家用得好AI。支持业界主流的GPU和深度学习框架,与华为自己的AI芯片和EI学习、推理平台结合有更大幅的性能提升和成本降低。对于微服务,企业客户更关注自身业务的安全隔离,为此华为推出专享版微服务引擎,为每个租户提供物理级隔离的服务注册、配置和治理,单租户管理规模10倍提升,让企业客户用得放心。云化分布式应用的运维是个难题,华为云已经发布的APM可以实时监控并管理企业应用性能和故障,帮助企业快速解决分布式架构下问题定位和性能瓶颈分析难题,改善用户体验。在此基础上,华为突破了从端(Mobile/Brows)到云应用(Server)的分布式调用链追踪技术,可以通过全链路跟踪快速还原问题现场,分钟级定位代码性能瓶颈,让客户用得省心。三个创新解决方案:智能边缘云,ROMA和区块链服务智能边缘云IEF,边云协同,云的能力向边延伸据IDC统计预测,到2020年将会有超过500亿的设备和终端联网,其中超过50%的数据需要在网络边缘侧分析、处理与存储。所以云数据中心的架构不再是全球若干个集中的数据中心,中心云+边缘云更加符合工业世界的需要。基于边缘云服务,可以通过中心云建模分析与边缘云实时决策的结合,实现高质量、高性能、实时的处理。华为智能边缘平台IEF将云的能力向边延伸,在边缘侧融合了计算、网络、存储、应用服务和AI能力,就近提供边缘智能服务。华为云与边缘服务基于同一平台、生态一致, 应用和服务构建一次,随处可运行。华为云IEF Service对边缘上的应用和服务进行统一的部署和管理,在边缘上提供从芯片、网络、边缘设备到服务全栈能力,同时,平台着力构建一个开放的生态,除了华为自身的边缘硬件如智能小站之外,还支持第三方边缘节点、设备和第三方服务的接入。企业业务集成平台ROMA,连接IT与OT,打通应用和数据孤岛企业的数字化要求企业实现广泛的开放和连接,这里连接包含多个层面:1.连接IT与OT,将IT数据和物理设备数据融合,消除数据鸿沟,打通数据价值边界2.连接应用和数据,打通数据孤岛,让信息自由流动3.连接云上云下,打通公有云和私有云甚至多云,打通企业能力边界4.连接生态伙伴,建立企业API经济和生态,依靠生态链联合创新和共享价值以华为自己的流程与IT系统为例,需要连接8个区域,170+个国家,1100+个应用,100+个生态伙伴,数十万设备。为提高连接和集成效率,华为打造了ROMA集成平台,用于自身的企业IT应用,现在以云服务的形式提供给我们的客户。ROMA支持海量数据接入,多协议、多厂商,支持千万级活跃设备,数据接入之后进行数据转换与调度,支持20+种数据源灵活转换,如各种关系型数据库,NoSQL数据库,存储,消息,API等,支持可视化路由及规则设计,简单易用。通过ROMA集成云上云下、多IT系统、外部客户与伙伴,在云端统一管理,极大提升集成效率。区块链服务BCS,链接价值,使能企业可信交易区块链技术对于企业建立对等的可信交易,同时保护自己的数据隐私,极具价值。华为是区块链技术的先行者之一,华为不仅大力投入开源社区推动区块链技术发展, 同时致力于可商用的区块链平台的建设,帮助企业客户在华为云上快速、高效的搭建企业级区块链行业应用。华为云区块链服务于10月10号正式商用,基于华为云全栈安全能力,通过分层加密、国密支持、同态加密和零知识证明等安全技术,全面保护区块链系统的账户、节点、账本和数据,确保用户和交易信息安全。华为云区块链可以同时在线上线下部署,也可以与第三方区块链互通,通过新推出的Fabric JDBC,可以让企业像使用数据库一样使用区块链,降低使用门槛。华为云区块链服务将致力于安全,交易性能,多链平台互通等方向上持续寻求突破,和合作伙伴与客户一起,通过区块链构建可信数字经济的基石。
  • [其他] 华为EI和HiAI概览
    企业智能(EI)• 企业有供应、制造、仓储、物流、推荐、风控等各子系统,场景非常复杂,华为的实践,就是把AI,与这些生产系统相结合,发生化学反应,让AI单点技术的进步,变成促进企业生产系统的进步,因为AI本身不是产品,需要与业务场景结合,才是有价值的。• 企业的生产+AI,我们叫EI(Enterprise Intelligence),EI就是企业的数据与算法、算力结合的实践。华为做为一个企业,不仅涵盖了 供应、制造、仓储、物流、报关等大多数制造业的典型过程,而且华为手机的电商平台,也覆盖了营销推荐、实时风控等子系统。• 在华为EI的实践过程中发现,有两个挑战,几乎每个场景都遇到:1)数据,通常不是非常小、也不是非常大,是选择传统的抽样模型,还是用深层网络模型,用哪一个投入产出最优? 实践后发现,有的生产系统,如供应链装箱,用统筹最优解算法最合适,而图片勘察、计算机视觉验收类,用深层网络模型最优。2)深层网络模型本身,模型调优很费力,具体又有两方面,第一是人的要求,要很有耐心、很细致、类似工匠精神的专家,第二是,要有随时可以获得的、强大的计算力,尤其在多任务并行时的稳定性、层数到一定深度后,还容易出现内存溢出等。• 在这张片子上的场景,都已经过华为自身实践、且有实际效果的服务,如智能装箱……• 现在这些服务,以华为云服务的方式开放出来,让更多的企业,可以站在华为实践过的肩膀上,使用AI,而不需要操心刚讲的两大问题,直接调用相应的服务API。华为云EI企业智能整体解决方案华为云EI服务华为EI服务• EI大数据提供:数据接入服务,云数据迁移,实时流计算服务,MapReduce服务,数据湖探索,表格存储服务等。• EI基础平台:ModelArts,深度学习服务,机器学习服务,慧眼HiLens,图引擎服务,视频接入服务。• 对话机器人:智能问答机器人,任务型对话机器人,智能质检,定制化对话机器人服务。• 自然语言处理:自然语言处理基础,内容审核-文本,语言理解,语言生成,定制自然语言处理,机器翻译服务。• 语音交互:语音识别,语音合成,实时语音转写。• 视频分析:视频内容分析,视频编辑,视频质量检测,视频标签,视频背景音乐识别。EI基础平台• ModelArts助力华为自动驾驶平台,高效管理AI数据处理流程,包括采集、筛选、混合标注和数据溯源,大大缩减了数据处理时间。利用分布式集群训练,提升了模型训练效率。40T原始数据处理从8000人天缩短到80人天,AI模型开发周期从数月缩短到数周。• 深度学习服务:DLS(Deep Learning Service)是基于华为云强大高性能计算提供的一站式深度学习平台服务,内置大量优化的神经网络算法模型,以兼容、便捷、高效的品质帮助用户轻松使用深度学习技术,通过灵活调度按需服务化方式提供模型训练、评估与预测。• 慧眼HiLens:HiLens端云协同AI平台为个人开发者、企业和设备生产厂商提供了一整套安全可靠的一站式人脸识别、视频分析、语音、文字识别等基础技能开发、部署和管理服务。• 图引擎服务:GES(Graph Engine Service)是针对以“关系”为基础的“图”结构数据,进行查询和分析的服务。广泛应用于社交关系分析、营销推荐、舆情分析、防欺诈等场景。• 批处理服务(Batch Service)是一种用于运行大规模并行批处理作业的分布式云计算服务。支持海量任务的自动调度、资源管理和数据加载,可广泛应用于深度学习、基因检测、视频分析等大规模并行计算场景。• 并行高效支持大规模的并行批处理作业,自动高效完成资源调度、任务发放和数据加载。• 便捷易用结合华为云上已有服务,提供丰富便捷的作业调度方法,方便用户快速实现已有流程上云,无需复杂编程即可配置云上负载。• 完全托管自动完成资源管理,数据加载和作业调度,用户可将批处理计算中的资源调度和流程调度完全托管给批处理服务。• 成本控制无需软硬件资本投资和人工运维,通过免费的批处理服务,可以直接使用云上资源,按需动态分配资源,按资源实际使用量计费。EI大数据• 智能数据平台• 智能数据平台面向企业数字化运营诉求,提供一站式智能数据管理能力,帮助企业快速构建从数据接入到数据分析的端到端智能数据系统,消除数据孤岛,统一数据标准,加快数据变现,实现数字化转型。• 提供包括异构数据接入、融合智能计算、数据分析服务、可视化数据开发治理能力,帮助各行各业企业构建数字化运营能力,加快数据变现。• 优势• 一站式数据管理:可视化数据建模,支持行业主题数据模型快速构建。• 智能ETL:标准SQL融合AI能力,快速实现非结构化数据标准化。• 开放兼容:所有组件完全兼容开源接口,已有业务无缝迁移。文字识别• 文字识别(Optical Character Recognition),就是将图片或扫描件中的文字识别成可编辑的文本。可代替人工录入,提升业务效率。支持身份证、驾驶证、行驶证、发票、英文海关单据、通用表格、通用文字等场景文字识别。• 用户认证识别:降低用户实名认证成本,准确快速便捷。• 财务报销审核:用于公司员工发票报销,票据自动识别,节省人工录入成本,提升效率。• 金融保险:用户申请保险报销,需提供身份证、报销单、医疗单据等纸件材料。通过OCR服务可实现信息的自动录入和审核校对,提升效率。• 海关单据电子化:很多公司都存在海外业务,通用OCR服务可实现海关单据数据自动结构化和电子化,提升效率和录入信息准确度。图像识别• 图像识别(Image Recognition),基于深度学习技术,可准确识别图像中的视觉内容,提供数万种物体、场景和概念标签,具备目标检测和属性识别等能力,帮助客户准确识别和理解图像内容。• 场景分析:图像的内容标签缺乏,导致用户检索效率较低。图像标签功能可准确识别图像内容,提高检索效率和精度,从而使得个性化推荐、内容检索和分发更为有效。• 智能相册:基于图像识别出的数万个标签,智能相册可以自定义分类,比如“植物”、“美食”、“工作”等类别。方便用户管理相册,带来良好体验。• 目标检测:在建筑施工现场,基于定制化的图像识别目标检测系统,可实时监测现场人员是否佩戴安全帽,以降低安全风险。• 图像搜索:海量图片库的搜索较为麻烦。基于图像标签的图像搜索技术,不管用户输入关键字,还是输入一张图像,都可以快速搜索到想要的图像。内容审核 Moderation• 内容审核(Content Moderation),基于图像、文本、视频检测技术,可自动检测涉黄、广告、涉暴、涉政等内容,帮助客户降低业务违规风险。• 内容审核:不合规内容的识别和处理是UGC类网站的重点工作,基于内容检测,可以识别并预警用户上传的不合规内容,帮助客户快速定位处理,降低业务违规风险。• 视频直播:在互动直播场景中,成千上万个房间并发直播,人工审核所有直播内容几乎不可能。基于图像检测能力,可对所有房间内容实时监控,识别可疑房间并进行预警。• 清晰度检测:某些业务场景需要用户上传照片,而照片的清晰度将影响后续业务处理。基于图像清晰度检测技术,可以自动对图像的清晰度进行判断并量化,减少二次上传。• 构图评价:某些业务场景需要用户上传高质量照片,而倾斜、变形、构图差的照片将影响后续业务处理。基于构图评价技术,可以对构图质量进行判断,减少二次拍摄和上传。交通智能体• 优势:• 数据全面和深入挖掘,全面融合互联网、交通大数据,深入挖掘大数据价值。• 全域协同与人车协同计算,实现整个区域的交通流量最大化,区域内车辆等待时间最小化。协调车辆和行人的通行需求,实现车辆、行人有序通行。• 实时信号灯调度,业内首家实现了交通智能体和信号管控平台的安全通讯接口标准制定。• 精确车辆行车轨迹预判,精准预测车辆的行车轨迹需求,提前规划通行路线。• 全时段:交通事件7x24小时全域、全时段感知。• 智能:区域协同信号优化。• 完备:关键拥堵点识别、关键拥堵路径识别、拥堵扩散分析。• 预测:人群密度预测,掌握人群迁移大交通规律。• 精准:交通路况7x24小时全面、精准掌握。• 便捷:实时信号灯调度,按需放行。• 可视:提交通态势大屏,所见即所得。• 精细:重点车辆管控,精细化管理。园区智能体• 从人防到智防:基于人工智能的智能防护,减轻安保人员压力。• 从刷卡到刷脸:刷脸无感通行,自动打卡,再也不怕忘带卡。• 从担心到安心:强大失物追踪分析能力,智能让员工和业主更加放心。• 应用实践:• 园区门禁:利用人脸检测和识别技术精确识别来访者的身份,快速返回识别结果;实现门禁更高的通行吞吐率、园区的自动化管理。• 安全区域监控:通过入侵检测、徘徊检测、遗留物检测等技术可实现对受控区域进行监控;保障园区的生活生产安全。• 智慧停车:通过车辆车牌识别、轨迹跟踪服务实现园区车辆出入管控、线路管控、车辆违停管理、停车位管理等。工业智能体• 三大转变:• 从人工经验到数据智能:基于数据挖掘分析,从数据中获取提升效率和产品质量的新经验。• 从数字化到智能化:智能分析能力,成为企业数字化的新动力。• 从产品生产到产品创新:企业内从产品设计到销售的数据协同,以及产业链上下游数据协同,创造新的竞争优势。• 应用实践:• 产品质量优化提升:基于客户的反馈、互联网点评分析、竞争对手分析、维修记录、售后历史数据,进行分类分析,发现产品关键问题,指导新产品设计改善,提升产品质量。• 智能设备维护:预测性维护,根据系统过去和现在的状态,采用时间序列预测、神经网络预测和回归分析等预测推理方法,预测系统将来是否会发生故障,何时发生故障,发生故障类型,可以提升服务运维效率,降低设备非计划停机时间,节约现场服务人力成本。• 生产物料预估:基于历史物料数据,对生产所需物料进行准确分析预估,降低仓储周期,提升效率。深度算法优化,基于业界时间序列算法模型,并结合华为供应链深度优化。汽车智能体• 三大转变:• 从事后发现到实时监控:车辆状态和位置实时监控,降低安全隐患,减少成本浪费。• 从人防到智防:AI为安全驾驶和乘车安全保驾护航。• 从人工到智能:智能规划、智能机器人解放双手。• 应用实践:• 生物钥匙:通过红外摄像头及基于边缘和云端的深度学习能力,通过对车主正面面部图像的3D建模,完成人脸识别和活体检测,精确识别驾驶员的身份,完成车主信息的快速匹配。• 电子围栏:实时判断车辆位置是否在指定区域,超出区域进行告警。• 实时路径规划:利用高效近似图算法,实时进行站点估算和规划;基于规划的站点进行实时路径规划,满足加班车、企业拼车、物流配送等场景。• 智能对话机器人:基于深度学习和知识图谱的自然语言理解平台,提供精准的智能问答,使能销售助理、保养推荐、故障问答、车险营销等场景。ModelArts• 自动学习:自动学习功能可以根据标注数据自动设计模型、自动调参、自动训练、自动压缩和部署模型,不需要代码编写和模型开发经验。• 端-边-云:端-边-云分别指端侧设备、华为智能边缘设备、华为云。• 在线推理:在线推理是对每一个推理请求同步给出推理结果的在线服务(Web Service)。• 批量推理:批量推理是对批量数据进行推理的批量作业。• Ascend芯片:Ascend芯片是华为设计的高计算力低功耗的AI芯片。• 数据准备效率百倍提升,内置AI数据框架,通过自动预标注和难例集标注相结合,提升数据准备效率。• 训练耗时大幅度降低,提供华为自研MoXing高性能分布式框架采用级联式混合并行,梯度压缩,卷积加速等核心技术,大幅度降低模型训练耗时。• 支持将模型一键部署到端,边,云各种设备和场景下,可以同时满足高并发,端边轻量化多种需求。• 匠心打造全流程管理,提供数据,训练,模型,推理整个AI开发周期全流程可视化管理,并且支持训练断点重启,训练结果比对和模型溯源管理。• AI市场,支持数据和模型共享,可帮助企业提升团队内AI开发效率,也帮助开发者实现知识到价值的变现。ModelArts产品优势• 企业级:支持海量数据的预处理和版本管理,支持端、边、云多场景模型部署,实现AI开发全流程的可视化管理,提供AI共享平台,帮助企业构筑内外部AI生态。• 智能化:支持模型自动设计,可根据部署环境和推理速度要求,自动训练出模型,支持图像分类和物体检测场景的自动建模,支持结构化数据自动特征工程和自动建模。• 高性能:自研MoXing深度学习框架,提升算法开发效率和训练速度,优化深度模型推理中GPU的利用率,加速云端在线推理,可生成在Ascend芯片上运行的模型,实现高效端边推理。• 数据准备效率百倍提升,40TB数据处理:8000人天->80人天。• 模型训练耗时大幅度降低,算法优化,计算快,简化调参,典型RestNet-50网络下,1000GPU集群,训练加速比0.8。• 模型一键部署到云,边,端。• AI模型部署:边缘推理,在线推理,批量推理。• 用AI方式加速AI开发过程——自动学习:UI向导,自适应训练。• 快亦有道——匠心打造全流程管理:开发流程自动可视化,训练断点重启,训练结果轻松比对。• AI共享——帮开发者实现AI资源复用:企业内共享,达到效率提升。AI共享平台(数据,模型,应用),外部市场(开放生态)。ModelArts功能介绍• 数据治理:支持数据筛选、标注等数据处理,提供数据集版本管理,特别是深度学习的大数据集,让训练结果可重现。• 极“快”致“简”模型训练:自研的MoXing深度学习框架,更高效更易用,大大提升训练速度。• 云边端多场景部署:支持模型部署到多种生产环境,可部署为云端在线推理和批量推理,也可以直接部署到端和边。• 自动学习:支持多种自动学习能力,通过“自动学习”训练模型,用户不需编写代码即可完成自动建模、一键部署。• 可视化工作流:使用GES(图引擎服务)统一管理开发流程元数据,自动实现工作流和版本演进关系可视化,进而实现模型溯源。• AI市场:预置常用算法和常用数据集,支持模型在企业内部共享或者公开共享。ModelArts应用• 图像识别,视频分析,语音识别,异常检测。• 适用场景:• 图像识别:准确识别图片中的物体分类信息,比如动物识别、品牌Logo识别、车型识别等。• 视频分析:准确分析视频中的关键信息,比如人脸识别、车辆特征识别的场景应用。• 语音识别:让机器理解语音信号,协助处理语音信息,适用于智能客服问答、智能助手等。• 产品推荐:根据客户本身属性和行为特征等,为客户提供个性化的业务推荐。• 异常检测:在网络设备运行中,用自动化的网络检测系统,根据流量情况实时分析,预测可疑流量或可能发生故障的设备。• 未来将会在数据增强,模型训练速度,弱监督学习等方面持续发力,将进一步提升AI模型开发效率。ModelArts开发类型• 所有的均建议搭配:对象存储服务OBS。• 零基础建模:• 面向对象:业务开发者:有AI应用诉求,但无AI开发能力,不熟悉AI开发语言框架,无法自己建模。• 特性:提供自动学习功能,可根据标注数据自动设计模型、自动调参、自动训练、自动压缩和部署模型,不需要代码编写和模型开发经验,即可实现零基础构建AI模型。• 支持场景:当前自动学习支持快速创建图像分类、物体检测和预测分析模型,新模型类型不断增加中。• 快速建模:• 面向对象:AI初学者,具备基础AI能力,缺乏完整AI开发能力,能够使用常用AI开发框架和开源工具进行简单模型创建。• 特性:ModelArts预置了多种已经训练好的算法,您可以上传自己的业务数据,根据业务选择对应的预置算法,并进行重训练,无需编写代码即可快速生成模型,并进行模型部署。• 支持场景:预置图像分类、物体检测和图像分割三种类型的算法,您可以基于实际应用需求,选择对应模型创建训练作业,从而得到您需要的模型。新预置模型不断扩展中。• 标准模型开发:• 面向对象:AI工程师和专家,具备完整的AI开发能力,多年AI开发经验,具备丰富的模型开发和调优能力。• 特性:ModelArts集成了Jupyter Notebook,您可以通过创建开发环境,自行编写模型训练代码和调测,然后使用编写好的训练代码创建训练作业,进行模型的训练和部署。 ModelArts支持数据集、训练作业及模型的多版本管理,还提供了数据集、训练作业、模型及服务演进过程溯源图,实现AI开发工作流可视化,让您轻松管理AI开发流程,提升AI开发效率。• 支持场景:支持深度学习和传统机器学习的自定义模型开发和部署。HUAWEI HiAI• HiAI是面向移动终端的AI能力开放平台,构建三层AI生态:服务能力开放、应用能力开放和芯片能力开放。端芯云结合的三层开放平台为用户和开发者带来更多的非凡体验。• 芯:优化原声特性,芯片能力开放 - 轻松获得NPU加速让性能最佳。• 端:APP智能化,应用能力开放 - 让App更加智慧强大。• 云:提供按需服务,服务能力开放 - 让服务主动找到用户。HiAI Foundation概述• HiAI Foundation API是移动计算平台中的人工智能计算库,该计算库面向人工智能应用程序开发人员,让开发者便捷高效地编写在移动设备上运行的人工智能应用程序。HiAI Foundation API将作为统一的二进制文件发布。这组API主要作用是通过HiAI异构计算平台来加速神经网络的计算,当前仅支持在Kirin SoC上运行。使用HiAI Foundation API,开发人员可以专注于开发新颖的AI应用程序,而不用关注针对计算的性能调优。HiAI Foundation API集成到Kirin SOC芯片上,为开发者提供基于移动设备的运行环境和调试工具,开发者可以在移动设备中运行神经网络模型,调用HiAI Foundation API进行加速计算。HiAI Foundation API无需安装,使用移动设备默认镜像即可支持相关集成、开发和验证。HiAI Foundation功能介绍• 主要功能:• 提供常用的人工智能业务功能API,可在移动设备上高效运行。• 提供了一个与处理器硬件无关的加速API,应用厂商和开发者可以在HiAI异构加速系统上加速模型计算、算子计算。• 基本功能:• 支持模型编译、模型加载、模型运行、模型销毁等AI模型管理接口。• 支持基本的算子计算接口,包括卷积、池化、全链接等接口。HiAI Foundation技术介绍• 支持针对神经网络模型运算的专用AI指令集,可以用最少的时钟周期高效并行执行更多的神经网络算子。• 通过工具可以把神经网络各种算子,比如卷积、池化、激活、全链接等离线编译成NPU的专用AI指令序列,同时将数据和权重重新摆放,指令与数据融合在一起生成离线执行模型。在离线编译的时候,可以把前后层(卷积、Relu、Pooling)能够融合的算子进行层间融合,这种方式可以减少DDR的读写带宽,提升性能。• 能够把神经网络模型中的相关数据(Batch、 Channel、 Height、 Width)以最高效的方式重新摆放,特别是Feature Map的通道数据,在做卷积运算的时候,对于通道相关联的计算效率会得到大幅提升。• 支持稀疏化模型加速。在不损失计算精度的前提下,对权重进行置零稀疏优化,NPU可以跳过系数为零的乘加运算,极大地提高了计算效率,同时也降低了带宽。HiAI Foundation执行介绍• 将标准的神经网络模型(Caffe等)编译转换为离线模型,编译的主要目的是对网络配置进行优化,生成优化后的目标文件,即离线模型,离线模型是序列化的存储在磁盘上,这样,神经网络前向计算时,可以直接使用优化后的目标文件进行计算,速度更快。• HiAI Foundation支持多种智能平台框架,包括Caffe、Tensorflow等,使用不同的智能平台框架,第三方需要在接口中指出本次计算需要使用的具体的智能平台框架,其他接口和参数无需修改。HiAI Foundation支持绝大部分模型和神经网络算子,并持续优化与完善。HiAI DDK概述• HiAI API集成在使用Kirin SoC芯片的android系统上,开发者可以在集成环境中运行神经网络模型,调用HiAI API进行加速计算。• HiAI DDK(Device Development Kit)是海思发布的人工智能计算SDK,该SDK面向人工智能应用程序开发人员和机器学习算法人员,通过使用HiAI DDK,可以更好的提升移动端机器学习模型运行速度。• DDK包说明• app_source为Android demo app的源码。(提供了从输入前处理到模型加载、模型前向计算、前向计算结果后处理、模型卸载、时间统计等一系列sample code示例,同时提供了同步,异步方式的sample code。)• DDK为HiAI开放的SDK。• Document为开发参考文档。• tools为Caffe/Tensorflow离线转换工具以及算子兼容性评估及分割工具。HiAI Engine• HUAWEI HiAI Engine为应用能力开放,轻松将多种AI能力与App集成,让App更加智慧强大。应用能力开放包括:• 1. CV引擎:CV,即计算机视觉,计算机能够模拟人的视觉系统感知周围环境,判断、识别、理解空间组成。能力包括图像超分、人脸识别、物体识别等。• 2. ASR引擎:ASR,即自动语音识别,将人的声音转化为文本,便于计算机进一步进行解析理解。能力包括语音识别、语音转换等。• 3. NLU引擎:NLU,即自然语言理解,与ASR有机结合,让计算机理解人的声音或文本,进行沟通或自然的动作。能力包括分词、文本的实体识别、情感偏向分析,机器翻译等。HiAI Service• 快服务智慧平台:聚合开发者的内容和服务,为华为终端产品提供第三方的直达服务。• 小艺对话开发平台:端到端地为开发者提供对话服务的开发、测试和部署的平台。快服务智慧平台介绍• 华为快服务智慧平台,是华为终端提供的面向开发者的原子化服务接入和分发平台。快服务智慧平台接入开发者的内容和服务,通过统一的服务分发策略,向华为泛终端(手机、平板、智能音箱、PC等)和终端上的媒体入口(如:手机上的华为智能助手、全局搜索、智慧视觉等)提供服务;实现服务一点接入,全场景和多入口精准分发。• 通过华为快服务智慧平台,为终端用户带来更便捷和高质量服务用户体验的同时,也可以基于华为终端的超级入口和海量用户,为开发者引入高流量。• 华为快服务智慧平台的业务架构如下所示:• 快服务(Ability),是连接用户意图与原子化服务之间的桥梁,开发者在快服务智慧平台的开发者门户定义服务,用户可以在华为的各个终端和媒体入口来使用快服务。• 例如:某开发者可以提供每日天气查询、空气质量查询等天气信息服务。开发者在华为快服务智慧平台上将天气信息注册成为快服务,用户在华为泛终端上就可以通过语音或者卡片查看天气相关信息。• 华为快服务包括直达应用类服务(APP Ability)、卡片类服务(Card Ability)、内容接口类服务(Content Ability)、对话类服务(Conversation Ability)四种类型。快服务分类• 意图(Intent):用于表达用户想要达成的目标或完成的任务,比如:打车、查看天气等。快服务智慧平台中,意图有唯一标识和一个或多个描述意图的参数,并且和开发者的服务进行关联。• 开发者在注册快服务的时候,需要选择以下几种触发方式来对意图实例化:• 关键词触发:用户通过文本关键词表达意图,当用户的意图表达和快服务定义的关键词或意图匹配后会触发该快服务;例如:用户在负一屏通过文本搜索百科。• 语音触发:用户通过语音表达意图,当用户的意图表达和快服务定义的关键词匹配后会触发该快服务;例如:用户通过语音助手查询天气。• 图片触发:用户通过相机拍照识别等方式表达意图,当用户的意图表达和快服务关联的意图匹配后触发该快服务;例如:用户通过智慧识屏来识别花的名称。• 扫一扫触发:用户通过扫描二维码、条码等方式表达意图,当用户的意图表达和快服务关联的意图匹配后触发该快服务。• 事件触发:开发者定义的基于时间、地理位置等事件意图触发规则,当事件发生时触发快服务,来满足用户的意图。例如:航班延误事件发生时触发通知,让用户及时了解航班动态信息,满足用户的航班查询意图。快应用• 对于终端用户:快应用是一种新型免安装应用。不仅具有安卓应用体验好、功能强的优点,还具备HTML5网页自动更新、占用内存少的便捷。用户可以将喜欢的快应用添加至桌面,方便再次访问。• 对于开发者:快应用是一种基于行业标准开发的新型免安装应用,使用前端技术开发成本低,可以调用设备能力用户体验好。拥有十大手机厂商的助力,获取新客成本低、留存率高。快应用服务场景• 应用市场首页专区和活动页:华为应用市场,可以从“快应用”专区进入,或者点击顶部活动区图片,进入精选快应用专区。• 应用市场、快应用中心、游戏中心搜索:在应用市场、快应用中心和游戏中心的搜索框中输入对应的关键字,点击搜索到快应用的“打开”。• 快应用管理和快应用中心:• 打开华为应用市场,选择“管理”页签,选择“快应用管理”进入“快应用中心”,可快速访问使用过的快应用(“快应用中心”可以添加至桌面)。• 长按快应用,可以将该快应用添加到桌面、置顶、分享、管理其权限和数据以及将快应用从“快应用中心”删除。• 添加到桌面网页跳转快应用:无论网页在社交平台还是在浏览器中,都可以通过发送一个分享链接打开快应用或快应用中的某一个页面,并可添加到桌面留存。
  • [行业动态] 华为云EI,让人工智能无所不及
    华为第十六届全球分析师大会在中国深圳召开。在“让Cloud无处不在,让AI无所不及”的主题论坛上,华为云EI服务产品部总经理贾永利发表了《让AI无所不及》的主题演讲,分享了华为全栈全场景AI在使能企业智能化转型过程的创新解决方案及相关行业实践。全栈全场景AI解决方案让智能无所不及当前,AI的应用正在从企业单个业务场景复制推广到更多部门,从先行者的小范围探索到行业企业的全面布局,与此同时,与AI相关的技术发展和演进速度也非常之快,新的AI算法不断刷新已有纪录,计算框架也不断出现。在发展迅猛的趋势之下,企业在探索和使用AI的过程中也遇到了非常多的困惑。针对AI应用当中的各种痛点,在2018全联接大会上,华为公司正式发布全栈全场景AI解决方案,为客户提供了从底层AI芯片、AI框架到应用使能的能力;面向政府、企业与开发者,提供全栈AI解决方案华为云EI。未来,基于华为昇腾(Ascend)系列AI芯片及多核ARM芯片“鲲鹏920”,华为云将更加以优质的能效表现,帮助客户进一步提升AI开发、数据处理的性价比与服务体验。华为云ModelArts:更快的普惠AI开发平台未来,随着数据模型的增大、海量数据预处理能力要求的增加,全生命周期管理加速将变得更加重要,只有拥有端到端全栈的优化能力,才能够帮助用户快速创建和部署模型,管理全生命周期 AI 工作流。华为云ModelArts一站式AI开发平台应运而生。ModelArts从设计之初便着眼于不同层级的AI开发者,从数据科学家、算法工程师,甚至AI初学者,都可以通过统一的平台对AI模型/工作流进行全生命周期管理。ModelArts可以帮助用户进行包括AI开发和运行阶段管理在内的全生命周期管理,在数据处理、模型训练、模型管理、模型部署、AI市场等各个环节提供更为快速有效的解决方案。接下来,华为云还将持续把华为2012实验室、EI产品部等在内的AI前沿的算法和理论研究,例如:小样本训练能力、半监督学习能力、神经网络自动搜索能力等,逐步产品化,并开放给开发者。具体来说,首先,数据处理在AI开发过程中极为关键,在项目中占得比例有时甚至超过进行训练的时间,同时往往消耗大量成本进行标注,ModelArts系统化的对这个过程进行了设计,提供了数据集版本管理、半自动标注等多个功能,针对不同项目,该阶段的人力消耗能够节约50%-80%。在模型训练部分,ModelArts通过硬件、软件和算法协同优化来实现训练加速。自研的深度学习框架——MoXing,可以自动将开发者的单机程序,转化为大规模分布式训练程序;提供超参的自动化调试优化;提供神经网络自动化搜索能力,帮助开发者自动化实现模型训练,大幅提升算法开发效率和训练速度,节约训练成本。而在模型管理方面,通过图引擎统一管理开发流程元数据,自动实现工作流和版本演进关系可视化,进而实现模型溯源、精度追踪;在模型部署方面,ModelArts可以一键将AI模型部署为在线推理服务或边缘推理服务。面向边缘推理场景,ModelArts可以自动对模型的适配进行优化,比如神经网络蒸馏,模型的压缩、枝剪等处理,让AI模型能够更好的适配边缘部署环境。瞄准三大行业AI落地场景,各领域合作已见成效贾永利表示,华为云EI通过在十余行业,大量的项目探索,总结了行业AI技术落地的关键路径。他表示,AI行业落地的关键在于找准场景,华为云EI针对海量重复场景、专家经验场景及多域协同三类场景,致力于实现效率提升、专业传承和突破极限,助力各行业智能化升级。在典型的海量重复场景——物流行业,每年货物破损不计其数,多数由于人为操作不当所导致。针对物流货物的运输、安检场景,华为云EI利用了视觉技术,帮助德邦快递实现了全面的自动化检测,节省了大量的时间成本和人力成本,有效减少了货物损耗。在此之前,德邦快递利用13,000路视频,使用人工观看,每人每天最多4倍速度观看8路摄像头,人力消耗预计达400人以上。针对多域协同场景,华为云帮助某机场解决航班靠桥率、旅客靠桥率、步行距离、地服消耗、滑行冲突率多等问题,实现核心指标靠桥率较人工提升了 5%,冲突率较人工降低10%,全面提升了指挥员工作效率和机场运行效率。而被优化机场全年由于停机位分配等原因,需要搭乘摆渡车的旅客数量,减少了250万。在任何行业里,专家都是非常宝贵且稀少的资源,在医疗领域更是如此,这也为专家经验场景提供了最为适合落地的基础。在大会现场,金域医学CIO李映华,就金域医学与华为云EI在医疗领域的创新成果进行了分享。他介绍道,目前金域医学与华为云已经围绕大数据、AI等多个方面开展了合作,例如借助深度学习等AI技术对海量病理切片及专家标注数据进行学习、训练,所产生的深度神经网络模型将可以辅助病理医生更加高效、及时、准确地对患者的病理切片进行诊断。在双方目前的合作当中,基于金域医学高年资细胞病理医生的专业标注以及华为云EI视觉团队的高效率、高质量的网络模型构建与训练,项目已取得了阶段性的突破,宫颈癌细胞学AI辅助筛查的敏感度超过99%,可媲美专家水平。AI技术红利加速释放,构建更全生态无论对于哪个行业,在AI落地过程中开发者都是一个关键要素。面向合作伙伴,华为云EI提供了市场营销策划、解决方案使能、联合创新Lab等多种支持计划,使能合作伙伴繁荣AI开发能力。面向开发者、高校和科研机构,华为在2018全联接大会发布了沃土AI开发者使能计划。通过沃土AI开发者使能计划,搭建一个技术交流、人才培养、机遇共创的通道。另外,开发者还可以借助ModelArts快速开展创新活动。以上海交通大学为例,借助ModelArts,学生在短时间内将传统竞赛赛车,改造为具备AI能力的自动驾驶赛车。改造后的赛车可以对红绿灯、障碍物、车道等环境进行识别,并且能够对特定目标进行跟随。同时,通过端云协同AI应用开发平台HiLens,用户可以更加方便管理海量的终端类设备,与ModelArts无缝互通。例如,深圳海雀科技通过HiLens开发的AI技能,将AI模型下发至其研发的家庭安防摄像头,让原本普通的摄像头变得更加智能。不仅AI开发过程变得更高效快捷,华为云还希望以更好的AI技术和生态,助力更多的企业和开发者更好地利用和分享他们的AI能力,从而构建更全的生态系统。开发者可以通过2019年3月最新发布的ModelArts的AI市场将AI模型、数据集进行共享和发布,也可以从市场获取基础数据集、模型进行更进一步的开发。此外,Atlas200开发者套件、HiLens wit深度学习摄像机等开发者套件也即将在5月份正式商用。目前,华为云正持续AI场景化落地应用,继续在“云+AI”进行探索与实践,助力把数字世界带入每个人、每个家庭、每个组织,从而构建万物互联的智能世界。
  • [其他] 让AI照进各行各业:华为云的普惠AI之道
    “过去是车看灯,读秒数通行。现在是灯看车,读车数放行。”在北京海淀区上地三街,在AI算法的帮助下,路口交通管理实现了实时在线决策和信号配时优化。上地三街这个过去著名的拥堵点,现在车流主方向(东西方向)平均延误减少15.2%,平均车速提升了15%,支路的平均延误时间降低了10%~20%。其实,这只是华为云普惠AI智能变革的冰山一角。如何让AI像电力、互联网一样,成为各行业企业的基本生产力,一直是华为云的目标。在普惠AI的道路上,华为云有什么独特的心法?借2018高交会契机,华为云中国区总裁洪方明向趣味科技详解了华为云的普惠AI之道 。AI要落地,先拆除三大门槛2015年兴起的这波AI浪潮,与以往AI浪潮的最大区别就是AI技术开始走出实验室,走向产业与生活,帮助人们解决现实世界中的问题。这场变革中,谁把AI用得最早、最好,谁受益最大。在华为看来,AI是一组技术集合,是一种新的通用技术(GPT)。它并不简单的是一个独立的产品,更不是一个封闭的系统。AI将成为电力、互联网一样的基本生产力,使众多行业效率得到指数级提升。这是华为云做普惠AI的出发点。洪方明认为,在将AI这种生产力释放到各行各业的过程中,企业面临着三大门槛:第一:“慢”,AI开发效率低,标注、训练、部署整个过程非常耗时;第二:“贵”,AI基础资源,尤其是算力稀缺且昂贵;第三:“缺”,AI人才的短缺,中国的AI人才缺口就超过500万人。这三点组成了“资源”、“应用”和“人才”三大门槛,极大限制了AI的行业落地进程。随着AI的日益普及,AI即将变成越来越多行业最核心的基础设施之一。然而这三大门槛却有越来越严峻的态势,算力依旧稀缺,人才缺口依旧是很多企业面临的瓶颈。AI技术发展与行业落地的巨大落差,让普惠AI成了各行业最迫切的需求。普惠AI,让企业用得起、用得好,用得放心那么,究竟如何让企业用的起,用的好AI,同时还要用的放心?在10月份举行的华为全联接大会上,华为云首次提出了全栈全场景AI解决方案,以普惠AI的方式,走出了一条AI行业落地之路。具体来说,针对“贵”和“慢”的问题,华为云通过公有云将AI技术模板化,以全栈全场景的形式全面部署在云、边、端。全栈指包括芯片、芯片使能、训练和推理框架和应用使能在内的技术全堆栈;全场景指包括公有云、私有云、边缘计算、物联网行业终端以及消费类终端的部署环境。针对企业对AI人才的焦虑,华为云推出一系列举措降低企业使用AI的门槛。比如,即取即用的AI功能和API接口、开放的开发平台可以让企业定制化开发自己的AI能力。华为云丰富的行业落地经验,还将通过行业预集成方案的形式直达各行业企业,让更多企业享受AI成功落地的成果。在安全性方面,华为云是国内惟一全平台、全节点、全服务通过PCI-DSS安全认证的云服务平台,为企业提供安全无忧的AI云服务。2017年,华为云携手客户与合作伙伴已经打造了超过200个AI项目,涵盖政务、交通、制造、物流、互联网等8大行业。全栈全场景AI解决方案成了华为云快速落地的助推器。华为云EI,行业变革的智能引擎“预计2025年,全球AI市场空间将达到3800亿美金,其中90%来自于政企市场。未来,政企市场将是云化、智能化的主场,我们在座的每一位都是这场变革的主角。”本届高交会上,洪方明再次强调了政企市场的关键性。当华为云AI以普惠的方式应用于解决各个行业的细分场景,华为将这种行业AI解决方案称为EI,即企业智能。华为云EI提供“云-边-端”三位一体的全栈协同智能服务,管理多种服务的一站式协同开发平台。此外,华为云EI还将统一AI开发语言,通过类SQL就可以实现AI业务的开发及编排。这些解决方案,都将极大降低AI应用开发门槛。比如,通过对分布式训练的调度算法、分布式梯度压缩深度优化,华为云让AI在亿级图片规模下的模型训练时间,已经从原来的30天缩短至小时级。而华为云的客户只需要将标注好的数据加载至华为云EI深度学习服务,即可快速自动训练出定制化模型。华为云EI不仅能帮企业实现降本增效,还将助力企业的商业模式创新和智能化转型。在物流行业,华为云EI对九州医药通的拣货员进行路径规划部署后,拣选效率提升近30%,派送车辆的调度效率也提升了5倍。在工业制造领域,油气公司采用华为云EI的故障预测和定位模型后,实现了对油气管道平台的故障概率预判与准确定位,使设备的宕机率下降了25%。在智慧园区管理方面,华为云EI将电子围栏和视频系统联动,节省了30%-40%的保安人力,并通过图像监控与能耗设备关联,做到无人区域照明、空调的自动关闭,将园区综合能耗降低了10%。在采用了华为云EI服务后,上海市政府“一网通办”政务服务平台能够通过智能客服实现与用户的多轮对话,并主动进行办事推荐,提升了市民满意度。虽然已经在普惠AI的大道上狂奔,但华为云“平台+生态”的长久战略不变,“上不碰应用、下不碰数据、不做股权投资”的三不原则也不变。洪方明强调,这些基本原则是华为云对生态的态度,是华为云的基因。“华为云聚焦ICT基础设施,提供一块数字化、智能化的‘黑土地’,这块‘黑土地’上可以‘玉米’、‘大豆’、‘高粱’、‘花生’、‘土豆’……,让各个伙伴的内容、应用、云在上面生长,形成共同的力量面向客户。”一项划时代的新技术,从诞生到成为水电煤一样的基础设施,需要一个漫长的发展过程。让所有企业都用得起、用得好,用得放心的,华为云的普惠AI无疑在尽力缩短这一历史进程。
  • [行业动态] 【人工智能】揭秘华为云EI:华为人工智能发展路线与BAT大不相同
    人工智能风口成最强“风口”,各大科技巨头和创业公司纷纷抢位。就中国科技业四大巨头:阿里、腾讯、百度、华为而言,前三家谈AI很多,华为则比较低调。通过研究,笔者发现华为人工智能发展路线与BAT大不相同:BAT更多聚焦消费互联网AI应用,而随着Cloud2.0 时代到来,华为AI(华为云EI企业智能 )更多聚焦产业互联网领域的应用,以AI技术使能企业发展(企业+AI),让企业更智能。凭借多年来在企业级IT市场的行业经验积累,以及强大的AI技术实力,开放华为自身应用AI的经验和能力,华为更有可能在用AI使能企业的赛道上走的更远,华为云EI将作为一项核心使能服务驱动企业、行业迈向智能世界。任正非透露华为人工智能主攻方向人工智能风口以至,这应该已经没有什么争议,就中国科技业四大巨头:阿里、腾讯、百度、华为而言,前三家实际上都已经在不同场合谈过很多次自己的AI战略重点,比如阿里正在把人工智能渗透到交易业务的方方面面,腾讯要围绕游戏、社交、内容三大场景,Make AI Everywhere;百度有百度大脑和无人车,只有华为比较低调,对人工智能谈论不多,提起华为的人工智能,很多人还主要是停留在Mate10和荣耀人工智能手机这样的消费终端产品。然而,就在最近,华为的人工智能在企业级市场布局曝光提速,种种迹象表明,除了AI手机,水面之下,华为在人工智能领域实际上有大想法,早有明确方向。最深刻的印象来自10月份的一封经过任正非签发的、主送全体员工,全公开的华为总裁办邮件。邮件内容是一篇题为《一杯咖啡吸收宇宙能量,一桶浆糊粘接世界智慧》的文章,记录了任正非十月份访问加拿大四所高校校长座谈会,以及在公司员工座谈会上的讲话,里面有大篇幅关于人工智能的内容,显示任正非对华为AI布局的深谋远虑,巨大投入,在讲话中,任正非甚至提到华为已经考虑过万一AI泡沫破灭怎么办?在这些谈话中,总结起来,任正非一共对人工智能谈了三点意见:首先,直面人工智能存在的争议,但明确人工智能的发展“无论人们接受不接受,社会都会客观前进”,“我也担心人工智能对人的价值观产生破坏。但是我们挡不住人类社会前进的步伐。”华为一定要发展人工智能,“现在华为公司在人工智能的投资上也是极大的。”第二,在人工智能的研发中,必须让AI坐实,不能“虚化”,“否则在产品人工智能开发上,不成熟,就不敢冒昧的投入数千人。”在这里实际上表达了两层意思,一是华为已经在人工智能领域投入数千人力,二是坐实不虚化。第三,华为人工智能的主攻方向有两个,一,大量的是解决我们管理中重复性劳动的自动化问题,降低了管理的成本,也避免人做重复工作,因审美疲劳而犯的低级错误,我们在这个世界上的生存能力就更强了;二,是对于不确定性事情的模糊性识别和智能化处理。主攻方向明确之后,华为的人工智能研究被分为三个部分,第一部分是基础理论研究;第二部分是做使能器来改造华为的流程管理,“这个使能工程不对外,只全对内”;第三部分就是做人工智能相关的产品,对外赋能。据华为消费者业务CEO余承东在前不久的世界互联网大会介绍,为了应对数据洪峰对ICT行业冲击,诺亚方舟实验室2012年6月的正式成立,是华为正式投入AI基础研究的最鲜明信号。华为在诺亚方舟实验室进行人工智能算法的研究、管理AI的技术合作、识别AI主要应用场景和需求管理等。诺亚方舟的上层组织就是神秘的“2012实验室”,是华为的总研究院,包括中央硬件工程学院、海思、研发能力中心、中央软件院等。与最近很火的阿里达摩院不同,华为2012实验室已经运作七年,做得多说的少,对外很是低调神秘。从内部应用到对外开放使能,华为云EI企业智能面世根据任正非的华为AI战略,由于华为的人工智能工程主要是建立在其自身遍布全球的业务和网络存量上,以前是“不对外,全对内”,所以对于华为的AI技术到底详情如何,外界一直知之不详。但最近,却多了两个重要外部观察窗口,一个是华为手机在AI应用方面的进展,包括去年发布的AI手机荣耀Magic、华为Mate 9、华为Mate 10,开启终端AI商业化元年,这一块报道已多;而另外一个则是华为EI(Enterprise Intelligence)企业智能服务的面世与上线。华为云EI和华为AI手机,可以看做华为人工智能战略的云侧和端侧,华为认为Mobile AI=On-Device AI + Cloud AI,构建芯、端、云协同发展人工智能。华为AI手机针对消费者市场,而华为EI则是针对企业级市场,其基础为华为云,目标是将各类AI单点技术与企业生产系统产生化学反应,让企业更智能。在本质上,华为EI就是要把任正非所提到华为多年来在内部通过AI解决华为公司内部生产、物流、供应链、终端等领域问题,所积累的一些相关的能力、知识和方法分享给更多企业,帮助企业实现智能化。可以从华为EI所推出的三类企业智能云服务看到华为这部分AI能力的组成,它包括:EI基础平台服务,比如深度学习服务、图引擎服务等;通用服务,如大数据、视觉认知、语音语义、人脸识别、图像识别和内容检测等;行业场景解决方案,比如智能水务、智能制造、智能电力、智能交通、智能金融、智能零售等30个企业智能服务。华为EI的推出可以说是完全顺应任正非人工智能战略的指导,也是在把华为在人工智能领域最擅长的技术和能力积累对外开放和输出。按照一般认知,当前的人工智能可以分为两种,一种是强人工智能,一种是弱人工智能。强人工智能是研究如何通过模拟人的思维和模拟人细胞构成的一个方向,这个领域目前也没有太大突破。而弱人工智能则是指将人工智能技术用于提高人类工作效率,这才是华为AI的长项,也是目前人工智能商业化的主流方向。为了对外输出华为所积累的AI能力,华为以华为云为基础推出了华为云EI企业智能服务,并从诺亚方舟实验室整合大批人力加入EI业务。华为的人工智能到底能做什么?从哪里来?EI的推出使华为成为科技界少有的能用AI技术对2B市场使能的科技公司,但华为的人工智能到底能做什么,和阿里、百度的对外赋能有什么区别?在上周的一次采访中,两位从诺亚方舟调入EI团队的技术带头人,向微天下揭开了华为AI的部分“神秘面纱”。由于立足内部应用,华为投入AI研发的初衷与互联网巨头有很大不同。它不是纯粹的探讨技术“无人区”,而首先是解决内部实际问题,与实业紧密结合,这使得华为切入AI的时间线非常早,涉及AI业务的团队非常多,从事AI研发的人力也非常多,他们分头为各个业务部门服务,比如手机、芯片、媒体、操作系统等等,但应用最多的却是任正非提到的两大条线:解决华为内部运作的自动化问题和华为的业务服务问题,比如,华为供应链的智能装箱、物流和路径规划,以及报关、发票、风控、营销、网络安全等场景。结果就是不经意间,华为有了企业中最多的AI使用场景,如任正非所说,“世界上还有哪个公司有这么大的业务量和数据量与我们比拼?”这就决定了,在华为EI所推出的三类企业智能云服务中,其中通用服务领域并不是华为的最长项,在对外赋能时,华为态度开放,与伙伴合作借助外力发挥各自优势,比如科大讯飞的语音、码隆科技的图片等。华为EI的长项是基础平台服务和行业场景服务,有世界领先的AI能力。BAT更多聚焦消费互联网AI应用,而随着Cloud2.0 时代到来,华为云EI 更多聚焦产业互联网领域的应用,以此支撑华为云产业互联网领导者品牌。比如华为云端到端的智能APIs服务。华为公司每年有180万以上的订单,大概会形成30万~50万规模的物流单,怎么实现从始发点货物的供货预估——货物的装箱管理——运输到目的区域的分发——最后一公里的客户配送,这就需要有一系列智能化的技术支撑。基于仓储的优化,这对于大型企业是比较重要的。现在仓储都分为几级,华为公司在海外布局了大概5个的集散中心,全球发货到集散中心之后,如何把货物进行比较好的布放以及取货顺序的安排,这个就需要有人工智能的算法在里面。集装箱装箱,要考虑类似于如何在一个最小的空间里面最大利用这些空间等问题。装箱也有一些规则,比如说形状、重量、是否怕压,这些都有一系列的算法去解决。在华为公司的全球仓储管理方面,通过应用华为云EI服务能提升20%的分拣装箱效率,应用EI实现智能装箱,根据物品特征提供最佳装箱方案,而且做到集装箱3D仿真可视,整体利用率提升6%,物流使用EI做路径规划可节省例外开销成本30%。OCR识别(Optical Character Recognition,光学字符识别),比如说企业的票据、发票、文本,怎么通过自动化的方法录入,包括一些纸质单据的传递,其实它也需要利用一些人工智能技术。原来的方法可能做得不太准,最近有了深度学习和其它的人工智能技术之后,识别率大大提高了。以前,华为供应链需要大量人员手工录入海关报关单据,手工录入系统效率低,使用华为云OCR服务以后,华为已经实现海关报关单据自动化 ,录入效率提升10倍,减少200+海关报关专职人员,并对报关信息进行大数据分析,完成分析预测,节省千万美金报关风控成本。华为云OCR服务,在比如数字及表格识别的有些场景准确率超过98%,这个准确率在商用领域是极高的,可以帮助企业可以大大节省人力,将人从枯燥的重复工作中解脱出来。还有风控等......华为具有庞大的体量,在实际内部运作中必须要解决这些问题,而华为又有足够的投入和足够的技术实力,再加上丰富的使用场景,终于形成华为有别于BAT的人工智能使能路线。还有一些重要场景发生在华为的产品服务过程中。比如,解决华为全球巨大的网络存量的网络维护、故障诊断与处理的能力的提升;使网络规划与优化从被动走向主动等;就像任正非所说,华为给全球30亿人口提供通信服务,提供设备的网络存量约一万亿美元,这些网络每年故障发生上百万次,在这一过程中,人工智能被用来帮助预测和预防故障。这些能力,都通过华为云EI企业智能服务向外界输出。由于这些AI能力是形成与华为自身的制作业实践中,这使得华为的AI使能具备双重属性,一重是赋能AI,另外一重则是利用AI技术使能工业4.0和智能制造。在华为云EI企业智能服务的对象中,还有一个特殊群体,那就是政务部门,比如深圳交警就在9月与华为联合启动“深圳城市交通大脑项目”,使用华为云EI企业智能来推进智能交通,在11月的2017世界智慧城市博览会上,该项目从全球300多个城市中脱颖而出,荣获2017世界智慧城市博览会唯一一个平安城市大奖。据悉,深圳城市交通使用了华为云EI视频识别和强化学习功能,将在深圳实现交通信号灯根据路况自动化调节。不惧泡沫破灭的务实化AI发展路线华为云EI企业智能服务的推出有鲜明的华为特色和任正非特色,体现出华为对AI的务实态度,综合起来就是这样一些原则:人工智能不能遍地跑;华为云坚持“不做应用、不碰数据、不做股权投资”;人工智能会不断推动人类进步。重复工作自动化,模糊判别智能化,是华为努力的方向。这些原则之下,就是华为人工智能的聚焦投入:要急用先行小步快跑,要聚焦在确定性业务、人工消耗大的项目,“不要铺开一个很广泛的战线。不要遍地都是智能化,这会形成全面开花没有结果的盲动,就有可能满盘皆输”;“先纵向打好歼灭战,旗开得胜后再横向扩张”。在这个战略的基础上,任正非才提出,即便未来AI泡沫破灭,也能实现华为AI大发展的策略。据悉,目前已经有不少企业客户对华为云EI服务非常感兴趣,例如:制造业、车联网、节能、城市交通、医药零售等行业场景,均有项目在运作中。医药零售行业巨头九州通正在应用华为云EI改善物流路线规划等业务,一步步朝着智能的九州通迈进;深圳城市交通正在使用华为云EI实现城市信号灯自动调节,城市交通将更智能……凭借多年来在企业级IT市场的行业经验积累,以及强大的AI技术实力,开放华为自身应用AI的经验和能力,华为更有可能在用AI使能企业的赛道上走的更远,华为云EI将作为一项核心使能服务驱动企业、行业迈向智能世界。
  • [Atlas800] AI CPU资源占用率低
    在Atlas800上推理的时候,通过npu-smi info watch查看npu使用情况的时候,AI CPU的资源占用率一直都在1%或者2%,请问这种情况是正常的吗?如果有问题,请问该从什么地方着手解决呢?
  • [行业动态] 【2月24日 AI 快讯】1.8万元起,三百万人抢购:华为折叠旗舰Mate X2发布了,将首发鸿蒙系统;
    今日共有8条快讯,全文 642字 产业优必选科技谭欢博士荣获IEEE RAS青年科学家奖春节期间,IEEE机器人与自动化协会公布了2021年度获奖名单,优必选科技联席首席技术官谭欢博士荣获政府/行业类青年科学家奖(Early Government or Industry Career Award in Robotics and Automation),是该奖项自1999年创办以来,中国内地工业界单位背景的首位获奖者。2021/02/23 15:05原文链接1.8万元起,三百万人抢购:华为折叠旗舰Mate X2发布了,将首发鸿蒙系统四月份,华为的新老机型就要全部升级鸿蒙OS了。2021/02/23 14:39原文链接毅力号登陆火星真实视频公开,我们还听到了火星的风声!真实视频让我们看到尘土飞扬的火星,听到了火星的风声。2021/02/23 14:36原文链接入门用技术致敬每一位妈妈,B站up主用AI还原李焕英老照片动态影像「从我有记忆开始,妈妈就是中年妇女的模样,所以我会忘记,她也曾是花季少女。」2021/02/23 14:59原文链接理论全监督语义分割训练新范式「像素对比学习」,苏黎世联邦理工等出品一种新的、全监督语义分割训练范式「像素对比学习」。2021/02/23 14:55原文链接微软拓扑量子计算梦碎?三年前Nature研究有误,未发现马约拉纳费米子微软量子团队报以厚望的「马约拉纳费米子」研究竟然是错误的!这篇2018年发表在Nature上的文章遭到了质疑。2021/02/23 14:33原文链接其他清华软件定义芯片团队成果入选固态电路顶会ISSCC 2021通过挖掘量化后CNN模型权值大量冗余的特征,提出一种能够显著减少冗余权值造成冗余乘操作的优化方法,降低了硬件功耗2021-02-23 23:12:01原文链接MIT一招霸气颠覆传统:勇敢换导师,成本我买单,学生沸腾了马上要学术自由了2021-02-23 13:04:24原文链接
  • [行业动态] 【2月23日 AI 快讯】无缝折叠屏仅售一万八,买到就赚到!华为Mate X2来了
    产业39%!机器人国产化未能实现「中国制造2025」目标「中国制造2025」设定到2020年,本土机器人制造商要占据供应国内市场一半,到2025年达到70%。根据深圳高工产业研究公司数据,去年中国企业制造的机器人占国内市场的39%左右,与竞争对手日本和德国的技术差距依然存在。2021/02/22 16:48原文链接国企数字化调查:四成企业自评低于全球平均水平,数据质量成主要障碍藏在111家国企背后的数字化四大发现2021/02/22 16:39原文链接英伟达让GPU挖矿效率减半,显卡却未必更好抢比特币已经冲上 5.6 万美元的时代里,英伟达的限制可能还不够。2021/02/22 15:02原文链接上汽集团大举进军芯片产业,借道地平线打通上下游今日,Auto Byte从可靠渠道获悉,上汽集团在“中国芯”方面将有重要动作。2021/02/22 12:13原文链接工程实现、动态展示多种社区发现算法,这个Python库助你发现网络图的社区结构一个用于发现网络图中社区结构的 Python 库。2021/02/22 14:57原文链接理论 这张“毅力号火星照片”,AI P过不光上了色,还将像素提高了6倍以上2021-02-22 12:58:52原文链接其他无缝折叠屏仅售一万八,买到就赚到!华为Mate X2来了新春理财手机。2021-02-22 23:43:48原文链接AI面试官也太好骗了!用书架图片做视频背景,能提高15%好感度这也行?2021-02-22 13:13:14原文链接黑湖智造完成近5亿元C轮融资,创造中国工业软件新里程碑本轮融资由淡马锡(Temasek)领投,华兴新经济基金(Huaxing Growth Capital)、光速中国(Lightspeed China Partners)以及包括金沙江创投(GSR Ventures)、BAI资本(BAI Capital)、GGV纪源资本(GGV Capital)、真格基金(ZhenFund)在内的所有老股东跟投。2021-02-22 10:50:33原文链接
  • [其他] 人工智能如何可能制造危险?
    大多数研究人员认为,一个超智能AI不可能产生人类的情感,如爱或恨。他们也认为人们没有理由期望AI有意识地趋善向恶。在AI如何成为风险的问题上,专家认为有两种情况最有可能发生:AI被设计执行毁灭性任务:自驱动武器(autonomous weapon)是为杀戮而生的人工智能系统。若落入恶人手中,这些武器简简单单就能造成大量伤亡。此外,AI军备竞赛也可能无意中引发AI战争,导致大量伤亡。为了避免被敌对势力从中阻挠,这些武器的“关闭”程式将被设计得极为复杂,所以人们可能对这种局面失去控制。这种风险虽然也存在于狭义AI(narrow AI)中,但随着AI智能和自驱动水平的提高,风险也会跟着增长。AI被用来执行有益的任务,但它的执行过程可能是破坏性的:当AI的目标同我们的目标没有完全对应时,这就有可能发生。这当然并非易事。试想,如果你召唤一辆智能车将你以最快速度送到机场,它可能不顾一切地严格遵从你字面意义上的指令,即使以你并不希望的方式——你可能因超速而被直升机追逐或呕吐不止。如果一个超智能系统的任务是一个雄心勃勃的地球工程项目,它带来的负作用可能是对生态系统的破坏,并把人类试图阻止它的行为视为一个必须解决的威胁。以这些例子来看,我们对高级AI的担忧并非在于其可能产生恶意,而是它可能达到的能力。超智能AI将非常善于完成其目标,如果这些目标不与我们的目标形成一致,我们麻烦就大了。正比如,你可能并非对蚂蚁深恶痛绝,也没有踩死蚂蚁的恶意,但如果你负责水电绿色能源项目,而项目开发的所在地区有一个蚁丘会因为大水而被淹没,那只能说是算蚂蚁倒霉罢了。人工智能安全研究的一个关键目的就是要避免将人类置于和这些蚂蚁同样的位置。作者:智言科技链接:https://zhuanlan.zhihu.com/p/29994571来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
  • [数据加载及处理] 【转载】MindSpore大V博文之架构系列(五)——AI框架中数据处理的挑战与解决思路
    本文是AI框架分析专栏的第五篇,总体目录参见:AI框架的演进趋势和MindSpore的构想:金雪锋:AI框架的演进趋势和MindSpore的构想zhuanlan.zhihu.com数据处理其实在AI的训练和推理中占了很大的比重,但是业界在这一块的分析比较少,本文期望通过MindSpore实践给大家一些参考。AI框架中的数据处理在构建深度学习模型时,数据处理是我们最先面临的挑战。任务开始之前,由于数据量受限,或者为了得到更好的结果,通常需要进行数据增强操作,来获得能使网络受益的数据输入。典型的训练数据处理流程如下图所示:加载:指从各种异构存储中将训练数据加载到内存中,加载时涉及数据的访问、解析等处理;Shuffle:训练一般是多个epoch,通过shuffle打乱数据集不同epoch的数据排序,防止训练过拟合。如果数据集支持随机访问,则只需按不同顺序随机选择数据就可以非常有效地进行混洗shuffle。如果数据集不支持随机访问(或仅部分随机访问像多个文件对象),那么一个子集的数据可以加载到一个特殊的混洗缓冲区shuffle buffer中。map:完成训练数据的处理,包括图像类数据增强、Text类分词等处理。其中,数据增强是一种创造有着不同方向的“新”数据的方法,一是从有限数据中生成“更多数据”,二是防止过拟合。batch:训练时一般都是使用mini-batch的方式,即一个批次训练少量数据;batch算子负责构造一个批次的数据发送给训练;repeat:可以通过repeat的方式增加训练的总数据量;一次repeat就是加载一遍整个训练集。模型在进行推理时,同样会涉及到数据处理,典型的过程如下图所示:推理过程的数据处理,将一张图片进行解码、缩放、中心截图、归一化、通道变换等操作后,送入模型中进行推理并得到结果。与训练相比,推理时的数据转换基本一致,不同的是推理时一般加载单样本进行处理,而非数据集。本文将重点分析AI框架在数据处理时面临的挑战以及MindSpore的解决思路。难点与挑战2.1 数据处理的高效性当前各AI框架的数据处理主要利用CPU运算,训练则利用GPU/AI芯片,两者是并行的。理想情况下,应该在每轮迭代开始前,就准备好完成增强之后的数据,保持训练过程持续地进行。然而在实际的训练中,很多时候数据处理成为了阻碍性能提升的瓶颈:或是因为从存储中读取数据的速度不足(I/O bound),或是因为数据增强操作效率过低(CPU bound)。根据黄氏定律,GPU/AI芯片的算力每一年会提升一倍,相比于即将失效的摩尔定律,AI芯片的算力提升速度会远大于CPU。模型迭代计算效率的不断提升,对数据处理也提出了更高的要求:数据处理过程必须足够高效,才能够避免GPU/AI芯片因为等待训练数据而空闲。2.2 数据处理的灵活性数据处理的灵活性挑战主要体现在以下两个方面:数据集种类繁多,难以统一目前已知常用的开源数据集有几百种,每种由不同的组织/机构来产生,有各自的格式与组织方式。根据深度学习任务的不同,每种类型的输入也有自身的特点。以图像为例,其包含类型、长、宽、大小等属性信息,每张训练图像被标记成某一个类别,这些图像及其对应类别的列表数据被用来进行分类等训练;以音频为例,通过训练可以直接将语音转换为文字,进一步作为智能AI的输入,完成语义理解及指令性操作。在数据集加载时,如何支持种类繁多的图像、文本、音频、视频格式,屏蔽IO差异并将其映射到内存结构中进行下一步处理,是AI框架重点需要解决的问题。数据增强算法非常灵活,需要框架提供足够易用的接口来支持用户定制数据处理过程例如CV类场景,图像作为网络的输入,需要保证一定的一致性(如:大小、通道数、归一化等),也需要有一定的泛化能力(如:镜像、旋转、混合、颜色变换等),才能使训练得到的模型具有更好的精度。研究已经证明,采用不同的数据处理逻辑,训练得到的模型精度会有明显的不同。以resnet50和ssd为例,数据处理过程对比如下:其中既涉及到经典的数据处理逻辑,又包含了用户自定义的处理过程。AutoML和动态shape等场景,也对数据处理的灵活性提出了更高要求。所以,提供更多、更灵活的数据处理机制,也是框架需要重点考虑的。2.3 端云统一训练导出的模型,在推理时如何高效进行数据处理:网络训练生成的模型文件中,记录了训练时的计算图及权重信息,但是数据处理过程往往没有统一存储到模型中,这就导致AI工程师在使用模型进行推理时,需要重新编写数据处理代码,十分不便。端侧资源受限,需要提供更轻量化的数据处理方式:在端侧场景下,CPU和内存资源往往比较少,在提供数据处理的能力时,要求API尽可能简单、轻便,以最少的资源占用获得最快的执行效率。同时,需要AI框架提供的库尽可能的小。所以,使用云化场景提供的数据处理机制(启动慢、资源占用大)就不是特别适用。如何在不同的场景下提供最合适的数据处理方法是AI框架面临的挑战。典型的云侧场景与端侧场景资源对比如下:资源云侧端侧CPU100+核4核-8核内存250G-750G3G-8GDeviceGPU/Ascend910CPU/Ascend310MindSpore设计思考3.1 设计目标与思路MindSpore的设计中,充分考虑了数据处理的高效性、灵活性以及在不同场景下的适配性。整个数据处理子系统分为以下模块:API:数据处理过程在MindSpore中以图的形式表示,称为“数据图”。MindSpore对外提供Python API来定义数据图,内部实现图优化和图执行。整个数据加载和预处理的流程实现为多步并行流水线(data processing pipeline),包括:Adaptor:将上层语言(如Python)构建的数据图,转换为下层可执行的C++数据图(Execution tree)Optimizer:数据图优化器Runtime:运行优化后Execution tree的执行引擎数据集算子(dataset operators):Execution tree中的某个节点,对应数据处理流水线中的一步具体操作,比如从文件夹加载训练数据的ImageFolder算子,做各种数据增强的Map算子,Repeat算子等。数据增强算子(data augmentation operators):也可称为tensor算子,是对某个tensor变换的,比如Decode,Resize,Crop,Pad等,通常是被dataset operator中的Map算子调用。数据增强后的结果,通过队列和前向反向计算系统相连。下面将介绍这套子系统如何达到极致的数据处理性能。3.2 极致的处理性能多段pipeline流水线:相比于业界其他框架,MindSpore采用了多段并行流水线(multi-stage parallel pipeline)的方式来构建数据处理pipeline。这种架构一方面可以更加细粒度地规划CPU等计算资源的使用,另一方面天然支持各段使用异构硬件进行流水处理,从而提高数据处理过程的吞吐量。如上图所示,每个数据集算子(inline除外)都包含一个输出Connector:由一组阻塞队列和计数器组成的保序缓冲队列。每当一个数据集算子完成一块缓存数据的处理,这个算子会将这块缓存推送到自身的输出Connector。下游的数据集算子会从上游的输出Connector里取出缓存进行后续处理。这种机制的优势包括:数据集加载、map、batch等操作以任务调度机制来驱动,每个操作的任务互相独立,上下文通过Connector来实现Pipeline;每个操作均可以实现细粒度的多线程/多进程并行加速。数据框架为用户提供调整算子线程数/多进程处理的接口,可以灵活控制各个节点的处理速度,进而实现整个数据处理Pipeline性能最优;Connector支持用户对其大小进行设置,在一定程度上可以有效的控制内存的使用率,适用于不同网络对于数据处理速度的要求。在这种数据处理机制下,对输出数据进行保序处理是保证训练精度的关键。保序意味数据处理流水线运行时,同样顺序的原始数据输入,需要保证数据处理完成后,得到同样顺序的数据输出。MindSpore采用轮询算法来保证多个线程数据处理的有序性:在上面的数据处理pipeline示例中,保序操作发生在下游map操作(4并发)的取出操作(单线程执行)中,其以轮询的方式取出上游队列中的数据。Connector内部有两个计数器expect_consumer_记录已经有多少个consumer从queues_中取了数据,pop_from_记录了哪个内部阻塞队列将要进行下一次取出。expect_consumer_以consumer个数取余,而pop_from_以producer个数取余。在expect_consumer_再次为0时,说明所有的local_queues_已经都处理上一批任务,然后继续下一批任务分配及处理,进而实现了上游至下游map操作的多并发保序处理。数据处理与计算过程pipeline数据pipeline会不断地进行数据处理,并把处理后的数据发送到device侧的缓存;当一个step执行结束后,会直接从device的缓存中读取下一个step的数据。数据处理:负责将数据集处理成网络需要的输入,并传递给发送队列中,保证数据处理的高效取可;发送队列Queue:维护数据列队,保证数据处理与网络计算过程互不影响,实现桥梁的作用;网络计算:从发送队列中获取数据,用于迭代训练。以上三者各司其职,相互独立,构筑整个训练过程中Pipeline。这样,只要数据队列不为空,模型训练就不会因为等待训练数据而产生瓶颈。缓存技术当数据集的size较大时,无法全部加载到memory cache,此时训练中的部分数据需要从磁盘读取,可能会遇到I/O瓶颈,增大每个epoch的cache命中率就显得尤为关键。传统的缓存管理策略采用LRU策略,没有考虑深度学习数据的读取特点:在不同的epoch之间数据是重复读取的,而在同一个epoch中随机读取。每条数据的读取概率都是相同的,因此哪个数据被缓存并不是最重要的,已经cache的数据在被使用之前不被换出更加重要。针对这个特点,我们使用了一个简单高效的缓存算法:数据一旦被缓存,就不会从cache中被换出。在数据图优化的过程中,会根据流水线结构自动生成缓存算子,既可以缓存原始数据集,也可以缓存数据增强处理后的结果。3.3 灵活的定制能力整个数据处理pipeline中,用户往往需要特定的处理逻辑,这些处理逻辑有其特殊性,无法固化到框架中。因此,框架需要具备开放的能力,让用户能够订制不同的数据处理逻辑。MindSpore提供了灵活的数据集加载方式、丰富的数据处理算子、自动数据增强、数据动态Shape、数据处理Callback等机制等供开发人员在各种场景使用。灵活的数据集加载方式针对数据集种类繁多、格式与组织各异的难题,MindSpore提供了三种不同的数据集加载方式:1)如果用户使用常用数据集,那么可以使用MindSpore内置的API接口直接进行加载。MindSpore实现了包括CelebADataset、Cifar10Dataset、CocoDataset、ImageFolderDataset、MnistDataset、VOCDataset等数据集的C++ IO Reader加载,在保证性能的同时,实现了数据集的开箱即用。2)用户将数据集转换为MindSpore数据格式,即MindRecord,然后通过MindSpore的API进行加载。MindRecord可以将不同的数据集格式归一化,有聚合存储、高效读取、快速编解码、灵活控制分区大小等多种优势。3)如果用户已经有自己数据集的Python读取类,那么可以使用MindSpore的GeneratorDataset API调用该类实现数据集加载。这种方式可以快速集成已有代码,改动最小,但因为是Python IO Reader,需要额外关注数据加载性能。通过Python层自定义、C层插件的方式支持更多算子MindSpore内置了丰富的数据处理算子。这些算子可以分为C层以及Python层,C层算子能提供较高的执行性能;Python层算子可以很方便集成第三方包完成数据处理的功能,但是性能较低,好处是易开发易使用。MindSpore支持用户扩展自定义的数据处理算子,用户可以开发C层算子代码,编译后以插件的形式注册到MindSpore的数据处理中进行调用。支持自动数据增强策略MindSpore提供了基于特定策略自动对图像进行数据增强处理的机制:通过基于概率或者回调参数的数据增强策略,可以实现算子自动选择执行,达到训练精度提升的目的。例如对 ImageNet 数据集,自动数据增强最终搜索出的方案包含 25 个子策略组合,每个子策略包含两种变换,针对每幅图像都随机的挑选一个子策略组合,然后以一定的概率来决定是否执行子策略中的每种变换。这些策略包括:RandomSelectSubpolicy - 多批概率算子,随机选择其中一批执行RandomChoice - 多个算子选择其中一个执行RandomApply -基于某个概率执行这批算子通过自动数据增强操作,在ImageNet数据集上可以提升1%左右的训练精度。支持动态shapeMindSpore通过 per_batch_map支持用户自定义控制输出不同Shape的训练数据,满足网络需要基于不同场景调整数据Shape的诉求。用户自定义数据Shape生成逻辑udf,如:第n个step生成shape为(x,y,z,...)的数据;通过batch(…, per_batch_map=udf)将第一步定义的逻辑生效,最终得到不同Shape训练数据。Callback机制让数据处理更加灵活通过callback机制实现根据训练结果动态调整数据增强的逻辑,为数据增强过程提供更灵活的操作。MindSpore支持用户基于数据处理提供的DSCallback(包含epoch开始、step开始、step结束、epoch结束等)实现自己的数据增强逻辑UDF,并将其添加至map操作中,以实现更灵活的数据增强操作。3.4 端云统一架构数据图与计算图的统一MindIR是MindSpore基于图表示的函数式IR,其最核心的目的是服务于自动微分变换。自动微分采用的是基于函数式编程框架的变换方法,因此IR采用了接近于ANF函数式的语义。推理数据图典型的场景为:数据集样本大小缩放、中间截图、归一化、通道变换。我们将推理数据图以子图的方式保存至生成的模型文件(MindIR)中,那么在推理时,可以通过统一的接口加载模型中数据处理流程,自动进行数据处理得到模型需要的输入数据,简化用户的操作,提升易用性。轻量化的数据处理云侧训练时,可以被使用的资源往往比较充裕,数据处理Pipeline在运行过程中是会占用比较多系统资源(CPU和内存),以ImageNet为例,训练过程中CPU占用20%,内存占用30-50G,这显然在端侧是不可被接收的,并且数据处理Pipeline在初始化时启动会慢些,这也不适用于端侧需要快速启动、多次训练/推理的前提条件。故:MindSpore基于现有数据处理算子,提供一套更轻量化、更适用于端侧的API,解决云化场景数据处理Pipeline不适用于端侧的问题。MindSpore基于Pipeline调整架构,支持数据处理单算子独立使用(Eager Mode),支持各种场景推理,提供给AI开发人员更大的灵活性;同时,将Pipeline轻量化,实现基于Pull Base的轻量化pipeline,减少资源占用并且处理速度快。通过上述两种方法,MindSpore保证了统一的数据处理架构支撑多种不同的应用场景。未来计划在未来,MindSpore将继续完善数据处理的易用性,提供更丰富的算子和内置数据集。与此同时,探索大规模数据处理的加速技术,包括:资源自适应分配当前各数据增强算子使用的处理线程数目由用户手工配置,对用户的调优经验要求极高。通过自适应判断Pipeline瓶颈,由框架给各个数据增强算子合理分配CPU资源,可以在训练过程中动态优化数据处理性能,免去用户繁琐的调优过程。异构硬件加速当前的数据处理Pipeline操作在CPU执行,一旦出现瓶颈,带来AI芯片/GPU等待空闲,用户无法充分利用所有硬件的计算能力。MindSpore期望构建用户无感知的异构硬件资源调度能力:通过监测硬件资源使用,完善Ascend/GPU上的数据处理算子,采用代价模型自适应地将数据处理任务调度至合适的资源,实现异构硬件的充分利用。分布式缓存当前如GPT-3等网络的训练需要使用超大规模数据集,这些数据难以在本地存储,直接从OBS读取会受网络IO限制而影响性能。与此同时,在AutoML场景下,用户经常在集群中运行同一类模型的多个作业(只是超参设置不同),每个作业独立进行数据加载和处理效率极低。MindSpore期望构建分布式缓存能力,加速这些场景下的数据处理。广告时间(参与MindSpore开源社区,成为AI开发者):https://gitee.com/mindspore/mindspore (二维码自动识别)MindSpore官网:https://www.mindspore.cn/MindSpore论坛:https://bbs.huaweicloud.com/forum/forum-1076-1.html代码仓地址:Gitee-https://gitee.com/MindSpore/MindSporeGitHub-https://github.com/MindSpore-ai/MindSpore官方QQ群: 871543426转自文章链接:https://zhuanlan.zhihu.com/p/352487023转自作者:金雪锋感谢作者的努力与分享,侵权立删!
  • [互联网] 华为发布5GtoB解决方案!
    在2021MWC上海期间,华为举办了主题为“5G共创新价值”的分论坛。华为常务董事、运营商BG总裁丁耘发表了同名主题演讲,阐述了5G当前良好的发展态势以及运营商取得的5G商业回报,并针对5GtoB的行业数字化机会,正式发布了华为5GtoB解决方案。5G发展超出预期第一波市场运营商已获得商业回报截至2020年底,5G商用终端和用户数相比2019年呈现爆炸式增长。商用上市终端达到380款,增长8倍;移动用户数达到2.2亿,增长17倍;无线家庭宽带连接达到105万线,增长21倍。丁耘预计,今年这些数字仍将维持3倍左右的增长。5G手机的价位也在快速下降,其中150美金的手机已经上市,低于300美金的中低端手机超过了30款。丁耘表示,随着网络和用户规模的持续激增,5G手机的生态将在未来1到2年和4G一样成熟。同时,5G第一波市场运营商也已经开始取得商业回报。中国和韩国5G用户数急速增长,全球领先,运营商收入持续增长;芬兰DNA和沙特ZAIN也都在5G商用初期取得了亮眼的财务经营结果。正式发布华为5GtoB解决方案使能整个5GtoB商业正循环,共创新价值丁耘提出,华为利用自身在联接、计算和行业数字化领域的积累,携手运营商和其他产业伙伴,构建了面向5GtoB的“销售、运营、服务”一站式平台解决方案。这个平台解决方案可以简化企业用户的交易模式,助力运营商网络能力变现,提升合作伙伴创新效率,使能整个5GtoB的商业循环,共创新价值。华为5GtoB解决方案由4大部分组成,包括“5GtoB基础网络”、“5GtoB网络能力开放”、“5GtoB应用使能”和“5GtoB行业市场”。“5GtoB基础网络”是5G解决方案的底座,华为要持续构建5GtoB场景化的规、建、维、优的服务能力。“5GtoB网络能力开放”可以把网络能力编排成商品发布出来,让企业用户、应用开发者更易使用5G网络,并且使能企业用户自主管理园区的5G网络。“5GtoB应用使能”是一个应用创新中心。在这里,应用开发者和系统集成商可以获取运营商的5G网络能力,同时让5GtoB应用开发更高效,应用集成更简单,建立5G网络能力到5GtoB应用的桥梁,实现业务敏捷开发和上线。“5GtoB行业市场”即在云上构建一个数字超市,企业用户可以按照不同的场景,在数字化的超市里,一站式订购所需要的5G行业解决方案。丁耘表示,华为已经联合运营商、合作伙伴和企业用户,在钢铁行业率先应用了5GtoB平台解决方案,将能力和经验沉淀在平台上,通过平台实现行业解决方案的标准化和快速复制,如5G转钢自动化、5G AR远程协助装配、5G钢表质检等。呼吁5GtoB生态和标准协助促进行业数字化繁荣演讲的最后,丁耘强调,行业数字化转型的空间巨大,但各个行业的信息化基础参差不齐,应用场景差异很大,相关数字化标准也有缺失。这些挑战需要行业伙伴们一起携手、共同参与来解决。华为也会在生态和标准协同方面持续投入,为行业数字化转型做出贡献。更多信息,请关注华为5G+X 联创营:https://developer.huaweicloud.com/techfield/5g.html5G云市场:https://marketplace.huaweicloud.com/markets/5GtoB/AI云市场:https://marketplace.huaweicloud.com/markets/ai/机器视觉云市场:https://marketplace.huaweicloud.com/markets/holosensstore/index.htmlIOT云市场:https://marketplace.huaweicloud.com/markets/iot/混合云云市场:https://marketplace.huaweicloud.com/markets/hcs/鲲鹏云市场:https://marketplace.huaweicloud.com/markets/kunpeng/
  • [课程打卡] 【7天玩转网络AI模型开发】cl15374661233打卡
  • [互联网] 5G时代,如何改变一个价值千亿的市场?
    游戏,是小伙伴抹不去的记忆:儿时的红白机是所有70、80后的经典。进入大学时代,对着一台赛杨CPU加持的电脑、全寝室凑钱攒出来的Riva128显卡,用校园卡通过电话线拨号玩《石器时代》,没日没夜。电子游戏从70年代开始引入到老百姓娱乐生活中,在日、欧、美快速增长,现在已经成为了千亿美元的市场。IHS预测,2022年,全球游戏内容和服务收入将超1450亿美元。在游戏细分市场中,主要由手游、PC和主机游戏三类构成。我们先简单区别一下手游、PC和主机游戏:手游,就是手机上的游戏,以前只有诺记的贪吃蛇,现在还有农药。充分利用用户的碎片时间,大部分下载免费,而游戏内道具付费,画面和故事情节相对简单,因此对硬件的需求也相对简单;PC游戏和主机游戏属于同一类,只是平台不同。玩的都是3A大作,4K 90fps极致画面,且很多是一步步深入剧情,有大量的优质IP,跟看电视剧一般,陷入后不能自拔。手游市场在4G时代和我们有点交集,主要是游戏加速功能。但我们现在要说的,是如何通过5G改变PC和主机游戏市场。我们来看看PC市场的一些变化:CES Asia上华为终端发布华为云电脑此前,华为发布Mate 20系列,并同时升级云电脑成为2.0。这小小的变化却带来大大的惊喜:虚拟GPU加持,为华为云电脑2.0赋予了更强的功能。它可以是随身的超级本,完成办公所需的计算功能;它也是移动的图形工作站,有用不完的云端GPU渲染能力;它就是一台移动的游戏主机,Mate 20现场就演示了端游高质量画质的赛车和RPG游戏;在现实网络下,1080p高清画质游戏体验非常惊艳!将游戏从本地移动到云端,一个新的时代即将到来!当网络发展到一定阶段,快到云端存储快似本地,云端反馈瞬间即达,那么,新的时代宣告到来— —这是Cloud X的时代。Cloud X的时代特征智能端+宽管道+云应用Cloud X是一类业务,目前有云电脑(Cloud PC),云游戏(Cloud Streaming Game),以及云AR/VR。它们都是云端实时计算/渲染,管道的实时传输,手机上的高性能解码和后期呈现,他们是eMBB业务的新星。在华为X Labs 5G环境中,合作伙伴贵州动视云科技在2K云游戏系统已经就位。将原本游戏主机能力放到云端,玩家手柄的所有操作命令实时发送到云端,瞬间完成画面渲染并下发端侧呈现(<20ms网络时延,100mbps+流量@2k 60fps画质),在大屏终端解码呈现。5G使得体验行云流水。Cloud X的商业模式:提供云服务增值业务+基于体验计费的网络在Cloud X服务中,云的价值更好地得到体现。在变现的过程中,零时延、无卡顿的网络体验,是用户意愿付费的前提。运营商具备得天独厚的优势运营商的云资产运营、大量的用户入口都是得天独厚的优势。选择属于您的Cloud X运营模式在5G时代,Cloud X端管云协同为行业带来机遇。运营商可以参与提供IT服务(Cloud PC),游戏娱乐(Cloud Streaming Game),以及各类沉浸式场景(Cloud AR/VR)的增值服务。那么,您准备好改变这些传统的千亿产业吗?更多信息,请关注华为5G+X 联创营:https://developer.huaweicloud.com/techfield/5g.html5G云市场:https://marketplace.huaweicloud.com/markets/5GtoB/AI云市场:https://marketplace.huaweicloud.com/markets/ai/机器视觉云市场:https://marketplace.huaweicloud.com/markets/holosensstore/index.htmlIOT云市场:https://marketplace.huaweicloud.com/markets/iot/混合云云市场:https://marketplace.huaweicloud.com/markets/hcs/鲲鹏云市场:https://marketplace.huaweicloud.com/markets/kunpeng/
  • [经验交流] 课程笔记 AI算力与5G的邂逅,保障网络畅通无阻
    ### 课程名称 AI算力与5G的邂逅,保障网络畅通无阻   ### 课程目录 ![naie-devrun-20201024-AI-5G-xiehou.png](https://bbs-img-cbc-cn.obs.cn-north-1.myhuaweicloud.com/data/forums/attachment/forum/202102/24/001730wlojerrmgmbp1r0m.png)   ### 课程链接 * AI算力与5G的邂逅,保障网络畅通无阻 https://vhall.huawei.com/fe/watch/6309 * 【10月24日DevRun开发者沙龙直播】参与互动赢大礼《AI算力与5G的邂逅,保障网络畅通无阻》 https://bbs.huaweicloud.com/forum/thread-81964-1-1.html * 网络人工智能-所有课程链接 https://bbs.huaweicloud.com/forum/thread-48711-1-1.html   ### 学习笔记 1. 网络故障定位的重要性 1. 一旦发生群障,将导致大面积的网络故障,能快速定位根因尤为重要。 2. 运营商网络的特点 1. 网络日趋复杂 2. 专业分工更细 3. 工单数量增加 4. 维护人员转型 3. 运营商网络故障运维的痛点 1. 告警量和故障量严重不对等 2. 工单数量较多,且存在重复工单 3. 重大故障情况下告警风暴 4. 企业专网的特点 1. 高可用性 2. 可靠性 3. 互通 4. 服务 5. 安全性 5. 企业专网故障运维的痛点 1. 网络领域多,故障告警繁多 2. 故障依赖人工分析 6. 故障根因定位的难点 1. 标注数据 2. 网络是一张动态图,链路实时更新。在动态图中实时定位 3. 准确率 4. 服务效率 7. 基于白名单过滤 8. 基于压缩(关联)规则过滤 9. NAIE故障识别及根因定位服务解决方案 1. 出色的性能 2. 故障识别时间:3 minutes or less 3. 能识别高达27种故障类别 4. 冷启动:不需要标注数据即可启用 5. 秒级获得故障根因和现象告警,支持条件化查找故障识别 6. 关联故障告警树形显示,关联关系秒级推断   ### 学习赛推荐 * [华为网络AI学习赛2021-KPI异常检测](https://competition.huaweicloud.com/information/1000041344/introduction) * [华为网络AI学习赛2021-硬盘异常检测](https://competition.huaweicloud.com/information/1000041370/introduction) * [华为网络AI学习赛2021-日志异常检测](https://competition.huaweicloud.com/information/1000041371/introduction)   ### 备注 1. 感谢老师的教学与课件 2. 欢迎各位同学一起来交流学习心得^_^ 3. 笔记只包含了部分知识点,若是对相关内容感兴趣的话,建议观看视频