• 华为 AI 音箱 2
    ,华为 AI 音箱 2,好快啊,刚上就没有了。
  • [其他] 破坏方法失效,新框架MagDR让Deepfake稳定难攻
    近年来,“AI 变脸”特效风靡全球,近期爆红的 “蚂蚁呀嘿” 再次掀起体验和讨论的热潮,这种源自人工智能生成对抗网络(GAN)的新技术,能够利用深度学习技术识别并替换图片或视频中的原始人像,不仅制作过程简单,而且逼真度惊人,几乎能达到以假乱真的效果。Deepfake 作为一项技术工具,有广泛的应用空间。语音合成能让计算机用人类的声音说出上百种语言,视频合成能让《速度与激情》里的 Paul Walker 复生,但若被滥用,也将带来巨大的风险,给身份识别和社会信任带来挑战,虚假视觉信息的应用与传播还会给人们造成隐私安全等多方面的困扰。为此,一些研究致力于防止滥用 Deepfake,有研究者通过在源数据中添加对抗性干扰来破坏 Deepfake 的可能性,但是这种方法尚未完全消除威胁。近日,来自腾讯 Blade Team 的研究者提出了一种 mask-guided 检测和重建方法 MagDR(Mask-guided Detection and Reconstruction),该方法能够让 Deepfake 免受对抗攻击,这为破环 Deepfake 带来了新的思考方向。同时,该方法也能用于提升 AI 图像处理的安全性。该论文已被 CVPR 2021 接收。论文地址:https://arxiv.org/abs/2103.14211MagDR 首先提出了一种检测模块,该模块定义了一些标准来判断 Deepfake 的输出是否异常,然后使用该模块指导一个可学习的重建过程。提取自适应 mask 是为了捕获局部面部区域的变化。在实验中,MagDR 保护了 Deepfake 的三项主要任务,并且学得的重建 pipeline 能够迁移到输入数据上。这表明 MagDR 在防御黑盒和白盒攻击方面都具有很好的性能。方法MagDR 框架代表 mask-guided 检测和重建。如图 2(a)所示,它包含两个主要组件,一个检测器和一个重建器,二者均由在自适应 mask 上计算出的一组预定义标准指导。总体思路是从输出图像中感知对抗性攻击的存在(通常会受到严重干扰),并执行可调算法将所有预定义标准转换为可接受的值,之后输出被认为已重构。在该设计框架下,可以自由更改每个模块的实现。MagDR 二阶段框架的核心思想在于使用一些非监督性指标,对对抗样本在 Deepfake 中所生成的结果进行敏感性的评估,并且利用人脸属性区域作为辅助信息以及通过对最优的防御方法进行搜索组合的方式对图片进行检测和重建,以期望能够达到净化原图并保持 Deepfake 输出真实性的目的。实验该研究选取了 Deepfake 中较为重要的三个任务进行攻防实验,分别为换脸、人脸属性修改以及表情变换。给原图增加噪声后,所产生的对抗样本尽管对原图进行了修改,但修改的程度明显低于人眼可察觉的水平,而 Deepfake 模型产生的深度伪造视频却已经崩坏,无法以假乱真,其对 Deepfake 带来的影响是灾难性的。 但当改为通过 MagDR 框架进行处理时,情况发生了变化。该模型首先对视频中的对抗攻击扰动进行检测,提醒 Deepfake 的使用者,所用的图片或视频大概率是存在对抗攻击的,然后通过重建视频模型,能够有效地将攻击者注入的对抗扰动进行消除,从而实现了 Deepfake 模型相关系统的正常使用。 MagDR 框架不仅能够消除对抗扰动带来的破坏性影响,同时还保留了原图的各种像素细节,进而保证了重建后的 Deepfake 结果与原图结果一致。 这一发现表明,目前业界主流的主动性防御的方法(Deepfake 对抗扰动)不再可靠,为了避免社交网络上人脸照片被恶意使用,还需要找到更佳的 Deepfake 防御方案。 同时,腾讯 Blade Team 研究员也在此发现的基础上提出了安全建议,比如可以生成特定的对抗扰动,使得产生出的崩坏效果受到限制,更加真实以绕过目前 MagDR 的检测,或者说产生更难以被重建模块消除的鲁棒性对抗扰动。 Tencent Blade Team 由腾讯安全平台部成立,专注于人工智能、移动互联网、物联网、云虚拟化等前沿技术领域的前瞻安全技术研究,目前已向 Apple、Amazon、Google、Microsoft、Adobe 等诸多国际知名公司报告并协助修复了 200 多个安全漏洞。研究团队还表示希望大家可以对 MagDR 的组件或者整体结构进行调整与创新,以其作为新思路的创新点,产生出更为强大的防御框架,从而防止 Deepfake 的恶意滥用,进一步地加强用照片或视频的安全性。技术在不断进步,只有“用 AI 对抗 AI”,才能让技术的安全应用走得更远。
  • [HDC2021] HDC 2021(Cloud)上,华为云IoT有哪些看点?来互动赢大奖啦!
    华为开发者大会2021(Cloud)来啦!>>戳我去HDC2021官网<<>>>【HDC.Cloud 2021】华为云IoT活动、看点汇总!一文带你线上看HDC2021 IoT专场议题!在本帖参与互动讨论即可获得200码豆奖励还有精美PVC包、手机支架、鼠标等奖品等你来拿!更有开发者大礼包等你来拿!请看下文详细规则!(活动时间:2021.04.06 - 2021.05.16)(码豆可在>会员中心<兑换实物奖品)参与方法 1.  回复本帖参与讨论,每人最多可回复10次;2.  回帖格式不限,但必须带有下文任一主题,回帖示例:示例1  我想了解 LiteOS 5.0 五大新特性简化端侧设备开发和调测。示例2  我想参加 物联网高校训练营-深圳职业技术学院&华为云IoT联合出品。示例3  标准物模型,构筑物联网方案的“积木式”交付体验,标准物模型到底能为物联网产业带来哪些价值呢?... ...奖励规则 1.  回帖即可获得200码豆奖励(码豆可在>会员中心<兑换实物奖品),每个账号仅可获得一次码豆奖励;2.  活动结束后,    在所有合格回复楼层中随机抽取6个,送鼠标一个    在所有合格回复楼层中随机抽取10个,送手机支架一个    在所有合格回复楼层中随机抽取20个,送精美PVC包一个更多华为云IoT相关活动:【HDC2021】0基础玩转华为云IoT,更有开发者大礼包等你来拿! 【互动即有奖,通关即得开发板】【华为云IoT云享专家招募】IoT行业开发者、技术专家进来集合!每月10万码豆!注意事项1.   请务必使用个人账号参与活动(IAM、企业账号等账号参与无效);2.   若未按要求回复,抽奖中奖无效,获奖资格顺延至下一合格楼层;同一账号不可重复获奖,如重复则顺延至下一合格楼层;3.   所有获得华为奖品的用户,请于获奖后3个工作日内完成实名认证,否则视为放弃奖励;4.   本次活动一个实名认证账号只能对应一个收件人,如同一账号填写多个不同收件人,不予发放奖励;5.   本次活动,奖品预计于2021年5月20日前完成发放,发放时间根据实际情况动态调整,如有延期敬请见谅;6.   本活动最终解释权归华为云所有。华为云IoT现场看点专题演讲看直播回放戳我>>>LiteOS 5.0 五大新特性简化端侧设备开发和调测4月24日 9:30-10:20会议中心201内容简介:踩内存,镜像文件太大,系统运行轨迹追踪难、资源占用难分析等等问题,对物联网端侧开发者造成困难,影响开发效率,LiteOS 5.0五大新特性,即新架构、新编译框架、新轻量级AI框架、新组件和库、新开发和调试工具,助力开发者快速开发,本次分享将结合实际开发案例,重点剖析使用LiteOS 5.0 新特性解决上述开发难题。内容大纲:1. 物联网端侧设备开发难题2. LiteOS 5.0 五大新特性3. LiteOS Studio开发和调测工具4. LiteOS 2021开源路标听众收益:1. 了解LiteOS 5.0 新架构、新编译框架、新组件和库;2. 了解LiteOS Studio可视化组件管理,让开发更容易;3. 了解LiteOS Studio开发调测工具:轻量级内存检测、镜像分析工具、可视化Trace等,助力开发者快速定位问题,解决开发难题;看直播回放戳我>>>标准物模型,构筑物联网方案的“积木式”交付体验4月25日 15:30-16:20清华大学C3-302内容简介:当前物联网模型碎片化严重,解决方案呈烟囱式发展,应用与硬件强绑定,导致企业物联网研发成本高,效率低。 华为联合信通院、腾讯发布物模型标准,帮助企业提升研发效率,推动物联网产业发展速度内容大纲:1. 目前物联网行业的发展趋势2. 物模型在物联网行业中的发展过程3. 华为云IoT标准物模型在行业解决方案中如何应用4. 伙伴案例介绍《软硬件解耦下的园区应用快速开发》听众收益:1. 了解当前物联网解决方案研发过程面临的问题。其中系统集成慢,硬件选型难的问题会影响到整体方案的发展演进2. 了解标准物模型为物联网产业带来的价值,以及在物联网方案研发带来的变化与提升3. 标准物模型在研发过程的应用场景以及案例看直播回放戳我>>>华为云IoT高可靠架构演进之单元化4月26日 9:00-9:50清华大学C3-302内容简介:物联网平台现已进入成熟区,规模化应用开始呈现,也对平台提出了更高的要求。如设备量大,种类多,企业租户不断增加,行业应用场景多,从消费到生产制造,从城市到工业,涉及到我们的生活、生产方方面面。在这种情况下,也对物联网平台提出了更高的要求,需要更好的满足高性能、高可靠、低延迟、高安全。我们华为云IoT是如何从架构演进来提升平台的单元化能力。内容大纲:1. 物联网平台的挑战2. 华为云IoT平台的单元化技术架构3. 开放的华为云IoT云服务听众收益:1. 提升开发者架构设计能力,指导物联网业务应用开发2. 对华为云产品有更深入的了解以及更好的应用选型开发者训练营看直播回放戳我>>>物联网高校训练营-深圳职业技术学院&华为云IoT联合出品4月24日 15:30-17:20会议中心204内容简介:通过动手实操,让高校开发者体验如何基于IoT借助物联网开发板快速模拟实现自动售货机购物订单数据上报,并结合AIoT构建销量预测模型,以及进行大屏展示。内容大纲:1. 解读物联网技术发展历程、趋势及当前应用场景2. 讲述自动售货机工作原理及物联网技术在其中的应用3. 华为物联网技术及基于AIoT区域销量预测与可视化呈现方案介绍听众收益:1. 通过结合开发板与华为云IoT设备接入服务,模拟实现售货机购物与订单数据上报功能2. 通过设置数据转发规则,实现模拟订单数据的生成与流转3. 基于大量的上报的订单数据,结合AI模型训练,实现自动售货机区域销量预测看直播回放戳我>>>IoT数字工厂方案,构筑数字化华为手机贴片产线4月25日 13:30-15:20清华大学C3-302内容简介:通过动手实操,让工业领域开发者体验如何基于华为云IoT的物联网联接和数据分析能力,从设备接入到产线孪生,完成一整套工业物联网方案的开发。内容大纲:1. 华为工厂产线数字化的实际经验2. 华为云IoT设备接入管理服务,物理网整体架构和基本概念3. 实际操作:结合工业场景,创建产品、创建&部署边缘网关、网关配置、创建工业设备,接入到边缘网关、数据上报、数据流转到IoTA服务4. 华为云IoT数据分析服务数字孪生技术详解5. 实际操作:以华为终端南方工厂SMT产线为例,体验使用华为云IoT数据分析服务实现SMT产线数字化实现听众收益:1. 了解物联网产业的时代背景以及物联网解决方案给行业带来的价值2. 了解物联网解决方案的基本技术要点和对应的解决方案3. 理解基于华为云物联网解决方案技术特点和对应的设计理念4.掌握基于华为云物联网服务的快速设备接入方案,并具备完整的设备接入实现能力看直播回放戳我>>>基于标准物模型实现不同类型的设备快速接入4月26日 10:00-10:50清华大学C3-302内容简介:课程讲述如何基于标准物模型开发物联网应用,应用通过物的接口控制不同类型的真实设备,不同应用也可以通过授权控制同一设备。内容大纲:1. 实现应用与硬件的独立开发交付,带来软硬件解耦,灵活组合更多方案的价值2. 华为IoT生态优势,结合Stage说明快速打造解决方案的能力3. 演示软硬件解耦:一个应用控制多个不同类型设备,不同应用控制同一类型设备听众收益:1. 了解华为物联网标准物模型的作用2. 理解基于标准开发的应用跟之前相比所带来的价值与优势扫地僧见面会王启军:华为云IoT首席架构师北京大学208华为云IoT首席架构师,负责华为云物联网架构的产品演进,致力于构建亿级连接、百万并发的物联网平台。书籍《持续演进的Cloud Native:云原生架构下微服务最佳实践》的作者;公众号“奔跑中的蜗牛”的作者;华为连续三年金牌讲师,Infoq和麦思博特约讲师,曾多次受邀在业界的各类技术大会上做分享,如ArchSubmit、InfoQ、Msup、Ias、Csdi、Giac等,深受开发者欢迎。话题方向:1.阐述华为云IoT产品对可靠的观点,把可靠能力放在第一位。2.技术上解释是怎么做到高安全、高可靠与高性能。3.突显相对互联网企业,华为文化的厚积薄发,是我们能做到高可靠的终极武器。程志:华为云IoT数据分析云服务架构师北京大学208现任职华为云IoT数据分析云服务架构师,曾负责亿级用户电信系统设计、百万级车联网大数据分析的设计与交付,具有丰富的大规模系统架构设计与实战经验;目前专攻物联网数据分析方向,主导华为物联网实时数据分析以及工业互联网相关的建模和分析方向。话题方向:1.孪生建模如何高效、快速2.建模语言应该如何选用3.复杂模型如何批量构建4.工业、物流、交通等不同行业的孪生模型打造的重点Codelab动手实验Codelab1-LiteOS:Huawei LiteOS是华为面向物联网领域开发的基于实时内核的轻量级操作系统,具备轻量级、低功耗、互联互通、组件丰富、快速开发等关键能力,可广泛应用于工业、城市、个人、家庭生活等领域的解决方案和终端设备。本实验将基于LiteOS 5.0 IDE工具实现工业终端应用的可视化快速调测。Codelab1-标准物模型:华为云标准物模型服务,面向设备厂商,规范设备数据格式能力,解决不同厂商设备差异化、接入难的问题;面向软件集成商(ISV),实现应用开发与设备解耦,解决应用对不同厂家设备适配难的问题。本实验将基于标准物模型实现不同类型工业设备的属性上报。Codelab1-IoT边缘:IoT边缘是边缘计算在物联网行业的应用。IoT Edge 在靠近物或数据源头的边缘侧,融合网络、计算、存储、应用核心能力的开放平台,就近提供计算和智能服务,满足行业在实时业务、应用智能、安全与隐私保护等方面的基本需求。本实验将指导您搭建一个基于IoT边缘服务的边缘节点,并通过边缘节点实现设备通过原生MQTT协议、标准Modbus协议及私有协议以设备直连边缘节点模式接入。Codelab2-IoT数据分析:华为云IoTA服务基于物联网资产模型,整合IoT数据集成、清洗、存储、分析、可视化,降低开发门槛,缩短开发周期,帮助IoT数据开发者快速实现IoT数据价值变现。本实验将指导您使用IoTA服务资产模型能力快速构建SMT数字工厂孪生体,并计算得出数字化产线和设备的OEE指标。Codelab3-IoT Stage应用部署:IoT行业生态工作台(IoT Stage)是一站式物联网交付平台,面向物联网渠道商与系统集成商,是买家、卖家、系统集成商的桥梁和纽带,助力设备和应用集成,使能行业应用服务,实现物联网应用的低成本复制。本实验将指导您基于IoT行业生态工作台将一个工业物联网应用快速一站式部署到公有云和边缘智能站点。
  • [制造] 浅论车联网的演进!
    何谓车联网?车联网从2009年发展至今,市场上商用落地的“车载信息服务(Telematics)”模式和技术实现,跟发展初期并没有本质上的区别,无非是移动互联网技术与应用的发展,使得信息服务的种类和内容更丰富,应用场景更多样,但还体现不出任何关于“网”的特殊价值。随着政府相关政策标准的制定与监管部门的积极推动,车联网全产业链,包括汽车、通信、互联网及出行服务等行业,对智能化、网联化、电动化、共享化的“新四化”概念认知走向高度趋同,其中以中国汽车工程学会2015年10月定义的“智能网联汽车”产品形态为代表,目标是以汽车工业为本,将基于车载驾驶辅助系统(ADAS:激光雷达、摄像头视觉识别、超声波等)与通信技术相结合,即智能化与网联化的高度融合,实现每个车辆个体的“自动行为”(包括收集、感知、辨识、追踪、判断、决策)能通过网络被传播、被共享、被分析,进一步提高交通安全和效率,并最终发展成可替代人来操作的新一代汽车。ICT使能车联网5G将使能一个万物互联的世界,汽车业将是第一批被5G技术改变的行业之一。具有超低时延,超高带宽和可靠性的5G网络,将为交通行业的安全和高效保驾护航。汽车要联网,就离不开信息与通信技术(ICT)的支持。作为全球领先的ICT解决方案提供商,华为在车联网领域的布局主要包括以下三个方面:端:汽车要联网传送数据,车内就必须装配内嵌通信模组的盒子,俗称T-Box。华为提供的3G/4G模组、定制化T-Box首当其冲,成为华为涉入车联网领域的排头兵。管:现阶段“车载信息服务”模式下的车联网应用对无线蜂窝网络的时延要求相对较低,大部分落地的车联网项目主要使用WCDMA网络;采用4G LTE的厂家较少,一方面4G模组的成本较高,另一方面采用4G模组主要是为了满足车内Wi-Fi热点的需求,主流车联网服务对高速率的网络传输需求反而不高。但不可否认的是,随着4G模组成本和流量资费的降低,4G网络的普及仍是趋势,基于4G网络特性的应用也会逐渐盛行。另外,华为研发的C-V2X,应用于自动驾驶乃至智能交通融合等场景,目前还处于标准制定、概念验证、相关政策法规逐步完善的阶段。云:这里所说的“云”实际上是OceanConnect物联网平台+华为公有云的组合。华为OceanConnect物联网平台并不是专门针对汽车行业的车联网垂直平台,而是基于物联网大连接的跨行业平台产品,具有大数据分析,快速行业应用使能,与业务应用分层解耦等特性。OceanConnect物联网平台车联解决方案是物联网在汽车行业的典型应用场景。车联网演进三阶段车联网正从车企主导的功能型车载信息服务阶段,向“智能网联”为特征的新型三阶段演进,包括智能网联服务阶段,到多方参与的车路网云协同服务阶段,再到未来的智慧出行服务阶段。其中,华为重点发力在后两个阶段,即车路网云协同多行业向“智能交通出行”演进。基于车联网平台的智能网联服务阶段华为并没有涉足传统意义上的Telematics功能性车联网平台,而是洞察到汽车产业的格局变革,基于Cloud Platform as a Service的定位,借助OceanConnect物联网平台构筑产业生态,成为跨行业服务使能的控制点。OceanConnect物联网平台的关键能力包括:提供连接管理、设备管理和应用使能基础能力:定期发布车联网服务套件,支撑个行业伙伴快速实现各种物联网业务应用;通过分层的安全架构,实现统一安全车辆网络接入;T-Box或车机内置IoT Agent,简化各类终端厂家不同协议的灵活适配;对接车企已有IT/OT系统,实现数据统一呈现和管理,降低企业投资成本。除了提供基础的车联网能力,华为OceanConnect物联网平台还将云计算、大数据以及网络方面的能力开放出来,联合已集成的合作伙伴能力,包装为不同的使能套件,让车企都可以基于这些套件,在平台上面选择自己需要的服务,从而满足最终用户的出行需求。基于LTE-V/V2X的车路网云协同服务阶段V2X是指Vehicle-to-Everything,希望实现车辆与一切可能影响车辆的实体进行信息交互,目的是减少事故,减缓交通拥堵,降低环境污染以及提供其他信息服务。V2X主要包含Vehicle-to-Vehicle(V2V)、Vehicle-to-Infrastructure(V2L)、Vehicle-to-Network(V2N)以及Vehicle-to-Pedestrian(V2P)。V2X目前主要有DSRC和LTE-V两类技术,DSRC(专用短距离通信技术)率先在美国提出,从2010年标准发布,已经经过多年开发测试。随着蜂窝移动通信技术发展,出现了C-V2X(Cellular V2X,即以蜂窝通信技术为基础的V2X)技术,目前主要是LTE-V,在芯片成本、技术先进性和商业模式方面都比DSRC有优势,发展十分迅速。V2X Server是C-V2X技术充分发挥的关键所在,华为OceanConnect物联网平台具备向V2X Server演进的能力,可与车企的车联网平台和ITS智能交通系统协同,更好地实现车路协同。V2X在ETSI中定义了53个应用场景,在3GPP中定义了27个应用场景,主要包括:交通安全:紧急制动预警、异常车辆提醒、交叉路口碰撞预警、道路危险状况提示、弱势交通参与者预警等。交通效率:基于信号灯的车速引导、绿波带、前方拥堵提醒、紧急车辆信号灯优先权等。LTE-V有效借助现有的蜂窝网络与频谱来实现V2X的信息交互,分为LTE-V-Cellular和LTE-V-Direct,前者为集中式,通过Uu接口通信,后者为分布式,通过PC5接口实现车车/车路的直连通信。3GPP R14已经将LTE-V标准冻结,中国标准C-ITS和CCSA正在加紧定制中,华为是LTE-V标准的3个报告人之一。2017年9月,LTE-V 5.9GHz频谱测试工作在国家无线电监测中心指导下已完成,测试结果符合预期。基于5G的智慧出行服务阶段5G将使能一个万物互联的世界,汽车业将是第一批被5G技术改变的行业之一。具有超低时延、超高带宽和可靠性的5G网络,将为交通行业的安全和高校保驾护航。针对车联网关键业务场景对网络性能的超高要求,5G网络可以通过网络切片等创新技术,提供低至1~5ms端到端时延和高至10Gbps峰值速率,从而助力自动驾驶成为现实。随着NR-V2X标准进程的加速,在R16和R17中有希望将Uu空口和Sidelink的标准内容进行冻结,将非常有利于基于5G网络的车辆网业务商用化实施,极大推动自动驾驶产业发展。5G车联网的主要应用场景包括远程遥控驾驶(Tele-Operated Driving,TOD)、高密度车辆编队行驶以及快速协同变道辅助等。其中,TOD可以借助5G高性能网络的远程驾驶控制系统,通过车内摄像头和传感器作为远程驾驶员的眼睛和感知,将车辆360°范围内的场景传输到操控室,驾驶员据此判断和操作,进行远程闭环操控汽车。2017年6月,中国移动、上汽集团和华为在上海共同完成中国首个5G远程驾驶演示,在5G的超大带宽和超低时延支持下,驾驶员可以在几十公里外轻松准确地驾驶车辆。远程驾驶场景需要50Mbps上行速率,将车辆采集的多路高清视频实时传达到驾驶台,而驾驶员对车辆的操控信号,通过5G网络超低时延,在10ms内传到几十公里之外的车辆上,与驾驶员置身车内操控几乎没有区别。TOD场景将广泛应用在机场、港口等固定线路的区域,以及矿区、建筑工地地基压实、垃圾废料煤层压实等恶劣环境中。同时,也可以作为未来租车和共享汽车服务中自动驾驶的补充,远程进行车辆驾驶和协调。华为正在与全球合作伙伴共同努力,加速5G自动驾驶时代的到来。更多信息,请关注华为5G+X 联创营:https://developer.huaweicloud.com/techfield/5g.html5G云市场:https://marketplace.huaweicloud.com/markets/5GtoB/AI云市场:https://marketplace.huaweicloud.com/markets/ai/机器视觉云市场:https://marketplace.huaweicloud.com/markets/holosensstore/index.htmlIOT云市场:https://marketplace.huaweicloud.com/markets/iot/混合云云市场:https://marketplace.huaweicloud.com/markets/hcs/鲲鹏云市场:https://marketplace.huaweicloud.com/markets/kunpeng/
  • [行业动态] 用AI守护“星星的孩子”
    孤独症儿童,常常被称为“星星的孩子”,因为他们就像天上的星星,在遥远而漆黑的夜空中独自闪烁着。今天,是第十四个"世界孤独症关注日"(世界自闭症关注日)。全球孤独症发病率呈不断增高趋势,中国有数亿名儿童(14岁以下),当前全国儿童精神科医生缺乏,妇幼保健院覆盖面广但对孤独症儿童的专业筛查能力不足。同时,日益升高的患病率与医学诊疗手段的缺乏,使其始终停留在行为诊断、行为矫正阶段。如何通过可靠的医学方法来建立门诊早期诊断与干预,对于家园共育,社会和谐具有广泛意义,迫切需要医务人员、科研人员,康复教育工作者及孤独症家庭,社会的共同努力。日前,北京大学神经科学研究所与华为云签署合作框架协议。根据协议,北京大学神经科学研究所韩济生院士/张嵘副教授课题组携手华为云EI创新孵化Lab脑科学团队,将在云计算、AI等技术驱动下,成立“联合创新课题组”,以智慧AI医疗为主要联合创新方向,发挥各自资源优势,全面推动儿童孤独症智能诊疗的AI算法研发和相应的应用平台建设。基于云的AI辅助诊断和配套干预技术有望缓解专业医生和康复人员的短缺现状,有助于医护人员的能力辐射和拓展到医疗、行为矫正资源匮乏的边远地区。▲基于华为云的孤独症智能诊疗一体化创新平台架构示意图1月初,双方与电子科技大学Keith Kendrick教授/蒋希副研究员课题组合作的“孤独症智能诊断与精准治疗一体化创新平台的构建与应用”获得首届“未来之星”生物医药创新成果转化项目大赛医疗器械组一等奖。后续,联合课题组将在华为云AI脑科学平台上共同打造“孤独症智能诊断与精准治疗一体化创新平台”,将系列研发成果集成上线并进行服务推广和应用,期望在未来能够有效降低国家和家庭在孤独症疾病诊疗方面的社会成本。 跟华为云一起,用AI守护“星星的孩子”。
  • [行业动态] 华为云与北京大学神经科学研究所达成合作,推动AI脑科学研究
    4 月 2 日是第十四个世界自闭症日,华为云与北京大学神经科学研究院,开启了用 AI 研究儿童自闭症的计划。日前,北京大学神经科学研究所与华为云签署合作框架协议。根据协议,双方将在云计算、AI 等技术驱动下,成立「联合创新课题组」,以智慧 AI 医疗为主要联合创新方向,发挥各自资源优势,全面推动儿童孤独症(又称「自闭症」)智能诊疗的 AI 算法研发和相应的应用平台建设。 孤独症谱系障碍(Autism Spectrum Disorder, ASD)是一种起病于儿童早期,以社交损害与行为刻板为特征的大脑功能疾病。我国拥有世界上最大的人口与儿童群体,随着孤独症发病率不断增高,现有的专业医疗人员数量和医学康复支撑体系无法满足对孤独症人群的诊断和治疗。北京大学神经科学研究所韩济生院士 / 张嵘副教授课题组根据多年脑科学研究积累,综合本土低龄 ASD 儿童的行为学、脑影像学等临床研究手段,联合电子科技大学 Keith Kendrick 教授 / 蒋希副研究员课题组系统性地提出了孤独症辅助诊断、亚型识别及特色治疗手段干预的一体化临床诊疗体系。 2020 年以来,北京大学神经科学研究所携手华为云 EI 创新孵化 Lab 脑科学团队,在脑疾病临床和脑科学研究方面的社会性示范应用方面开展了一系列创新性的合作尝试。联合研发团队正通过前沿 AI 脑科学研究手段,启动一系列基于孤独症患儿脑影像多模态数据进行生物标记物异常识别的早筛和亚型诊断算法研发和基于 AI 视觉的孤独症儿童突出能力识别算法研发,并将通过把研发成果集成上线到华为云 AI 脑科学平台面向全国各基层单位进行推广应用,从而完成 「AI 脑疾病算法研发 -> 临床成果转化应用 ->临床研究数据汇聚 ->进一步提升 AI 算法准确性和适用性」的平台运行生态闭环,期望在未来能够有效降低国家和家庭在 ASD 疾病诊疗方面的社会成本。  基于华为云的孤独症智能诊疗一体化创新平台架构示意图1 月初,联合创新课题组合作的「孤独症智能诊断与精准治疗一体化创新平台的构建与应用」获得首届「未来之星」生物医药创新成果转化项目大赛医疗器械组一等奖。 近年来,华为云 EI 创新孵化 Lab 脑科学团队面向脑科学领域的多个重大关键问题开展攻关,充分发挥华为云在 AI 研发和高性能计算领域的技术积累,协同中国顶尖的脑科学研究机构、脑疾病诊疗机构基于华为一站式 AI 开发平台 ModelArts 联合打造和推广 AI+HPC 赋能的脑科学平台,为中国宏观和介观脑图谱、脑功能组学的科研创新和成果转化提供一站式的研产用转化支撑。 
  • [课程打卡] 【7天玩转网络AI模型开发】hid_6k-5iuerjumvjr3打卡
    7天实战营上机指导书 Day11、数据资产服务和数据集服务订阅成功。
  • [AI家园] 用AI守护“星星的孩子”
    孤独症儿童,常常被称为“星星的孩子”,因为他们就像天上的星星,在遥远而漆黑的夜空中独自闪烁着。今天,是第十四个"世界孤独症关注日"(世界自闭症关注日)。全球孤独症发病率呈不断增高趋势,中国有数亿名儿童(14岁以下),当前全国儿童精神科医生缺乏,妇幼保健院覆盖面广但对孤独症儿童的专业筛查能力不足。同时,日益升高的患病率与医学诊疗手段的缺乏,使其始终停留在行为诊断、行为矫正阶段。如何通过可靠的医学方法来建立门诊早期诊断与干预,对于家园共育,社会和谐具有广泛意义,迫切需要医务人员、科研人员,康复教育工作者及孤独症家庭,社会的共同努力。日前,北京大学神经科学研究所与华为云签署合作框架协议。根据协议,北京大学神经科学研究所韩济生院士/张嵘副教授课题组携手华为云EI创新孵化Lab脑科学团队,将在云计算、AI等技术驱动下,成立“联合创新课题组”,以智慧AI医疗为主要联合创新方向,发挥各自资源优势,全面推动儿童孤独症智能诊疗的AI算法研发和相应的应用平台建设。基于云的AI辅助诊断和配套干预技术有望缓解专业医生和康复人员的短缺现状,有助于医护人员的能力辐射和拓展到医疗、行为矫正资源匮乏的边远地区。▲基于华为云的孤独症智能诊疗一体化创新平台架构示意图1月初,双方与电子科技大学Keith Kendrick教授/蒋希副研究员课题组合作的“孤独症智能诊断与精准治疗一体化创新平台的构建与应用”获得首届“未来之星”生物医药创新成果转化项目大赛医疗器械组一等奖。后续,联合课题组将在华为云AI脑科学平台上共同打造“孤独症智能诊断与精准治疗一体化创新平台”,将系列研发成果集成上线并进行服务推广和应用,期望在未来能够有效降低国家和家庭在孤独症疾病诊疗方面的社会成本。 跟华为云一起,用AI守护“星星的孩子”。识别小助手二维码进群了解医疗行业AI最新实践
  • [线上活动] 【2021 HDC活动】大话AI,赢翻倍码豆~
    每一个开发者都在创造一往无前的奔腾时代世界有你,了不起!大家在期待华为开发者大会2021(Cloud)吗?HDC官网:https://developer.huaweicloud.com/HDC.Cloud2021.html在期待HDC上华为云AI的精彩分享内容吗?他来了,真的来啦~【大话AI】福利活动向大家狂奔而来!三层套娃任务,一一解锁,赢翻倍码豆赶快参与讨论赢取码豆和周边好物吧! 参与方式 任务一:2021年4月1日-4月20日期间参与下面三个主题任一一个回帖并扫码添加小助手,添加成功后,对话框回复“HDC”立即入群, 可获得200码豆,一个用户最多回答三个问题1、 2021HDC,您对哪个华为云AI议题比较感兴趣?;2、 您在AI开发者过程中踩过哪些坑?3、 您想和华为云专家深入讨论哪些AI问题?(请扫小助手入群,获取HDC第一手福利)任务二:2021年4月20日-4月26日在【AI Gallery】上签到并完成你的第一个模型订阅,获得500码豆任务三:2021年4月20日-4月26日在【AI Gallery】上发布你的第一个AI模型,获得1000码豆备注:码豆发放数以最终解锁的任务层为准,不累计发放。如只完成任务一可得200码豆,完成任务一、二可得500码豆,完成任务三可得1000码豆 奖品设置  活动时间 4月1日-4月27日 活动规则1、 参与用户必须体验或访问过 ModelArts 才可参与活动:点击访问 ModelArts 成功即可,否则视为无效参与;2、 活动时间:即日起至4月27日00:00;3、 活动结束后5日内公布详细结果,公示期3天,公示期结束开始兑奖,一般15个工作日左右完成发放,但可能会有所延长;4、 所有奖品都是活动结束后,统一收集并确认信息后进行发放,活动奖品颜色随机,且部分奖品数量有限发完即止;5、 因奖品采购时间、批次产生的差异属正常情况,如奖品库存不足将进行同价位奖品调换,介意者谨慎参与活动;6、 如发现使用他人身份恶意重复报名活动,或采取机器批量注册/虚拟手机号注册/购买账号等恶意注册行为进行违规行为,华为云AI社区有权取消相应人员的活动参与权利,并收回相关奖励;7、 所有的获奖账号必须在领取奖品之前就完成实名认证,且实名账号必须与参与活动的账号为同一个,同一实名账号仅可参与此活动一次。8、 本次活动所有回帖内容需满足华为云论坛发帖规范:https://bbs.huaweicloud.com/forum/thread-23077-1-1.html。   
  • [热门活动] HDC扫地僧约你聊聊:AIOps Engineering的实现,回帖抽奖品
    Gartner的研究显示只有53%的项目能够从AI原型开发进入到生产环境,一个关键的因素是没有一个稳健的生产级的AI工程流水线支撑。稳健的AI工程技术有助于提高AI模型的性能、可扩展性、可解释性和可靠性,同时实现AI投入的全部价值。AI项目在可维护性、可扩展性和治理方面常常面临问题,这使它们成为大多数组织面临的挑战。NAIE首席架构师沈唯祥邀你讨论!【活动时间】2021年4月2日~2021年4月8日 【参与方式】直接在本帖回复关于以下问题的理解或评论1、AI模型的开发环境和生产环境的主要差异是什么?2、IT和CT应用AI的环境有什么主要的差异?3、MLOps的目标是什么?围绕这个目标需要解决那些主要的问题。【活动奖品】(1)满48层时,随机送NAIE盲盒(10个)(2)满88层时,随机加送智能保温杯(5个)(3)满188层时,随机加送生物陶瓷电吹风(3个)    评奖标准:回复话题内容的质量预约HDC大会现场沈唯祥扫地僧见面会:点击预约【活动规则】1、互动有礼的活动2021年4月8日23:59截止。2、为防止有恶意发帖行为,每个话题最多评论1条,若超过将取消获奖资格。3、本次回帖内容需满足华为云论坛发帖规范https://bbs.huaweicloud.com/forum/thread-23077-1-1.html 【获奖公示】2021年4月9日公示点击查看HDC其他活动如有问题请联系助理小爱
  • [热门活动] HDC扫地僧约你聊聊:AutoML端到端视角分析,回帖抽奖品
    机器学习的应用需要大量的人工干预,这些人工干预表现在:特征提取、模型选择、参数调节等机器学习的各个方面。AutoML试图将这些与特征、模型、优化、评价有关的重要步骤进行自动化地学习,使得机器学习模型无需人工干预即可被应用。诺亚AI系统工程实验室主任刘文志与您交流,了解AutoML的大规模并行,多阶段联合优化,统一框架设计,搜索空间表示和设计等关键技术,及训练时间长、模型泛化性、没有统一的框架,完全的自动化等难点的挑战。【活动时间】2021年4月2日~2021年4月8日 【参与方式】直接在本帖回复关于以下问题的理解或评论1、实用AutoML系统所面临的关键技术难题和挑战有?2、如何解决这些问题和挑战?【活动奖品】(1)满48层时,随机送NAIE盲盒(10个)(2)满88层时,随机加送智能保温杯(5个)(3)满188层时,随机加送生物陶瓷电吹风(3个)    评奖标准:回复话题内容的质量预约HDC大会现场刘文志扫地僧见面会:点击预约【活动规则】1、互动有礼的活动2021年4月8日23:59截止。2、为防止有恶意发帖行为,每个话题最多评论1条,若超过将取消获奖资格。3、本次回帖内容需满足华为云论坛发帖规范https://bbs.huaweicloud.com/forum/thread-23077-1-1.html 【获奖公示】2021年4月9日公示点击查看HDC其他活动如有问题请联系助理小爱
  • [热门活动] HDC扫地僧约你聊聊:万级边缘侧联邦训练,回帖抽奖品
    标注数据少、数据孤岛、数据隐私成为AI主要屏障。联邦学习可以解决传统机器学习需要把训练数据集中带来的安全、隐私问题。“天才少年”王宇辰邀你讨论联邦学习如何在通信网络中应用以及在NAIE上的能力。同时也会涉及一些其他AI应用的探讨。【活动时间】2021年4月2日~2021年4月8日 【参与方式】直接在本帖回复关于以下问题的理解或评论1) 为什么需要联邦学习?它有哪些特点和价值?2) 联邦学习应用场景,实际应用的case以及在NAIE上的能力建设。3) 联邦学习AI相关的技术点【活动奖品】(1)满48层时,随机送NAIE盲盒(10个)(2)满88层时,随机加送智能保温杯(5个)(3)满188层时,随机加送生物陶瓷电吹风(3个)    评奖标准:回复话题内容的质量预约HDC大会现场王宇辰扫地僧见面会:点击预约【活动规则】1、互动有礼的活动2021年4月8日23:59截止。2、为防止有恶意发帖行为,每个话题最多评论1条,若超过将取消获奖资格。3、本次回帖内容需满足华为云论坛发帖规范https://bbs.huaweicloud.com/forum/thread-23077-1-1.html 【获奖公示】2021年4月9日公示点击查看HDC其他活动如有问题请联系助理小爱
  • [热门活动] HDC扫地僧约你聊聊:多模态学习、交互式学习,回帖抽奖品
    自然语言是用来描述现实世界的,融合自然语言和图像、视频等多种模态的信息,对自然语言理解、图像和视频理解会有显著的价值,这在近几年AI领域的研究中得到验证。在电信、医疗、物流这样的真实产业应用中,融合多模态信息的AI模型会有哪些实际应用场景,会带来哪些显著的改变?NAIE首席算法专家陈义邀你讨论【活动时间】2021年4月2日~2021年4月8日 【参与方式】直接在本帖回复关于以下问题的理解或评论1. 过去一年中,多模态机器学习令人印象最深刻的结果有哪些?2. 真实产业应用中,多模态机器学习的潜在应用场景有哪些?会带来的显著价值是什么?3. 在实际场景中应用多模态机器学习的主要障碍是什么,有哪些技术挑战?【活动奖品】(1)满48层时,随机送NAIE盲盒(10个)(2)满88层时,随机加送智能保温杯(5个)(3)满188层时,随机加送生物陶瓷电吹风(3个)    评奖标准:回复话题内容的质量预约HDC大会现场陈义扫地僧见面会:点击预约【活动规则】1、互动有礼的活动2021年4月8日23:59截止。2、为防止有恶意发帖行为,每个话题最多评论1条,若超过将取消获奖资格。3、本次回帖内容需满足华为云论坛发帖规范https://bbs.huaweicloud.com/forum/thread-23077-1-1.html 【获奖公示】2021年4月9日公示点击查看HDC其他活动如有问题请联系助理小爱
  • [互联网] 打造东方智造城,华为云助力上海推进5G产业加速集聚孵化!
    来源:新华网打造上海成为具有世界影响力的国际数字之都,正成为当下上海推进城市数字化转型的核心。上海2021年的政府工作报告中指出,坚持数字经济和实体经济深度融合,推动数字产业化、产业数字化。加快发展在线新经济,聚焦智能工厂、工业互联网、电商平台等重点领域,着力培育新生代互联网产业集群。大力推进新一批新基建重大项目,新建5G室外基站8000个。当前,上海正着力集聚一批标志性、代表性、功能性的重大项目,加快打造世界级前沿产业集群。而目前上海已实施在线新经济“23条”,正在积极推动工业互联网创新升级,加快在线教育、在线新文旅等发展,并已在全国率先建成5G和固定宽带“双千兆”城市。助力上海从“代工厂”到“东方智造城”据悉,截至今年1月底,上海已累计建设5G基站超过9万个,智能制造、健康医疗、智慧教育等十大领域的430多个5G应用项目正在加快推进,同时还创办了上海金桥5G产业生态园。得益于上海领先的数字化建设、产业集群优势以及5G、云计算、大数据与物联网等新技术的加持,金桥实现了从“代工厂”到“东方智造城”的跨越。自2020年开园以来,上海金桥5G产业生态园就聚焦金桥的三大重点产业“智能造”“大视讯”“未来车”,引进多个重点项目入驻。其中,华为全球首个以5G为主题的创新中心— —华为上海5G创新中心,就坐落于上海金桥,它的成立为金桥三大重点产业的建设和发展提供了强大的动能。为5G产业提供了丰富的应用落地沃土,以及培养了一大批潜在的合作企业。可以说,华为上海5G创新中心的成立,一方面,助力浦东实现区域联盟协同发展,为金桥5G生态园企业提供5G、云服务等全方位技术支持;另一方面,加速5G研发成果转化,推进5G产业加速集聚孵化,逐步形成5G协同创新生态体系,催生新的细分产业集群,赋能金桥产业高质量发展和数字化精细管理。5G改变社会,华为云产业云助力上海打造长三角示范点自创新中心落地以来,一直在持续发力联合生态、新兴产业、地方产业和人才培养,以5G改变社会为愿景,以打造长三角示范点为目标。华为希望以技术推动金桥5G生态园建设,助力上海构建5G产业联合共同体、开拓创新优质企业孵化、加速区域内产业升级并打造5G产业创新人才实训基地。目前,创新中心已经在推动产业生态建设、助力产业人才培养等多方面取得了显著成绩。其中,在赋能产业上,创新中心为产业生态服务,通过联合产业联盟,提供专业解决方案等方式推动产业的数字化转型。目前,创新中心已联合政府、协会、咨询、科研院所成立区域性的视讯、工业、生物医疗联盟或圈子,积极开展了培训讲座、人才培训等生态建设活动,并为政企转型升级提供了集成制造中心IMC、企业集成平台ROMA、机器学习服务MLS、深度学习DLS、医疗智能体等技术支持。联合产业联盟也是创新中兴赋能产业,为产业生态服务的重要方式。创新中心抓住5G超高清产业发展机遇,以先进技术为驱动,加快全媒体传播和智能化转型,与5G超高清产业联盟、智能驾驶联盟成员之间互联、互动、互融、互通,助力金桥打造具有影响力的5G产业生态,辐射上海乃至全国。创新中心推动5G技术在上海生物医药行业的应用就是一个很好的示例。随着中国医药领域数字化进程不断加速,医药服务水平大幅提升,医药产业转型升级也进入快车道。华为作为全球领先的ICT基础设施提供商,已为上海市生物医药行业协会的发展提供了场景化生态方案,助力医药行业转型升级。而创新中心也将汇聚华为在5G研发方面最核心、最前沿的技术,助力生物医药行业的数字化转型。除了推动产业生态建设,创新中心在人才培养方面也取得了成绩。2020年9月在浦东新区,由浦东新区人力资源和社会保障局、中国(上海)自由贸易试验区管理委员会金桥管理局主办,华为技术有限公司协办的“5G技能湾”正式成立,这是浦东新区首个“产业+技能”和“产教融合”为一体的技能品牌基地,也是全市首个与5G产业相结合的技能人才培养基地。作为首批就业创业见习基地,“5G技能湾”自成立以来便持续跟踪国家新基建发展进程,研究5G应用产业发展,预测产业技能培养需求,制定5G技能人才培训计划,助力5G产业应用新技术、新职业发展,优化产业服务生态环境。目前,上海浦东携手华为打造的华为上海5G创新中心,已成为全国的标杆。上海市浦东新区党宣部官方公众号“浦东发布”称:华为上海5G创新中心正助力金桥打造“东方智造城”,这无疑是政府对华为上海5G创新中心的高度肯定。提升创新能力,让科技和产业深度融合华为上海5G创新中心于2020年得到工信部授牌全国首批标杆创新中心。作为上海唯一的标杆创新中心,创新中心正积极打造创新“智能体”。截至目前,创新中心为45家企业提供数字化转型服务。其中,智能造领域20家,未来车领域9家,大视讯领域16家,包括环 球网(上海)数字科技有限公司、上海理想信息产业(集团)有限公司、上海跨与事业发展有限公司等。以环 球网(上海)数字科技有限公司为例,作为一家围绕政府、企业商业需求,开展电商直播、电商服务平台搭建、短视频内容创意、制作、分发等业务的优质“内容营销策略服务商”,对网络直播多平台运行的稳定性、流畅性以及平台管理等有着极高的要求。因此,华为上海5G创新中心将联合抖音/快手直播等头部KOL直播平台,助力金桥打造5G+视讯直播生态。在助力传统工业企业方面,华为上海5G创新中心针对上海理想信息产业(集团)有限公司的发展需求和金桥本地域情况,助力其打造一个属于金桥本土的5G+工业互联网平台。农业上,华为上海5G创新中心联合中国供销集团、孰美农业、打造了花卉、水果、5G农机等现代智慧农业联合体,助力上海农业数字化进程;医疗行业也有创新中心的身影,未来,创新中心将联合上海跨与事业发展有限公司与爱克斯射线防护技术有限公司,为其打造5G+云+智能医疗方舱的智慧医疗体解决方案,助力行业医疗标准发布,打造创新医疗应急生态。制造业方面,华为上海5G创新中心联合沪东造船旗下东欣软件共同成立联合实验室,共探5G+云赋能高端装备制造;而在汽车行业,围绕金桥“未来车”生态,华为上海5G创新中心助力上汽智能网联共推5G+港口、5G+矿山、5G+干线仓储物流的创新场景加速孵化,实现消费互联网及产业互联网的全方位融合。另外,华为上海5G创新中心以音视频产业能力,助力中国电信天翼超高清在大视频、老人儿童随身终端等数字生活化场景,推进5g数字生活业务规模化生态发展。为强化上海资源配置功能、科技创新策源功能、高端产业引领功能以及开放枢纽门户功能,全面深化国际经济、金融、贸易、航运、科技创新中心建设,全力打响“四大品牌”,加快建设现代化经济体系,持续提升上海城市能级和核心竞争力。在2021年,华为上海5G创新中心将继续联合政府。协会、咨询、科研院所,区域性的视讯、工业、生物医疗联盟或圈子,围绕圈子开展品牌线上线下的品牌活动,把华为在5G领域的研发成果在金桥开发区进行全产业多垂直领域、多场景的应用,进一步推动技术赋能产业数字化升级。目前,华为云产业云已在全国落地超120个创新中心、产业集群攻关基地,通过联合300余家合作伙伴,为逾1.7万家制造企业开展数字化转型,为100余万名企业用户提供数字化转型服务,从业务流深入“研产供销服”5大类制造场景,以电子、装备等产业集群实践经验及优势,拓展覆盖汽车、石化、钢铁、五金等逾15个产业集群。从企业成长生命周期来构建赋能平台,实现从小企业到大企业,从大企业到卓越企业的跨越。更多信息,请关注华为5G+X 联创营:https://developer.huaweicloud.com/techfield/5g.html5G云市场:https://marketplace.huaweicloud.com/markets/5GtoB/AI云市场:https://marketplace.huaweicloud.com/markets/ai/机器视觉云市场:https://marketplace.huaweicloud.com/markets/holosensstore/index.htmlIOT云市场:https://marketplace.huaweicloud.com/markets/iot/混合云云市场:https://marketplace.huaweicloud.com/markets/hcs/鲲鹏云市场:https://marketplace.huaweicloud.com/markets/kunpeng/
  • [经验交流] AI前沿:数据智能产品与技术漫谈
    背景:大数据是AI时代的基石。企业与政府大力加强业务智能、决策智能发展,其中,数据相关的基础设施、应用与服务建设一直是焦点所在。人工智能公司创新奇智的数据智能团队依托Orion自动化机器学习平台,在制造、金融、零售等场景中,积累了不少实践经验。本文以问答方式,与创新奇智的数据智能产品总监、技术总监探讨了数据智能领域的产品与技术实践规律及前沿趋势。问:如何理解“数据智能”?在行业市场上,数据智能是一个常用于产品宣传,却又缺乏清晰定义的一个术语。该如何看待这个概念的本质?答:企业和政府信息化部门做了多年的大数据建设,这个领域概念繁多,脉络复杂。经常看到不同背景的人在一起谈数据智能,说的却不是一件事。根据我们的理解:数据智能的本质是——由高价值大数据有效驱动的智能业务。从行业客户的业务视角来看,当然是先有业务需求,再有数据智能产品或解决方案。例如,我需要智能营销,自然就引发有关客户画像的机器学习需求,而机器学习类的算法需求又必然引发对高质量数据样本、数据标签等的依赖。从产品与解决方案的系统视角看,数据智能需要先打下良好的地基——大数据平台,然后在其基础上建设机器学习算法领衔的人工智能平台,以支撑应用层的业务功能,实现客户的业务规划和产出预期。整个大数据体系的理论基础早在 2004 年前后就已经建立起来了。过去一二十年,行业先解决的是“有没有数据”的问题,即“数字化”“信息化”等老问题。数据在平台内的表现形式经过几次迭代,从单纯的结构化数据,到结构化与非结构化数据的共生,再到多模态数据以及与特定应用类型相关的数据视图,等等。接下来,完成了信息化建设的行业客户开始把注意力集中到数据本身的价值问题上,即“数据有没有用”的问题。很长一段时间里,似乎人人都在谈“大数据”,可大多数时候只是“数据大”,很多数据并不知道该如何发挥价值。其实,真正的大数据不是单纯说数据量有多大,而是要考察数据本身是否蕴含了足够的聚合价值、信息价值、业务价值。一些企业花费资源建了大数据中心,数据量不可谓不大,但遇到业务问题时,要么找不到数据,要么发现数据不合用,要么发现系统缺乏利用数据的有效接口……光有数据而没有应用,这就很难支撑起数据智能的摩天大厦了。再进一步,当行业客户拥有了高价值的大数据基础后,必然要追求大数据在智能业务中的使用效率和价值回报。最近几年人工智能热度高,不少客户尝试使用机器学习系统来解决业务问题,但数据基础、机器学习算法和业务应用之间往往难以形成良性循环,数据与算法和业务之间的关联度不高,人工智能技术未能深入到核心业务链条中,很难达到一个最佳的投入产出比。好的数据智能产品必须能解决这些问题,至少,应能做到以下三点:降低客户积累与聚合高价值大数据的整体成本;在保障数据安全的基础上,大幅提高客户数据的流转效率和使用效率;发挥客户大数据中蕴含的信息价值和业务价值,利用智能算法提高客户业务效率。问:许多客户反映,他们在数据智能建设上的最大痛点是经常发现数据不可见、不好用、噪音多、难聚合、难提炼、难生效。数据智能产品该如何避免这些痛点?答:从大数据到人工智能的建设链路周期很长。很多客户也是在建设中边摸索、边改进需求、边升级业务流程的。如果用割裂的方式,分别考察和采购数据库、大数据平台、机器学习算法、业务应用软件等,就很容易导致上述痛点问题的出现。反之,如果能在一个整体思路下,仔细评估数据智能产品与客户当前工具链、价值链的匹配度,项目的成功概率就大了很多。在工具链层面,客户要采购的数据智能产品必须和今天客户环境中的相关软硬件工具协同工作。技术上,新产品是否能从已有产品中顺利导入导出数据,能否和现有IT运维人员的能力匹配,是否能和已有的数据存储平台兼容等,都是工具链层面需要考察的重点问题。在价值链层面,数据智能产品与客户的业务有多好的连接度,能同时支持多少业务的运行,能在业务运行时提供多少效率提升或价值提升,最终的投资回报是多少——这些问题不想清楚,上述痛点必然反复出现。举个例子,我们在为某家银行做智能风控业务时发现,该银行曾经尝试过一个机器学习算法支撑的风控模型,但实施过程中客户自己发现,无论如何优化,该风控模型的“增益”就是上不去,很难在业务层面体现出可见的价值回报。客户回过头来调研后得到结论:机器学习模型效率不高,是因为从大数据层提取的样本特征质量不高;样本特征质量不高,是因为大数据层聚合的原始数据噪音较多;原始数据噪音较多,最明显的原因是已有的大数据平台是与上层的机器学习模型分别建设的,数据虽多,却难以用机器学习算法期待的方式参与上层的风控模型。简单说,这家银行采购的大数据平台与风控模型之间缺乏可连接性,丰富的数据资源难以发挥效力。我们为这家银行提供的解决方案,就更像是一条能够将大数据平台与智能风控模型联通的自动供应链——其实就是从业务视角出发,将大数据平台的数据在更高一层的视图上进行再次清洗、对齐和平展化,然后在工具链中,增加一个自动特征工程的层级,利用机器学习算法自动完成特征生成、特征价值评估和特征筛选。经过这样的系统改进,最上层的风控模型拿到的样本特征质量获得大幅提高,业务价值也逐渐凸显出来。问:从大数据到智能决策的整个产品链条,未来的发展趋势是什么?数据智能的整体产品设计经历了三个发展阶段。我们把各阶段的典型产品形态总结成三种“数据智能范式”:一、传统范式——以业务单元为核心由业务需求带动数据需求的模式——早期的数据类应用以业务需求为单元,单独建设,隔离发展。每个业务模块拥有自己独立的数据支撑和应用支撑。二、流行范式——以数据整合为核心先有数据汇聚,再共享给不同业务来使用的模式——业务形态的多样化以及客户对投入产出比的高要求必然带来数据层面的整合与业务层面的整合。今天的大多数数据智能系统建设都采用了数据整合、业务整合的思想。例如,数据湖是典型的数据整合层,中间件是典型的业务共享单元层,流行的数据**则试图将数据与业务的可扩展性容纳到一个统一的体系内。三、未来范式——以数据资源按需流转为核心单纯的数据整合与业务整合可以解决资源共享的基本问题,但不易达到数据使用效率的最大化。我们认为,未来更好的数据智能范式,应该是自上而下围绕业务价值建立的数据按需供给、自动响应、安全流转的新范式。在未来的数据智能范式中,客户对业务价值的要求体现在整个系统架构的设计思路里。自底向上,系统逐层提供数据支撑和业务灵活度:未来范式的基础是“数据资产地图”。“数据资产”和传统“数据”这两个概念间的最大不同是前者强调数据的可用性,后者强调数据的技术形态。所有数据都可能形成数据资产。我们可以通过智能技术,将数据的潜在价值挖掘出来,例如,将实体间的关系揭示出来,将隐藏在信息背后的深层知识抽取出来,将数据中蕴含的样本特征提炼出来,将数据在高维空间的分布规律描绘出来,等等。我们还可以在非常细的粒度上,为每一“份”数据标记它的来源、位置、交换方式、“健康”状况等。由此,上层算法或应用不仅可以快速找到所需的数据,还可以随时知晓这份数据该如何用,是否可用等。在数据资产地图中,每份数据都是“有生命的”。未来范式的中间层级是“数据供应链”。这个概念和此前强调数据聚集与使用关系的“数据仓库”以及强调通用业务单元的“中间件”不同。数据供应链更强调数据与不同业务应用之间的无缝衔接和数据在整个业务流程中的安全、有序流转。简单说,未来的大数据不应是静态的数据聚合与共享,而应该是动态的,可以根据业务流程的变化而变化,“按需匹配”完成数据供应的技术体系。最后,统一的数据资产地图和高效的数据供应链支撑起顶端的数据决策引擎。引擎可以有针对性地调度、获取和应用数据资源,利用机器学习技术为客户业务提供强有力的支持。拿图书馆来打比方:传统范式下的数据管理就像是每个图书馆各自管理图书,各扫门前雪;流行范式下大集中的数据管理就像是把全国各地图书馆里的书都调过来,统一存在超大规模的库房里。这两种方式各有各的挑战。而在上面谈到的未来范式下,图书本身是不一定要物理集中的,集中和流转的有可能是图书的摘要,有可能是图书的索引,有可能是图书中提取的知识脉络或内容纲要,也有可能是表明图书目前状态和使用价值的元数据。读者可以在任何时候、任何地点,快速定位需要的信息或知识。读者需要什么样的知识组织形式,图书馆就可以按照什么样的形式来重新组织和包装知识——这是知识的按需供应。所谓“数据供应链”,本质是一种价值传导。很多大数据工程是先搭好数据平台,然后等着业务过来使用,就像图书馆先把图书摆在书架上,等着读者来借阅。如果用动态的思路来看待这个问题,我们完全可以用更低的成本,更聪明地组织好数据资产中的定位信息和元数据,每当一个新的需求方提出了数据访问要求,就很快通过一个灵活的配置文件,将所需的数据组织好,供给到需求方——这是数据价值的按需供应。问:数据库,数据仓库,数据湖,数据**,数据集市,数据治理,大数据操作系统,AI操作系统,智能决策引擎……这些相关但内涵又非常不同的概念之间,是否反映了某种技术和产品演进规律?答:在行业解决方案这个大背景下,技术和产品概念的演进必然是市场需求与技术迭代两者相互作用、相互助力的结果。早期的概念更偏向对技术价值的展现,中后期,这一类概念逐渐转向业务需求驱动,更偏向对业务价值的展现。例如,很多年前,数据仓库、数据ETL(抽取、转换、加载)的概念更多是从技术侧演进的,基本上源于技术人员在解决那些简单关系型数据库力不从心的任务时的深入思考与高层设计。单点的业务需求和单点的技术积累一旦拓展到不同的数据维度,不同的数据分析方式,就必然引发更高层次的架构组合与技术抽象。而晚些出现的数据湖、数据集市、数据**等概念,则更加深刻地体现了系统对业务价值的支撑。产品和技术人员搭建的平台已经从数据库、数据仓库等要解决的“如何存”“如何查”等基础问题,上升到了“不同模态的业务数据如何聚合”“数据如何被业务使用”“业务如何扩展”等问题。后面这些问题显然与业务价值更近。当然,也有一些概念是纯粹针对市场的包装。比如很多产品声称自己是“AI操作系统”,可业界对什么是“AI操作系统”的理解并不一致,机器学习所代表的AI算法集合与管理计算资源、输入输出设备的操作系统之间也缺乏技术上的可比性。这样的概念有很大的市场营销空间,但可能很难在产品与技术领域沉淀下来。问:技术和工程层面,今天数据智能相关的热点技术有哪些?举例来说,多模态数据的处理是一个难点,也是今天的技术热点。今天各类行业客户业务相关的大数据环境里,数据本身的形态复杂度急剧增加。文本、语音、图像、视频等数据和传统的结构化数据相比,单条数据的体积更大,信息密度也更低,但是事实性更强。体积更大会导致存储成本更高,进而会导致在实际环境中其存储的时间更短,处理时消耗的计算资源更多,处理的时间更长;信息密度更低,使得我们在使用时一般会基于场景做一些信息抽取的过程,转换成结构化数据使用;事实性更强,所以在做基于多模态数据的综合判断时,这些非结构化数据的结论权重会更高。深度学习技术的迅猛发展为解决类似问题提供了很好的技术支撑。最近两年非常火的基于Transformer的预训练模型可以跨数据形态,用类似的方式学习到文本、语音、图像、视频中蕴含的信息或知识。比如,2021年3月阿里巴巴与清华大学联合发布的业界最大的中文多模态预训练模型M6,就可以适用于广泛的多模态任务,包括产品描述生成、视觉问答、诗歌生成等,还专门支持文本引导的图像生成任务。此外,如何用人工智能的前沿技术,自动清洗数据,如何自动将不同来源、不同字段规范的数据相互对齐,如何从数据背后发现隐藏的更有价值的信息或知识,如何从一个领域数据处理快速迁移到另一个领域等,都是未来几年数据智能领域需要投入大量研发资源的地方。当然,人工智能不是万能的,不是一件拿着锤子就可以到处敲钉子的工作。好的人工智能技术要落地,必须结合具体业务,将算法的应用范围限定在一定的场景内。即,人工智能落地非常依赖于“有限场景”。简单讲,如果不限定领域,从所有文本中评估两个实体间的相关度肯定是非常难的,但如果限定金融领域的文本,这时再评估两个金融术语之间的相关度,问题就会容易不少。问:数据可视化技术在数据智能中的作用如何?如何设计一个成功的数据可视化产品?答:数据可视化是借助视觉表达方式,将枯燥专业的,不直观的数据内容,浅显直观的传达给数据使用者的一种手段,是数据智能的重要组成部分。一个成功的数据可视化产品,最重要的是找准数据可视化产品的定位,即数据可视化产品的受众。数据可视化需要匹配受众的专业背景知识,并能够让受众轻松快速地查看和使用数据,同时还要充分考虑受众对数据呈现基本原理的熟悉程度,以及是否需要经常定期查看图表等因素。受众的不同会影响到数据可视化的数据的层次、数据粒度、数据的类型、图表的使用、示例说明的详细程度以及交互的程度。在一个针对多受众的数据可视化产品中,会基于不同的受众决策采用不同的数据可视化展现方案,并保持可视化的一致性。例如,将一组无序的离散数值型数据做可视化时,如果受众几乎没有统计学相关的知识,我们可以按照数值区间分组,然后通过饼图或者南丁格尔玫瑰图来显示;如果稍微有一点点统计学的知识,则可以通过箱型图来显示;如果有一定的统计学背景,就可以选择用直方图了;如果统计学知识很深厚,则可以进一步在直方图上拟合出概率质量函数。当然这些还仅仅只是从数据视角出发考虑的问题,从艺术视角来看,针对统计学知识比较少的受众,在一些报告类的数据可视化产品中可以用一些更个性化、更酷炫的方式展现饼图、南丁格尔玫瑰图或者箱型图中的数据;从设计的视角来看,针对有丰富统计学知识的受众,在直方图和概率质量函数拟合时可以提供丰富的配置方法,让用户可以非常方便的选择和调节背后的算法公式。问:自动化机器学习(AutoML)可以在 数据智能系统中扮演什么角色?在企业应用中引入自动化机器学习,有哪些需要注意的地方?AutoML技术最吸引人之处在于它能够实现更便捷、更高质量的AI智能应用搭建,从而实现人工智能这种社会基础动力的普及。识别、预测等各类与机器学习相关的业务需求,都可以通过AutoML来不断降低搭建门槛、提升效率和质量。建设AutoML系统时,一方面,为了提升便捷性,要考虑整个AI智能应用搭建的全流程。例如,场景化AutoML平台在机器学习建模过程之外,涵盖模型搭建前的业务分解、数据评估以及后续的智能应用部署实施和更新等流程,形成完整的自动化流程,满足客户从业务到任务、从任务到流程、从流程到模型以及从模型到最终应用的全流程需求。另外,采用无代码或低代码的开发方式以及友好的用户界面,加以对自动化环节的可解释性展示,最终达到用户便捷无忧的实际体验。另一方面,AutoML结果的高质量是依赖先进算法以及高质量模型和知识的丰富积累来实现的。如创新奇智的场景化AutoML平台,在采用业界最先进的自动化特征工程、模型选择、参数优化、模型融合等算法技术的同时,基于元学习和经验概化理论,首创了基于实际场景迁移的AutoML方法,实现了一整套场景化AutoML方法论和算法工具,从而最大化人工智能引擎的最终效果。问:如何高效管理数据智能平台涉及的各类计算资源,特别是深度学习高度依赖的GPU资源?举例讲讲单GPU训练和多GPU训练的资源调度问题。该如何高效利用好单张 GPU 的算力资源?GPU 的架构模型与 CPU 有很大不同,很多时候难以沿用 CPU 虚拟化的方案。我们常需要针对 GPU 的特点,构建一种适用的虚拟化方案。除了 Nvidia 的商业方案外,随着云原生的发展和开放,还有很多基于 K8s 的技术方案可供选择。其中有两个主要技术:调度技术解决是否允许将任务分配到某张 GPU 卡上的问题,隔离技术解决同张 GPU 卡上不同任务之间不互相影响的问题。该如何提升GPU 集群的分布式训练效率?训练任务规模的增长要求分布式的训练方式,而分布式训练必然会涉及到模型参数的同步和分发,技术上既有基于参数服务器的 PS 架构,也有从 HPC领域发展而来的基于 MPI 通信原语的 Ring AllReduce、Binary Blocks 等架构,这些架构除了解决分布式训练过程中模型参数的同步问题外,还在降低参数同步所带来的性能损耗方面做出努力。这样,对于分布式训练任务,用户仅需指定资源需求、Worker节点数量,提供训练代码,就可实现像单机训练任务一般简单的分布式训练。从客户角度讲,数据智能平台的基础资源管理部分最好能提供一种同时兼容单GPU训练和分布式GPU训练的任务、资源调度方案。在客户业务初期试验阶段,任务规模一般较小,通过虚拟化方案,客户可以实现在一张 GPU 上同时训练多个任务;而在业务应用阶段,单机训练无法承载生产级别的数据量和模型规模,需要借力分布式训练,最大程度的发挥 GPU集群的整体效率。问:创新奇智在数据智能领域提供的Orion系列产品和解决方案有何特点?创新奇智的Orion自动化机器学习平台是一套符合未来数据智能范式的,拥有可灵活选择、配置的三层结构,面向行业客户,以私有化部署为主的系列产品和解决方案。Orion数据智能引擎主要包括三大产品单元:Orion IRC:智能资源调度管理,提供计算资源管理和数据资产地图。Orion DAC:智能数据融合管理,支持数据动态融合,实现数据供应链。Orion AML:自动化机器学习,基于数据完成智能决策。从设计初衷上说,Orion自动化机器学习平台主要希望帮客户解决两件事:如何用好数据,如何提高数据决策能力。首先,要“让数据会说话”。获取、清晰、存储、加工、管理这些数据基础操作都只是手段而不是目的,最终目的是能让客户从数据中获取足够的使用价值。这里面最关键的因素是如何“盘活”数据资产。数据越来越多,但只有“盘活”了数据与业务之间的供需关系,真正建成了“数据供应链”,客户业务才能有提升。继而,要“让数据会决策”。数据智能引擎必须在数据建设的基础上,用有效的、面向业务目标的机器学习能力,帮助客户提高从信息中获取知识,从知识中预测趋势,从趋势中洞见未来的能力。有了这样的能力,客户的决策才能真正升级到数据驱动的层次上。Orion自动化机器学习平台的核心使命就是利用前沿技术盘活客户数据,实现数据价值,赋能客户业务。