-
描述10类常见美食图片数据集1、数据简介本数据集为华为云AI大赛入门赛《爱(AI)美食·美食图片分类》竞赛数据集。本数据集已经在ModelArts数据管理模块进行了标注,数据标注类型为“图像分类”。本数据集包含10种美食图片,分别为:冰激凌、鸡蛋布丁、烤冷面、芒果班戟、三明治、松鼠鱼、甜甜圈、土豆泥、小米粥、玉米饼,每类图片500张。2、适用的算法本数据集可用于如下AI Gallery图像分类算法进行训练:图像分类ResNet50-EI-Backbone:https://marketplace.huaweicloud.com/markets/aihub/modelhub/detail/?id=24298ade-0189-48ee-88e3-e01f484e73dc图像分类-ResNeSt:https://marketplace.huaweicloud.com/markets/aihub/modelhub/detail/?id=10014e59-0a42-4a6c-a17c-afae33dcd420图像分类-ResNet_v1_50:https://marketplace.huaweicloud.com/markets/aihub/modelhub/detail/?id=40b66195-5bbe-463d-b8a2-03e57073538d图像分类-Inception_v3:https://marketplace.huaweicloud.com/markets/aihub/modelhub/detail/?id=cad65a02-ef22-46e1-bd5b-01f231da9272图像分类-Inception_Resnet_V2:https://marketplace.huaweicloud.com/markets/aihub/modelhub/detail/?id=27536e00-e8fc-43e4-9833-2e4b6e8e1f1d图像分类-Res2Net_50:https://marketplace.huaweicloud.com/markets/aihub/modelhub/detail/?id=cfe5f5e6-84fe-400a-8323-2a0eb41b0011图像分类-MobileNet_v2:https://marketplace.huaweicloud.com/markets/aihub/modelhub/detail/?id=0470e6b1-923b-47a8-ba3e-fe93de5ae2a0
-
近年来,深度神经网络的出现一定程度上颠覆了医学影像行业的发展路径,人工智能介入下,影像相关科室繁杂重复的工作逐渐由算法接替,医生资源短缺这一问题似乎出现了解决的希望。但AI亦有其限制。从当前发展情况看,有效的人工智能算法大多**于存在大量标准化数据的病种,毕竟要实现高质量AI诊断,需要大量的高质量标注图像进行前期的算法训练。这一数据相关的特质限制了医学AI的广泛应用。现实之中,罕见病和疑难杂症的数据较少,囿于患者隐私、数据安全等问题,数据收集行为的开展也较为困难。此外,医学图像的标注过程成本较高,对于不同的标注内容往往需要开发特殊的标注工具并交由有经验的医生进行。多方面原因协同下,某些医学图像问题的高标注质量医学图像数据集非常稀缺,其AI自然也难以孕育。好在AI面临的困境并非没有解法。回想起来,人类只需通过极少的样本就能辨别新的事物,那么机器是否能以复制人类的这一能力呢?答案或许是可以的。最近医学AI领域兴起的一系列小数据学习方法便是以模仿人类的判别能力为目标,尝试通过减少需要的数据量,实现特定目标图像的识别,最终克服医学领域数据量少、标准缺乏的问题。以先验知识为基础的小样本学习要实现小样本学习(few-shot learning)必须要具备一些特定条件,譬如模型学习前已经吸收了一定类别的大量资料后,再加之新类别的极少量数据,最终实现小样本模型的形成。因此,小样本学习的关键是在算法中纳入合适的先验知识。具体到医疗领域之中,很多医学图像模态中广泛存在器官的位置先验信息,例如CT图像中肝脏主要位于腹腔的右上位置,而脾则在腹腔的左上部分,这些位置先验信息对于AI识别特定类别的器官有非常大的帮助。体素科技在顶级会议ISBI2021上发表的论文《Location Sensitive Local Prototype Network For Few-shot Medical Image Segmentation》便提出了一种基于位置先验信息的局部原型网络(location sensitive local prototype network,见图1)。该论文以肝和脾影像数据构建训练集,再将其收获先验信息的算法加入少量肾部影像分割任务,实现基于小样本学习的AI模型训练。图一:基于位置先验信息的局部原型网络框架在公开的CT器官分割数据集Visceral进行试验后,其结果表明,论文提出的新框架比目前的最好方法在Dice Score指标上提高了10%,显著推进了小样本下的器官分割这一领域的技术进展。利用极端变化一致性来提高数据不足情况下医学图像分割的鲁棒性除了数据获取困难这一问题外,研究人员在训练时还会遭遇数据来源不统一的问题。由于医学图像的拍摄设备和拍摄环境和方式多样,各个医院和体检中心之间的人群分布差异明显,因此很难收集和标注足量的训练数据充分涵盖不同来源的图像特征。如果训练数据和实际测试数据存在明显的的分布差异(domain shift),生成的模型往往性能不佳。体素科技在顶级会议MICCAI2020上发表的《Extreme Consistency: Overcoming Annotation Scarcity and Domain Shifts》为解决这一问题提供了方向。具体而言,该论文提出了极端一致性(extreme consistency)的概念,核心思想是在训练数据中加入极端的图像变换(比如大量强烈的亮度, 对比度, 旋转, 尺寸变换),以增加训练数据的多样性,并假设这些极端的图像变换并不影响图像的语义含义。举例来说,眼底图像中的血管在经过极端的旋转和亮度对比度等变换后,依然能够对应血管本身。为了实现这一构想,论文设计了一种半监督算法(semi-supervised learning, 见图2), 迫使模型遵守极端变化前和变化后的语义一致性这一约束,进而提高模型对于分布差异的鲁棒性。该论文在皮肤病变分割数据集(ISIC)和两个眼底血管分割数据集 (HRF和STARE)上进行了测试,展现了在数据不足和分布差异较大情况下,算法的鲁棒性和准确性的优势。 图2:左边是基于极端一致性的半监督学习方法的伪代码,右边是网络结构示意图。 少标注和弱标注情况下医学图像分割如何解决?除了数据的来源问题,对已有数据进行分割标注同样需要研究人员付出大量成本。在中国,影像数据标注非常昂贵,尤其是像素级别的医学图像分割标注,人力支出更为巨大。因此,近期大量的研究工作试图解决不完善医学图像分割数据集中的两类典型问题:标注稀缺。数据集中只有极稀少的图像数据有分割标注。弱标签。数据集中的图像数据只有部分标注、或者标注带有噪声、或者只有图像级的类别标签没有逐像素的分割标注。对于这两问题,体素科技发表在顶级期刊《Medical Image **ysis》中的文章《Embracing Imperfect Datasets: A Review of Deep Learning Solutions for Medical Image Segmentation》系统性地对现有方案进行了详细的回顾和分类总结(见图3所示)。根据医学图像分割数据集的不同缺陷,论文对这些方案的选择给出了实际的指导建议。图3:医学分割图像数据集数据集缺陷问题及相应训练策略总结
hellohelloya
发表于2022-01-06 10:07:15
2022-01-06 10:07:15
最后回复
hellohelloya
2022-01-06 10:07:15
1810 0 -
描述爱(AI)美食–10类常见美食图片数据集1、简介该数据集为华为云AI大赛入门赛《爱(AI)美食·美食图片分类》竞赛数据集。数据来自真实的美食图片,包括包含中餐、西餐、甜点、粥类,每张图像中美食所占比例大于3/4,每张图片代表一类美食。2、数据类别及目录结构说明- 数据类别该数据集包含10种美食图片,分别为:冰激凌、鸡蛋布丁、烤冷面、芒果班戟、三明治、松鼠鱼、甜甜圈、土豆泥、小米粥、玉米饼,每类图片500张。- 目录结构说明aifood (数据集根目录) |- images (存储图像数据) |- 三明治 (每个子目录是一个分类,目录名称即为分类标签名) |- 43600.jpg (图像文件) |- 43601.jpg (图像文件) |- … (更多图片) |- 甜甜圈 (每个子目录是一个分类,目录名称即为分类标签名) |- 19697.jpg (图像文件) |- 19698.jpg (图像文件) |- … (更多图片) … (更多分类) |- meta (存储数据元信息的目录) |- labels_10c.txt (每行代表一个标签,涉及10个分类,即:冰激凌、鸡蛋布丁、烤冷面、芒果班戟、三明治、松鼠鱼、甜甜圈、土豆泥、小米粥、玉米饼)3、其他说明该数据集可以用于图像分类场景训练,也可以基于ModelArts数据标注进行物体检测类型的标注,然后用于目标检测场景训练。
-
日前,华为云在知识计算领域的多跳知识推理问答取得重大进展。基于自然语言处理领域的领先技术积累,华为云语音语义创新 Lab 联合华为诺亚方舟实验室在国际权威的 HotpotQA 评测 Fullwiki Setting 赛道荣登榜首,在答案模糊准确率和联合模糊准确率(Joint F1)等指标上均达到第一。作为企业重要的信息载体,数字化文档记录了大量企业知识,如何快速帮助企业员工从数字化文档中获得答案,是企业文档维护人员的痛点。为解决此问题,一方面需要较强的阅读理解技术,另一方面还需要构建一套复杂的开放域问答流程。 HotpotQA 评测数据是斯坦福、CMU 和蒙特利尔大学杨植麟、齐鹏、张赛峥等人于2018年首次推出的新型问答数据集,由斯坦福的 Manning 教授和深度学习三巨头之一的 Bengio 牵头。该数据集由多跳复杂问题以及对应的答案组成,同时包含佐证证据用来解释答案的来源。在斯坦福此前公布的 SQUAD 评测任务中,机器已经多次超过人类,该评测仅需要从单个篇章中找到与问题有关的答案即可,故相对简单。然而,HotpotQA 评测需要从整个 wikipedia 或者多篇文章中找出问题相关的答案,同时要求返回问题到答案的推理链,难度大大增加更具有挑战性。该评测也吸引了来自谷歌、微软、Facebook 等知名研究机构以及 CMU、Stanford、华盛顿大学、清华大学、北京大学等知名高校。挑战多跳知识推理技术高点HotpotQA 评测的难点在于机器要结合多篇文章进行多跳推理才能得出答案,并返回佐证证据。该评测分为 Distractor Setting 和 Fullwiki Setting 两个赛道。Fullwiki Setting 相较于 Distractor Setting 更为复杂也更接近实用价值,需要从整个维基百科文档中抽取文档,然后再从文档中提取段落,最后从段落中抽取答案,而 Distractor Setting 赛道会提供 10 篇备选的篇章。如何从大量文档段落中去多跳搜索候选,然后理解候选段落的内容提取佐证证据成为比赛的关键。华为云联合华为诺亚方舟实验室,提出了新的检索目标 hop,用于收集维基百科中隐藏的推理证据,解决复杂多跳问题,同时结合 beam search 对答案进行排序和融合。如今,企业面临着数字化、知识化转型,知识化转型重要的关键技术就是知识的理解和推理,该技术对企业知识转型具有重大的意义和推动作用。2020 年华为云推出知识计算解决方案,企业可以基于华为云知识计算解决方案打造自己的知识计算平台,用于研发、生产、运营、销售、售后服务等企业核心流程。目前,该方案已在石油、汽车、医疗、化纤、煤焦化、钢铁、交通等行业率先实践。
hellohelloya
发表于2022-01-06 10:04:37
2022-01-06 10:04:37
最后回复
hellohelloya
2022-01-06 10:04:37
1158 0 -
ModelArts是面向AI开发者的一站式开发平台,您可以使用ModelArts完成爱(AI)美食赛题数据处理、训练建模、推理测试以及结果的提交。附件文档包含使用ModelArts完成爱(AI)美食赛题的全流程指导,通过本文档您可以快速了解ModelArts平台的使用,有助于您使用ModelArts来完成爱(AI)美食赛题。详细内容查看附件pdf文档《爱(AI)美食-美食图片分类Baseline》。0%baseline files.zip (90.4 K)0%爱(AI)美食-美食图片分类Baseline.pdf (1.14 M)
-
【大赛介绍】由深圳市政务服务数据管理局、南山区人民政府主办,南山区政务服务数据管理局、华为技术有限公司承办的“华为云杯”2020深圳开放数据应用创新大赛(Shenzhen Open Data Innovation Contest,简称SODiC),以“数聚粤港澳,智汇大湾区”为主题,面向全球高等院校、专业研究机构、数据分析公司、开发者征集基于开放数据的创新应用解决方案和算法模型。AI训练营录播视频链接(含baseline解读&调优):https://huaweicloud.bugu.mudu.tv/watch/lm0p02d7
-
作者 张倩近日,国际权威研究机构 IDC(国际数据公司)最新发布的《中国 AI 云服务市场(2020 上半年)跟踪》报告显示,华为云一站式 AI 开发平台 ModelArts 位居机器学习公有云服务中国市场份额第一位,高达 29%。报告指出:华为在国内市场具有先天的认知优势,开发者对于华为的技术、产品、品牌有着天然的认知和信赖。其中,华为云一站式 AI 开发平台 ModelArts 在行业用户中的主动提及率非常高。可以见得,在 ModelArts 平台学习 AI 技术已经成为越来越多开发者的偏爱,ModelArts 也正逐渐成为行业 AI 落地的首选。数据来源:IDC《中国 AI 云服务市场半年度研究报告,2020H1》众所周知,市场份额是产品是否好用的一个忠实反应。对于用户来说,「好用」的标准非常简单,即你的产品到底有没有解决我的问题?比如能否实现降本增效,产品是否安全可控等等。 作为一站式 AI 开发平台,华为云 ModelArts 的用户所关注的问题也在这一范畴之内。具体来说,他们会关心:这个平台上手门槛高不高?成本、效率高不高?我的数据隐私能得到保护吗?我的模型我自己能把关吗? 接下来,我们就从这些问题入手,看看市场份额第一的华为云 ModelArts 有没有解决这些问题。 开发者和企业所看中的,华为云 ModelArts 都满足了吗? 1. 门槛、成本和效率 一位从传统 IT 转向 AI 软件研发的技术总监曾表示,在早期的研发阶段,他们遇到了不少棘手的问题,比如从数据收集、处理,模型训练、管理到发布,AI 开发基本都处于一种「乡间作坊」的工作模式。这种工作方式不仅效率低下,而且不利于新人的培养,让人才培训成本居高不下。同时,模型上线后的工作性能受物理硬件的限制,横向扩展耗时耗力,资源利用率也无法有效保障。 这位技术总监提到的问题主要体现在门槛、成本和效率几个方面。在门槛方面,推动 AI 发展的核心四要素——算法、算力、数据和知识,每一个都存在门槛。在成本方面,传统的「乡间作坊」工作模式开发流程冗长,涉及的人员较多,人力、物力成本居高不下;在效率方面,这种工作模式容易重复造轮子,资源复用率低。 在种种困境下,华为云 ModelArts 走进了这些开发团队的视野。 为什么是 ModelArts? 在自然语言处理领域,BERT 的问世是一个里程碑事件。它让整个社区尝到了「预训练」的甜头:只需要简单的迁移策略,就能让模型在下游任务中获得良好的性能,使该领域由原来的手工调参、依靠机器学习专家的阶段,进入到大规模、可复制的大工业生产的阶段。这一经验同样可以复制到其他领域,华为云 ModelArts 的通用预训练模型架构——EI-Backbone 就是这一路径的开拓者之一。 EI-Backbone 通过整合算法模型、算力、数据和知识,可以进行模型选择自动设计、参数配置自动调优,在分钟级内完成模型训练,无需依仗专家经验就能大幅提升模型精度,显著降低 AI 使用门槛,缩短开发流程,提升开发性能。该架构提供了一种「预训练模型 + 小样本微调」的高效训练模式,能够让开发者基于行业小样本数据训练高精度模型。这在医疗等优质数据稀缺的场景中尤其有用。以医疗影像分割为例,过去需要成百上千例标注数据才能进行的训练,在 EI-Backbone 的加持下,只需要几十例甚至十几例标注数据即可完成,节省标注成本高达 90% 以上。 效率的提升和成本的节约还体现在算力方面。华为全联接大会 2020 发布的最新版华为云 ModelArts 3.0 在集群规模、任务数量以及分布式训练各个环节做了针对性优化,并支持弹性训练。弹性训练指的是华为云 ModelArts 提供的两种模式:一是 Turbo 模式,可以充分利用空闲资源加速已有训练作业,训练速度可提升 10 倍以上,并且不影响模型的收敛精度;二是经济模式,可以通过最大化资源利用率给开发者提供极致的性价比,在大多数典型场景下可以提升性价比 30% 以上。这种降本增效的成果在实际的业务场景中是非常可观的,无论是对 AI 开发者的低成本快速上手的需求,还是对行业 AI 智能转型升级来说,无疑都是最合适的选择。 2. 对数据的掌控 AI 模型性能的提升离不开大量的多源数据。如果企业只用自己有限、单一来源的数据进行训练,得到的模型可能不够准确,或泛化性较差。在此背景下,各个数据拥有方不可避免地要进行合作。 但与之矛盾的是,很多行业的数据涉及用户隐私、行业机密等问题,数据拥有者不愿或不能将数据上传至一个数据中心进行模型训练,从而形成了一个个的「烟囱」或「孤岛」。 华为云 ModelArts 的用户大多是这种类型,他们身处医疗、政务、金融等安全、隐私性要求极高的领域,因此必须对自己数据的流向进行严格把控,做到数据不出库。 数据不能出库,但模型的参数可以,这就是华为云 ModelArts 提供的联邦学习解决思路。在华为云 ModelArts 3.0 下,用户可以各自利用本地数据训练模型,不交换数据本身,只用加密方式交换更新的模型参数,实现云边协同训练。此外,华为云 ModelArts 3.0 不仅支持横向联邦学习,处理对齐的数据,还支持纵向联邦学习,可以轻松处理训练样本 ID 重叠多的数据。 对于使用华为云 ModelArts 实现行业 AI 落地的用户来说,引入联邦学习不仅解决了数据隐私问题,还节约了数据方面的成本。众所周知,医疗、制药等领域的数据标注难度非常大,需要领域专家的介入,因此成本非常高。通过联邦学习,各个数据拥有方都可以在这一技术的保护下实现数据价值的交换,显著降低成本。 3. 对模型的掌控 模型从实验室走向生产环境是一个令人揪心的过程。开发者和企业会担心这个模型精度不够高、性能不够好、可解释性差、可信度低等问题。在这些都没弄清楚之前,没有人敢大规模部署这款模型。 华为云 ModelArts 的成功之处在于,它在一定程度上缓解了这种「不透明」所带来的顾虑,将自动评估、诊断之后得到的模型精度、性能、可解释性、可信度等信息展示在一块「面板」上,让用户直观地看到自己模型的基本情况。 而且,这种评估是非常精细的,仅精度方面就有准确率、精确率、召回率、F1 值、混淆矩阵、ROC 曲线、数据敏感度分析等多项指标。这些指标可以帮助用户进行有针对性的调优,让用户做到「心中有数」,放心部署。 哪些行业已经用上了华为云 ModelArts? 当前,华为云 ModelArts 已经在金融、医疗、药物研发、自动驾驶等多个领域得到了广泛应用。 在金融领域,华为云 ModelArts 已经用于金融票据 OCR 识别。由于金融票据格式多样,差别细微,需要 AI 专家进行长时间的票据 AI 训练,因此业界识别准确率普遍不够精准。针对票据模型开发训练数据标注、模型训练、调优和部署上的诸多难点,华为云 ModelArts 通过数据集分类、自动学习、迁移学习等方法,让初级 AI 开发者无需调参等操作,轻松操作数据标注工具,完成部署。 在医疗领域,去年 11 月份,放射学领域国际顶级期刊《Radiology》发表了华为云 EI 创新孵化 lab、华中科技大学电信学院、华中科技大学同济医学院附属协和医院放射科联合团队的最新研究成果:运用华为云 ModelArts 开发的一套基于 CTA 影像的脑动脉瘤检测算法。该算法灵敏度高达 97.5%,帮助医生临床诊断灵敏度提升约 10 个百分点,漏诊率降低了 5 个百分点,同时有效缩短了医生的诊断时间。在药物研发领域,2020 年,华为云 EI 与中国科学院上海药物研究所签署联合创新合作协议,将华为自研的 FedAMP 算法和 AutoGenome 算法应用到药物研发的 AI 任务中,精准预测药物水溶解性、心脏毒性和激酶活性。中国科学院院士、中国科学院上海药物研究所研究员蒋华良联合华为云发布基于 ModelArts 平台的药物联邦学习服务,以解决研发数据高壁垒、高成本以及高机密的问题。实践证明,通过华为云 EI 联邦学习训练后的模型,准确度远超传统的联邦学习和深度学习算法。回顾过去的一年,华为云 ModelArts 在抗击疫情方面也发挥了重要作用,其参与的联合科研团队在 2020 年 2 月份就筛选出了五种可能有效的新冠抗病毒药物。此外,华为云还依托 AI 昇腾集群服务和 ModelArts 推出了 AI+CT 医学影像分析服务,运用计算机视觉与医学影像分析技术对患者肺部 CT 多发磨玻璃密度影(GGO)以及肺实变进行分割以及量化评价,并结合临床信息和实验室结果,辅助医生更高效、精准地区分早期、进展期与重症期,助力疫情防控工作。 技术赋能行业离不开一个低门槛、高效率同时又安全、可靠的工具。华为云 ModelArts 这类 AI 开发新工具的出现是实现技术普惠的重要条件,让「学 AI,用 ModelArts」成为开发者群体的新风尚,亦将让行业 AI 落地开拓者们亲手触碰到未来。 参考链接: https://www.zhihu.com/question/327642286/answer/1465037757 https://bbs.huaweicloud.com/blogs/203915 https://tech.ifeng.com/c/81fISXbX0Ay 本文转自:机器之心
hellohelloya
发表于2022-01-06 09:18:46
2022-01-06 09:18:46
最后回复
hellohelloya
2022-01-06 09:18:46
1938 0 -
作者 | AI科技评论AI 科技评论消息,**计算机学会(ACM)于今日刚刚宣布了 2020年新当选 ACM Fellow 名单,共有 95位科学家当选,其中包括陈怡然、颜水成、周昆、申恒涛、陶宇飞、王薇、Cathy Wu、李学龙、吕晨阳、任奎、王义、张耀文等12位华人学者!值得注意的是,2020 年入选的 ACM Fellows 中,还有多位图灵奖得主(未经评选,直接授予),包括Whitfield Diffie、Adi Shamir、Manuel Blum等人。作为世界上最大的计算机领域专业性学术组织,ACM 的影响力不言而喻。它创立于 1947 年,目前在全世界 130 多个国家和地区拥有超过 10 万名会员,其所评选的图灵奖是计算机界最负盛名、最崇高的一个奖项,被称为「计算机界的诺贝尔奖」。而 ACM Fellow 则设立于 1993 年,用于表彰在计算和信息技术领域从业五年以上,并做出了「突出贡献」(Exceptional Contributions) 的科学家,是 ACM 所有会员中最顶尖的那 1% 位成员。截止目前为止,已有 1000 多位 ACM Fellow 诞生。本次选出的95名ACM Fellow ,分别在人工智能、云计算、计算机图形学、计算生物学、数据科学、安全和隐私、软件工程、量子计算和网络科学等领域做出了广泛的基础性贡献。ACM 前主席 Cherri M.Pancake 曾经说过:“计算机技术对塑造我们今天的生活和工作产生了巨大影响。所有直接或间接影响我们的技术都是无数个小时工作的结果,协作或个人工作,以及创造性的灵感,有时甚至是明智的冒险。每年,我们都希望有一批最杰出的人成为 ACM Fellow,ACM Fellow是我们整体认可的基石,在强调ACM Fellow的成就时,我们希望给予应有的赞誉,同时也向公众传播计算机专业人员所从事的特殊领域。”为彰显ACM的全球影响力,2020年ACM Fellow 来自澳大利亚、加拿大、中国、埃及、法国、德国、以色列、意大利、瑞士和**的大学、公司和研究中心。以下是12位入选华人学者介绍:陈怡然杜克大学电子与计算机工程终身正教授、IEEE Fellow、杜克大学计算进化智能中心(CEI)主任、** NSF 新型可持续智能计算产学合作中心主任。专注于研究新型存储系统、机器学习和神经形态计算,以及移动计算系统。1998年获得清华大学理学学士学位,2001年获清华硕士学位,2005年获普度大学博士学位。在工业界工作五年后,他于2010年加入匹兹堡大学担任助理教授,后于2014年晋升为终身副教授,并获双世纪校友讲席。他同时也是 NSF CAREER奖、ACM SIGDA杰出新教师奖、德国洪堡资深学者研究奖和IEEE SYSC/CEDA TCCPS职业中期奖的获得者,并被列入HPCA名人堂。陈教授出版过一本专著并发表过400多篇技术论文。他获得过96项**专利,担任或曾担任十多个国际学术论文/期刊的副主编,并曾在60多个国际会议的技术和组织委员会任职。他现在是IEEE电路和系统( IEEE Circuits and Systems )杂志的主编。他获得过七次最佳论文奖,一次最佳 poster奖,以及十四次最佳论文提名。入选理由:对非易失性内存技术的贡献。个人主页:https://ece.duke.edu/faculty/yiran-chen 颜水成前依图科技首席技术官,新加坡国立大学终身机器学习与计算机视觉实验室负责人,IEEE Fellow、IAPR Fellow,曾任 360 集团副总裁、首席科学家与人工智能研究院院长。主要研究领域为计算机视觉、机器学习与多媒体分析。本科就读于北京大学数学科学学院,在微软亚洲研究院实习期间,先后师从人脸识别和智能视频监控专家李子青和计算机视频检索研究领域的“开山鼻祖”张宏江,还与前滴滴研究院院长何晓飞一同搭档发表 4 篇单篇引用过千的论文。他们将 Subspace Learning 与 Manifold Learning 两个当时非常火爆的领域巧妙而简单地串联了起来。2006年,颜水成在伊利诺伊大学香槟分校(UIUC)做博士后研究,师从计算机视觉大师黄煦涛(Thomas Huang)。2007年12月,颜水成教授加入新加坡国立大学,其团队在五年内获得了计算机视觉领域的核心竞赛即PASCAL视觉对象类和ImageNet大规模视觉识别挑战赛的十余次冠军或荣誉奖,以及十多次(最佳)学生论文 奖项。此外,颜水成团队提出的“Network in Network”(NIN)网络结构的核心 1×1 卷积,在近年来几乎被所有计算机视觉深度学习模型当作标准模块,后期出现的 GoogleNet、ResNet等模型也借鉴了其思想。他的团队开发的“Purine”是全球第一个开源的支持多机多GPU的深度学习系统。入选理由:对视觉内容理解技术与应用的贡献。个人主页:https://www.ece.nus.edu.sg/stfpage/eleyans/ 周昆浙江大学计算机系教授,IEEE Fellow,兼任浙江大学计算机辅助设计与图形学国家重点实验室主任,教育部长江学者特聘教授,国家杰出青年科学基金获得者。主要研究方向为计算机图形学、计算机视觉、人机交互和虚拟现实。在ACM/IEEE Transactions上发表论文80余篇,论文引用1万余次,获得发明专利50余项。此外,他曾获得2009年NVIDIA Professor Partnership Award、2010年中国计算机图形学杰出奖、2011年中国青年科技奖、2011年《麻省理工学院技术评论》全球杰出青年创新人物奖 (MIT TR35 Award)、2012年中组部首批青年拔尖人才支持计划、2013年国家自然科学二等奖、2016年陈嘉庚青年科学奖、2017年浙江省自然科学一等奖。入选理由:对计算机图形学的贡献。个人主页:https://person.zju.edu.cn/kunzhou 申恒涛申恒涛教授,**光学学会会士和ACM杰出会员,是电子科技大学计算机科学与工程学院院长,电子科技大学人工智能研究院执行院长,四川省人工智能研究院(宜宾)院长。他分别于2000年和2004年获得了新加坡国立大学计算机科学系一等荣誉学士和博士学位。随后加入昆士兰大学并于2011年底成为教授。他一直从事最前沿的计算机科学研究,研究方向包括多媒体搜索,计算机视觉,人工智能,和大数据管理。申恒涛累计发表了300+篇高水平同行评审论文,其中包括200多篇CCF A类论文, 并获得了8个国际会议和期刊的最佳论文奖,包括A类会议ACM Multimedia 2017 最佳论文奖和ACM SIGIR 2017 最佳论文-Honourable Mention奖,以及IEEE Transactions on Multimedia 2020最佳论文奖。入选理由:对大规模多媒体内容的理解、索引和检索的贡献。个人主页:https://cfm.uestc.edu.cn/~shenht/#陶宇飞**中文大学计算机与工程系教授,复旦大学兼职教授。主要研究兴趣是开发“小而精”的算法,以及数据库、机器学习与理论计算机科学的交叉研究。他在2002年于**科技大学获得计算机科学博士学位,师从 Dimitris Papadias 教授。他曾在CMU担任访问科学家、**城市大学担任助理教授、昆士兰大学担任教授。曾获得2002年**杰出科学家奖、SIGMOD 2013/2015 最佳论文奖、2016年谷歌教职研究奖、PODS 2018 最佳论文奖等。入选理由:对用于大规模数据处理的算法的贡献。个人主页:https://www.cse.cuhk.edu.hk/~taoyf/ 王薇加利福尼亚大学洛杉矶分校(UCLA)计算机系 Leonard Kleinrock 讲席教授,Scalable **ytics Institute 主任,Jonsson Comprehensive 癌症中心、量子计算生物研究所成员。主要研究兴趣为大数据分析、数据挖掘、数据库系统、自然语言处理、生物信息学、计算机生物与计算医疗。她于1999年从UCLA获得计算机科学博士学位,曾于1999年至2002年在IBM T. J. Watson中心担任研究员,于2002年至2012年在北卡罗来纳大学教堂山分校计算机系担任教授。她曾获得 IBM 发明成就奖、微软研究 New Faculty Fellow。入选理由:对数据挖掘的奠基与实践的贡献。个人主页:http://web.cs.ucla.edu/~weiwang/(吴凯茜)Cathy H. Wu特拉华大学生物信息与计算生物中心 Edward G. Jefferson 主席与教授,蛋白质信息资源(PIR) 主任,乔治城大学医学中心兼职教授。主要研究兴趣包括蛋白质家族分类和功能注释、生物数据整合和文本挖掘。她在1978年本科毕业于国立台湾大学植物病理学,随后于1982年获得**普渡大学植物病理学硕士学位,1984年获得普渡大学博士学位。博士毕业后,她继续求学之路,1986年在密歇根州立大学获得分子生物博士后学位,并于19**在德克萨斯大学获得计算机科学硕士学位,硕士毕业论文主题是使用人工神经网络来分类蛋白质,导师为George M. Witson III。之后,19**至1994年,她在德克萨斯大学计算机系担任助理教授,教计算机科学的课程,又在德克萨斯大学健康中心担任助理教授、副教授与教授。吴自1990年以来一直从事生物信息学研究,并开发了几个蛋白质分类系统和数据库。入选理由:对生物信息学、计算生物、知识挖掘与语义数据聚合的贡献。个人主页:https://bioinformatics.udel.edu/people/personnel/cathy_wu/ 李学龙李学龙,国际欧亚科学院院士、西北工业大学教授、博导,校学术委员会副主任。毕业于中国科学技术大学,关注高维数据的智能获取、处理和管理。在应用系统中发挥作用。在工程和计算两个领域入选全球高被引科学家。 此外,还入选**科学促进会会士(AAAS Fellow)、**光学学会会士(OSA Fellow)、国际光学工程学会会士(SPIE Fellow)、国际电气电子工程师协会会士(IEEE Fellow)、国际模式识别学会会士(IAPR Fellow)等。2018年,获得“钱伟长中文信息处理科学技术奖”一等奖。入选理由:对计算高阶数据以及从高阶数据中学习的贡献。个人主页:https://teacher.nwpu.edu.cn/2018010290.html 吕晨阳吕晨阳,圣路易斯华盛顿大学计算机科学与工程系教授,研究领域包括实时系统、无线传感器网络和物联网。他是“ACM Transactions on Sensor Networks”的期刊主编、IEEE IOT期刊的区域编辑。此外,他发表了150多篇研究论文的作者,被引用超过14,000次,h指数为54。他1995年在中国科技大学念完本科,1997年获得中国科学院硕士学位,2001年在弗吉尼亚大学获得博士学位。入选理由:表彰其在自适应实时系统、实时虚拟化和无线网络物理系统方面的贡献。个人主页:https://www.cse.wustl.edu/~lu/任奎浙江大学求是讲席教授,目前担任浙江大学网络空间安全学院院长、计算机科学与技术学院副院长、计算机创新技术研究院执行院长,此前入选 IEEE Fellow。主要研究方向为云安全、物联网安全与隐私保护,是其研究领域的权威专家。任奎教授发表了280余篇同行评议的期刊与会议文章,获得了包括IEEE INFOCOM’20、IEEE Globecom’19, 中国密码学会’18、ACM ASIACCS’18、IEEE ICDCS’17、IWQoS’17,ICNP’11等在内的多篇最佳论文和时间考验论文奖。他的H-Index为69,文章总引用次数超过30,000次,并入选科睿唯安高被引科学家。同时任奎教授的多项研究成果在工业界有广泛应用。入选理由:对无线系统安全与云数据安全的贡献。个人主页:https://person.zju.edu.cn/kuiren 王义瑞典乌普萨拉大学信息技术系教授,主要研究兴趣为 CPS 的设计与动态更新、安全至上的嵌入实时系统、实时调度、建模与验证。1982年本科毕业于中国东北大学计算机工程专业,随后赴瑞典查尔姆斯理工大学攻读计算机科学博士预科与博士学位。2014年当选 IEEE Fellow。曾获得2019年 IEEE TCRTS Award、RTSS 2099/2015/2017 最佳论文奖、ECRTS 2015最佳论文奖、DATE 2013最佳论文奖、ETAPS 2002 最佳工具论文奖。入选理由:对实时系统的自动化分析与验证的贡献。个人主页:http://user.it.uu.se/~yi/ 张耀文张耀文,国立台湾大学电机工程系特聘教授,他在1988年获得国立台湾大学学士学位,在1993年获得德克萨斯大学奥斯汀分校硕士学位,1996年获得德克萨斯大学奥斯汀分校博士学位。研究领域为电子设计自动化、积体电路实体设计、积体电路可制造性设计等。入选理由:为算法电子设计自动化做出贡献。个人主页:https://www.ee.ntu.edu.tw/profile1.php?teacher_id=943001&p=3近三年来当选 ACM Fellows 的华人学者 2019年共有 7 位:吕松武、宋晓东、陶大程、谢源、周礼栋、陈熙霖、李向阳。 2018 年共有 6 位:李飞飞、刘欢、罗杰波、Lili Qiu、何田以及 Lillian Lee。 2017 年共有 9 位:马毅、芮勇、杨强、张世富、翟成祥、张爱冬、Li Erran Li。以下为2020年入选 ACM Fellow完整名单:Daniel J. AbadiUniversity of MarylandFor contributions to stream databases, distributed databases, graph databases, and column-store databasesSamuel MaddenMassachusetts Institute of TechnologyFor contributions to data management and sensor computing systemsJames AllanUniversity of Massachusetts AmherstFor contributions to information retri, including topic detection and trackingScott MahlkeUniversity of MichiganFor contributions in compiler code generation for instruction level parallelism, and customized microprocessor architecturesSrinivas AluruGeorgia Institute of TechnologyFor contributions to parallel methods in computational biology and leadership in data scienceDavid MaltzMicrosoft AzureFor contributions to networking infrastructure, including data center networking, network operating systems, and cloud networkingAndrea C. Arpaci-DusseauUniversity of WisconsinFor contributions to storage and computer systemsVolker MarklTU BerlinFor contributions to query optimization, scalable data processing, and data programmabilityRemzi Arpaci-DusseauUniversity of WisconsinFor contributions to storage and computer systemsMaja MataricUniversity of Southern CaliforniaFor contributions to socially assistive robotics and human-robot systemsSuman BanerjeeUniversity of Wisconsin-MadisonFor contributions to design, implementation, and tools of wireless systemsFilippo MenczerIndiana UniversityFor research on the vulnerability of social media networks to disinformation and manipulationManuel BlumCarnegie Mellon UniversityFor contributions to the foundations of computational complexity theory and its application to cryptography and program checkingJose MeseguerUniversity of Illinois at Urbana-ChampaignFor the development of logical methods for design and verification of computational systemsLionel BriandUniversity of Ottawa and University of LuxembourgFor contributions to automated software testingMeredith Ringel MorrisMicrosoft ResearchFor contributions to human-computer interaction, information retri, computer-supported cooperative work, and accessibilityDavid BrooksHarvard UniversityFor contributions to software and hardware design for power-efficient computer architecturesNachiappan NagappanMicrosoft ResearchFor contributions to empirical software engineering and data-driven software developmentRan CanettiBoston UniversityFor contributions to cryptography and computer securityRadhika NagpalHarvard UniversityFor contributions to collective intelligence, including self-organizing systems and swarm roboticsJohn CannyUniversity of California, BerkeleyFor contributions in robotics, machine perception, human-computer interaction, and ubiquitous computingMoni NaorWeizmann Institute of ScienceFor contributions to the foundations of cryptography and theoretical computer scienceAnantha ChandrakasanMassachusetts Institute of TechnologyFor energy-efficient design methodologies and circuits that enabled ultralow-power wireless sensors and computing devicesChandrasekhar NarayanaswamiIBM T.J. Watson Research CenterFor design and development of the Linux Watch and SoulPad, which influenced wearable and mobile systemsYao-Wen ChangNational Taiwan UniversityFor contributions to algorithmic electronic design automationSam H. NohUNISTFor contributions to storage system software, including flash and byte-addressable non-volatile memoryMoses CharikarStanford UniversityFor design of efficient algorithmic techniques for big data, hashing, approximation algorithms, and metric embeddingsPrakash PanangadenMcGill UniversityFor making continuous state systems amenable to logical and computational treatmentYiran ChenDuke UniversityFor contributions to to nonvolatile memory technologiesSethuraman PanchanathanArizona State UniversityFor contributions to multimedia technologies and leadership in the scientific communityGraham R. CormodeUniversity of WarwickFor contributions to data summarization and privacy enabling data management and **ysisManish ParasharRutgers UniversityFor contributions to high-performance parallel and distributed computing and computational sciencePatrick CousotNew York UniversityFor contributions to programming languages through the invention and development of abstract interpretationKeshab K. ParhiUniversity of MinnesotaFor contributions to architectures and design tools for signal processing and networking acceleratorsMathieu DesbrunCalifornia Institute of TechnologyFor contributions to geometry processing and discrete differential geometryHaesun ParkGeorgia Institute of TechnologyFor contributions to numerical algorithms, data **ytics, and leadership in computational science and engineeringWhitfield DiffieFindora Advanced Research CenterFor the invention of asymmetric public-key cryptography and the promulgation of a practical cryptographic key-exchange methodGordon PlotkinUniversity of EdinburghFor contributions to the science of programming languages, particularly their operational and denotational semanticsBonnie J. DorrIHMCFor human-centered and linguistically inspired approaches to natural language processing Michael O. RabinHarvard UniversityFor the introduction of nondeterministic automata, probabilistic automata, and for contributions to computability and computational complexity theoryNicholas DuffieldTexas A&M UniversityFor contributions to network measurement and **ysisKui RenZhejiang UniversityFor contributions to wireless system security and cloud data securityAlan EdelmanMassachusetts Institute of TechnologyFor contributions to algorithms and languages for numerical and scientific computingPaul ResnickUniversity of MichiganFor contributions to recommender systems, economics and computation, and online communitiesThomas EiterTU WienFor contributions to knowledge representation and reasoning, logic programming, and declarative problem solvingMary Beth RossonPennsylvania State UniversityFor contributions to human-computer interaction, including scenario-based designCormac FlanaganUniversity of California, Santa CruzFor contributions to static and dynamic program debugging and verification methodsSteven SalzbergJohns Hopkins UniversityFor contributions to computational biology, including software for DNA sequence **ysis, alignment, and genome assemblyJodi ForlizziCarnegie Mellon UniversityFor contributions to design research in human-computer interactionSanjit Arunkumar SeshiaUniversity of California, BerkeleyFor contributions to formal verification, inductive synthesis, and cyber-physical systemsDieter FoxUniversity of WashingtonFor contributions to probabilistic state estimation, RGB-D perception, and learning for robotics and computer visionAdi ShamirWeizmann Institute of ScienceFor contributions to the field of cryptographySanjay GhemawatGoogleFor contributions to distributed systems designHeng Tao ShenUniversity of Electronic Science and Technology of ChinaFor contributions to large-scale multimedia content understanding, indexing and retriAntonio GonzalezUniversitat Politecnica de CatalunyaFor contributions to the design of energy-efficient and resilient computer architecturesAmit ShethUniversity of South CarolinaFor contributions to data semantics and knowledge-enhanced computingAndrew D. GordonMicrosoft Research and University of EdinburghFor contributions to programming languages: their principles, logic, usability, and trustworthinessAdam SmithBoston UniversityFor contributions to data privacy and cryptographySteven GribbleGoogleFor contributions to virtualization technology across clusters, servers, and networks Olga Sorkine-HornungETH ZurichFor contributions to digital geometry processing, computer animation, computer graphics and visual computingSusanne E. HambruschPurdue UniversityFor research and leadership contributions to computer science educationRick L. StevensArgonne National LaboratoryFor contributions in high-performance computing systems, collaborative environments, and tools for large-scale science initiativesMartin HellmanStanford UniversityFor the invention of asymmetric public-key cryptography and the promulgation of a practical cryptographic key-exchange methodPeter StoneUniversity of Texas at AustinFor contributions to automated planning, learning, and multiagent systems with applications in robotics and ecommerceNicholas HighamUniversity of ManchesterFor contributions to numerical linear algebra, numerical stability **ysis, and communication of mathematicsYufei TaoChinese University of Hong KongFor contributions to algorithms for large scale data processingC. Anthony (“Tony”) R. HoareUniversity of CambridgeFor contributions to the theory of programming, and its application to the practice of engineering of softwareLeandros TassiulasYale UniversityFor contributions to network control and optimization with applications in communication networksHolger H. HoosLeiden UniversityFor contributions to automated algorithm selection and configuration for optimization and machine learningKenneth Lane ThompsonGoogleFor contributions to the development of operating systems theory and for the implementation of the UNIX operating systemIhab F. IlyasUniversity of WaterlooFor contributions to data cleaning and data integrationAndrew TomkinsGoogleFor contributions to the understanding of the web and web-based social networksLizy Kurian JohnUniversity of Texas at AustinFor contributions to the design, modeling and benchmarking of computer architecturesOlga TroyanskayaPrinceton University and Simons FoundationFor contributions to computational biology, data integrationJoost-Pieter KatoenRWTH Aachen UniversityFor contributions to model checking of software and probabilistic systemsMatthew A. TurkToyota Technological Institute at Chicago and University of California, Santa BarbaraFor contributions to face recognition, computer vision, and multimodal interactionNam Sung KimSamsungFor contributions to design and modeling of power-efficient computer architecturesWil Van Der AalstRWTH Aachen UniversityFor contributions to process mining, process management and data scienceSven KoenigUniversity of Southern CaliforniaFor contributions to artificial intelligence, including heuristic search and multi-agent coordinationToby WalshUniversity of New South Wales and CSIRO Data61For contributions to artificial intelligenceDavid KotzDartmouth CollegeFor contributions to the security, privacy, and usability of mobile systemsWei WangUniversity of California, Los AngelesFor contributions to the foundation and practice of data miningArvind KrishnamurthyUniversity of WashingtonFor contributions to networks and distributed computer systemsLaurie Ann WilliamsNorth Carolina State UniversityFor contributions to empirical research on agile software development, software security, and software engineering educationRavi KumarGoogle ResearchFor contributions to web science modeling, **ytics, and algorithmsCathy H. WuUniversity of DelawareFor contributions to bioinformatics, computational biology, knowledge mining and semantic data integrationZhou KunZhejiang UniversityFor contributions to computer graphicsShuicheng YanYITU TechnologyFor contributions to visual content understanding techniques and applicationBrian LevineUniversity of Massachusetts AmherstFor contributions to network forensics, security, and privacy, and for thwarting crimes against childrenWang YiUppsala UniversityFor contributions to the automated **ysis and verification of real-time systemsKevin Leyton-BrownUniversity of British ColumbiaFor contributions to artificial intelligence, including computational game theory, multi-agent systems, machine learning, and optimizationMichael J. ZydaUniversity of Southern CaliforniaFor contributions to game design, game and virtual reality networking, and body trackingXuelong LiNorthwestern Polytechnic UniversityFor contributions to computing on and learning from higher-order dataSteven H. LowCalifornia Institute of TechnologyFor theoretical foundations and real-world deployment of Internet congestion control and smart grid optimizationChenyang LuWashington University in St. LouisFor contributions to adaptive real-time systems, real-time virtualization, and wireless cyber-physical Acm Fellow 2020年名单:https://www.acm.org/media-center/2021/january/fellows-2020
hellohelloya
发表于2022-01-06 09:16:33
2022-01-06 09:16:33
最后回复
hellohelloya
2022-01-06 09:16:33
1390 0 -
近日,在 Qcon 全球软件开发大会(深圳站)上,华为云人工智能领域首席科学家、IEEE FELLOW 田奇博士,作了题为「云原生时代,视觉预训练大模型探索与实践」的主题演讲,介绍了云原生时代华为云在 AI 基础研究、视觉预训练模型研发和行业实践,以及 AI 开发平台 ModelArts 的最新进展。以下是田奇博士演讲要点:随着企业数字化的转型,传统企业已基本上将业务从线下搬到了云上。其中,第一个阶段是将企业的业务简单地部署到云上,我们可以称之为 ON CLOUD,在这种形态下,通过资源池化,解决了 IDC 时代运维、部署、扩容的难题。但是,传统方法的过于厚重、烟囱式的架构,导致云对业务的价值还仅仅停留在资源供给阶段,未充分发挥出云计算的潜力。随着企业的数字化建设逐步迈入智能化阶段,企业需要充分利用云计算带来的红利,就需要让其业务能力内生于云,由现在的 ON CLOUD 进阶到 IN CLOUD 阶段,即基于云的技术架构来构建企业业务,通过构建多云、多中心的分布式架构以及敏捷、智能的企业数字化业务,将企业的数字化建设带入智能化新阶段。此时,云对业务的价值不再是简单的资源供给,还能够以应用为中心,为业务赋能。一站式 AI 开发平台,加速行业 AI 落地,践行普惠 AI华为云提供了一站式的 AI 开发平台,加速行业 AI 落地,践行普惠 AI。华为云对 AI 平台打造了四层体系,第一层是智能体;第二层是知识计算解决方案;第三层是 ModelArts Pro,针对专业应用开发套件;第四层是 ModelArts Fundamental。对于一站式的 AI 开发平台,主要聚焦在模型高效、数据高效以及知识高效。这些强大的 AI 服务,底层都是基于云原生容器的 Volcano 高效能调度引擎,而 Volcano 调度引擎将训练任务的效率提升了 50%。华为云 AI 基础研究进展华为云长期扎根 AI 技术基础研究,在计算机视觉、语音语义、决策优化三个方向做了深入探索与研究。为此,我们针对数据、模型和知识提出了六个子计划。其中,针对模型包含两个计划,一个是针对大模型的模型摸高计划,提供极致的性能;第二是针对小模型的模型瘦身计划。针对数据提出了两个计划,一个是处理多模态的数据魔方计划;另一个是针对小样本学习的数据冰山计划。最后针对知识的高效提取,我们提出了两个计划:建造通用 AI 系统的万物预视计划以及学习一种新范式的虚实合一计划。在这些计划中,我们始终聚焦在模型高效、数据高效、知识高效等重点方向上。对于自主研发的一些新技术,比如自动学习、知识蒸馏、预训练模型等等,都会以即插即用的方式部署到华为云线上,助力 AI 行业落地。在众多 AI 领域中,计算机视觉具有广泛的落地场景,在智能汽车、智能手机、无人机、智能眼镜等应用都有计算机视觉算法的身影。这些年随着计算能力和 5G 通信技术的极大提高,以计算机视觉为代表的大批 AI 技术,已跨越了早期仅在研究领域取得进展的阶段,过渡到了与社会环境协同发展、共同促进的阶段。未来视觉 AI 技术会在千行百业进行落地,比如政府、医疗、工业、能源、交通、物流、金融等等。但是,技术落地也面临着巨大的挑战,由于 AI 应用的碎片化、定制化等因素,极大地限制了 AI 在真实环境下的落地部署。为了解决应对 AI 碎片化等问题,我们提出了预训练大模型的解决方案,希望能用大量无标注的数据和更大的模型来实现更通用的 AI 系统。在自然语言处理领域,这两年大规模预训练模型取得了突破性进展,但是预训练模型对算力有极大的需求,而且我们预计更大规模、更大参数的模型还会继续出现。因此,受到自然语言处理中预训练模型的启发,在计算机视觉中我们也希望构建通用的 AI 系统,为下游各种视觉任务提供一个高效的初始化模型。现在主流的学习方式有两种,一种是监督学习,一种是强化学习。监督学习需要海量标注样本,泛化能力相对比较弱,另一种是强化学习,强化学习需要海量的试错,同样缺乏通用系统所需要的可适用性、可重复性以及鲁棒性。我们认为,自监督学习是迈向常识学习的关键步骤,但是目前自监督学习在视觉任务中的应用还不够成熟。过去,在数据标注、模型训练和输出阶段,分别要做大量的重复工作。未来,我们希望可以对计算机视觉或者自然语言处理任务构建一个通用预训练模型,仅通过下游少量的标注样本进行微调就可以高效完成任务,从而大量节约开发成本。视觉预训练大模型研究和实践接下来的报告,我会介绍一下我们在预训练模型方面的工作,主要是在自监督学习过程中预训练模型的一些进展。自监督学习由于不需要任何人工标注便能够学习图像的内在表征,近年来受到了业界的极大关注。在没有人工标注的情形下,自监督学习需要预先设定一些预训练任务辅助模型学习。2016 年以前,一些预训练任务推动该领域出现了一些大的进展。自监督学习主要分为两种,一种是生成式,一种是对比式,近几年最新的一些工作大多是基于实例区分的对比学习。 基于实例区分的对比自监督学习在最近几年取得了极大的进展,在一些任务上刷新了现有自监督预训练任务的 SOTA 结果。最近我们在对比自监督学习方面有两项优化工作,首次实现了在 ImageNet 线性分类任务中达到全监督基线性能,并且在小样本分类上大大超越了之前的方法。然而,现有的自监督预训练模型仍然处于探索阶段,存在大量的问题未能够解决:现有的自监督预训练算法迭代缓慢,很难复制到大模型以及超大规模数据集;另外,相较于全监督学习,其特征表达在大多数下游任务上仅仅能获得与之相比拟的结果,其进一步的性能优势还有待挖掘。因此,如何利用自监督学习在超大数据集合,超大模型上获取更强的泛化性能将会是未来的发展方向。在这里,介绍一下我们最新的几个工作,在对比自监督学习框架下,我们提出了基于邻域保持的混合图像增强,在业界首次提出了利用不同图像数据增强策略提升其泛化性能。过去,对比学习通常利用同一样本的不同数据增强生成正样本集合,并且把其他样本均视为负样本的策略,将样本特征的距离拉近或者拉远作对比学习任务,而我们首次提出了选取不同正样本的方法。同时,提出了基于局部领域混合增强的技术,把多个相似样本的特征拉近,不同样本的距离拉远。我们的方法在 ImageNet 线性分类评估上,TOP-1 的精度达到了 75.5% 准确率,离监督学习基线 76.5% 仅仅差了 1 个百分点。通过对预训练模型在小样本标注数据上进行微调(1% 和 10% 标注的数据),我们的精度达到了最好的结果。 接下来介绍一个我们今年刚刚完成的工作,基于等级化语义**的对比自监督学习框架。在上述工作的基础上,我们进一步发现即使显示地拉近语义相似性样本,特征表达的可分离特性并没有达到我们的预期目标,这限制了其泛化表征能力。自监督学习仍然存在优化困难,收敛速度慢等问题,为此,我们做了两点改进,第一,我们拓展了自监督学习算法中正样本数目,使得正样本集合能够更加高效的被**,同时避免受大量负样本优化的影响。第二,我们在浅层特征上引入对比自监督学习,通过精心设计的浅层优化目标加速训练过程,在浅层特征上实现了更好的可分离性,我们发现这些优势对小样本学习有极大的提升。从结果来看,我们在线性分类任务中达到了 76.4% 的精度,首次达到了和全监督基线相比拟的性能,而且通过将预训练模型在小样本标注数据上进行微调,在之前的结果上又得达到了新的 SOTA,特别地,仅仅使用 10% 标注,我们在 ImageNet 分类上达到了 75.1% 的 TOP-1 精度。上述两项工作都是在没有任何标签设置下完成的,更进一步,我们探索了如何把对比学习和数据标签高效地结合起来,通过引入图像真实标签来辅助对比学习,我们认为应该将自监督学习得到的表观特征和监督学习的语义特征相结合,它的本质是把表观相似和语义相似的样本距离拉近,将不相似样本的距离推远。从结果上看,这个工作在各个下游工作中(比如检测、语义分割、实例分割)的表现全面超越了以往的自监督和全监督的泛化能力。华为云的第二个核心研究方向是如何设计高效的视觉识别模型,即模型高效。在这个方向主要聚焦两个方面,第一是如何设计神经网络模型,第二是在神经网络架构搜索中,如何在原子算子层面上进行搜索。关于神经网络模型设计,最初的方式都是手工设计的,这种方式经过高速发展后,也进入了一个瓶颈,因此从 2017 年开始,自动的神经网络架构搜索经历了一个迅猛发展的过程,也取得了一些可喜的成绩。但是搜索出的网络也面临几个问题,第一个问题,搜索空间仍然是手工定义的;第二个,搜索的卷积算子是人工定义的,而且相比于手工设计的网络,搜索的网络可迁移性也是比较差的。我们在网络架构搜索上第一个工作是 P-DARTS,提出渐进的可微分网络架构搜索算法。之前的网络架构搜索面临着搜索网络和测试网络深度不一样的问题,在较浅的搜索网络中搜索出来的架构并不适合较深的测试网络。早期的方法直接加深搜索的深度,但是会造成显存爆炸的问题,并且导致搜索不稳定。为了解决这个问题,我们提出了两个思想,一个是搜索空间近似,第二个是搜索正则化。搜索空间近似,是指采用渐进搜索策略,逐渐加深搜索的深度;同时进行链接权重的学习,把权重比较小的链接运算都扔掉,这样减少了搜索空间。搜索正则化主要是对搜索得到的一些 skip connect 的数量上的限制。从结果上看,我们把 P-DARTS 搜索的网络迁移到 ImageNet 上,在 ImageNet 分类任务上与基线方法相比提高了两个百分点。P-DARTS 网络搜索算法是在 P100 上完成的,大概需要 0.3 个 GPU-days。与去年同期的 DARTS 工作进行大致的比较,它的搜索时间是 4 个 GPU-days,而在性能和速度都有超越的情况下,我们的方法只需要 0.3 个 GPU-days。我们在架构搜索上的第二个工作是 PC-DARTS,这是业界搜索速度最快的网络架构方法之一,其主要思想有两个,一个是采用局部连接的思想来解决网络冗余的问题,第二个是采用边正则化的思想来解决网络搜索稳定性的问题。并且,这个工作首次在大规模图像数据集 ImageNet 上进行了神经网络架构搜索。我们最新的一个相关工作是 GOLD-NAS,渐进剪枝的单阶段可微分搜索算法。这个算法主要的一个贡献是它打破了传统可微分搜索空间的诸多限制,因此大大增加了搜索空间的容量,并提出了单阶段优化策略和渐进剪枝的优化策略。从结果上看,在扩大的搜索空间中,算法不仅能够找到绝对性能更强的网络,也能找到具有更高性价比的网络。我们第四个工作是卷积搜索,提出对卷积操作进行搜索,当前的模型搜索都是采用一些固定的卷积操作,比如 1×1、3×3 的卷积,这种方式限制了模型的性能。因此,为了将卷积的设计也纳入搜索的范围,这个工作提出了针对点云任务的基于数据驱动的模型搜索,同时对卷积的结构也进行了搜索,将来将进一步扩展到传统的图像领域。我们最近两年在计算机视觉三大顶会 CVPR、ICCV、ECCV 大概发表了近百篇文章,基本进入视觉研究领域第一梯队,极大地提高了华为在计算机视觉领域的国际竞争力,同时有一些工作也获得了最佳论文和最佳论文提名。而且最新的算法已经逐渐部署到华为的一站式 AI 开发平台,在一些行业得到了广泛的应用,下面再介绍一下视觉任务的进展和在行业的实践。第一个进展是图像分类技术,在 ImageNet 上,今年我们的分类准确率达到了 85.8%,而之前谷歌最好的精度是 85.5%。从今年 3 月份以来,我们在这方面一直保持着领先水平。第二个进展是弱标注场景下的图像分类技术。在 WebVision 大规模弱标注的网络图像分类比赛中,大约有 5000 个类别的 1600 万张图像,有 90 多支参赛队伍竞争,华为云在分类准确率上取得了业界第一的水平。我们把图像分类技术应用到了一些传统行业,比如米旗蛋糕店。结果上看,我们的技术让商品整盘识别率达到了 99% 以上的精度。另外,我们的模型训练时间小于一天,因此每天都可以进行模型更新,商品的识别时间也小于 1 秒。第三个进展是图像检测、分割技术,在业界权威的目标检测数据集 MS-COCO 数据集上,不论是单模型还是多模型,我们都取得了今年业界第一的成绩。我们将检测、分割技术用到了医疗智能体,在今年新冠肺炎 AI-CT 辅助筛查中实现了自动智能检测,而且已经在各大医院成功部署。我们第四个进展是多模态数据处理技术,相对于单模态,多模态具有天然的互补优势,比如在无人驾驶中除了图像的输入,还有激光雷达信号、GPS、图像分割的数据。在最权威的三维目标检测 NuScenes 数据上,我们提出的技术也取得了非常好的成绩,我们的结果比第二名领先了 3.1%。同时我们将多模态处理技术用在了深圳交通智能体上,实现对红绿灯控制的智能化,在交通总量相同的情况下将平均通行车速提高了 15%,将平均等待时间、延误时间下降了 17.7%。最后介绍一下华为云一站式 AI 开发管理平台 ModelArts。ModelArts 有两个不同层次的版本,一个是 ModelArts Fundamental,一个是 ModelArts Pro。根据华为云在十多个行业常年的技术积累,ModelArts Pro 开发平台主要提供五大类的专业应用开发套件,包括文字识别套件、视觉套件、知识图谱套件、多模态开发套件、自然语言处理套件,还提供了四十多个行业级的高精度预置的算法, 包含数据准备、数据处理、 模型设计、模型管理及部署等等。以上是华为云在视觉预训练模型上的一些基础研究最新进展和行业实践的案例,以及在华为云 AI 开放平台沉淀的一些工作。谢谢!文章来源:https://www.jiqizhixin.com/articles/2020-12-08-8
hellohelloya
发表于2022-01-06 09:15:25
2022-01-06 09:15:25
最后回复
hellohelloya
2022-01-06 09:15:25
1257 0 -
近日,放射学领域国际顶级期刊《Radiology》发表了华为云 EI 创新孵化 lab、华中科技大学电信学院、华中科技大学同济医学院附属协和医院放射科联合团队的最新研究成果:AI 算法检测动脉瘤灵敏度高达 97.5%,帮助医生临床诊断灵敏度提升约 10 个百分点,漏诊率降低 5 个百分点,同时有效缩短医生诊断时间。日前,放射学领域的国际顶级期刊《Radiology》(《放射学》)发表了一项来自中国的「人工智能 + 医学影像」最新研究成果:运用 AI 帮助医生检测脑动脉瘤,灵敏度达到 97.5%;AI 协助放射科医生阅片,帮助医生临床诊断灵敏度提升约 10 个百分点,漏诊率降低 5 个百分点;同时有效缩短医生诊断时间。论文链接:https://pubs.rsna.org/doi/10.1148/radiol.2020192154这项研究由华为云 EI 创新孵化 Lab 联合华中科技大学电信学院、华中科技大学同济医学院附属协和医院放射科完成,运用华为云一站式 AI 开发平台 ModelArts 开发了一套基于 CTA 影像的全自动化、高度敏感的脑动脉瘤检测算法,帮助医生更快速高效地诊断脑动脉瘤。Radiology 杂志是放射学领域的顶级期刊,一直被公认为该领域最新、最高质量研究的权威参考,2020 年最新影响因子为 7.9,是该领域内被引用次数最多的期刊之一。脑动脉瘤辅诊:「人工智能 + 医学影像」新突破「人工智能 + 医学影像」是将目前最先进的人工智能技术应用于医学影像诊断,帮助医生诊断患者病情的人工智能具体应用场景,可以广泛用于各类病灶识别与标注,如宫颈癌、肺部结节、心脑血管疾病辅诊等。脑动脉瘤诊断难点脑动脉瘤是脑动脉内腔的局限性异常扩大造成的一种瘤状突出,存在渗漏或破裂风险,位居脑血管疾病病因的 Top3,堪称「沉默又**的杀手」。脑动脉瘤造成了大约 80%-90% 的非创伤性蛛网膜下腔出血。这一严重的脑部疾病死亡率为 23%-51%,另外还有 10%-20% 的永久残疾风险,对其进行早期诊断与治疗非常必要。动脉瘤位置多发,形态多样,对医生资历要求较高。中国人口基数大,高资历医生匮乏,相关医生工作强度极大。 动脉瘤破裂的风险取决于动脉瘤的大小、形状和位置,因此脑动脉瘤的检测和特征提取是指导治疗的关键。目前,CT 血管造影成像(CTA)是评估颅内动脉瘤的主要影像学检查手段,与磁共振血管造影(MRA)相比, CTA 是一种快速且经济有效的诊断技术,通常具有更广的可用性和较高的空间分辨率。与数字减影血管造影(DSA)相比,CTA 通常更广泛且具备无创性。但是由于脑动脉瘤体积小和颅内血管的复杂性,即使专业的放射学专家进行诊断也需要耗费很长的时间,一些小动脉瘤还可能被遗漏。AI + 医学影像,解决脑动脉瘤辅诊难题在最近发表在 Radiology 的这项新研究中,华为云 EI 创新孵化 Lab 联合华中科技大学电信学院、华中科技大学同济医学院附属协和医院放射科运用华为云一站式 AI 开发平台 ModelArts,开发了一套基于 CTA 影像的全自动化、高度敏感的脑动脉瘤检测算法。ModelArts 平台提供数据预处理及半自动化标注、大规模分布式训练、自动化模型生成,以及端 - 边 - 云按需部署能力,帮助用户快速创建和部署模型,管理全周期 AI 工作流。 该研究开发的脑动脉瘤检测算法包括一个编码器和解码器,并在编码器解码器中间使用了密集的空洞卷积 (DAC) 和残差多核池化 (RMP) 模块。输入的 CTA 图像被重采样至 0.39×0.39×0.39 mm^3 分辨率,算法输出会提供动脉瘤存在概率、动脉瘤位置以及直径大小等信息,并在 CTA 原始图像上为可疑的动脉瘤勾画出一个边界框。脑动脉瘤检测算法的整体架构。该研究使用了 534 名患者的 CTA 数据来训练深度学习检测算法,然后在另外 534 例数据上进行验证。验证集共含有 649 个动脉瘤,该研究算法检测出来了 633 个,灵敏度达到 97.5%;同时算法还检测出了 8 个新的动脉瘤,而这些动脉瘤在医生最初的诊断中被忽略了。这 8 个动脉瘤有 6 个直径小于 3mm,2 个在 3-5mm 之间,说明该研究算法对于微小动脉瘤也具备非常好的性能。数据获取、筛选和分割流程图。算法在验证集上的 FROC 曲线。此外,为了验证该研究提出算法对放射科医生的协助作用,研究人员另外收集了 400 例 CTA 数据作为外部测试集(188 个阳性和 212 个阴性),由四名放射科医生分别在没有算法协助和有算法协助下进行阅片。统计结果显示,在有算法协助的情形下,放射科医生的表现都有一定的提升,特别是经验较少的医生进步最明显。帮助影像科医生,而不是取代他们参与该联合项目的华中科技大学同济医学院附属协和医院影像科专家龙茜博士表示:「我们联合华为云开发的深度学习算法在检测动脉瘤方面表现出了出色的性能。我们发现极少数动脉瘤在最初的临床诊断报告中被忽略了,但它们被深度学习算法成功地识别出来了。」该研究表明,深度学习算法在脑动脉瘤的诊断中具有潜力,有望在临床上作为第二意见的诊断工具。AI 有许多优点,主要是因为其不受经验水平、工作时间和情绪等影响人类表现的因素的影响。对于三甲医院来说,「人工智能 + 医学影像」的引入可以改善高度依赖医生人工读片的传统模式,一定程度上缓解医学影像诊断的压力,同时满足三甲医院的科研需求。对于基层医院来说,相比三甲医院,对复杂影像的处理能力、判断能力更为薄弱,因此误诊漏诊率更高。人工智能通过把影像诊断结果进行前期的分析和处理,可以提高筛查数量,降低误诊漏诊率,进而提高综合医疗水平。当然,这个系统也有一些局限性。它可能识别不出非常小的动脉瘤或位于类似密度结构的动脉瘤,如骨骼。同样,它的判断也受到假阳性的影响,可能错误地将类似于动脉瘤的结构识别为动脉瘤,这时就需要医生把关,共同做出准确诊断。人工智能会替代影像科医生吗?对此,龙茜博士表示:「与华为云合作开发 AI 深度学习算法的目的是帮助影像科医生,而不是取代他们。未来需要进一步收集、分析、验证更异构的高质量数据,进一步验证该算法,这是评估其推广性和对日常临床工作适用性的关键,需要 AI 算法专家、影像科专家等进一步通力合作。」 加速 AI 基础研究和医疗领域落地随着人工智能的不断发展,国内主要 IT 和云厂商都在医疗、大健康领域有所布局。医疗基础研究方面,华为云 EI 创新孵化 Lab 重点聚焦于如何解决医疗领域的重大技术难题。在 MICCAI 2019 、MICCAI2020、Radiology 等人工智能医学影像学术会议期刊上连续发表了华为云人工智能医学影像分析团队 6 篇论文,涵盖宫颈癌筛查、脑中风分割、心室分割以及平片诊断报告自动生成相关领域的研究成果。在 LUNA-2016、HC-2018、ISLES-2018 的个业界多个挑战赛事上获得业界领先水平。在产业落地方面,在医疗影像领域,华为云可提供企业级的医疗影像 AI 平台,支撑全流程可追溯的端到端 AI 建模,助力医疗影像 AI 更加系统、快速、安全地走向市场。在基因组、制药等领域,与医疗行业领先企业及医院和高校合作,加速 AI 研究和应用落地。
hellohelloya
发表于2022-01-06 09:08:04
2022-01-06 09:08:04
最后回复
hellohelloya
2022-01-06 09:08:04
2474 0 -
3月9日,由东风汽车集团有限公司、东风畅行(武汉)科技股份有限公司联合主办、华为公司承办的“东风出行杯开发者创意大赛”顺利收官,来自武汉大学的“教学实验大楼6楼”团队成功问鼎夺冠。受新冠肺炎疫情影响,比赛采用线上方式进行。“东风出行杯开发者创意大赛”是大数据分析、创意交流赛事,赛题与东风畅行实际业务相结合,为开发者提供一个交流、学习,创新挑战的平台,以达到为业务赋能、培养汽车行业大数据人才的目的。大赛参赛者基于华为云一站式人工智能开发平台ModelArts,根据组委会提供的历史出行订单、出行原始**点数据,完成了订单需求预测、出行行为分析等模型的开发。大赛由东风出行平台提供2019年9~11月的部分订单数据,数据量大于50万行。赛题包括“订单需求预测”和“出行行为分析”两部分,参赛者通过分析历史订单数据,对给定的时间和给定的地点或区域,使用算法预测订单需求数量;同时通过分析用户使用东风出行app的历史数据,分析用户出行规律和人口流动特征,生成个性化运营方案。大赛期间,华为云面向参赛开发者提供了AI开发平台ModelArts,作为一站式人工智能开发平台,ModelArts为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流,成为本次大赛的重要技术支撑。大赛分为初赛、决赛两个阶段,吸引了东风集团内部单位、外部企业、高等院校的25支队伍参赛。在初赛截止前,各参赛队提交了代码、模型、开发过程及解题思路介绍材料、仿真环境演示结果等,经由专业评审评判,最终7支参赛队入围决赛。入围决赛的队伍,经过线上答辩,八位专家评委严格评估,评选出最终获奖者:来自武汉大学的“教学实验大楼6楼”团队荣获一等奖,上海交通大学“蒲公英”团队、东风汽车公司技术中心“珠山湖波特舰队”团队获得二等奖,东风汽车公司技术中心“哈哈的数据联盟”团队、武汉大学“WHURSGIS”团队、东风日产乘用车公司“大碗宽面”团队、武汉理工大学“Transformer”团队获得三等奖。武汉大学“教学实验大楼6楼”团队获大赛冠军自2019年5月正式上线网约车业务以来,东风畅行旗下的东风出行平台用户订单数据已经超过100万。大赛充分结合平台大数据和华为云ModelArts的AI开发能力,赋能各参赛开发者产出优秀创意,为东风出行的运营升级提供更多思路,让无形的数据资产发挥出了更大价值,赋能智慧出行,改善用户体验。东风汽车集团有限公司副总经理尤峥代表东风公司对全体参赛队伍表示感谢。他说,本次大赛历时近2个月,后期还遭遇了前所未有的疫情。各参赛队努力克服困难,全身心地投入赛事当中,展示了良好的比赛成果。此外,本次大赛也为东风汽车数字化业务的价值挖掘提供了新思路、新模式。尤峥还表示,当前我国已将智能网联汽车与新能源汽车并列作为汽车产业发展的重要战略方向,数字化转型已成为重中之重。未来,汽车产品的定义将会发生变化,新一代汽车融合云计算、大数据、物联网、移动通讯、AI、三电等创新技术,汽车产业的价值链会向“产品+数据+服务+生态”拓展,数字化与生态融合将成为价值增长带。面向未来,也期待参赛选手在内的广大青年才俊们能够携手东风、共创未来。智慧出行是东风公司战略发展方向之一,在东风公司与华为公司的深化战略合作基础上,这次赛事也为双方创造了出行业务智能化的新契机。除智慧出行外,华为云ModelArts还支持图像分类、图像检测、视频分析、语音识别、产品推荐、异常检测等多种AI应用场景,让AI的行业应用有了更多想象空间。目前,ModelArts已经拥有开发者超过4万;2019年5月,ModelArts在斯坦福大学DAWNBench榜单以2分43秒的成绩获得图像识别训练时间世界第一。
-
2019,华为云进入发展快车道。根据IDC发布的《2019年上半年云专业服务跟踪报告》显示,华为云以5.4%的份额位居2019H1中国前十大云专业服务商市场份额第一。市场份额的背后,华为云发挥着自身技术创新优势,不断深入行业场景,赋能千行百业。在开发者生态构建方面,华为云亦是不遗余力。2019年,华为云举行了一系列开发者大赛,为开发者提供展示自我的舞台,助力企业与优秀人才、前沿科技的对接,助推万物互联的世界提前到来。No.1数字中国创新大赛:文化传承-汉字书法多场景识别赛2019年1月,华为云以“文化传承-汉字书法识别场景”为赛题,通过人工智能算法实现书法文字的自动识别,解决实际场景中有些书法文字难以识别的问题,传承中国千年文化。赛事共有1071赛队的1203名选手报名,最终破晓、银月之晶、Gtai三支团队获得前三名。冠军团队破晓,赢得最高8万元大奖,并获得华为云AI实验室的实习机会,以及华为云面试绿色通道资格。比赛过程中,华为云为参赛选手们提供了华为云ModelArts一站式AI开发与管理平台和华为云OCR(文字识别服务)技术支持。其中,华为云OCR凭借识别精度高、服务稳定、支持复杂场景、简单易用等优势,现今已被广泛应用于物流、医疗、金融等行业。No2华为云人工智能大赛•无人车挑战杯7月1日,“华为云人工智能大赛•无人车挑战杯”开始报名。通过本项赛事,华为云全面锻炼和提高了赛队的AI解决方案能力及无人驾驶编程技巧的赛事。作为整场赛事的技术支撑,华为云ModelArts一站式AI开发与管理平台及计算机视觉端云协同解决方案HiLens让参赛开发者们轻松地进行了模型开发与部署。具体而言,在识别红绿灯的问题上,无人车可在上路前通过华为云HiLens Kit采集交通灯照片,然后在ModelArts上进行图片数据集的标注并生成标注数据,轻松过灯。No3华为云鲲鹏开发者大赛7月23日,“2019华为云鲲鹏开发者大赛”开赛,选手基于华为云自主创新的鲲鹏云服务器,进行主题为“化鲲为鹏”的游戏策略开发。大赛吸引了来自北京大学、浙江大学、哈尔滨工业大学等全国374所高校的学生,以及50个来自不同行业的开发者共1200多位选手参赛。而华为云鲲鹏开发者大赛的最大亮点就是在于华为云为参赛选手们提供最新的华为云鲲鹏云服务器。基于鲲鹏处理器对云原生软件随时随地的部署,华为云鲲鹏云服务可以帮助开发者在大数据、分布式存储、ARM原生应用等诸多应用开发场景中游刃有余,为其提供从芯片到服务器到云平台的全栈自主创新能力,帮助开发者轻松应对多云计算的挑战。No4华为云人工智能大赛·**分类挑战杯于7月30日启动“华为云人工智能大赛·**分类挑战杯”致力于运用AI赋能**分类,减轻城市居民在**分类方面产生的困扰。截至比赛结束,有2600多位社会各界开发者参赛。比赛中,华为云为选手提供ModelArts、算力云资源、数据集等。ModelArts以全流程的极简和自动化升级已有的传统AI开发模式,让数据准备、算法开发、模型训练、模型管理、模型推理全链条产生质的飞越。值得一提的是,华为云ModelArts不仅仅应用于**分类,还可适用于建筑、互联网、医疗等诸多行业场景。华为云历来重视用技术使能开发者,不仅发布了ModelArts、HiLens、华为云鲲鹏云服务、OCR等众多解决方案及工具,帮助开发者驰骋开发界,还在2019华为全联接大会上,发布了沃土计划2.0,宣布未来五年将投入15亿美元,帮助全球开发者基于华为开源开放的产品和服务进行技术与商业创新。依托华为30年的技术积淀,华为云正在努力构建完善的开发者生态,以促进每一位加入华为云生态的开发者,不仅能获得技术支持,还能找到同伴、发现商机,将梦想从不可能变可能。如果说云计算改变了中国各行各业的发展历程,那么可以说,华为云正让每一位开发者参与到这一历史进程当中。
-
昇腾AI初创大赛决赛暨星火计划Online第二期 直播信息华为昇腾AI初创大赛决赛暨星火计划Online第二期将于2020年12月17日下午2点在线上直播间举办。下午14:00-18:30将由13家海内外人工智能初创企业进行昇腾AI作品路演,并由专家评委现场评优;晚上20:00-21:00,在同一直播间,还将直播星火计划Online第二期:大咖教你如何玩转昇腾社区,由昇腾开发者首席运营官带你深入掌握昇腾社区通关秘籍!直播回看链接:https://bbs.huaweicloud.com/live/DevRun_live/202012171400.html?ticket=ST-215734-WfOHdEbGd2pbFpMPjzSgomVb-sso&locale=zh-cnhttps://bbs.huaweicloud.com/live/DevRun_live/202012171400.html?ticket=ST-215734-WfOHdEbGd2pbFpMPjzSgomVb-sso&locale=zh-cn
-
盘点 AI 十年来取得的重要突破。过去十年间,人工智能技术突飞猛进,最疯狂的科幻小说场景现在已经成为我们生活中不可或缺的一部分。十年前,人们在谈论 AI 的理论化和实验,但这些年来,AI 变得更加切实了,也变成了主流。无论是国际标准课程、平台、库、框架、硬件,一切都顺理成章。就算说这十年里取得的成绩奠定了未来的基础,也不为过。这篇文章将盘点 AI 十年来取得的重要突破。卷积2012 年是深度学习历史上重要的一年。那一年,卷积神经网络(CNN)在著名的 ImageNet 挑战赛中大放异彩。由 Alex Krizhevsky 等人设计的卷积神经网络「Alexnet」以远超第二名的成绩夺冠,在 ImageNet 数据集上的视觉识别错误率为 15.3%,降低了一半。该神经网络对猫的检测准确度达到了 74.8%,在 YouTube 视频中检测人脸的准确率为 81.7%。现在,手机和商场中的人脸识别应用都应该归功于 2012 年的这项工作,识别准确率的提升使研究者能够进行医学成像模型的部署,这些模型具备高置信度。与 AI 对话Vaswani 等人 2017 年发表的《Attention Is All You Need》带来了级联效应,使得机器能够以前所未有的方式去理解语言。得益于 Transformer 架构,AI 现在能够撰写假的新闻、推文,甚至可能引起政治动荡。继 Transformer 之后,谷歌又推出了 BERT 模型,将其用于关键字预测和 SEO 排名等。BERT 如今已经变成了自然语言处理领域的实际标准,诸如 Microsoft 和 NVIDIA 之类的公司开始堆积更多参数来追赶该模型。NVIDIA 的 Megatron 具有 80 亿个参数,而 Microsoft 的 Turing NLG 模型具有 170 亿个参数。OpenAI 的 GPT 模型后来居上,1750 亿参数的 GPT-3 目前是历史记录的保持者。GPT-3 也是 Transformer 的扩展,是目前最大的模型,它可以编码、写散文、生成商业创意,只有人类想不到,没有它做不到。将人类一军AI 早已在国际象棋中击败了人类。而更加复杂的人类游戏,如 Jeopardy! 游戏、围棋、德州扑克等,也没有挡住算法的脚步。人工智能近几年来最广为人知的事件就是 AlphaGo 在最复杂棋类游戏——「围棋」上击败了人类顶级选手。与此同时,在这个十年中,IBM 的 Watson 也在 Jeopardy! 决赛中击败了两位人类,最终 Watson 获得了 77147 美元奖金,而两位人类分别获得了 24000 和 21600 美元。Facebook 和卡耐基梅隆大学共同开发的德扑 AI Pluribus 战胜了五名专家级人类玩家,实现了前辈 Libratus(冷扑大师)未能完成的任务,该研究还登上了 2019 年的《科学》杂志。2020 年 12 月,DeepMind 提出的 MuZero 让一种人工智能模型掌握多种游戏,包括将棋、国际象棋和围棋。每一个生物体的行为都可以在其蛋白质中寻踪溯源。蛋白质承载着秘密,**蛋白质或许有助于击败新冠大流行。但蛋白质结构非常复杂,需要不断地运行模拟。DeepMind 尝试解决这一难题,其开发的深度学习算法「Alphafold」**了出现五十年之久的蛋白质分子折叠问题。计算机视觉被证明可以帮助诊断,而解决蛋白质折叠问题甚至能够帮助研发人员开发新药。AI:是艺术家,也是骗子去年,在一则视频中,比利时首相谈论着解决经济和气候危机的紧急需求,后来人们发现这其实是 Deepfake 视频。在机器学习和 AI 对比利时首相声音和表达方式的操纵下,这则假视频让首相发表了一场关于全球变暖影响的演讲。这些伪造内容的背后是精心设计的算法——生成对抗网络(GAN)。该算法在 2014 年提出,并得到广泛应用,甚至已经侵入了人类工作的最后一道壁垒:创作。这种网络可以生成从未存在的人脸、互换人脸,让一国总统胡言乱语。GAN 生成的一幅画甚至在佳士得拍卖会上以破纪录的价格——40 万美元成交了。GAN 的另一面是被用于恶意目的,以致于像 Adobe 这种公司不得不研究新技术来鉴别伪造内容。GAN 在下一个十年里仍将是被广泛讨论的对象。秘密武器——硅神经网络的概念诞生了半个世纪,今天流行的反向传播方法也出现三十年了。但是,我们仍然缺少能够运行这些计算的硬件。过去十年,我们见证了十多家公司研究专门的机器学习芯片。这些年来,芯片技术得到了极**展,我们可以在手掌大小的设备上执行百万次运算。这些芯片被用到数据中心,用户可以观看自己喜欢的 Netflix 电影、使用智能手机等。接下来,专为边缘设备定制的 AI 芯片蕴含着价值数十亿美元的商机。苹果等公司已经开发了定制化机器学习芯片(如 A14 Bionic)来提供智能服务。即使是依赖英伟达和英特尔的 AWS,也正在慢慢进入芯片行业。随着芯片变得越来越小,这一趋势只会更加明显:例如使用英伟达 Jetson AGX Xavier 开发者套件,你可以轻松创建和部署端到端 AI 机器人应用,用于制造、零售、智能城市等等。谷歌的 Coral 工具包可将机器学习带到边缘设备上。安全、实时输出是目前的主题。开源文化逐渐成熟2015 年,TensorFlow 开源。一年后,Facebook AI 又开源了基于 Python 的深度学习框架 PyTorch。今天,TensorFlow 和 PyTorch 已经成为使用最广泛的框架。通过不断的版本更新,谷歌和 Facebook 为机器学习社区带来了极大便利。自定义库、软件包、框架和工具的爆发式增长,使得更多人进入了 AI 领域,也为 AI 研究带来了更多人才。开源是近几年的一个主要特性。开源工具和越来越多的可用资源(如 arxiv 或 Coursera)促进了 AI 变革。另一个催化剂是流行的竞赛平台——Kaggle。Kaggle 和 GitHub 滋养了一批高质量 AI 开发者。更多学习,更少规则Schmidhuber 教授上世纪 90 年代初提出的元学习概念,最近才逐渐得到关注。元学习指在有限训练示例的基础上,使机器学习模型学习新技能并适应不断变化的环境。通过操纵超参数对特定任务优化机器学习模型需要大量用户输入的话,过程会较为繁琐,而使用元学习后,这一负担将得到极大缓解,因为元学习将优化部分自动化了。自动优化带来了一个新的行业 MLaaS(机器学习即服务)。未来方向关于一些专家预测以下领域或许将发挥主要作用:可复现性差分隐私几何深度学习神经形态计算强化学习尽管 AI 已经进入许多我们未曾想象的领域,但它仍需应用到更流行的应用中,如自动驾驶汽车。然而,挑战更多地在于数学层面:目前已有能够做出准确决策的算法,也有能够处理这些算法的处理器,但何时能够部署到应用上仍未可知。不管是医疗还是自动驾驶汽车,AI 仍需要继续进展,而这只有在透明性和可复现性得到建立时才会发生。原文链接:https://**yticsindiamag.com/ai-top-decade-2010-2020-breakthroughs/本文来源:https://www.jiqizhixin.com/articles/2021-01-11-3作者:RAM SAGAR编译:蛋酱 魔王
-
作者 | 陈大鑫、青暮 2012年1月11日,因疫情延迟半年已久的 IJCAI 2020大会正会终于迎来万众期待的开幕式!本届大会是第29届国际人工智能联合大会(IJCAI-PRICAI 2020),大会原定于2020年 7 月 11 日在日本横滨召开,现在会址从日本横滨改到了全程线上举行。线上的虚拟环境究竟是怎么样的?给人的体验感和参与感又会如何?南京大学人工智能学院院长周志华教授对此表示道:“走进虚拟会场想起仙剑奇侠李逍遥。”在开幕式上,大会组委会连续公布了包含IJCAI 2020 卓越研究奖、约翰·麦卡锡奖、计算机与思想奖、Donald E. Walker 杰出服务奖、AIJ 经典论文奖、AIJ 突出论文奖、IJCAI-JAIR最佳论文奖、IJCAI 杰出论文奖等多项大奖 。在查看各项大奖之前,就让AI科技评论带大家再次回顾一下IJCAI-PRCAI 2020论文接收情况。一、大会论文统计IJCAI-PRCAI 2020共收到6814篇论文摘要,以及5147篇提交论文,其中346篇论文由于违反提交政策被desk rejected,2191篇论文被summary rejected,也就是还没进入评审阶段就被直接拒绝,占比高达42.5%,最后只有591篇论文被接收,仅占非 desk-rejected 论文的12.5%,占总投稿量的11.5%(2018年、2019年的接收率分别为20.5%、17.9%)。录用论文列表:http://static.ijcai.org/2020-accepted_papers.html 按照国家分布,和往年一样,中国的接收论文数和投稿数都位居第一。论文接收数排第二、第三的是**和澳大利亚。这三个国家的论文接收率分别为:中国9.51%,**11.5%,澳大利亚15.5%。以下则是按照大洲统计的论文投稿数和接收数分布情况。按照主题领域统计,除了机器学习、自然语言处理、计算机视觉、数据挖掘等大类外,其他比较受关注的领域有:基于智能体和多智能体的系统、多学科课题和应用、机器学习应用、知识表征和推理、人与AI等。 二、IJCAI 2020 大奖IJCAI 卓越研究奖IJCAI 卓越研究奖(Research Excellence Award)是 IJCAI 所有奖项中最为重要的一个奖,它对获奖者的要求是「在整个职业生涯中始终保持高质量的研究,且取得实质性成果」。2020年该奖项的获得者是科克大学(University College Cor)计算机科学与信息技术学院荣誉教授Eugene C. Freuder。Eugene C. Freuder在基于约束的推理和问题解决方面( constraint-based reasoning and problem solving)做出了开创性研究。过去获得此殊荣的都是人工智能领域最杰出的科学家:约翰·麦卡锡(1985),艾伦·纽厄尔(Allen Newell ,**),马文·明斯基(1991),雷蒙德·瑞特(1993),Herbert Simon(1995),Aravind Joshi (1997),Judea Pearl(1999),Donald Michie(2001),Nils Nilsson (2003),Geoffrey E. Hinton(2005),Alan Bundy(2007),Victor Lesser(2009),Robert Anthony Kowalski (2011), Hector Levesque(2013),Barbara Grosz(2015),Michael I.Jordan(2016),Andrew Barto(2017),Jitendra Malik(2018)和Yoav Shoham(2019)。在之前的19位获奖者中,有6位还获得了图灵奖(约翰·麦卡锡,艾伦·纽厄尔,马文·明斯基,Herbert Simon,Judea Pearl和Geoffrey E. Hinton)。Herbert Simon同时还获得了诺贝尔经济学奖(1978年)。IJCAI 计算机与思想奖IJCAI 计算机与思想奖(Computers and Thought Award)是 IJCAI 最早设置的一个奖,主要奖给 35 岁以下的研究者,是对于年轻学者来说最高的一个奖项。 2020年IJCAI计算机与思想奖的获得者是华沙大学数学、信息学和力学系助理教授Piotr Skowron。Skowron教授以其对计算社会选择(computational social choice)和委员会选举(committee elections)理论的贡献而受到认可。IJCAI 约翰麦卡锡奖IJCAI 约翰麦卡锡奖(John McCarthy Award)是以人工智能领域的创始人 John McCarthy 而命名,是针对 mid-term career award。IJCAI-John-McCarthy奖旨在表彰那些在获得博士学位后十五到二十五年内,在人工智能领域建立了卓越研究记录的职业生涯中期研究人员。该奖项的被提名者将对其所在领域的研究议程做出重大贡献,并将拥有一流的影响力研究成果。该奖项以约翰·麦卡锡(1927-2011)的名字命名,他被公认为人工智能领域的创始人之一。麦卡锡不仅给人工智能这门学科起了名字,而且对计算机科学,特别是人工智能做出了持久的重要贡献,包括LISP编程语言、知识表示、常识推理,以及人工智能中的逻辑主义范式。该奖项是在麦卡锡家族的全力支持和鼓励下设立的。过去获得过该奖项的学者有: Bart Selman (2015), Moshe Tennenholtz (2016), Dan Roth (2017), Milind Tambe (2018) and Pedro Domingos (2019).2020年约翰麦卡锡奖的获得者是麻省理工学院计算机科学和人工智能实验室(CSAIL)主任Daniela Rus,她同时也是Andrew和Erna Viterbi电机工程与计算机科学教授、ACM、AAAI、IEEE Fellow,并且是**国家工程院和**艺术与科学研究院院士。 Daniela Rus教授因其在自治(autonomy)科学和工程以及多智能体算法的发展方面的贡献而受到认可。值得一提的是,Daniela Rus也曾是雷锋网邀请到的CCF-GAIR首届(2016)大会演讲嘉宾,更多信息请查看 “雷锋网专访CSAIL主任Daniela Rus:人机关系之未来的最靠谱预测 ”一文。IJCAI Donald E. Walker 杰出服务奖正如一个**的成败离不开后勤供给,一个成熟的研究社区也离不开背后默默为社区服务的团体。IJCAI Donald E. Walker Distingguished service Award 正是 IJCAI 为这样默默服务的人而设立的一个奖项,它奖励那些为 AI 社区提供持久服务的人员。2020年的获奖者是新南威尔士大学人工智能科学教授、Data61算法决策理论小组负责人Toby Walsh。Walsh教授以其杰出的贡献以及在整个职业生涯中对人工智能领域的广泛服务而受到认可。三、AIJ 期刊(Artificial Intelligence Journal)奖项AIJ 经典论文奖(The AIJ Classic Paper Award)该奖项表彰至少于 15 年前发表在 AIJ 杂志上,而如今仍然有很高重要性、很大影响力的杰出研究论文。2020年获奖论文:《Temporal Constraint Networks》。论文链接:https://www.sciencedirect.com/science/article/abs/pii/0004370291900066论文摘要:本文将基于网络的约束满足方法扩展为包含连续变量,从而为处理时间约束提供了框架。在这个称为时间约束满足问题(TCSP)的框架中,变量代表时间点,而时间信息则由一组一元和二元约束表示,每个约束都指定一组允许的间隔。该框架的独特之处在于允许处理度量标准信息,即评估事件之间的时间差。我们提出了用于执行以下推理任务的算法:找到给定事件可能发生的所有可行时间,找到两个给定事件之间的所有可能关系,并生成一个或多个与所提供信息一致的场景。本文区分了简单的时间问题(STP)和一般的时间问题,前者在任何一对时间点上最多允许一个间隔约束。我们证明,包含Vilain和Kautz点代数的主要部分的STP可以在多项式时间内求解。对于一般的TCSP,我们提出一种分解方案,该方案执行所考虑的三个推理任务,并引入各种技术来提高其效率。我们还研究了路径一致性算法对时间问题的预处理的适用性,证明了它们的termination ,并限制了它们的复杂性。AIJ 突出论文奖(The AIJ Priminent Paper Award)该奖项表彰不早于7年内发表在 AIJ 杂志上,且有很高重要性、很大影响力的研究论文。2020年获奖论文:《Conflict-based search for optimal multi-agent pathfinding》。论文链接:https://www.sciencedirect.com/science/article/pii/S0004370214001386 论文摘要:在多主体寻路问题(MAPF)中,我们给定一组智能体,每个智能体都有各自的起始位置和目标位置。任务是寻找所有智能体的路径,同时避免冲突。以前,为解决此问题而进行的大多数工作都以最佳方式将单个智能体视为单个“联合智能体”(joint agent),然后应用A *算法的单智能体搜索变体。在本文中,我们提出了一种新的最优多主体寻路算法——基于冲突的搜索(CBS)。CBS是一种两级算法,不会将问题转换为单一的“联合智能体”模型。在较高级别,对冲突树(CT)执行搜索,该树是基于各个智能体之间的冲突的树。CT中的每个节点代表了一组对智能体运动的约束。在较低级别,执行快速单智能体搜索以满足高级CT节点施加的约束。在许多情况下,这种两级形式使CBS需要检查的状态少于A *算法,同时仍保持最佳结果。我们分析了CBS,并展示了其优缺点。此外,我们介绍了Meta-Agent CBS(MA-CBS)算法。MA-CBS是CBS的泛化。与基础的CBS不同,MA-CBS不仅限于低级别的单智能体搜索。相比之下,MA-CBS允许将智能体合并为一小组联合智能体。这缓解了基础的CBS的某些缺点,并进一步提高了性能。实际上,MA-CBS是可以建立在任何最佳而完整的MAPF求解器之上的框架,以增强其性能。在各种问题上的实验结果表明,与以前的方法相比,速度提高了一个数量级。四、IJCAI-JAIR最佳论文奖自2003年起,IJCAI-JAIR最佳论文奖每年从最近5年发表在JAIR中的论文中评选并表彰一篇杰出论文。评审的标准基于论文的重要性和presentation的质量。2020年 IJCAI 2020 IJCAI-JAIR最佳论文:《From Skills to Symboles: Learning Symbolic Representations for Abstract High-Level Planning 》。论文链接:https://dl.acm.org/doi/10.5555/3241691.3241695本文优雅地展示了如何自动构建适用于评估在一个持续、底层环境环境中的高级动作序列组成的规划的抽象表示。这遵循了人工智能中围绕程序抽象符号表示构建智能体控制体系结构的悠久传统、建立高层行为和抽象表示之间的原则性联系,以及构造具有可证明属性的抽象表示的理论基础和用于自主学习抽象高级表示的实用机制。2020 IJCAI-JAIR最佳论文荣誉提名:《Coactive Learning》论文链接:https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.693.7316&rep=rep1&type=pdf五、IJCAI 2020杰出论文今年一共有两篇论文获得IJCAI 2020杰出论文奖。杰出论文一:《Synthesizing Aspect-Driven Recommendation Explanations from Reviews》论文链接:https://www.ijcai.org/Proceedings/2020/0336.pdf论文介绍:解释有助于使推荐变得有意义,从而增加了采用的可能性。然而,现有的解释性推荐的方法往往依赖于严格的标准化模板,这些模板只能通过填充空白aspect sentiments来定制。为了更灵活、更通俗、更多样化地解释interest的各个方面,本文通过从评论中选择片段来综合解释,同时优化其代表性和连贯性。为了适应目标用户的aspect偏好,本文基于一个兼容的可解释的推荐模型,将用户的观点进行上下文化。之后在多个产品类别的数据集上的实验表明,与基于模板、评论摘要、选择和文本生成的baseline相比,本文的方法是高效的。杰出论文二:《A Multi-Objective Approach to Mitigate Negative Side Effects》论文链接:https://www.ijcai.org/Proceedings/2020/0050.pdf论文介绍:在非结构化环境中运行的智能体通常会产生在设计时可能不容易识别的负面作用(NSE)。本文研究了在系统部署期间,如何使用各种形式的人类反馈或自主探索来学习与NSE相关的惩罚函数。本文将减少NSE影响的问题描述为一个多目标马尔科夫决策过程,该过程具有字典式( lexicographic)奖励偏好和松弛性。松弛表示相对于智能体的主要目标允许的最优策略的最大偏差,以减轻作为次要目标的NSE。实验结果表明,本文提出的框架能够有效地缓解NSE影响,并且不同的反馈机制会引入不同的偏差,从而影响NSE的识别。最后值得一提的是,张成奇教授将担任IJCAI 2024的大会主席(Conference Chair),周志华教授将担任IJCAI 2021的程序主席(Program Chair),而杨强教授则是去年IJCAI 2019理事会主席(President, Board of Trustees)。本文来源:微信公众号:AI研习社作者 | 陈大鑫、青暮
推荐直播
-
华为云码道-玩转OpenClaw,在线养虾2026/03/11 周三 19:00-21:00
刘昱,华为云高级工程师/谈心,华为云技术专家/李海仑,上海圭卓智能科技有限公司CEO
OpenClaw 火爆开发者圈,华为云码道最新推出 Skill ——开发者只需输入一句口令,即可部署一个功能完整的「小龙虾」智能体。直播带你玩转华为云码道,玩转OpenClaw
回顾中 -
华为云码道-AI时代应用开发利器2026/03/18 周三 19:00-20:00
童得力,华为云开发者生态运营总监/姚圣伟,华为云HCDE开发者专家
本次直播由华为专家带你实战应用开发,看华为云码道(CodeArts)代码智能体如何在AI时代让你的创意应用快速落地。更有华为云HCDE开发者专家带你用码道玩转JiuwenClaw,让小艺成为你的AI助理。
回顾中 -
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中
热门标签