• [其他] Transformer进军low-level视觉!北大华为等提出预训练模型IPT
    本文是北京大学&华为诺亚等联合提出的一种图像处理Transformer。Transformer自提出之日起即引起极大的轰动,BERT、GPT-3等模型迅速占用NLP各大榜单;后来Transformer被用于图像分类中同样引起了轰动;再后来,Transformer在目标检测任务中同样引起了轰动。现在Transformer再出手,占领了low-level多个任务的榜首,甚至它在去雨任务上以1.6dB超越了已有最佳方案。论文链接: https://arxiv.org/abs/2012.00364Abstract随机硬件水平的提升,在大数据集上预训练的深度学习模型(比如BERT,GPT-3)表现出了优于传统方法的有效性。transformer的巨大进展主要源自其强大的特征表达能力与各式各样的架构。在这篇论文中,作者对low-level计算机视觉任务(比如降噪、超分、去雨)进行了研究并提出了一种新的预训练模型:IPT(image processing transformer)。为最大挖掘transformer的能力,作者采用知名的ImageNet制作了大量的退化图像数据对,然后采用这些训练数据对对所提IPT(它具有多头、多尾以适配多种退化降质模型)模型进行训练。此外,作者还引入了对比学习以更好的适配不同的图像处理任务。经过微调后,预训练模型可以有效的应用不到的任务中。仅仅需要一个预训练模型,IPT即可在多个low-level基准上取得优于SOTA方案的性能。
  • [其他] 无卷积!金字塔视觉Transformer(PVT):用于密集预测的多功能backbone
    论文地址:https://arxiv.org/abs/2102.12122源码(欢迎点击star):https://github.com/whai362/PVT TL;DR这个工作把金字塔结构引入到Transformer[1]中,使得它可以像ResNet[2]那样无缝接入到各种下游任务中(如:物体检测,语义分割),同时也取得了非常不错的效果。希望这些尝试能够促进更多下游任务的进一步发展,将NLP领域中Transformer的火把传递到CV的各个任务上。
  • [其他] 2020中国计算机视觉人才调研报告(节选)
    一、CV人才现状:七成以上CV人才集中在区域经济发达、相关产业聚集、高校资源丰富的一线与新一线城市,整体人才分布集中度高。目标检测作为CV领域的基础研究任务,是近年来中国CV产业落地过程中应用最广泛的技术之一,也是CV人才最集中研究的细分领域。CV人才在“后疫情”时代仍拥有较高收入水平,其中算法岗的平均薪资伴随工作年限的增长增幅不断加大。随着计算机视觉技术的广泛落地,垂直行业在CV领域深度耕耘,打造了行业专属的CV应用。除人工智能和互联网行业外,电商、金融、企业服务、教育、文娱内容等领域也拥有大量CV人才。 二、CV人才诉求:企业偏好多元化专业背景人才,以促进CV与更多学科深度交叉融合。CV人才在未来还需软硬兼修,一方面加强新技术实用化的硬实力,另一方面积极提升解决问题的软技能。企业已经意识到在CV的落地场景中,单纯依靠模型优化并不能解决所有问题。因此,除算法岗外,超六成企业表现出对AI产品经理的强烈需求。 三、CV人才培养与发展:我们从CV人才、企业及高校三个角度洞察到现实与期望的差距。这也是计算机视觉作为一门理论研究与工程实践高度融合的学科在发展进程中的挑战。在调研中,高校和企业对于建立联合实验室以及科研项目合作表示出强烈的意愿,这有望成为CV领域人才培养的重要方式来源:德勤
  • 机器视觉与计算机视觉的区别与联系
      在很多情况下,我们误认为机器视觉就是计算机视觉,其实这是不准确的。何为机器视觉?何为计算机视觉?首先我们从定义着手,机器视觉其实就是用机器代替人眼进行测量和判断。计算机视觉是利用计算机和其辅助设备来模拟人的视觉功能,实现对客观世界的三维场景的感知、识别和理解。机器视觉和计算机视觉不仅是两个不同的概念,而且侧重点也不同。机器视觉侧重工程的应用,强调实时性、高精度和高速度;而计算机视觉侧重理论算法的研究,强调理论,由于理论的研究发展速度往往快于实践应用,也就是说计算机视觉的发展速度要远远超过了其时间生产的应用速度,因此计算机视觉的很多技术目前还难以应用到机器视觉上。但是二者还是共用一套理论系统,只是发展的方向不同而已,一个侧重实际应用,一个侧重理论算法的研究,不能说谁替代谁,各有千秋。
  • [开发资源] IVEManager
    对指定视频区域进行裁剪,整体区域缩放,先裁剪后缩放。CropUtils用于对指定区域YuvFrame进行裁剪(不缩放)、ZoomUtils用于对整个区域YuvFrame进行缩放(放大/缩小),CropAndZoomUtils支持指定区域YuvFrame进行裁剪+缩放。下载链接:https://ysubox.cikits.com/p/55427c4c30db3668a0d48fd0b065b5c5
  • [热门活动] 华为机器视觉普教联网解决方案,用AI守护校园安全
    近期,教育部、公安部联合在京召开全国学校安全工作视频会,要求在校园安全,学生安全这一核心任务上,要认真做好“六个强化”,扎实做好学校安全工作,千方百计保障师生安全,其中明确指出“要强化安防基础”。近年来,校园安全事故频发,食品安全,校园暴力等,无一不在危害和摧残着孩子们的身心健康,我们不想再说,“孩子是家庭的希望,是祖国的未来,少年强则国强,少年智则国智”,我们想切实为孩子们,为校园安全,做些什么。华为机器视觉普教联网解决方案,秉承Huawei HoloSens SDC 、Huawei HoloSens IVS智能化产品能力,打造与众不同的,真正让家长安心的幼儿园。校园出入口,便捷通行功能有效减少门口的拥堵,降低因为拥堵发生安全事故的概率,通过门禁有效识别入园人员身份,可疑人员、突发事件快速响应,提前预警,同时可通过一键报警装置实现危险警情一键上报。教学活动区域态势感知功能,通过预集成危险行为检测智能算法,防止孩子活动时意外情况的发生。操场区域因为范围广,人数多,老师无法照看到所有小朋友,全景监测功能很好的解决了这一问题,帮助老师照看操场上每一位孩子。食堂区域响应政府“明厨亮灶”工程,通过部署防油污高清摄像机,实时上传厨房视频信息,让食堂接受政府和公众的监督,摄像机内加载特定的算法,可以对食堂内部违规操作,不规范行为进行捕捉并告警,保障孩子们饮食安全,真正让家长们安心。华为机器视觉普教联网解决方案已在多个校园部署。如深圳市罗湖区幼儿园就部署了整个方案,使用感受良好。孩子脆弱又天真,稚气而可爱,华为机器视觉普教联网解决方案,致力守护孩子天真的笑脸,无忧的童年,守护社会和家庭的未来,保障孩子平安成长。了解更多相关商品请点击进入:华为好望商城【华为云云市场,助您无忧上云】
  • [热门活动] 机器视觉十大创新方案高效应对智慧交管十大挑战
    2020年9月17日,以“智汇津门,路畅行安”为主题的首届全国智慧交管行业峰会在天津成功召开,来自全国的近500位部交管局领导、专家学者与企业领袖,共同探讨人工智能、云、大数据、5G等新技术在智慧交管领域的应用。华为机器视觉总裁段爱国出席并发表了“全息感知,数据智能,赋能交通智能体”主题演讲,从当前交通管理智能深化面临的十大挑战出发,分享了华为在构建交通智能体的优秀实践。华为致力于把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。未来二三十年,人类一定会进入万物感知、万物互联和万物智能的智能社会。5G、AI和机器视觉三种技术相互促进、相互激发,加速智能世界的到来。未来十年,机器视觉将成为万物感知入口,引爆行业数字化。2020年,华为机器视觉不断丰富产品与场景化解决方案,在交管领域重点聚焦智能化应用落地,取得了巨大进展。摄像机出货量相比去年同期大幅提升,于5月份发布了AI超微光卡口摄像机,被称为华为机器视觉的“Mate7”,全息路口解决方案在发布后短时间内取得了多个项目突破的喜人成绩。交通综合治理道阻且长,当前交管智能深化还面临着诸多挑战,段爱国从感知检测、建设施工、数据应用三个维度的十大挑战出发,分享了华为机器视觉在赋能交通智能体的创新成果。挑战1:设备多,麻雀杆,升级维护难传统摄像机功能固化,导致路口一种业务部署一套设备,麻雀杆现象非常严重,不仅造成资源浪费,而且影响市容市貌。其次这些设备的功能升级、维护极其困难,对新出现的新能源车牌无法识别。如何做到一个设备实现全业务智能、可持续升级迭代是用户共同期许。华为创新方案:华为软件定义摄像机(HoloSens SDC)支持一机多用,违法/事件/流量多功能合一;支持开放SDC OS架构,可通过华为算法商城快速加载第三方算法,例如华为与上海电科合作,在SDC上加载了16种违法检测算法,如“连续变道、变道不打灯、未交替通行”等新型违章检测算法已实战部署。挑战2:光污染隐患大,强反光看不清道路上的高光爆闪灯对交通安全影响很大,常受到民众投诉,若不加补光灯或者采用红外爆闪灯,车辆抓拍的图片效果差,有偏色,无法达到执法取证的要求。如何做到不要爆闪灯、但要全天候高清全彩是个业界难题。华为创新方案:华为AI超微光卡口,采用LED智能精准补光技术,有效截止杂散光束对司机的影响,能减少光污染90%。内置2颗AI芯片,总算力达到20TOPS,用算力换图像,通过深度卷积网络模型实时优化图像质量,对夜间低照度车辆抓拍效果和白天车窗玻璃彩纹干涉的车内图像进行增强,从而得到全天候、全彩、不偏色的车内外高清图像。挑战3:全局与细节无法兼顾交通管理既要掌控全局态势,又要知晓事故、事件的细节。传统的云台远近无法兼顾,基本无智能;枪球一体机的固定枪机不能随球机同步转向,双镜协同能力有限。如何做到全局与细节兼顾,还要强智能?华为创新方案:华为“二郎神”AI双模智能球机,采用90°广角加40倍长焦的双镜头一体化设计,双镜智能协同,远近兼顾,实现全场景无盲区的覆盖,同时支持多场景不同预置位不同智能检测。挑战4:电动车、行人违法多,监管难传统电警、卡口重点关注的对象是机动车,而对其他交通参与者如行人和电动车的关注较少,导致交通违法管控、信控配时比较困难。如何提升对其他交通参与者的感知问题亟待解决。华为创新方案:华为经济型全结构化摄像机可实现行人、机动车、非机动车全结构化,并对行人流量精准采集。同时全结构化摄像机前端智能化,生成图片转发到后端平台分析的模式比前端非智能摄像机加后端平台做视频分析的模式更具优势,大大提升了算力的利用效能,同时降低对芯片制程的要求。挑战5:城市破路施工影响大,审批难老城区在智能化升级改造中常面临破路施工难题,对交通影响巨大。同时破路施工的审批周期常在三个月以上,而不需要破路的施工审批周期仅需2周。如何做到不破路,又能智能升级改造是刚需。华为创新方案:华为即将推出的无网电警卡口采用VideoX无线组网技术,不破路,快速部署,可全面覆盖各种路口形态,降低系统建设TCO。挑战6:临时点位部署难在重大赛事安保、应急指挥中常需要临时增加视频点位来实现全程可视。业界常采用4G摄像机,但由于4G带宽原因,视频流畅度并不高;一些业界5G摄像机因为处理不好I帧码流与基站带宽的匹配问题,单基站接入数量非常有限,建设成本高。华为创新方案:华为是全球5G技术的领导者,推出的5G摄像机采用端网协同的智能流控技术和智能编码技术,可实时根据5G信号强弱智能调整I帧码率,使单基站的摄像机接入数量对比业界提升2-3倍,即使在网络丢包率达到10%的情况下,FillP传输专利技术对带宽利用率依然超过95%,视频体验更流畅。挑战7:部分道路布网、取电难部分农村道路、高速公路、偏远道路,布网、取电难,现场运维不方便,容易造成监管盲区。华为创新方案:华为的“四无”生态型摄像机,突破时空限制,采用高效能光储一体化技术,用更小的太阳能电池板和刀片锂电解决供电问题,通过VideoX自组网技术,解决无网问题,通过远程运维,减少人力成本。挑战8:单维数据不精准,路口管理不精细十字路口的优化治理受限于缺少精准的数据,传统的单维采集方式存在诸多限制,如单向视频容易被大车遮挡,夜间低照度、雨雪雾霾天气数据准确度不高;传统的环形线圈极易损坏,在线率低;浮动车数据采样率低,数据颗粒度大;雷达对低速目标不敏感,易产生断点,重复计数。因此,提供全面、准确、实时、精细的交通数据,是交通精细化治理的基础。华为创新方案:华为基于AI超微光卡口、毫米波雷达和智能交通微边缘ITS800打造了全息路口解决方案。采用多方向雷视拟合技术,结合高精度地图呈现路口数字化上帝视角,精准刻画路口每一条车道、每一辆车的行为动向。ITS800边缘计算单元可生成有标识的车牌、车辆属性、车速、位置、行驶姿态等五类元素据,可合成40多种业务指标,助力交通管理走向科学化、精细化。通过对交通事故、事件的自动感知,精准辅助定责,可节约处警时间20分钟,降低次生事故发生;提供精准车道级流量数据,支持路口信控自适应配时;通过实时交通热力图和路网出行规律,快速发现交通隐患点,缩短治理周期,并依据数据分析给出交通组织优化的合理建议。挑战9:路段点位少,违法多,监管弱路段是交通违法的高发区,但当前部署的卡口、电警摄像机主要集中在路口和少量重要路段,点位有限。但路段的社会视频有很多,如何有效利用各类现有视频资源,提升路段监管能力是当务之急。华为创新方案:智能视频存储IVS3800通过多算法仓,集成业界各类型人、车、违法、事件、流量算法,复用前端电警、卡口视频、图片流及社会点位视频流,实现交通违法、流量二次检测,扩大执法半径,实现现网视频利旧增值,有效节约投资。挑战10:人车数据不关联,执法取证难假牌、套牌查控难,交通肇事逃逸追查难,执法取证难,买卖分黄牛管控难。根源在于人与车数据未关联,不能实现违法精准处置。华为创新方案:智能视频存储IVS3800采用vPaaS多算法服务框架完成人车数据关联归档,实现以人搜车、以车搜人。同时支持256位车辆特征识别,在千万级干扰数据集上验证以图搜车准确率达到87%。华为机器视觉以HoloSensSDC全息精准感知打造“最亮双眼”,以HoloSens IVS全网数据融合构筑“最强大脑”,以HoloSens Store全域协同应用锻造“最快双手”,赋能交通智能体,助力交通管理进入科学化、精细化新时代。商品链接:交通事件检测;前端科技点击进入:华为好望商城【华为云与云市场,助您无忧上云】
  • [热门活动] 华为机器视觉打造阳光厨房解决方案,让“阳光”洒满厨房
     走进一家餐厅,优美的用餐环境,干净整洁的厨房,厨师们戴着厨师帽和口罩,手中的铲勺在轻盈的跳舞,顿时,味蕾在跃动。这些都归功于“阳光厨房”的概念。        “阳光厨房”是指在餐饮服务单位的食品加工关键环节安装视频监控设备,对厨房操作间的各流程进行公开化监控的一种经营方式,根据食品安全法,“食品处理区内从业人员应穿戴清洁工作衣帽从事食品加工操作并且头发不应外露。同时国家市场监督管理总局发布的《餐饮服务明厨亮灶工作指导意见》,已明确提出,鼓励餐饮服务提供者实施明厨亮灶,以此保障消费者的知情权。  华为机器视觉&安徽水天阳光厨房解决方案        华为机器视觉的软件定义摄像机、智能视频存储产品和安徽水天科技公司以厨房场景为核心的智能分析能力(厨师帽识别、口罩识别等)相结合,解决目前学校、园区、机关单位的后厨的安全及卫生问题,发现异常通过水天科技智能化综合管理平台自动告警提示并推送到指定平台,帮助经营者实现:        1、提升经营管理效率:阳光厨房解决方案自动监督后厨的干净和卫生;及时发现改进点。        2、提升顾客信赖度:后厨可视,让顾客可以放心吃,安心吃。       3、厨房重点区域无死角监控:安装华为HoloSens SDC摄像机对厨房重点区域进行视频监控。        基于华为HoloSens SDC摄像机装载安徽水天公司的智能算法,可实现:厨师帽识别:对进出后厨活动的人员是否佩戴厨师帽进行自动识别,若识别到人员未佩戴厨师帽,可立即发出告警信息。口罩识别:对进出后厨活动的人员是否佩戴口罩进行自动识别,若识别到人员未佩口罩,可立即发出告警信息。厨房老鼠侦测:对厨房食物存放处的侦测,识别到老鼠后告警提示管理人员进行及时处理。煤气罐检测:对重点餐饮单位后厨不能使用煤气罐,当识别到煤气罐后自动告警提示。文中提到的商品链接:阳光厨房解决方案华为好望商城【华为云云市场,助您上云无忧】
  • [热门活动] “AI”触手可及,智慧生活就在你身边
    近年来,随着云计算、大数据等技术的不断成熟,我们已经看到AI正以惊人的速度在各个行业中开展应用。可以说,AI已然成为未来智慧城市、智慧生产、智慧生活的强大引擎。作为业界公认的AI最先落地的领域,机器视觉利用视频+AI+大数据的能力,让智能视频和数据分析不仅仅应用于安全保障,更逐步成为各行各业的全新生产力。AI+机器视觉@旅游景区范围大,视频有死角,摄像机选点难度高?多路视频,存储难,分析难、检索难?丽江古城×华为HoloSens机器视觉,旅行,看见风景,看见AI。AI+机器视觉@教育考场视频画面有死角,运维复杂?试卷保密室安防要求严,人力成本高?多考点视频信息割裂,协同管理难?贵州省考试院×华为HoloSens机器视觉,标准化智慧考场守护教育公平。AI+机器视觉@电力隧道管廊安全作业管理难?传感系**立数据割裂,运维复杂?深圳前海电力×华为HoloSens机器视觉,解放摸黑前行的巡检人。AI+机器视觉@科创园区视频智能化识别率要求高?存量安防系统智能化升级成本高?视频存储空间利用率低?京东方×华为HoloSens机器视觉,给高创园区智慧升级打个样!AI+机器视觉@物流货场安全作业边界管理难,视频周界部署成本高?人、车、货数据信息割裂,业务协同闭环难度大?京铁云×华为HoloSens机器视觉,构建全新的货场运营体系。AI+机器视觉@办公园区红外周界误报率高传统安防人工告警时效性差?金风科技×华为HoloSens机器视觉,提供园区管理效率提升新引擎。AI+机器视觉@能源井下无光场景色彩还原难度高?矿区安全作业流程、人员流动管理难?多矿区视频信息割裂,数据共享难?淮河能源×华为HoloSens机器视觉,科技让生产更安全!时代洪流滚滚向前,新技术、新需求不断驱动行业数字化转型的日新月异。躬身入局,沉浸其中,与行业客户、生态伙伴一起解码核心业务场景,利用技术创新由内而外驱动行业数字化转型不断提速,华为机器视觉,在路上。点击进入:华为好望商城【华为云云市场,助您上云无忧】
  • [热门活动] 【华为好望商城】安防第一个算法网购商城,华为AI赋能千行百业的数字新基建
      门口的刷脸闸机识别顾客体温,收银台处的摄像机识别VIP身份,货架前的监控识别偷盗行为,天花板上的摄像头监测热力图……        如果一个便利店老板想让店铺智能起来,他只需要进入一个名为Huawei HoloSens Store(华为好望商城)的网上商城,购买AI算法。点点鼠标,不同功能的AI算法就会自己部署到便利店的摄像机上。        当然,这些摄像机得是华为软件定义摄像机,一种像手机一样可以下载App的摄像机。        软件定义摄像机、智能视觉平台、算法商城、摄像机1拖N、共享协同、数据融合……这些词在2019年被华为一把扔进AI安防一江春水时,引起了业内不小的震动。华为机器视觉产品线总裁段爱国曾说:“华为做软件定义摄像机,智能手机这样的软件定义产品珠玉在前”!        2019年10月,华为重磅推出Huawei HoloSens Store(华为好望商城),并在线下业务试水。不到半年,Huawei HoloSens Store推出在线交易版,正式走上互联网平台。目前, Huawei HoloSens Store已经汇聚了四十多种算法,涉及零售、交通、政府、园区等各行各业。        不得不说,这对于智能安防行业的集成商、代理商来说是一个好消息。利用Huawei HoloSens Store,摄像机集成商不用再像无头苍蝇一样在智能视频算法市场中遍寻适配的算法。只需要在HoloSens Store网站上选择自己的设备型号和场景需求,就能匹配到合适、高质量的算法,一键部署到设备上。Huawei HoloSens Store目前的算法在数量约40多个,机器视觉云服务总经理徐迎辉说,为了保证算法质量,Huawei HoloSens Store会通过刚需程度和成熟度严选算法的两大标准,使商城获得良性循环的基础。由此可见,华为的HoloSens Store首先是要保证算法质量,并不急于冲量。买家和卖家是一个硬币的两面,就像淘宝商城能使得卖家免去实体店运营的麻烦一样,Huawei HoloSens Store同时为算法提供商(卖家)带来了便利。对于算法提供商来说,他们只需要把算法上架到Huawei HoloSens Store,平台会帮助他们精准匹配买家。换句话说,他们可以“埋头”搞研发,坐等算法变现。        对华为来说,Huawei HoloSens Store不仅为华为安防的客户提供了源源不断的算法,还是在通过这些算法解决千行百业的实际痛点,看到千行百业的产业AI化的可能。随之而来的,是华为乃至整个智能安防市场的扩容与放量。正如Huawei HoloSens Store商城总经理说,预计千万级发货的智能终端都将成为HoloSens Store的潜在用户。        就像App Store的出现标志着手机进入智能机时代一样,Huawei HoloSens Store的上线也标志着华为机器视觉注定走了一条和传统安防不一样的道路。        从2018年福州生态大会上的一个沙盘,到2019年华为机器视觉业务部门试水,再到今年3月上线在线交易版,Huawei HoloSens Store这一华为机器视觉的算法“泉水”已经蓄势待发。        2020年伊始,华为智能安防改名为“华为机器视觉”,剑指千亿机器视觉赋能千行百业的新市场。华为常务董事汪涛说,HoloSens Store是“智能视频落地千行百业的催化剂!”段爱国则预测,HoloSens Store将影响未来安防十年的发展!        近日,华为一口气发布了包括“四无”生态摄像机、5G摄像机、热成像摄像机在内的十几项新品和方案,有望进一步为Huawei HoloSens Store带来百万级的潜在用户!点击进入:华为好望商城【华为云云市场,助您上云无忧】
  • [行业动态] 【2月25日 AI 快讯】2020中国计算机视觉人才调研报告:算法岗年薪三十多万,超六成企业急需AI产品经理
    今日共有10条快讯,全文 1050字 产业办公因AI而能:科大讯飞发布全新一代智能办公本X2科大讯飞消费者事业群副总裁钟锟全面介绍并展示了智能办公本新品——讯飞智能办公本X2。2021/02/24 16:41原文链接公交智能转型之路:自动驾驶、手脉识别、语音交互,深兰以人工智能打造“功夫熊猫”深兰科技自2017年开始尝试整车设计,一路至今,推出多项应用成果,同时取得多个城市的自动驾驶牌测试照。经过三年中无数次的钻研和打磨,最终形成的熊猫智能公交整合自动驾驶技术、手脉识别系统、语音交互、精准广告推送等功能,实现在公交的动力、安全、效益和服务上的全面升级。2021/02/24 16:10原文链接2020中国计算机视觉人才调研报告:算法岗年薪三十多万,超六成企业急需AI产品经理最近,德勤携手极市计算机视觉开发者平台、中国图象图形学学会联合发布《2020年度中国计算机视觉人才调研报告》,通过把握计算机视觉人才脉搏,报告发现以下核心观点和主要成果2021/02/24 11:24原文链接理论中山大学发布无偏视觉问答数据集KRVQA,论文登上顶刊TNNLS近期,中山大学人机物智能融合实验室发布了基于常识的无偏视觉问答数据集 (Knowledge-Routed Visual Question Reasoning,KRVQA)。2021/02/24 14:43原文链接一天刷到5篇「x is All You Need」,当学术论文开始标题党……在机器学习论文数量迅速增加的当下,「标题党」趋势也正在抬头。然而,「标题党」虽好,也要当心同质化啊。2021/02/24 14:34原文链接入门深度学习领域最常用的10个激活函数,一文详解数学原理及优缺点激活函数是神经网络模型重要的组成部分,本文作者Sukanya Bag从激活函数的数学原理出发,详解了十种激活函数的优缺点。2021/02/24 14:39原文链接芯耀辉完成4亿融资,红杉中国领投助力解决芯片IP痛点芯片IP领先企业芯耀辉科技(以下简称”芯耀辉”)近日完成天使轮及Pre-A轮超4亿元融资。Pre-A轮由红杉中国、高瓴创投、云晖资本和高榕资本联合投资,松禾资本、五源资本(原晨兴资本)、国策投资和大横琴集团等机构参投。老股东真格基金和大数长青同时追加投资。融资将用于吸引海内外尖端技术人才,提升产品交付能力,功能深化和芯片生态连接能力升级。同时,芯耀辉将进一步投入服务体系。2021/02/24 10:50原文链接工程有钱有闲有知识:「百发百中」篮板作者又出新作:百发百中台球杆「I don't have skill, but I do have technology.」2021/02/24 14:31原文链接其他安卓能帮你检查密码泄露了!还有Messages定时发送等多项功能优化密码泄露,现在能在登录之前收到提醒了!2021-02-24 17:26:01原文链接1%学者拥有21%引用量,全球学术圈两极分化扩大科学界的“富人”和“穷人”之间的差距越来越大。2021-02-24 13:11:13原文链接 
  • [技术干货] 利用生物视觉机制提高神经网络的对抗鲁棒性 | NeurIPS 2020
    作者:慕苏红色石头的个人网站:红色石头的个人博客-机器学习、深度学习之路www.redstonewill.com【简介】本文将两种生物视觉机制,分别是视网膜的非均匀采样机制和多种不同大小的感受野存在机制,应用到神经网络中,提高了神经网络的对抗鲁棒性。论文地址:https://arxiv.org/abs/2006.16427【引言】尽管卷积神经网络在视觉识别任务上取得了卓越的表现,但它们在一些任务上仍然落后于人类的视觉系统。比如,神经网络对于微小的对抗扰动十分脆弱,而人眼对于视觉刺激上的微小扰动则非常鲁棒。近年来,有大量工作表明人工神经网络在建模大脑的腹侧视觉流上具有适用性。因此,本文提出将两种生物视觉机制应用到神经网络中,以提高神经网络的对抗鲁棒性。此外,作者通过消融实验,进一步分析了每种机制中影响神经网络鲁棒性的关键因素。【模型介绍】1. 生物视觉机制第一种机制是视网膜对视觉刺激的非均匀空间采样机制。视网膜小凹中心的视锥细胞密度最大,从中心向四周视锥细胞密度递减。上图左侧显示了5种视网膜注视点下,视网膜空间采样的分布和效果。第二种机制是视觉皮层V1细胞存在不同尺度的感受野机制。上图右侧显示了5种不同的视觉皮层注视点下,周围不同空间尺度的感受野区域(红色矩形框)。2. 基于生物视觉机制设计模型基于上述两种生物视觉机制,作者设计了下图所示的神经网络模型C和D。模型A是普通的卷积神经网络,模型B简单地截取图片上的不同区域来模拟不同注视点的作用,被称为“粗糙的注视点”模型。模型A和B是为了和模型C、D作对照。模型C是融入第一种生物启发机制的模型,被称为“视网膜注视点”模型(retinal fixations),该模型对图片在不同注视点下进行非均匀采样,之后再将其送入神经网络中。模型D是融入第二种生物启发机制的模型,被称为“视皮层注视点”模型(corticalfixations),该模型将标准的ResNet网络分成不同的分支,每个分支处理一种尺度的感受野,之后再将不同分支的结果拼接起来。【实验结果】1、正常样本上的准确率上表展示了模型A(STANDARD RESNET)、B(COARSE FIXATIONS)、C(RETINAL FIXATIONS)、D(CORTICAL FIXATIONS)在不同的数据集上的测试准确率,可以看到模型B的性能普遍优于普通模型A,同时模型C的性能和模型B旗鼓相当,两者差距不大。2、对抗鲁棒性上图显示了在不同数据集上,随着对抗扰动大小的增加,不同模型的鲁棒性结果。我们可以发现,基于生物视觉机制的模型(retinal fixations和cortical fixations)比普通模型(ResNet)具有更好的对抗鲁棒性。此外,在CIFAR10数据集上,retinal fixations和cortical fixations模型的鲁棒性要低于对抗训练的模型。3. 消融实验作者通过消融实验来研究两种生物视觉机制中影响神经网络对抗鲁棒性的决定性因素。如上图左侧所示,“uniformresampling”为均匀采样,而“retinal fixations”采用非均匀采样,可以看到,相比于最优的对照模型,均匀采样的准确率提升小于0,而非均匀采样的准确率提升大于0,说明均匀采样无法提升模型的鲁棒性,而非均匀采样可以。在上图右侧中,由于“cortical fixations”模型考虑图片不同尺度的感受野,同时采用多条神经网络分支处理不同尺度的感受野图片,最后对不同尺度的感受野图片进行高斯下采样再送入CNN中。因此“emsembling”消融模型仅采用一条神经网络分支,“gaussian blur”采用和“coarse fixations”模型一样的下采样方式,但是在图片上加了高斯模糊,“gaussian downsample”则是“cortical fixations”模型中对应最大感受野的分支。我们可以发现,“emsembling”模型无法提高神经网络的鲁棒性,“gaussian blur”能稍微提高模型的鲁棒性。“gaussian downsample”能大幅提高模型的鲁棒性,但是性能低于“corticalfixations”,说明在“cortical fixations”模型中增加对大尺度感受野图片特征的利用,有利于提高模型的对抗鲁棒性。本文首发于公众号:AI有道(ID: redstonewill),欢迎关注!——转自知乎/红色石头
  • [技术干货] 计算机视觉和 CNN 的里程发展
    上世纪60年代,Hubel等人通过对猫视觉皮层细胞的研究,提出了感受野这个概念,到80年代,Fukushima在感受野概念的基础之上提出了神经认知机的概念,可以看作是卷积神经网络的第一个实现网络,神经认知机将一个视觉模式分解成许多子模式(特征),然后进入分层递阶式相连的特征平面进行处理,它试图将视觉系统模型化,使其能够在即使物体有位移或轻微变形的时候,也能完成识别。 卷积神经网络是多层感知机(MLP)的变种,由生物学家休博尔和维瑟尔在早期关于猫视觉皮层的研究发展而来,视觉皮层的细胞存在一个复杂的构造,这些细胞对视觉输入空间的子区域非常敏感,称之为感受野。 卷积神经网络(Convolutional Neural Networks, CNN)由纽约大学的Yann Lecun于1998年提出,其本质是一个多层感知机 **计算机视觉和 CNN 发展十一座里程碑:** - AlexNet(2012年) - ZF Net(2013年) - VGG Net(2014年) - GoogLeNet (2015年) - 微软 ResNet (2015年) - 区域 CNN(R-CNN - 2013年,Fast R-CNN - 2015年,Faster R-CNN - 2015年) - 生成对抗网络(2014年) - 生成图像描述(2014年) - 空间转化器网络(2015年)
  • [开发资源] SnapFileDemo下载
    SnapFileDemo下载云盘下载链接请参考:https://ysubox.cikits.com/p/66224985b0b19bdc5ffcf4cd7c9cc219
  • [技术干货] 机器视觉开发者求助渠道汇总——工单/求助帖
    推荐三个好望云服务的求助渠道,具体操作方法如下: 渠道1:在机器视觉论坛——好望云服务站专区中发布主题(推荐简单问题咨询、资源获取使用)https://bbs.huaweicloud.com/forum/forum-1195-1.html渠道2:提交工单(推荐问题定位、Demo等资源获取/项目对接前期沟通等使用)1、登录华为云,在账户中进入“工单管理”界面。2、在“新建工单”中进入“更多工单产品分类”。3、选择“行业视频管理服务”4、选择对应的问题类型,并新建工单5、以摄像机接入为例,选择“设备接入”->“新建工单”。6、在“新建工单”界面,提交相应的信息,反馈的问题会有工程师跟进解决。渠道3:对于项目型对接,涉及到方案设计、咨询等问题,可通过工单方式建立线下IM企业群,可帮忙企业开发者高效对接。