• [行业资讯] 供应链流程的下一步是什么?
    供应链企业需要采用创新技术来确保敏捷性、提高生产力和提高效率。在过去一年,全球供应链由于发生疫情而承受着巨大压力。对在线商品、关键医疗用品等的空前需求,加上全球库存短缺,使得供应链难以满足不断增长的客户需求和期望。事实上,最近进行的研究表明,新冠疫情破坏和影响了全球四分之三以上(78%)的供应链。这场疫情让供应链行业意识到,敏捷性不再是一件锦上添花的事情,而是管理消费者需求变化、不断发展的技术和意外中断的必要条件。随着世界开始重新开放,供应链学会应对未来几个月和几年的不可预测性,企业必须着眼于解决方案的未来发展,以保持竞争力、继续履行订单并满足客户需求。无论发生什么,敏捷性是在疫情之后取得成功并适应不确定的未来的关键。提高供应链生产力对于供应链和仓库业务,工作人员的生产力对于跟上持续的市场需求和增长至关重要。例如,在电子商务中,消费者根据其快速准时交付订单的能力来评估品牌的服务,因此工作场所的效率将确保零售供应链能够满足客户的期望。因此,供应链需要选择采用针对供应链流程和用户体验都进行了优化的移动操作系统(OS)。然而,企业现在面临越来越多的选择,因为传统的Windows和Android操作系统现在正在与苹果公司的iOS竞争。尽管与iOS相关的成本通常很高,但在制药和零售等某些行业的采用正在增长,因为这些行业被其安全性、可管理性和消费级用户界面功能所吸引。更重要的是,Windows CE最近鼓励供应链进行现代化改造,并迁移到新设备。企业应该利用这三种操作系统的兼容软件,将现有的Telnet和Web应用程序快速安全地迁移到Android、iOS和Windows10操作系统中。这意味着供应链可以选择他们希望在其供应链中运行的设备。这将在每台设备上提供相同的视图和一致的用户体验,以最大限度地提高员工的生产力和准确性,减少停机时间,减少入职时间并最终让客户满意。支持语音的解决方案新冠疫情的影响将电子商务世界向前推进了大约5年,预计这种趋势不会很快放缓。电子商务和消费者需求增长得越多,改进仓库流程的需求就越大。为了满足需求,许多仓库正在探索采用支持语音的技术,以帮助他们更智能、更快、更高效地工作。通过采用语音技术,以往采用纸质文件来了解哪些订单需要拣货或包装的日子已经一去不复返了。与其相反,仓库员工可以利用语音替代方案,更准确地完成工作。事实上,通过语音技术,员工可以将工作效率提高25%,并将错误率降低35%。为了最大限度地发挥语音解决方案的优势,企业应该寻求一种简单快速的部署,几乎没有停机时间,并培训员工更加简单。有效的解决方案还将提供根据需要扩大或缩小规模的灵活性和多功能性。语音技术为仓库提供了快速满足消费者突然激增需求的工具,并加速这些业务进入供应链。工业物联网的兴起供应链也处于工业物联网(IIoT)的复苏增长之中。虽然这种转变在疫情爆发之前就已经开始,但由于供应链无法以传统方式运作,新冠疫情加速了工业物联网(IIoT)的采用。物联网设备连接到互联网,因此相互连接,无需人工干预即可有效通信和传输数据。当应用于供应链行业时,物联网设备非常有益。从移动操作系统到支持语音的技术,它们提供的连接可以在货物沿着供应链向下移动时实现实时库存可见性和资产跟踪,对机器和设备进行预测性维护以避免计划外停机,让员工专注于更高价值责任,及早发现因货物丢失或延误而引起的问题。工业物联网(IIoT)网络可以促进自动化“协作机器人”或协作机器人的引入,并通过鼓励用户与仓库中的连接设备更好地集成来减少员工的培训时间。然而,这可能是一把双刃剑,因为尽管工业物联网(IIoT)可以提高效率,并使供应链员工更有效地运作,但这也意味着需要管理和控制更多设备以确保不出问题。因此,供应链组织必须采取措施缓解工业物联网(IIoT)问题,包括确保所有边缘设备都得到妥善管理和保养。有了这些措施,企业也开始将他们的思维方式转变为统一端点管理(UEM),也就是新的移动设备管理(MDM)。MDM功能对于保持对连接的供应链设备和资产的控制至关重要,确保它们安全、可用和可访问。组合解决方案允许企业在一个简单的系统中配置、部署、更新和维护所有设备,从而优化设备性能。更重要的是,它可以通过远程管理所有连接的设备来实现无需人工交互的设备管理方法。远程管理设备的能力至关重要,因为新冠疫情的影响仍然存在,供应链企业希望部署永久的混合或灵活的工作环境。如果说,在过去的一年教会人们什么的话,那就是现状可能会在几天甚至几小时内出人意料地发生变化。供应链必须准备好应对突然的中断,继续照常营业,并通过采取措施提高其生产力和敏捷性来确保其在未来世界中的地位。无论是通过升级移动设备软件、将补充设备集成到工业物联网(IIoT)、采用新的创新解决方案还是通过自动化设备管理减少停机时间来实现这一目标,企业都必须利用支持性技术来优化这些决策。
  • [行业资讯] 车载智能语音助理异军突起,往汽车标准配备前进
    根据Voicebot.ai于2019年宣布了关于车载语音助理的报告,针对1,040名美国成年人的问卷调查,以了解语音助理使用于汽车的趋势。近年来,随着智能手机逐步成为美国成年人的必需品,使得许多人在车上不只有讲电话,甚至回复简讯,因此,美国许多州法律规定,在开车时,不准驾驶使用手机,因此透过语音助理在汽车中操作就成为重要的关键功能。 根据调查问卷显示,美国成年人口有4570万人每月使用45%的智能音箱,可是却高达7700万人每个月使用语音助理。与家中的智能音箱相比,语音助理导入车内似乎是更棒的使用体验。在使用率方面,智能音箱仍占据93.3%的使用比例,其次是智能手机的65.8%,至于在汽车内也高达50.1%。 那么,人们如何在汽车中使用语音助理呢?根据调查显示,车载系统通过蓝牙连接到智能手机的情况和最初安装在汽车上的情况超过30%。其中,苹果的CarPlay比例是20.7%,谷歌的Android Auto是9.5%紧随其后。 在年龄方面,年龄在30岁至44岁之间是使用车载语音助理比例最高的族群,占据33.5%。在收入方面,年收入在15万至20万美元之间族群使用率为69.2%。 每月至少使用一次车载语音助理的人的比例高达67.5%。每天使用的用户也达24.2%。只有3.6%表示他们只是尝试后再也没有使用它。 在汽车行驶的过程中,使用语音助理的最大目的是打电话,高达是73.7%,其次是汽车导航达50.3%,简讯传递与回复为41.2%,播放音乐为28.7%,查询附近餐厅比例为17.6%。 近年来,厂商都逐步在改善语音助理,有高达24%的人认为改善很多,27.2%比例认为有些许进步,23.8%比例认为没甚么变化,只有2.8%的人认为语音助理变得更糟糕。 那么,语音助理的存在是否会影响消费者下次购车的决定呢?大约60%的汽车购买者认为,未来拥有语音助理的汽车是选购车的重要依据。此外,25%的购车者认为,只是重要的考虑因素之一。 Voicebot.ai还发现,进入2019年之后,有高达57.6%的人认为车载语音助理的使用比例会愈来愈高,只有4.0%以负面态度看待。毫无疑问的,2019年起,车载语音助理的使用比例将不断攀升,而且会成为愈来愈重要的汽车标准配备之一。
  • [行业资讯] 人工智能和物联网推测智能语音商品应用的演变
    从电影《星际争霸战》(Star Trek)到《钢铁人》(Iron Man),与计算机交谈和沟通一直是人类科技技术的目标之一。以目前来说,语音技术、人工智能及物联网最新进展已将这部分实现。智能手机、智能喇叭和其他设备能够透过 Google 智能语音助理、Siri 和 Alexa 等语音助手来对设备进行指令。 为了帮助了解智能语音技术的未来,先简易分析一下语音助手设备受欢迎的程度、使用它们的最佳状况以及我们如何利用智能语音来作为生物辨识身份的识别工具防止个人资料安全盗用。 语音助理和智能喇叭 智能喇叭受到消费者青睐大部分归因于它们能够理解语音命令并与其他装置设备连接。预计到 2020 年,Amazon Echo 和 Google Home 等智能与音声控喇叭的销售量将达到2.25亿台。 数字语音助理(DVA;Digital Voice Assistants )的扩展是科技公司期望与客户保持互动性所需要采用三个主要趋势之一。根据 IDTechEX Research 研究报告表示,2029年智能语音技术市场将达到 155 亿美元。知名管理咨询、讯息技术跨国公司埃森哲(Accenture)还发现全球有93%的消费者希望家里设备都能够透过智能语音系统来驱动家里的相关电器物品。 车内的声音 除智能家居之外,采用语音技术受到最大的影响就是汽车。语音助手减轻了当今驾驶所面临的最严重的问题之一“分心驾驶”。 美国知名行动用量保险 (UBI) 技术公司TrueMotion,声称“普通美国司机在每次驾驶过程中共花费17%的时间来说话、刷卡或发讯息。” 一般来说,驾驶在开车的途中需要将双手放在方向盘上,并将眼睛放持续专注在前方的交通状况。因此,在不久的将来将会把语音助手融合在开车驾驶的环境。而现今,虽然在车内还未有非常成熟的语音助手,但越来越多车子配备 Apple CarPlay 以及 Android Auto 也算是符合趋势并往前迈进一大步。 人工智能(AI)调查机构 Voicebot 最近的一份报告表示,超过一半的美国车主在驾驶汽车中使用了语音助手,共有67.5%的人每个月都会使用。使用车载语音的前5个用途是打电话(73.7%)、导航(50.3%)、发送讯息(41.2%)、播放音乐(28.7%)和询问餐厅(17.6%)。此外,有60%使用过车载语音助手的用户表示,这是他们购车时所决策考虑的一个重大因素。 语音生物辨识认证 随着我们的更多个人信息在在线共享,资料安全问题在全球成为一个日益严重的问题。在英国,个人资料遭窃占所有举报诈欺案件的56%。许多银行都期望透过语音生物辨识身份来防范电话诈欺。2016年,英国第二大银行巴克莱(Barclays)推出了语音识别服务,以防止所有语音诈欺行为。该技术仅透过语音识别,完全不需要安全密码,因为「每个人的声纹特质就跟指纹一样是独一无二的」。除此之外,语音识别技术也能够用于智能居家及智能办公室。 智能电子锁等设备目前使用密码或行动应用程序进行验证,可能会产生许多不稳定的用户体验。去年底,知名电子锁公司耶鲁(Yale)智能安全系统出现了一个小故障,导致许多人被关在家或被锁在家外面好几个小时。 安全公司企业正在为智能居家创建新平台。语音安全和身份验证的领导者 Pindrop 公司宣布,他们正在通过语音识别平台将语音生物辨识技术扩展到智能居家。预计消费者很快就能够透过声音来验证我们在家中或办公室的各种物联网设备身份及账户。 语音科技就是未来 我们习惯使用键盘、鼠标和触碰式屏幕与计算机进行互动。语音助理提供更自然,更有效的互动,更有可能会形成一种习惯;因为说话和提问是大部分的人与生俱来的能力。随着人工智能和物联网不断的进步,语音助理将很快成为我们与计算机互动的主要方式,就像《钢铁人》的人工智能管家“贾维斯”(Jarvis)一样。
  • [热门活动] 泛微发布全新人事管理平台——聚才林
    聚才林 -- 人事管理平台近日,泛微发布了全新人事管理平台——聚才林,是一套与业务系统融为一体、工作流驱动的全员人事管理平台。“聚才林”为各行各业的客户提供一套人力资源应用领域的专项产品及解决方案,重点提供组织、人事、考勤管理、薪酬管理、招聘管理、绩效管理、培训管理、员工自助等人力资源方面的数字化应用。组织HR管理面临着以下问题:1、系统主要服务HR部门,相关数据缺少有效协同,个性化需求响应成本高:2、由于信息量大、数据来源多,如何实现过程的优化?如何形成对员工和组织全面客观公正的评价?3、如何实现HR管理与业务融入,让静态数据有动态业务支撑?因此,HR系统需要与动态业务管理深入融合,在业务开展过程中才能发现人才、培养人才,只有把业务数据都传输到HR系统中,才会更全面更立体了解人才。现在,泛微发布的——聚才林新一代的HR系统为组织提供了全面的人事管理应用,涵盖选、用、育、留 人事管理的全过程:• 完善了HR核心的应用:组织人事、招聘管理、薪酬、绩效等;• 实现HR事务与业务融合,流程驱动入转调离的基本信息和工作数据,形成员工的成长轨迹;• 过程中结合智能组件:如电子签章、智能语音助手等,提高HR工作效率,提升员工人事服务体验;• 通过低代码开发平台,能够快速应对各类的人力资源需求。聚才林-人事管理平台应用亮点一、部门、组织、全员-灵活适用满足各层级诉求,服务组织所有成员1、助力组织“找到人、用好人”更好的帮助组织找到人,无论是内部人员的内推,还是外部各大招聘网站的对接,智能简历解析,更精 准、方便的招募到合适的人员。更好的帮助组织判断人,通过客观的数据分析,形成人员画像、组织画像,组织再大,也不会错过、误 判人才。2、为HR部门降低重复、低价值的操作,高效处理核心事务在招聘端一键发布内外网的招聘需求,利用自动化工作,抓取外部简历并解析,自动匹配岗位需求。灵活的排班、假勤管理与内部流程及外部数据的打通,高效处理假期。强大的薪酬管理、灵活应对薪酬体系、薪酬核算、便捷的工资发放。3、让员工方便办理人事相关事务构建个人工作门户,转变以往“人找事”到“事情主动到人”推送。搭建人力共享中心:聚才林HR让很多人事事务变成员工自助化服务,例如请假、查工资、查考勤、查 绩效,只需对手机发布语音指令,系统就能立即根据权限自动办理。二、全流程驱动、自动化处理流程驱动让结果有据可依OA的流程审批功能,可以实现HR事务通过流程审批后直接存档,所有结果数据和过程数据相关联,可 以通过过程查看结果,也可以通过结果追踪过程。通过流程来驱动:入转离的审批、用工需求的审批、请销假的审批、工资绩效的审批……等业务。三、业务、管理、数据、行为-全面协同汇总所有工作轨迹和数据形成人员画像聚才林HR整合各异构系统数据,以HR为维度汇总,客观全面展现员工画像。把业务数据、管理数据、 效率数据、行为习惯,工作的点点滴滴都记录下来,有效反映一个人的全貌,反映组织的全貌。聚才林的HR根植于泛微OA,所有人都在OA上工作,工作的点点滴滴能够在聚才林上反映出来,聚才 林天然具备全面协同的能力。四、低代码平台-适应HR个性化需求按需扩展业务需求,快速响应聚才林HR源于泛微,预置了近百项开箱即用的模块,也可以通过云商店下载不同行业特色的人事包。 系统内置低代码平台,适应HR个性化需求。即使不懂代码,也可以按照组织需求定制各类个性化应用,比如干部管理、证照管理、员工活动管理等 等。五、业务系统与HR的融合无缝衔接、相辅相成聚才林HR能够无缝衔接第三方业务系统:如招聘网站、ERP、CRM等业务系统、企业微信、考勤设备等业务系统中的流程、工作微博、知识分享、问答交流、任务等模块产生的数据可以全面支撑HR系统了解每一位员工。(员工画像)结语:作为新一代全程数字化人力资源管理软件,聚才林HR软件目前已经完善了招聘、组织、人事、假勤、薪资、绩效、第三方集成等模块。今后,泛微将会推出更多的配置化交付功能,快速构建人事业务场景,聚才林始终努力为客户打造一套全面协同、智能化、流程驱动、全程电子化与业务系统融为一体的HR系统,让人力资源管理更全面、更精准、更智慧:• 协同化:所有与组织、员工相关的数据都相互协同;• 数字化:所有人力资源应用功能数字化,随时调用;• 流程化:贯穿人力资源管理全业务,更加合规高效;• 智能化:融入RPA、语音识别、OCR等智能化技术;• 低代码化:不懂代码,也可以快速搭建个性化需求;• 全程数字化:减少手工录入签署,人事文件线上签。
  • [行业资讯] 国家网信办:合成人声、人脸替换等深度合成信息内容须进行显著标识
     1 月 28 日消息,国家互联网信息办公室就《互联网信息服务深度合成管理规定(征求意见稿)》(以下简称“意见稿”)公开征求意见。  意见稿表示,为了规范互联网信息服务深度合成活动,弘扬社会主义核心价值观,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益,我办起草了本次意见稿。  意见稿中明确表明,本规定所称深度合成技术,是指利用以深度学习、虚拟现实为代表的生成合成类算法制作文本、图像、音频、视频、虚拟场景等信息的技术,包括但不限于:  (一)篇章生成、文本风格转换、问答对话等对文本内容进行生成或者编辑的技术;  (二)文本转语音、语音转换、语音属性编辑等对语音内容进行生成或者编辑的技术;  (三)音乐生成、场景声编辑等对非语音内容进行生成或者编辑的技术;  (四)人脸生成、人脸替换、人物属性编辑、人脸操控、姿态操控等对图像、视频内容中人脸等生物特征进行生成或者编辑的技术;  (五)图像增强、图像修复等对图像、视频内容中非生物特征进行编辑的技术;  (六)三维重建等对虚拟场景进行生成或者编辑的技术。  同时意见稿第十四条显示,深度合成服务提供者提供以下深度合成服务的,应当使用显著方式对深度合成信息内容进行标识,向社会公众有效提示信息内容的合成情况:  (一)提供智能对话、智能写作等模拟自然人进行文本生成或者编辑服务的,在文本信息内容的稿源说明处等位置进行显著标识;  (二)提供合成人声、仿声等语音生成或者显著改变个人身份特征的编辑服务的,在音频信息内容的合理区域以语音说明等方式进行显著标识;  (三)提供人脸生成、人脸替换、人脸操控、姿态操控等虚拟人物图像、视频生成或者显著改变个人身份特征的编辑服务的,在图像、视频信息内容的明显位置进行显著标识;  (四)提供沉浸式拟真场景等生成或者编辑服务的,在虚拟场景信息内容的明显位置进行显著标识;  (五)提供其他具有生成或者显著改变信息内容功能的服务的,在文本、图像、音频或者视频、虚拟场景等的合理位置或者区域进行显著标识。
  • [行业资讯] 智能语音助理的未来
    编译:iothome人工智能已经真正改变了智能语音助理在我们日常生活中的使用方式,而我们才刚刚开始了解它们。 一份又一份报告预测智能语音助理将会快速发展,这意味着这些物联网设备背后的工具和技术正在塑造技能互联网。这些新一代智能工具和技术可以促进零售、物流、医疗保健、智慧城市、制造业和自动驾驶汽车等领域的增长。 普华永道(PWC)最近的一项调查显示,智能语音助理在过去十年中已被广泛应用,未来,它们将继续塑造我们的生活和工作。以下是报告中的一些数字: ▲90%的人认可智能语音助理▲72%使用智能语音助理▲57%的语音命令来自智能手机▲27%的语音命令来自智能扬声器▲20%的语音命令来自车辆导航系统 此外,在18-24岁的青少年中,语音辅助技术的采用率最高。但使用智能语音助理频率最高的年龄段是25-49岁,其中65%的人被认为是“重量级”用户,每天至少向设备发出一次语音命令。 更重要的是,让我们考虑一下今天语音助理的用途。根据普华永道的调查,人们要求语音助理执行的最常见任务是在互联网上搜索信息、回答问题、提供天气或新闻、播放音乐以及设置计时器或提醒。此外,该报告还显示了一些不太常见的任务,比如发送文本或电子邮件以及检查网络流量。有趣的是,50%或更多的人说他们从来不通过智能语音助理购买或订购东西并使用它们来控制其他物联网设备。 至于增长,Juniper Research表示,到2023年将有80亿个数字语音助理投入使用。这意味着该阶段已经迈出了重要的一步,但是,这种增长对聊天机器人等意味着什么呢? 在过去十年的使用中,第一个障碍,意识,已经被消除了。现在,在同一时期,第二个障碍,即在不同人群中获得接受和基本使用,也已经消除。这项技术在相对较短的时间内也取得了长足的进步,然而,下一个障碍将与用户的信任有关。 还有很多工作需要做。我们需要扪心自问,为什么人们不使用智能语音助理来完成更复杂的任务?普华永道的报告显示,当涉及到更复杂的任务并涉及到人们辛苦赚来的金钱时,人们更喜欢使用他们知道和信任的方法。这意味着语音助理还没有出现在信任列表中。但并不是每个人都这样,在这项调查中,大约50%的人说他们用智能语音助理购物,购买包括食品(34%)、日用品(31%)、书籍(24%)和交通出行(21%)。 但约有25%的受访者表示,他们不考虑使用智能语音助理进行购物。最主要的原因是人们不相信智能语音助理能够正确地理解和处理购买。 这与风险有关。当您要求Google Home mini在Spotify上播放某个列表或者告诉您外面的温度时,风险并没有那么高。但如果您在Echo上要求亚马逊Alexa给您买一个新的空气过滤器并把它送到您家时,那么这就涉及资金交易了。 您相信人工智能能够理解您的要求,买到正确的过滤器,向您收取正确的费用,并把它送到正确的地方。但即使在不到50美元情况下,仍然存在很大风险。赢得消费者信任将是语音助理技术公司的下一个重大任务,因为购物只是人们不愿意做的事情之一。 根据普华永道的调查显示,使用智能语音助理控制其智能家居的人数甚至更少,而这或许就是问题的最大症结所在。(来自物联之家网)在未来,我们需要看看语音助理还能做什么,而这将需要得到更多用户的信任,例如,对智能语音助理的一个预测是,它们将在医疗保健领域得到越来越多的应用。 智能语音助理有能力在如此多的领域中提供帮助,但现在真正的问题是,我们还需要多长时间才能真正相信智能语音助理?
  • [行业资讯] 从触摸到声音:语音技术如何改变物联网格局
    编译;iothome肆虐的冠状病毒大流行给经济和社会造成了沉重打击。尽管这一全球性挑战的长期后果尚待观察,但我们在互动和经商方式上已经发生了根本性的变化。诸如社交距离和避免触摸物体表面之类的措施给语音识别带来了新的动力,并推动了无接触控制的发展。 语音识别技术已经存在很长一段时间了。20世纪50年代初开发的第一套系统只能理解数字,到2017年,这项技术达到了人类水平的准确度。这种先进程度使得语音识别能够在各个行业中扩展,并成为互联设备的标准。普华永道最近的一项调查显示,90%的受访者认可语音助理,其中72%的人使用过智能语音助理。 随着千禧一代和Z一代的采用,语音技术正逐渐成为主流。事实上,全球语音识别市场预计到2025年将达到318.2亿美元。 当一些科技巨头为了获得更大市场份额而展开竞争时,值得一问的是,为什么这项技术如此受欢迎,以及是什么原因导致了人们向语音的转变。 是什么推动了语音革命 这种流行病凸显了迫切需要重新考虑用户与控制器进行交互的方式,以支持非接触式系统。除了提高安全性之外,语音优先技术还通过增加交流的便利性来改善客户体验,因为我们说话的速度比打字快得多。通过将口头命令应用于非接触式控制系统,交流变得更加自然和高效。 除了为用户提供低成本、高舒适度的体验之外,还有其他因素促使人们转向语音: ▲具有语音功能的设备的全球移动性,可用于移动语音搜索▲智能扬声器已广泛渗透到现代家庭▲自然语言处理(NLP)的进步,使情感分析和一般上下文理解成为可能▲人工智能和机器学习的进步推动了个性化体验▲智能语音物联网设备无处不在 随着语音识别系统的不断成熟和日趋完善,语音技术有望在未来几年内吸引数十亿的用户。专家预测,在未来5年内,几乎每个应用程序都会以某种形式集成语音技术。 实施语音技术 从家庭自动化到电子商务到医疗保健再到汽车,各行各业都在将物联网功能与语音识别技术相结合,以满足不断变化的消费者需求并释放业务优势。 ▲智能家居 由连网设备和功能组成的智能家居生态系统使远程访问和实时监控成为可能,但语音控制系统将智能家居自动化提升到了一个新的水平。 诸如Amazon Echo、Google Nest和Samsung SmartThings之类的智能家居中心使用户可以使用简单的语音命令来管理连网设备——所有这些设备都是从单一的界面进行管理。 ▲数字化工作场所 家庭并不是语音激活设备发挥作用的唯一地方,语音技术也在改变工作场所。Gartner预测,到2023年,25%的员工与应用程序的交互将通过语音进行。 如今,支持语音的虚拟助理通过执行琐碎且耗时的任务(例如安排会议和面试、设置提醒等)来帮助员工提高效率和生产力。具有语音到文本功能的语音界面可以为会议、讲座和电话会议做笔记,生成亮点并与参与者共享,以简化协作。 对话式销售平台Tact.ai使用语音智能来自动化和简化卖家的工作流程。该平台使销售人员可以随时使用语音命令发送电子邮件、搜索文档、浏览销售历史记录等等。 ▲智慧能源管理 随着家庭自动化系统的日益普及,基于语音的助理可以轻松地从连网设备中获取丰富的能源数据,并将控制权交回用户手中。能源公司开始通过Alexa、Google助理,Siri和其他虚拟助理吸引住宅用户,以提供有关当前能源使用的信息,提供个性化的节能建议并提高能源消耗效率。 在客户体验体系中添加语音助理也是引入自助渠道和降低呼叫中心成本的好方法。会话助理可帮助用户访问帐户余额,查找有关最佳费率的信息,获取有关停电和能源使用趋势的最新信息等等。 电力公司为用户提供能源管理工具的一个很好例子是Octopus,它是一家与Alexa合作将实时能源价格与语音自动化结合起来的能源公司。除其他事项外,用户可以询问虚拟助理何时电费最便宜,然后在该时段安排最高能耗任务以降低电费。 ▲医疗保健 在医疗环境中,物联网语音控制有助于改善患者体验并提供个性化护理。智能语音助理可以实时更新患者病历,提供有关药物和治疗程序的信息,等等。 健康技术公司Orbita提供了一个语音健康虚拟助理,它简化了与医院工作人员的沟通,并大大缩短了响应时间。波士顿儿童医院推出的儿童疾病管理系统(KidsMD)允许家长在支持Alexa的设备上获取高质量的临床信息和特定的治疗方案。 ▲语音支付 语音技术已作为一种强大的工具而受到金融业的关注,该工具可以改善客户服务、个性化金融体验并获得竞争优势。像bankofamerica和Ally Bank这样的大公司正在利用基于文本和语音的对话代理来帮助客户查询他们的余额、设置账户提醒、跟踪他们的支出、获取常见问题的答案等等。另外,像Atom这样的挑战者银行使用语音生物识别技术为银行应用程序增加了另一层安全性。 随着人们对这项技术的更多信任,语音支付也开始兴起。最近的一项研究表明,用户现在更愿意用自己的声音支付低价商品、订阅以及点播电影、音频和电视节目的费用。 银行中语音技术的另一个潜在用途是每天被人们使用的ATM。语音识别可以作为一种替代方式来认证用户和执行交易,而不需要基于触摸的交互——在疫情大流行后的世界,这可能会成为新的标准。 是否适用于工业物联网? 消费者物联网并不是感受到语音技术热潮的唯一行业。在高度重视灵活性、效率和可持续性的工业物联网环境中,基于语音的设备可以改变游戏规则。 制造工厂、建筑工地、生产线——所有这些工业环境都需要物联网语音识别系统提供的免提移动性。当员工需要获得额外的指示或搜索解决方案时,语音控制可通过非接触式和直观的交互方式来方便地访问所需信息。 到2022年,在工业4.0生态系统中进行协作的所有人中,有超过50%的人将使用虚拟助理或智能代理与周围环境以及其他人进行自然而高效的互动。 在智能工厂环境中,基于语音的助理还可以执行以下功能: ▲创建工作单并记录资产数据▲更新订单的装运状态▲通过访问集成ERP系统中的数据来改善资源规划▲与资产管理系统集成。 语音引导仓储,简称VDW,也正在兴起。在高强度仓库环境中,语音拣选系统使用语音识别来帮助员工与仓库管理系统交互,并通过语音接收指令,从而提高生产效率并减少错误。ZeteMedia是一家语音拣选解决方案供应商,它可以轻松地与WMS、ERP和其他企业系统集成,以优化复杂的仓储操作。 实施挑战 但是,在工业环境中利用语音技术并非没有挑战。为了使物联网中的语音控制器有效,声音必须清晰明了且语音命令必须易于理解,而这在嘈杂的工作环境中并不总是容易实现的。支持语音的助理不仅需要将人声与背景噪音区分开,而且还需要支持不同的语言和口音才能真正发挥作用。 物联网中语音控制面临的另一个挑战是,不是所有的物联网设备都连接到互联网,或者并非一直连接到互联网。(来源物联之家网)为了确保可靠的人机交互,需要强大的离线语音识别功能。恩智浦通过其远距离离线语音控制解决方案满足了市场需求,该解决方案利用其最先进的微控制器使设备制造商更容易集成语音命令。 总部位于特拉维夫的人工智能初创公司Onvego也在致力于实现物联网设备的语音激活,即使它们处于离线状态。除了多语言支持外,其语音解决方案还以机器学习算法为基础,以确保在企业的特定内容中进行快速培训。 总结 声控技术被誉为我们的未来,它以我们无法想象的方式重新定义了我们与世界互动的方式。具有语音功能的物联网正越来越多地从智能家居转向工业应用。尽管语音控制面临某些挑战,但其速度、便利性和免提交互的好处(尤其是在需要保持社交距离的情况下),正在推动该技术成为我们生活中不可或缺的一部分。
  • [其他] LeCun预言的自监督模型来了:首个多模态高性能自监督算法,语音、图像文本全部SOTA
    自监督学习能在各种任务中学习到分层特征,并以现实生活中可使用的海量数据作为资源,因此是走向更通用人工智能的一种途径,也是深度学习三巨头之一、图灵奖得主 Yann LeCun 一直推崇的研究方向。LeCun 认为:相比于强化学习,自监督学习(SSL)可以产生大量反馈,能够预测其输入的任何一部分(如预测视频的未来画面),从而具有广泛的应用前景。自监督学习通过直接观察环境来进行学习,而非通过有标签的图像、文本、音频和其他数据源进行学习。然而从不同模态(例如图像、文本、音频)中学习的方式存在很大差异。这种差异限制了自监督学习的广泛应用,例如为理解图像而设计的强大算法不能直接应用于文本,因此很难以相同的速度推动多种模态的进展。现在,MetaAI(原 Facebook AI)提出了一种名为 data2vec 的自监督学习新架构,在多种模态的基准测试中超越了现有 SOTA 方法。data2vec 是首个适用于多模态的高性能自监督算法。Meta AI 将 data2vec 分别应用于语音、图像和文本,在计算机视觉、语音任务上优于最佳单一用途算法,并且在 NLP 任务也能取得具有竞争力的结果。此外,data2vec 还代表了一种新的、全面的自监督学习范式,其提高了多种模态的进步,而不仅仅是一种模态。data2vec 不依赖对比学习或重建输入示例,除了帮助加速 AI 的进步,data2vec 让我们更接近于制造能够无缝地了解周围世界不同方面的机器。data2vec 使研究者能够开发出适应性更强的 AI,Meta AI 相信其能够在多种任务上超越已有系统。    论文地址:https://ai.facebook.com/research/data2vec-a-general-framework-for-self-supervised-learning-in-speech-vision-and-language    项目地址:https://github.com/pytorch/fairseq/tree/main/examples/data2vec转发自:https://www.jiqizhixin.com/articles/2022-01-21-5
  • [技术干货] 华为云AI论文精读会2021第二十二期:可变长度的语音片段情感识别解读分享
    2021年11月3日上午10:00,举行华为云AI论文精读会2021第二十二期:可变长度的语音片段情感识别解读分享。本期邀请到的嘉宾是:陈城鑫,中国科学院大学信号和信息处理专业博士研究生,研究方向为多模态情感识别和语音交互。本次论文精读的领域是NLP领域,感兴趣的小伙伴点击下方的链接一起观看学习吧~华为云AI论文精读会致力于让更多人低门槛使用经典算法,助力AI开发者基于ModelArts,实现高效率论文复现和挑战!本期视频:算法链接:https://marketplace.huaweicloud.com/markets/aihub/modelhub/detail/?id=302dce12-f205-482e-a955-4a84193ae7fb华为云AI论文精读会2021·论文算法实战赛报名地址:https://competition.huaweicloud.com/information/1000041393/introduction
  • [技术干货] 华为云AI论文精读会2021第二十一期:语音驱动风格可控手势生成
    2021年10月28日晚上19:00,举行华为云AI论文精读会2021第二十一期:语音驱动风格可控手势生成。本期邀请到的嘉宾是:张旭,大连理工大学计算机科学与技术硕士研究生,研究方向为人工智能、数据挖掘与应用,曾于大连理工大学获得国家奖学金。本次论文精读的领域是NLP领域,感兴趣的小伙伴点击下方的链接一起观看学习吧~华为云AI论文精读会致力于让更多人低门槛使用经典算法,助力AI开发者基于ModelArts,实现高效率论文复现和挑战!直播间链接:https://bbs.huaweicloud.com/live/cloud_live/202110261900.html算法链接:https://marketplace.huaweicloud.com/markets/aihub/modelhub/detail/?id=9256a610-0912-4106-9ed4-087a99fc58dd华为云AI论文精读会2021·论文算法实战赛报名地址:https://competition.huaweicloud.com/information/1000041393/introduction
  • [行业资讯] 外卖平台为骑手们定制专属头盔:可语音接单、碰撞检测
    近日,为解决外卖配送员骑行安全的问题,饿了么与美团分别推出了自己研发的智能头盔。1月12日,饿了么宣布在上海等城市试点智能头盔,计划今年在全国发放超100000顶。据介绍,这款头盔可以通过语音指令进行接单操作。为了提升语音识别的准确度,智能头盔搭载了独立降噪控制芯片,降低环境噪音后可以使语音识别更为精准。同时,通过内置的传感器,智能头盔可以进行佩戴检测及碰撞检测。此外智能头盔还内置了警示灯,如果骑士刹车或者到了没有路灯的地段,头盔的侧灯也会自动闪烁,提升骑行安全。目前,正在测试将智能头盔与骑士接单软件互联互通,扩展出更多功能。饿了么终端技术负责人郑海波透露,未来智能头盔将“进化”为AI助手,骑士可以与智能头盔语音互动。美团外卖在去年也推出了这样的智能头盔。其定制式开发的智能头盔在湖南、广东、辽宁、宁夏等省(区、市)批量投放使用,通过物联网、AI等技术手段,为骑手安全保驾护航,降低骑手配送过程中的交通事故发生率。美团的智能安全头盔主要具备四项功能:一是有嵌入蓝牙耳机、麦克风、快捷按键等功能,可方便骑手听单、接单既提升配送体验,又避免因听单、接单导致分散精力,进而带来安全隐患;二能对骑手进行戴盔检测,提高戴盔率;三是配置自感应尾灯,可识别骑手夜间工作模式并自动开启频闪,对后车进行提示,防止后车追尾;四是进一步提高电池续航能力,充电2小时后可使用3天时间。
  • [问题求助] Atlas200dk中文语音识别MindStudio样例运行教程还有么?
    【功能模块】【操作步骤&问题现象】1、2、【截图信息】【日志信息】(可选,上传日志内容或者附件)
  • [近期热门] 年度盘点:2021年 人工智能行业进入下半场
    据IDC中国12月22日公布的数据,2021年上半年中国的人工智能整体市场规模达21.8亿美元,同比增42.2%。在整体市场规模增长的情况下,人工智能的各个细分市场的增长情况以及市场格局也在发生着变化。作者:GPLP犀牛财经 李东耳   来源:搜狐自从2015年人工智能火爆之后,人工智能行业经过长达7年的发展开始进入到了下半场。据IDC中国12月22日公布的数据,2021年上半年中国的人工智能整体市场规模达21.8亿美元,同比增42.2%。在整体市场规模增长的情况下,人工智能的各个细分市场的增长情况以及市场格局也在发生着变化。计算机视觉厂商纷纷登陆二级市场据IDC中国相关报告,当前人工智能市场主要分为三个部分:计算机视觉市场、语音语义市场、机器学习平台市场。2021年上半年,计算机视觉市场的市场规模为9.9亿美元,同比增33.0%,低于整体市场规模增长;语音语义市场的市场规模为9.4亿美元,同比增45.0%,略高于整体市场规模增长;机器学习平台市场的市场规模为2.6亿美元,同比增101.8%,虽增长显著但整体规模不高。与此同时,在计算机视觉市场参与的巨头当中,2021年上半年前五大计算机视觉厂商分别是商汤(00020.HK)、旷视科技、海康威视(002415.SZ)、云从科技和创新奇智,同为AI四小龙的依图科技位居第6位,这6家企业占据了几乎一半的计算机视觉市场份额。与此同时,另据IDC中国报告指出,上述企业中创新奇智、商汤科技、海康威视的增速比较明显,且从规模上看,前5大厂商均已能够跻身世界领先行列。从资本市场的角度看,2021年是头部计算机视觉厂商集体上市的一年。海康威视虽然是上半年第三大计算机视觉厂商,但其已经上市,而且该业务仅是海康威视业务中的一部分,2021年AI第一股争夺战以商汤科技12月30日在港交所挂牌上市告终。早在2019年就赴港IPO的旷视科技如今正在转战科创板,云从科技已过会但还未正式登陆二级市场,但上市已成必然趋势,正式上市也只是时间问题。随着头部计算机视觉厂商纷纷登陆二级市场,计算机视觉或将迎来更快增长。语音语义市场潜力巨大与计算机视觉市场不同,语音语义市场的集中度相对要小得多,前三大厂商科大讯飞(002230.SZ)、阿里云、百度智能云仅占据了约四分之一的市场,其后依次是思必驰、小i机器人、拓尔思。在语音语义市场中,头部厂商仍然以大玩家为主,互联网厂商优势显著,不过报告显示,阿里云、百度智能云的市场份额正在逐步逼近科大讯飞。语音语义市场增长较计算机视觉市场增长相对较快,市场份额逐渐接近的原因,与其应用场景日益丰富有关。以C端为例,语言在人与人工智能的交互中的使用频率越来越高,语音识别已成为智能手机的必备功能,部分可穿戴智能设备也越来越多地使用语音识别功能。虽然当前消费者对于消费电子的语音功能使用频率还不算高,大部分消费者也还没有养成使用语音功能的习惯,但语音识别已逐渐成为消费电子产品的标配功能。智能家居的普及也为AI语音识别提供了新的市场,以智能音箱为代表的语音识别设备和手机、智能电视均是智能家居的重要入口,且从用户的使用体验来看,智能音箱有着智能手机无法替代的使用体验。随着语音语义技术的提升,这些语音识别设备在智能家居中的作用将会更加突出,也将有更多智能家居产品使用语音功能。和发达国家相比,中国智能家居普及度还较低,且地域差异较大,这也就意味着仅仅是追赶上发达国家水平,都会为智能家居释放出巨大的市场空间,作为智能家居的上游产业,语音语义人工智能也将会因此拥有巨大的增量市场。此外,目前语音语义市场仍有一些潜在市场等待开发。如在家用机器人领域,陪伴机器人是对语音语义人工智能技术需求最大的分类之一。虽然不少企业尝试过陪伴机器人,但大多以失败告终,主要原因还是技术不成熟导致无法满足消费者的需要。事实上,未来陪伴机器人仍将会进入到千家万户,这些都是语音语义人工智能未来的增长点,而这还只是在C端,语音语义人工智能在B端也有较大的市场空间待开发。机器学习平台市场高速增长ing2021年上半年,机器学习平台市场的市场规模为2.6亿美元,同比增101.8%。虽然机器学习平台市场的市场规模相对较小,但增长速度却非常高。从市占率角度看,机器学习平台市场的集中度更高,仅是第四范式一家企业在2021年上半年就占据了超四分之一的市场份额,市占率前三的第四范式、华为云、九章云集更是占据超过一半的机器学习平台市场份额。IDC中国报告显示,2021年上半年,机器学习平台市场份额翻倍的主要驱动因素主要有两个:一是传统政企客户构建AI中台带来的需求增长;二是厂商对于AutoML等降低机器学习门槛技术的不断投入。此外,IDC另一份报告中曾指出,自动化机器学习将是解决当前行业用户人才以及技能不足的有效路径。因此,人口红利逐渐消失部分岗位开始去人工化、政企单位加速数智化转型等都为机器学习平台的增长提供了不小的助力。不过,和很多前沿科技在商业化落地时遇到的问题一样,机器学习平台的客户都是B端和G端的客户,一方面客户需求多样,很多甚至需要定制化服务,另一方面,客户需求又很简单,就是要提升工作效率。因此,在机器学习平台还未完全成熟的当下,任何企业都有超车的可能,谁能更有效、更有针对性地解决客户提升工作效率的需求,谁就能在机器学习平台的市场竞争中胜出。与此同时,由于机器学习平台与大数据、云计算有较多联系,因此在机器学习品台领域,以第四范式为代表的人工智能企业和以华为云为代表的云计算服务商成为机器学习平台的主要竞争者,二者互有利弊,但和计算机视觉等人工智能技术相比,计算机学习品台这种完全to B的领域当前发展尚浅,究竟谁更能代表机器学习平台的未来还需时间的检验。人工智能的未来在哪儿?随着人工智能在人们的生产生活中的应用范围越来越广,人工智能也将在更多的领域发挥作用,自动化机器学习、知识计算、数字孪生、智能决策、文档型AI等新技术的成熟与应用将加速人工智能增量市场的挖掘。从IDC中国的报告中不难发现,语音语义人工智能技术或将成为接下来中国人工智能市场突破的重点,B端或将成为人工智能增长的重要驱动因素。语音交互在B端的应用正在逐步放开。据《2020~2021中国语音产业发展白皮书》,智能语音已在智慧教育、智慧医疗、智慧城市、智慧制造等领域大显身手,特别是在智能制造领域,智能语音在工业品声纹质检、智能语音调度与通信、工业设备运维检修等应用场景下得到了应用。随着人工智能在智能语音方面的成熟,越来越多工业场景也将运用到智能语音技术。在其他一些to B的应用场景中,语音交互也令政企客户的工作效率大大提升,智慧办公、同声传译、客服接待等多种办公场景均可因人工智能的语音交互能力的提升得到飞速发展。同时,和很多to C的领域相比,包括语音交互等各种B端的人工智能应用还不够充分,一个很重要的原因就在于当前不少to B的人工智能企业无法满足政企用户的特殊需求,存在供需上的不平衡。或许和云计算等科技领域一样,开源是一个不错的解决方式,可以让客户也拥有根据自身需求开发所需的人工智能产品的能力。如今,旷视科技等部分人工智能企业已将框架代码开源,建立人工智能中台。随着人工智能to B思路的转变,B端市场将成为人工智能行业的重要驱动因素。(本文仅供参考,不构成投资建议,据此操作风险自担)
  • [技术干货] freeswitch-1.10.6源码编译安装
     FreeSWITCH 是一个电话的软交换解决方案,包括一个软电话和软交换机用以提供语音和聊天的产品驱动。FreeSWITCH 可以用作交换机引擎、PBX、多媒体网关以及多媒体服务器等。软件语言:C软件协议:MPL-1.1部署服务器 TaiShan 200 2280          操作系统 openEuler release 20.03 (LTS)         编译器GCC版本 7.3.11.软件的依赖安装yum  install -y autoconf automake libtool gcc-c++ ncurses-devel make zlib-devel libjpeg-devel libevent openssl-devel e2fsprogs-devel curl-devel pcre-devel speex-devel sqlite-devel libedit-develldns-develyum install -y ca-certificatesyum -y install ldns-devel libidn-devel unbound-develyum -y install libedit-devel.aarch64yum -y install libtiff-develyum -y install opus-develyum -y install *atomic*yum -y install libuuid-devel libatomic openssl-develyum -y install libsndfile-develyum -y install lua lua-devel2.获取软件安装依赖包软件包地址 https://github.com/signalwire/freeswitch/tree/v1.10.63.解压并进去安装目录unzip  freeswitch-1.10.6.zip && cd  freeswitch-1.10.64.生成编译文件./bootstrap.sh5.编译执行./configure6.安装部署make -j8 && make install 编译安装报错处理 Freeswitch Error: spandsp >= 3.0... configure: error: no usable spandsp; please install spandsp3解决步骤步骤:1、安装sofia-sipcd /usr/local/src/freeswitch-1.10.5.-releasegit clone https://github.com/freeswitch/sofia-sip.gitcd sofia-sip./configuremakemake installldconfig2、安装spandspcd /usr/local/src/freeswitch-1.10.5.-releasegit clone https://github.com/freeswitch/spandsp.gitcd spandsp./configuremakemake installexport PKG_CONFIG_PATH=/usr/local/lib/pkgconfig:${PKG_CONFIG_PATH}ldconfig编译报错 mod_av.la 问题解决步骤1、安装libav wget https://freeswitch.org/stash/rest/api/latest/projects/SD/repos/libav/archive?format=zip./configure --enable-sharedmakemake install2、安装libksgit clone https://hub.fastgit.org/signalwire/libks.gitcmake ..makemake installcp /usr/lib/pkgconfig/libks.pc /usr/lib64/pkgconfig/3、安装libvpxgit clone https://freeswitch.org/stash/scm/sd/libvpx.gitcd libvpx./configure --enable-pic --disable-static --enable-sharedmakemake installcp /usr/local/lib/pkgconfig/vpx.pc /usr/lib64/pkgconfig/编译报错mod_signalwire依赖缺失解决步骤1、编译signalwire-cgit clone https://github.com/signalwire/signalwire-c.gitcd signalwire-cmkdir buildcd buildcmake ..make -j4make instal安装完成7、下载默认语音包make -j cd-sounds-install && make -j cd-moh-install8、配置环境变量export PATH=$PATH:/usr/local/freeswitch/bin/9、查看版本freeswitch -version装软件下载安装4.1.1 安装软件安装软件freeswitch安装安装步骤步骤1::通过通过Yum源安装依赖源安装依赖yum install -y autoconf automake libtool gcc-c++ ncurses-devel make zlib-devel libjpeg-devel libevent openssl-devel e2fsprogs-devel curl-devel pcre-devel speex-devel sqlite-devel libedit-develldns-develyum install -y autoconf automake libtool gcc-c++ ncurses-devel make zlib-devel libjpeg-devel libevent openssl-devel e2fsprogs-devel curl-devel pcre-devel speex-devel sqlite-devel libedit-develldns-devel步骤步骤2::下载下载freeswitch 1.4.26源码源码wget https://github.com/signalwire/freeswitch/archive/refs/tags/v1.4.26.tar.gz步骤步骤3::解压并进入目录解压并进入目录tar -zxvf v1.4.26.tar.gz && cd freeswitch-1.4.26步骤步骤4::生成配置文件生成配置文件./bootstrap.sh步骤步骤5::配置编译选项配置编译选项./configure --enable-portable-binary --prefix=/usr/local/freeswitch --with-openssl --build=arm-linux步骤步骤6::执行编译并安装执行编译并安装make -j4 && make install步骤步骤7::下载默认的语音包下载默认的语音包make -j cd-sounds-install && make -j cd-moh-install步骤步骤8::配置环境变量配置环境变量将如下环境变量添加到/etc/profile,并执行source /etc/profile生效export PATH=$PATH:/usr/local/freeswitch/bin/—— 结束结束软件运行与验证软件运行与验证05
  • [其他] 语音内容标注
    > 由于模型训练过程需要大量有标签的视频数据,因此在模型训练之前需对没有标签的视频添加标签。通过ModelArts您可对视频添加标签,快速完成对视频的标注操作,也可以对已标注视频修改或删除标签进行重新标注。登录ModelArts管理控制台,在左侧菜单栏中选择数据管理> 数据标注,进入数据标注管理页面。在数据集列表中,基于标注类型选择需要进行标 --- 由于模型训练过程需要大量有标签的音频数据,因此在模型训练之前需对没有标签的音频添加标签。通过ModelArts您可对音频进行一键式批量添加标签,快速完成对音频的标注操作,也可以对已标注音频修改或删除标签进行重新标注。 #### 开始标注 1. 登录ModelArts管理控制台,在左侧菜单栏中选择“数据管理> 数据标注”,进入“数据标注”管理页面。 2. 在数据集列表中,基于“标注类型”选择需要进行标注的数据集,单击标注作业名称进入标注作业标注详情页。 3. 在标注作业标注详情中,展示此标注作业下全部数据。 #### 同步新数据 ModelArts会自动将数据集中新增的数据同步至标注作业,包含数据及当前标注作业支持的标注信息。 为了快速获取数据集中最新数据,可在标注作业详情页的“未标注”页签中,单击“同步新数据”,快速将数据集中的数据添加到标注作业中。 #### 标注音频 标注作业详情页中,展示了此数据集中“未标注”和“已标注”的音频,默认显示“未标注”的音频列表。 1. 在“未标注”页签左侧音频列表中,单击目标音频文件,在右侧的区域中出现音频,单击音频下方![image.png](https://bbs-img.huaweicloud.com/data/forums/attachment/forum/202110/31/224948htl5wocub603hvfj.png) ,即可进行音频播放。 2. 根据播放内容,在下方“语音内容”文本框中填写音频内容。 3. 输入内容后单击下方的“确认标注”按钮完成标注。音频将被自动移动至“已标注”页签。 **图1** 语音内容音频标注 ![image.png](https://bbs-img.huaweicloud.com/data/forums/attachment/forum/202110/31/2250003rtqrxtlrplj8zl1.png) #### 查看已标注音频 在标注作业详情页,单击“已标注”页签,您可以查看已完成标注的音频列表。单击音频,可在右侧的“语音内容”文本框中了解当前音频的内容信息。 #### 修改标注 当数据完成标注后,您还可以进入“已标注”页签,对已标注的数据进行修改。 在标注作业详情页,单击“已标注”页签,然后在音频列表中选中待修改的音频。在右侧标签信息区域中修改“语音内容”文本框中的内容,单击下方的“确认标注”按钮完成修改。 #### 添加音频 除了同步新数据外,您还可以在标注详情页面中,直接添加数据,用于数据标注。 1. 在标注作业详情页面,单击“未标注”页签,然后单击左上角“添加数据”。 2. 在弹出的导入对话框中,选择数据来源、导入方式、导入路径等参数,导入数据。单击确定。 **图2** 导入数据 ![image.png](https://bbs-img.huaweicloud.com/data/forums/attachment/forum/202110/31/225024gvwzrlhkfh6luuh5.png) #### 删除音频 通过数据删除操作,可将需要丢弃的音频数据快速删除。 在“未标注”或“已标注”页面中,选中需要删除的音频,然后单击左上角“删除音频”,在弹出的对话框中,根据实际情况选择是否勾选“同时删除源文件”,确认信息无误后,单击“确定”完成音频删除操作。 说明: 如果勾选了“同时删除源文件”,删除音频操作是将删除对应OBS目录下存储的音频。此操作可能会影响已使用此源文件的其他数据集或数据集版本,有可能导致展示异常或训练/推理异常。删除后,数据将无法恢复,请谨慎操作。
总条数:418 到第
上滑加载中