• [技术干货] 语音合成
    语音合成语音合成,又称文语转换(Text to Speech)技术,能将任意文字信息转化为相应语音朗读出来。语音合成涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术。为了合成出高质量的语言,除了依赖于各种规则,包括语义学规则、词汇规则、语音学规则外,还必须对文字的内容有很好的理解,这也涉及到自然语言理解的问题。语音合成应用场景服务机器人客服系统智能家具出行导航阅读软件语音合成系统一个完整的语音合成系统过程是先将文字序列转换成音韵序列,再由系统根据音韵序列生成语音波形。其中:        第一步涉及语言学处理,例如分词、字音转换等,以及一整套有效的韵律控制规则;        第二步需要先进的语音合成技术,能按要求实时合成出高质量的语音流。语音合成技术的研究已有两百多年的历史,但真正具有实用意义的近代语音合成技术是随着计算机技术和数字信号处理技术的发展而发展起来的,主要是让计算机能够产生高清晰度、高自然度的连续语音。语音合成流程
  • [技术干货] 自动语音识别发展史
    自动语音识别语音识别技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的高端技术。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。自动语音识别发展史1952年,贝尔研究所研究成功了世界上第一个能识别10个英文数字发音的试验系统;1970年以后,在小词汇和孤立词的识别方面取得了实质性进展;1980年以后,孤立词转向连接词识别;1987年12月,李开复开发出世界上第一个“非特定人连续语音识别系统”,用统计方法提升了语音识别率;1990年以后,大词汇量连续语音识别得到优化;1997年,IBM Viavoice首个语音听写产品问世;2010年,Google VoiveAction支持语音操作与搜索;2011年初,微软的DNN在语音搜索任务上取得成功,科大讯飞将DNN首次成功应用到中文语音识别领域;2011年10月,苹果iPhone 4S自带的语音助手Siri一炮走红;2013年,Google发布Google Glass,苹果发布iWatch都嵌入语音交互功能;
  • [技术干货] 语音
    语音来源发音器官分喉下、喉头、喉上三个部分。喉下部分是由气管到肺。从肺呼出的气流成为语音的声源。喉头部分主要是声门和声带。声带是两条韧带,起着喉的阀门作用,它的闭拢和打开成为声门。声门大开时气流畅通,声门闭合,气流冲出使声带作周期性的颤动就产生声音。喉上部分包括咽腔、口腔和鼻腔3个区域,主要起调节语音的作用。其中口腔和鼻腔是调节发音的主要器官。鼻腔基本上是固定的,而口腔中则由于舌的伸缩、升降,小舌的抬起、下垂,使容积变化而产生不同的语音。口腔从唇部到声门总称为“声腔”,分成若干段。声道构造图文字文字是一个汉语词汇,基本意思是记录思想、交流思想或承载语言的图像或符号。文字一词出自《史记·秦始皇本纪》:“一法度衡石丈尺,车同轨,书同文字。”文字和语言等其他工具一样,都是交流信息的工具,同时蕴含一定意义与审美价值,有渊源的历史沿革。文字在语言学中指书面语等表达人们意思的视觉形式,古代把独体字叫做“文”,把合体字叫做“字”,如今联合起来叫做“文字”。在日常生活中,“文字”还可以指语言、文章、字等。视觉符号形式,可以突破口语的时间和空间限制。
  • [技术干货] 语音识别
    语音处理语音信号处理(speech signal processing)简称语音处理。•语音处理是用以研究语音发声过程、语音信号的统计特性、语音的自动识别、机器合成以及语音感知等各种处理技术的总称。•由于现代的语音处理技术都以数字计算为基础,并借助微处理器、信号处理器或通用计算机加以实现,因此也称数字语音信号处理。语音处理介绍语音信号处理的研究起源于对发音器官的模拟。1939年美国H.杜德莱(H.Dudley)展出了一个简单的发音过程模拟系统,以后发展为声道的数字模型。利用该模型可以对语音信号进行各种频谱及参数的分析,进行通信编码或数据压缩的研究,同时也可根据分析获得的频谱特征或参数变化规律,合成语音信号,实现机器的语音合成。语言信息主要包含在语音信号的参数之中,因此准确而迅速地提取语言信号的参数是进行语音信号处理的关键。语音学语音学是语言学的一个分支,是研究人类语言声音的学科。主要研究语言的发音机制,语音特性和在言谈中的变化规律。狭义的语音学对应英语中phonetics一词,关注的重点在具体语音本质以及产生语音的方法。与之相对的是音韵学(或称音系学),研究音位或语音区别特征在某种语言中运作的抽象规则和语音的系统。广义的语音学是指语音学和音韵学这两大方面研究的总合。在中国传统音韵学研究中有关语音的描写和分类,也都属于语音学的范畴。但自近代科学的语音学发展以后,分类越来越细,定义也趋于严密,语音学就专指语音本身特点的研究了。
  • [问题求助] 实时语音转换SDK
    请问一下实时语音转换的demo程序怎么重写on_response函数呢?
  • [分享交流] 在线求语音对抗样本生成算法相关参考代码或干货文献
            近些年来,深度学习技术在海量数据以及强大计算能力的驱动下取得了长足的发展,特别是在语音识别、计算机视觉、自然语言处理等领域,深度学习以其强大的网络表达能力刷新了一项又一项记录,各种各样基于深度学习的产品和服务也逐渐在产业界落地应用。正因为深度学习技术蕴含着巨大的商业价值,其背后潜在的安全问题更值得我们去深究。最近的研究表明,深度学习面临安全和隐私等多方面的威胁,其中对抗性样本是目前深度学习面临的最主要的威胁之一。                对语音场景下的对抗样本进行研究;对该领域的基本方法及进展进行综述,并实现两种常见的语音对抗样本生成算法,能够对特定场景下的语音样本进行攻击。        在线蹲一个大佬!!!
  • [已解决问题归档] IVR流程是否支持传送语音到自定义接口
    【问题简要】我们有一个潮汕话识别的http接口,传入参数是wav格式的语音文件,希望在IVR用户说完话后,把这段语音传送到自定义接口,接口识别这段语音后,返回相应的指令控制后面的流程,请问可以怎么实现?(或者平台本身支持潮汕话识别也可以)【问题类别】智能IVR【期望解决时间】24小时内【问题现象描述】如题
  • [问题求助] 定制语音合成
    在电脑网站上购买了定制语音合成,该如何使用?
  • [公告] 华为云语音语义创新Lab招聘了~
  • [客户案例]华为云助力南京栖霞公安,语音机器人
    随着节后开工潮到来,各地返程人口陆续增多,返程人员信息和疫情监控状态成为新型冠状病毒肺炎防疫工作的重点内容。南京市公安局栖霞分局采用AI技术,化解疫情回访数据量巨大、易疏漏、采集跟踪不及时等问题。据了解,南京市栖霞区暂住人口约36.5万,人员流动量大,及时进行这些流动人群的信息回访和疫情状况采集对当地的疫情防控工作尤为重要。如果采用人工拨打电话的方式,在短时间内不可能完成所有电话排查。疫情当头,电话每晚拨出一分钟,电话通知的意义也将随之下降。同时,纯人工的工作方式,外呼沟通内容同步慢,通知内容完整性难以保证,数据统计维度难以统一,最终呈现出来的汇总数据也难以完整体现真实情况。因此,南京市公安局栖霞分局决定部署华为云联合杭州一知智能新上线的智能语音疫情回访系统。部署智能语音回访系统后,针对不同地区返回南京的民众情况,栖霞公安分局通过电话了解民众近期一定时间段内进出南京情况、返宁计划等相关信息,并做好科学防疫提醒。AI智能语音疫情回访系统,可大大降低疫情排查人员工作负担和感染风险,提升疫情排查效率。考虑到36.5万的呼叫量级巨大,栖霞公安分局首先对从重点地区返宁的租客进行重点呼叫,确保及时了解最新进展,并计划在5天内完成全部电话拨打,日均拨打电话量超过7万。据媒体报道,武汉某社区10名工作人员连续拨打20多个小时电话,只能勉强完成1500余户居民的体温监测。智能语音疫情回访系统后台界面此外,南京市公安局栖霞分局还在官方微信公众号发布推文,提醒居民注意接听回访电话,提高回访效率。据悉,疫情期间,华为云联合一知智能免费向各界提供智能语音疫情回访系统,并得到了运营商深度支持,为智能语音疫情回访系统新开辟了疫情专线,以实现高可信度和高接通率的电话回访。在时间上,最快当日即可上线所属单位系统,开始民众通知和回访的拨打工作。该智能语音疫情回访系统主要覆盖四大场景。疫情通知:点对点快速呼叫,宣讲防控知识;本地居民排查:帮助各政府单位、企业、学校快速完成信息收集;流动人员排查:批量调研返岗人员身体状况,自动生成统计报表;患者跟踪:如有症状,将定期跟踪身体状况。在此呼吁,如果接到疫情回访电话,请您耐心接听,防控疫情、人人有责。
  • WeLink联合对话机器人服务推出智能语音助手“小微”,语音就能办事,效率提升5倍
    WeLink联合对话机器人服务推出智能语音助手“小微”,语音就能办事,效率提升5倍。华为云WeLink(简称为WeLink),华为出品,是专为企业打造的数字化办公协作平台。移动端支持iOS、Android系统。开启数字化办公,体验全新工作模式,立即下载吧!扫描二维码下载(推荐)有两种方式打开小微:在消息首页下滑屏幕,便可呼出小微长按通讯录图标,说出你的问题小微邀您共同战“疫”战 “疫”已经打响,大局又当如何管控?看着每天不断攀升的病例人数,如何才能保证自己在这场战争中全身而退?小微可以为你做什么?查询专业防疫知识勤洗手,少聚会,多消毒,常通风,出行记得戴口罩。如何洗手才有效?怎样消毒才正确?如何口罩多久需要换?想知道更多防疫知识。对小微说:如何正确戴口罩。自我防护做得好,健康工作没困扰。掌握最新疫情除了避免前往人多拥挤地,疫情发生地也得绕道而行,想知道最新疫情情况和确诊人数?对小微说:深圳疫情情况。战术性撤退也是战胜疾疫的条件之一。便民资讯查询复工时间已经确定,孩子的开学时间又该如何判断?对小微说:上海小学什么时候开学。咨询小微开学时间,各地区都能查询!
  • 智能外呼机器人被人民公安报报道了
    https://mp.weixin.qq.com/s/TGSKEOIaK92QzdBqq94sCw华为云智能语音回访系统是由华为云和一知智能科技联合推出,集成了华为云EI外呼机器人、语音识别和语音合成等能力。在疫情期间,各级政府、公安、应急、疫情指挥部等用户,通过外呼机器人对数十万人群实现自动化、周期性的筛查摸排、信息收集、疫情通知,精准地识别、跟踪高风险人员,从而解放了更多的人力投入到更加紧急的岗位当中去。并且该系统实现效率是人工外呼的8倍,后台报表可以快速发现高风险人员,实现快速预警,快速介入处置。华为云智能语音回访系统,还可根据使用单位的实际需求,快速定制化外呼对话流程和逻辑跳转,应用到疫情防控通知、流动人员排查、本地居民排查和重点人员跟踪等场景。
  • [云上求助] 市长热线怎么修改CTI服务器语音提示内容
    【问题简要】市长热线怎么修改CTI服务器语音导航提示内容【问题类别】CTI服务器      【期望解决时间】2天【问题现象描述】因湖北省12345热线平台为配合2020湖北省防疫指挥部调度工作,需对地市12345市长热线做导航语音提示内容进行修改     环境信息:华中。       
  • 语音识别的方言识别程度怎么样
      想问一下华为和讯飞合作的ASR,对于方言的识别效果如何呢?就比如说的是很纯正的上海话,能否保持高准度的识别呢?
  • [WeLink&开放平...] 添加语音技能,一句话直达“健康打卡”
    第一步:进入小微助手管理后台详见前面说明第二步:添加“健康打卡”技能操作步骤:① 点击左侧导航“对话意图”,选择“意图配置”,展示默认预置语音技能① 点击 “添加意图”按钮,进入添加页面在表单中填入以下关键信息(其他字段无需填写),点击保存Ø 名称:健康打卡Ø 提示语:疫情防控,进入健康打卡…Ø 意图编码:healthcheckØ 标准问法:健康打卡④保存成功后,在意图配置列表中便生成了“健康打卡”新技能第三步:配置指令链接操作步骤① 在意图配置中,点击“健康打卡”技能后的“指令”,选择小微进入① 点击“编辑”按钮,便可开始配置找到“指令配置”栏目,按以下内容填写,如图所示Ø 指令类型:选择“链接”Ø 打开方式:选择“新页面打开”Ø 处理结果模板:输入“{"androidUri":"h5://20200128152245983377095/html/index.html","iosUri":"h5://20200128152245983377095/html/index.html"}”④点击保存,完成指令配置 第四步:技能发布操作步骤① 在“意图配置”页面,点击“健康打卡”技能后的“发布”按钮,确认发布②成功发布后,便可在WeLink移动端体验啦企业员工可以通过小微语音快速进入“健康打卡”应用典型问法:健康打卡、健康问卷、进入健康打卡…下拉进入小微语音体验 长按通讯录快速对话