-
1. 解决问题与挑战:1.1 业务场景: 一款具备语音交互的机器狗,对机器狗科研demo样机搭载语音识别ASR、自然语言处理NLP、语音合成TTS服务实现语音交互的功能,实现语音运动控制、语音智能交互、智能提醒等智能语音服务。解决问题:实现准确快速的语音识别、多音色富有情感的语音合成等功能1.2 挑战: 伴随5G技术的发展、互联网基础设施的完善,采用API访问云端实现一些例如语音识别、语音合成模块功能,逐渐可以简化或者取代一些复杂的本地资源部署,快速实现相应的功能。在过去,对于一些语音交互科研机器人,语音服务经常面临本地部署设备数目少、部署成本高、维护麻烦等问题,寻求低成本、部署方便、语音合成迅速的语音交互服务模块在很长一段时间内,成为我设计语音交互机器人设计关键瓶颈难题。1.3 使用服务:语音识别ASR/ 语音合成TTS/ 自然语言处理NLP1.4 如何解决:在本地设备部署语音唤醒服务,设备语音唤醒后,将录音片段通过华为云的语音识别接口传至华为云进行语音识别处理。将华为云返回的语音识别文字信息在本地进行自然语言处理或运用华为云的自然语言处理模块进行自然语言处理得到相应的语义、控制指令信息。将需要语音合成的文字通过华为云的语音合成接口传至华为云,得到相应的音频信息。2. 使用场景: 语音交互机器人控制指令识别:通过语音识别服务,在本地通过正则匹配,数据库对比等操作,得到语音信息中的控制指令信息,用于机器人的语音控制。 语音交互机器人对话语音的语音转写:运用语音识别服务,获取语音信息中相应的文字信息,用于自然语言处理模块的文本输入,或者对话机器人api的输入。 语音交互机器人自然语言处理:通过华为云的自然语言处理服务,得到相应的回复语言,用于智能对话、智能提醒等功能。 语音交互机器人语音合成功能:运用华为云的语音合成服务实现对答文本的语音合成服务。3. 业务架构图/方案截图:4. 使用规模: 语音识别:500次/月 语音合成:500次/月5.使用收益: 简化了语音交互模块的配置:学生可以轻松通过API调用的方式实现语音识别、语音合成等服务,简单便捷。 提升了语音交互的质量:得益于华为云低延时高速的特性,让在线服务可以与本地服务媲美,语音识别准确率很高,同时语音合成提供了多种语音交互音色供开发者使用。6.意见/建议:对于长语音的识别速度可否进一步优化 。对于语音合成可以考虑例如中英语音的合成,提升中英语音合成的情感度,衔接的自然度。有些音色在中英混合语音合成时,中文语音合成情感比较充足,但英文就显得很生硬。 建议增添音色选项。对比阿里云、腾讯云、京东云等语音合成服务,他们可配置音色相比会更多些。如有条件适宜,可否考虑提升服务器的部署分布,现在语音合成语音识别仅有北京四的服务器可供选择,能否增设一些南方地区的语音服务的服务器。服务指南通俗易懂,配置简单。但对一些小白用户可能存在门槛,如条件适宜,可否会像思必驰、讯飞等平台提供一些入门指导教程参考。不过对于多数开发展,当前服务指导书足够的。对于在校学生、或者科研团队,可否提供一些特殊套餐供学生选用。降低学生使用成本。
-
语音合成语音合成,又称文语转换(Text to Speech)技术,能将任意文字信息转化为相应语音朗读出来。语音合成涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术。为了合成出高质量的语言,除了依赖于各种规则,包括语义学规则、词汇规则、语音学规则外,还必须对文字的内容有很好的理解,这也涉及到自然语言理解的问题。语音合成应用场景服务机器人客服系统智能家具出行导航阅读软件语音合成系统一个完整的语音合成系统过程是先将文字序列转换成音韵序列,再由系统根据音韵序列生成语音波形。其中: 第一步涉及语言学处理,例如分词、字音转换等,以及一整套有效的韵律控制规则; 第二步需要先进的语音合成技术,能按要求实时合成出高质量的语音流。语音合成技术的研究已有两百多年的历史,但真正具有实用意义的近代语音合成技术是随着计算机技术和数字信号处理技术的发展而发展起来的,主要是让计算机能够产生高清晰度、高自然度的连续语音。语音合成流程
-
在电脑网站上购买了定制语音合成,该如何使用?
-
语音导航使用语音合成服务将车载导航数据转换成语音素材,为用户提供精确的语音导航服务。利用个性化定制能力,提供丰富的导航语音服务。有声读物将书籍、杂志、新闻的文本内容转换成逼真的人声发音,充分解放人们的眼睛,在搭乘地铁、开车、健身等场景下获取信息、享受乐趣。电话回访在客服系统场景中,通过语音合成服务将回访内容转换成人声,直接使用语音和客户交流,提升用户体验。智能教育集成语音合成的教育系统可以实现中英文标准朗读及带读,应用于课堂和学生自学,提升教学效率。
上滑加载中
推荐直播
-
华为云IoT开源专家实践分享:开源让物联网平台更开放、易用
2024/05/14 周二 16:30-18:00
张俭 华为云IoT DTSE技术布道师
作为开发者的你是否也想加入开源社区?本期物联网平台资深“程序猿”,开源专家张俭,为你揭秘华为云IoT如何借助开源构建可靠、开放、易用的物联网平台,并手把手教你玩转开源社区!
去报名 -
华为云开发者日·广州站
2024/05/15 周三 14:30-17:30
华为云专家团
华为云开发者日HDC.Cloud Day是面向全球开发者的旗舰活动,汇聚来自千行百业、高校及科研院所的开发人员。致力于打造开发者专属的技术盛宴,全方位服务与赋能开发者围绕华为云生态“知、学、用、创、商”的成长路径。通过前沿的技术分享、场景化的动手体验、优秀的应用创新推介,为开发者提供沉浸式学习与交流平台。开放创新,与开发者共创、共享、共赢未来。
去报名 -
企业级数仓迁移工具助您轻松上云
2024/05/21 周二 16:30-18:00
Nick 华为云数仓GaussDB(DWS)研发专家
随着云时代的到来,传统数仓已无法满足企业的需求,越来越多的企业选择从传统数仓迁移到云数据仓库,云数仓为企业提供了更低的成本、更灵活极致的体验。本期直播将为您带来企业级数仓搬迁的解决方案,带您一览华为云数仓GaussDB(DWS)提供了哪些迁移方案助力用户实现数据迁移,如何保障迁移后数据的一致性。
去报名
热门标签