• [问题求助] AICC tts播报
    问题来源】深圳容大【问题简要】放音收号识别cell获取文本数据放音【AICC解决方案版本】AICC23.100【期望解决时间】尽快【问题现象描述】使用放音收号识别cell获取接口返回的message来播报,已经配置tts参数:com.iflytek.tts.vid=62320截图如下:
  • [其他问题] 基于QT for andriod添加第三方库
    基于QT for andriod添加第三方库的时候一直调用失败,找不到函数的定义
  • [问题求助] 生产环境调用H侧的修改接口时,返回修改成功事件,但是was里查看数据并没有修改 
    【问题来源】中讯网联    【问题简要】调用接口返回修改成功事件,但was里查看数据并没有修改【问题类别】普通座席【AICC解决方案版本】UAP9600 V1R5C00 SPC102CTI版本:ICDV300R008C25SPC017【期望解决时间】【尽快】【问题现象描述】 被修改的坐席工号:2426 该坐席需要删除的技能队列名称:热线VIP组、购买服务 第一次修改时间点:2023-08-25 13:41:12秒调用H侧的修改接口:url = https://10.68.82.37:9143/agentgateway/resource/config/vdn/agents?agentId=2426 时间点:2023-08-25 13:41:12.978 第一次调用H侧修改接口,鉴权失败没有修改成功 时间点:2023-08-25 13:41:13 继续调用H侧修改接口 返回结果为:retcode=0 即修改成功 现象:ipcc根据H侧修改成功事件处理了对应坐席相关信息,但查询该坐席信息时,ipcc界面技能队列已经删除,但查询was该坐席的技能对应信息并没有被删除,如图  修改时间点:2023-08-25 13:42:35 调用H侧修改接口 返回结果为:retcode=0 即修改成功 现象:ipcc根据H侧修改成功事件处理了对应坐席相关信息,但查询该坐席信息时,ipcc界面技能队列已经删除,但查询was该坐席的技能对应信息并没有被删除,如图  查看对应日志:user_info_0825_10.68.28.224.log、user_info_0825_10.68.25.239.log 
  • [问题求助] U9600对接智能TTS/ASR问题
    【问题来源】中讯网联    【问题简要】智能IVR识别超时【问题类别】智能IVR【AICC解决方案版本】UAP9600 V1R5C00 SPC102CTI版本:ICDV300R008C25SPC017【期望解决时间】【尽快】【问题现象描述】华为U9600对接科大的TTS/ASR,模拟以下三个场景的情况下调测场景1:正常情况外部用户呼入电信系统进入智能语音导航,输入音频后,asr服务器正常识别并返回000normaluap收到000后返回给ivr,ivr做正常处理。场景2:噪声情况外部用户呼入电信系统进入智能语音导航,模拟外部噪声的情况下,asr服务器无法识别,并返回001 no-marchuap收到001后返回给ivr,ivr做了失败出口走逃生处理。场景3:超时情况外部用户呼入电信系统进入智能语音导航,不输入任何音频,asr服务器捕捉不到音频,返回002 time outuap收到002返回给ivr,ivr做了超时处理。【问题描述】业务侧希望uap对科大的mrcp返回做些处理,比如场景2的001-no-march,可处理成为场景3的002-timeout这种情况,请问我们uap有调整这种参数的配置吗?另外001-no-march我们实测的噪声情况下,在1分半钟左右asr返回001 no-march,这个时间能在uap做调整吗?下面是科大提供的底层代码
  • [问题求助] 客户手机端播放指定铃声
    【问题来源】   光大【问题简要】  如何设置客户手机端播放指定铃声【问题类别】  IVR、座席【AICC解决方案版本】  AICC版本信息:AICC 8.15.0  UAP版本信息:UAP9600 V100R005C00SPC112  CTI版本信息:ICDV300R008C23SPC014【问题现象描述】           客户电话进线后,转接到某一技能队列,座席电话端振铃,客户手机端能听到嘟、嘟的声音,该声音对客户不太友好。如果要播放指定的铃声,是否需要在智能呼叫中心配置管理系统was的基本信息->提示信息参数配置->座席回铃音中这么配置,文件/序列值ENT66.in这是什么配置文件,里面存放的是要播放的汉字吗。
  • [问题求助] 【AICC产品】【IVR功能】IVR转满意度时,提示“message=Routing failed., retcode=100-007”
    【AICC产品】【IVR功能】IVR转满意度时,提示“message=Routing failed., retcode=100-007”【问题来源】   暂时涉密【问题简要】 电话正常接入到座席,通话完成后,座席点击满意度(transfer),无法正常转到可用的IVR路由点上去。【问题类别】   IVR【AICC解决方案版本】【AICC可选择版本:AICC 8.15.1.SPC3】【UAP可选择版本:UAP9600 V100R005C00SPC028】【CTI可选择版本:ICD V300R008C23SPC005】【期望解决时间】  1月18日下班前【问题现象描述】  技术询类问题【截图信息】agentgateway的日志如下,完整的见附件2023-01-17 16:25:17.438] [transfer                      ] [WorkNo = 142 received message: transferInfoParam:{mode:0, devicetype:3, address:10****06, mediaability:MEDIA_AUDIO, callappdatalength:null}] [https-jsse-nio-172.16.0.152-8043-exec-10] [VoiceCall.java:141][172.16.0.103] [2023-01-17 16:25:17.467] [transfer                      ] [WorkNo = 142 return message:{result={}, message=Routing failed., retcode=100-007}] [https-jsse-nio-172.16.0.152-8043-exec-10] [VoiceCall.java:146][172.16.0.103]从开发手册上看请问:mode:0, devicetype:3 时 address 应该填啥?(本日志填写的是可以正常接入的号码 10111006),请问写10111006是否有问题?如果没问题transfer时报“100-007”错误是啥问题?
  • [通用服务] 【AI使能】政务语音分析
    算法能力描述调用方式接口详细说明一句话识别一句话识别接口,用于短语音的同步识别。一次性上传1min以内音频,能快速返回识别结果。POST链接Websocket链接录音文件识别录音文件识别接口,用于识别长录音文件。POST链接GET链接语音合成语音合成,是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果,将用户输入的文字合成为音频。通过音色选择、自定义音量、语速,为企业和个人提供个性化的发音服务。POST链接分类文档链接备注华为云在线课程语音处理理论、应用与实验(免费)链接本课程就语音处理的理论及应用做了介绍,介绍了大量具体的语音识别与语音合成的模型,不同模型各有特点,适应于不同的应用场AI技术应用场景--语音识别(收费)链接语音识别技术的应用在我们的日常生活中非常常见,人机交互、智能家居、智能问答等等,本课程将从语音识别的基础出发,带领大家一步步深入语音识别技术的内在机制,帮助大家讲语音识别技术快速落地到实际的应用场景中。
  • [算子开发] onnx opset13中的Loop算子该如何自定义实现?
    我在使用atc转换onnx模型提示不支持Loop算子,我准备使用TBE自定义算子开发(DSL开发方式)去实现,可是我不知道该如何处理Loop算子中的子图,CANN文档中找不到相关案例。我想请教两个问题问题1这种方法实现Loop算子可行吗?问题2如果可行,有大佬能教教我吗?或者可以提供一个案例嘛?
  • [问题求助] 语音合成 VITS pytoch框架转 ONNX 报错 ,长虹企业重要客户,重点项目
    [ERROR] TBE(8520,atc.bin):2022-09-02-15:18:16.121.452 [util.cc:103][OP_PROTO] CheckTwoInputDtypeSame:103 OpName:[Mul_3865] "The Mul_3865 op dtype is not same, type1:DT_INT32, type2:DT_INT64"
  • [问题求助] 语音合成 VITS 转onnx报错
    [ERROR] TBE(8520,atc.bin):2022-09-02-15:18:16.121.452 [util.cc:103][OP_PROTO] CheckTwoInputDtypeSame:103 OpName:[Mul_3865] "The Mul_3865 op dtype is not same, type1:DT_INT32, type2:DT_INT64"
  • [技术干货] (转)深度解读思必驰语音合成技术,干货满满
    语音合成(Text to Speech,TTS)又称文本语音转换技术,顾名思义,是把文本信息转化成语音信息。它是对话式人工智能的最后一环,也是关键一环,它的效果直接影响着人机语音交互的体验。思必驰作为国内领先的对话式人工智能平台公司,它的语音合成技术表现究竟如何?语音合成的“前世今生”人的语音,本质上是发音器官震动,产生声波传出。模仿人声,最古老的方法是使用乐器。到19世纪,就可以用机械方法产生语音了。那时,科学家们会制作出一些精巧的气囊和风箱去搭建发声系统,合成出一些元音和单音。 人类发音示意图进入电子时代的1939年,贝尔实验室H·杜德利制作出第一台电子合成器,这是用共振峰原理制作的语音合成器,该技术使用固定频率,以电子复制我们改变口型时所发出的元音声,也这正是英国剑桥大学著名物理学家斯蒂芬·霍金教授所使用的声音合成器。上世纪90年代,随着计算和存储能力大幅度提升,基于大语料库的单元挑选与波形拼接合成方法出现,可以合成出高质量的自然人语音。 语音合成技术演变进入21世纪,随着深度学习技术的兴起和快速发展,以语音合成为代表的语音处理技术得到了极大的飞跃。神经网络语音合成在近几年来取得了显著突破,合成的音质和自然度越来越好,运行速度也越来越快。思必驰目前所使用的,也正是这种方法。思必驰TTS,魅力何在?早在2007年于英国剑桥大学创立时,思必驰关于语音合成技术研究就已开启,该项工作由思必驰联合创始人兼首席科学家、上海交通大学教授俞凯领头。语音合成系统主要分为文本处理、声学模型、声码器三个部分。文本处理负责对文本进行转写和phoneme序列转换;声学模型使用深度神经网络,可以在文本特征与声学特征之间学习到更复杂的非线性关系;声码器负责将声学模型输出的声学特征,通过卷积运算,转换成音频。经过10多年的研究积累,思必驰在建模方法上,涵盖了从传统的统计参数模型到最新的基于神经网络的方法;对声码器的研究,涵盖了从传统的基于信号处理的方法到最新的基于神经网络的方法。语音合成的质量与效果,既有赖于语音厂商的算法模型,还取决于音频语料的质量,即数据质量。思必驰有着丰富的声优资源以及声优挑选的经验,在苏州建设有专业录音棚并与国内多个城市的录音棚有着长久合作关系。与此同时,思必驰数据团队也对数据标注有着严格的质量把控。  位于思必驰苏州总部的专业录音棚经过多年的技术积累,思必驰已逐步形成了一套成熟的技术方案,业务涵盖了数据语音定制、数据快速定制、声音克隆、歌声合成、多语种合成、情感合成等,可选公有云、私有云以及离线三种部署模式,经典模式可在思必驰官网实时体验。2017年、2020年,思必驰还先后参与国家标准《中文语音合成互联网服务接口规范》与行业标准《中文语音合成服务系统评估规范》的制定,并成为全国首批通过评估测评的公司之一,获得“TTS-4S(Standard Similarity Scene System)服务证书”。该测评从合成质量、定制能力、场景表现力和系统安全可靠等维度,全面评估合成水平和服务能力。 2019年11月,思必驰首批通过“中文语音合成水平测试”未来世界,百“声”争鸣为能快速提供语音合成定制服务,思必驰全程提供音色选择、录音指导、音频处理、模型训练、服务部署等专业服务,赋予产品开口讲话的能力。截至目前,思必驰语音合成已建设的声音库内包含音色接近200个,涵盖多种风格,以及各个年龄层次。思必驰语音合成服务,也已在车载、家电、机器人、智能客服等诸多领域成功落地,为众多终端产品赋予声的魅力,使得万物皆可沟通,并逐渐走入人们的工作与生活。 当你在家里“躺平”,来自如影智能的语音管家“Edison”,用他温暖、绅士的声音(文章开头的音频A),为你带来踏实与慰藉;当你在爱车中驰骋,车萝卜的语音助理“萝卜”清脆、简明的声音,如同车水马龙路途中的一股清流;当你接起顺丰95338服务热线的外呼电话,智能客服“丰小蜜”亲切又不失严谨的声音,配合高效的工作能力,带给你最省心省力的服务体验……镜头切换到泛娱乐领域,思必驰团队打造的“小驰机器人”在央视《机智过人》中,现场用撒贝宁的声音生成了一曲《好久不见》。在《经典咏流传》中,思必驰携手栏目组共同推出 “读诗成曲”线上互动小工具,提供实时读诗成曲的能力。用户仅需读几句简单的诗词,便可快速生成有腔有韵的歌声,互动总量超过821万人次。 思必驰联合创始人兼首席科学家俞凯参与节目录制在个性化定制上,思必驰不仅可以提供普通话定制、歌声定制,还可以通过迁移学习方法,提供更高难度的方言、小语种TTS定制,如粤语、上海语、四川话、山东话、东北话、德语、法语等。而思必驰的情感合成技术,则赋予美妙音色丰沛的情绪,让声音更具表现力与感染力此外,思必驰声音复刻技术也已在斑马智能、爱驰汽车、岚图汽车、仙豆智能等车联网客户以及IoT领域落地,仅需录音20句话约400汉字,10分钟之内便可以完成模型生产,MOS 合成音/录音达到90%,相似度合成音/录音达到80%。人类的声音,是人类语言的物质外壳,却承载着重要的信息和真挚的情感,拥有着无穷的魅力。人工智能突飞猛进地发展正不断催化人机交互方式的巨变,“万物可沟通、万事可打理”的语音互联未来世界,正加速到来…… 
  • [体验官] 5分钟玩转AI语音合成
    实验准备:华为云账号(已实名认证),如没有账号信息,请先先注册华为云账号信息,参考实名认证介绍_帐号中心_用户指南_实名认证_华为云 (huaweicloud.com)电脑Chrome浏览器实验过程:点击API Explorer_开发者社区-华为云 (huaweicloud.com),进入API Explorer页面,选择【语音交互服务--语音合成接口--RunTts】在Body体的text输入想要转换的内容,再点击调试按钮。(注意红色*为必填项)调试成功后,会提示提示成功或者失败。失败的话,请仔细查看对应的错误码信息,按照下方链接,找到对应的解决方法错误码_语音交互服务 SIS_API参考_附录_华为云 (huaweicloud.com)在成功界面,复制响应体内容,再打开华为云内置的CloudIDE,体验项目。(若未开通CloudIDE,进入CloudIDE_集成开发环境_WebIDE_华为云 (huaweicloud.com)点击【立即体验】免费开通即可)双击json文件,将上一步复制的响应体内容粘贴进去点击运行温馨提示:刚才复制的响应体内容,建议先下载,在赋值。小编刚通过自带的复制按钮,复制的不全,导致JSON格式异常,运行报错。运行成功后,返回到Explorer下,选择mp3文件,右键,选择download。在电脑中找到刚下载的文件,打开,就能听到转换后的语音内容了。实验过程到此结束,赶快体验吧,5分钟真的可以实现文本到语音的转换,转换后还是个美女小姐姐的声音哦。
  • [技术干货] 体验API Explore,花样玩转AI语音合成接口[转载]
    链接:https://bbs.huaweicloud.com/blogs/352647您将会学到什么您可实时访问和调用API获取语音合成结果,将输入的文字合成为音频。您需要什么硬件要求• PC电脑软件要求• Chrome浏览器需要的知识点• 熟悉常规电脑操作常识环境准备注册华为云账号、实名认证· 如果您已拥有华为账号且已通过实名认证,可直接体验。· 若您还没有通过实名认证的账号,请注册华为账号,然后完成实名认证(推荐使用“扫码认证”方式,即时完成)。· 参考如何实名认证和如何扫码认证。操作指导步骤一:访问API Explorer的AI语音合成接口点击链接进入API Explorer页面,选择【语音合成接口】,(注意:要登录自己的账号哦,没有账号请注册账号)步骤二:体验接口调试功能在text参数里随意输入想合成的文本,发起调试步骤三:将语音编码转成音频文件复制步骤二调试成功的响应体,复制按键如图所示点击【预览代码】进入新页面,并点击右上角【在CloudIDE上】打开(若未开通CloudIDE,进入CloudIDE产品页面点击【立即体验】免费开通即可)进入CloudIDE双击json文件将之前复制的响应体粘贴到json文件预置的空数组中(提示:若要拼凑多个转语音编码,可生成多个语音编码的响应体,复制到数组中,用逗号隔开)点击运行到Explorer下,选择mp3文件,右键,选择download,即可下载生成音频文件来听啦恭喜您已完成体验。华为云PaaS产品体验大本营(答疑交流群)
  • [热门活动] 【获奖结果公示啦】花样玩转AI语音合成接口赢华为自拍杆、mini小音箱、荣耀手环
    给你个AI语音合成接口,你会玩出什么花样?语音合成,是一种将文本转换成逼真语音的服务。可实时访问和调用API获取语音合成结果,将输入的文字合成为音频。支持音色选择、自定义音量、语速,为企业和个人提供个性化的发音服务即日起至2021年12月31日,体验还有好礼赢取哦奖项&玩法奖励说明简图:如何将文字转语音编码?1.1、点链接>>>访问API Explorer的AI语音合成接口(注意:要登录自己的账号哦,没有账号请注册账号):1.2、在Body里面输入相应参数,点击调试。(将调试成功后的截图(需要漏出账号部分信息)发本论坛评论区,即可获得抽华为自拍杆资格)如何将语音编码转成音频文件?2.1 复制1.2 调试成功的响应体2.2 点开链接>>>访问华为云AI合成音频模板2.3 点击预览代码2.4 用CloudIDE打开2.5 进入CloudIDE双击json文件2.6 将复制2.1复制的响应体粘贴到json文件预置的空数组中(提示:若要拼凑多个转语音编码,可生成多个语音编码的响应体,复制到数组中,用逗号隔开)2.7 点击运行2.8 到Explorer下,选择mp3文件,右键,选择download,即可下载生成音频文件来听啦(也可以将合成的音频文件通过插入音视频的方式分享到评论区来参与评奖哦)以上就是功能用法简略版的介绍了,花样玩法欢迎各位小伙伴大开脑洞,把你的想法或成果分享到本帖评论区,有机会赢迷你音箱或手环哦,也可以参照更详细版的指导手册下方附活动交流&答疑群码,欢迎进群交流~附则:论坛活动通用规则   1)请务必使用个人账号参与活动(IAM、企业账号等账号参与无效)。2)严禁灌水,严禁带有色情、政治、宗教、推广、外链广告内容,严禁抄袭、复制他人内容,一经发现,取消中奖资格。3)请确保您邀请的用户为真实有效的用户,如发现存在恶意注册、恶意邀请等行为(“恶意”是指为获取奖励资格而异常注册账号等破坏活动公平性的行为),我们将取消相关人员获奖资格。同时,将对该账号进行禁言禁止参与社区活动3个月的处罚,行为严重的将对账号进行永久封号。4)获奖用户需在华为云进行实名认证,同一身份信息只能获奖一次。5)对于严重违反活动规则的用户,将纳入社区失信黑名单,取消获奖资格,并做封号处理。6)所有参加本活动的用户,均视为认可并同意遵守《华为云用户协议》《华为云社区运营机制》。其他未尽事宜请参考:1、华为云社区常规活动规则:https://bbs.huaweicloud.com/forum/thread-5766-1-1.html2、所有参加社区活动的开发者用户,均视为认可并同意遵守《华为云开发者用户协议》,包括以援引方式纳入《华为云开发者用户协议》的《可接受的使用政策》、《法律声明》、《隐私政策声明》、相关服务等级协议(SLA),以及华为云服务网站规定的其他协议和政策(统称为“云服务协议”)的约束。云服务协议链接的网址:http://www.huaweicloud.com/declaration/sa_cua.html如您不同意以上活动规则及相关条款,请勿参加论坛相关活动。
  • [技术干货] 定制语音合成电脑app
    定制语音合成电脑app我利用华为云提供的api开发了一款定制语音合成app。默认保存方式是wav,操作完成后改名为mp3,mp4,再剪影是可以正常使用的。点击免费朗读使用的是我默认的sk和ak,你也可以使用自己的ak和sk。不放心就免费朗读就好了。一次限制500个字,是华为云的限制和我没关系。我想吐糟一下,北京4的定制语音合成服务器是朕的垃圾。有时候要连续好几次。才能上传文件成功。导致软件体验也是非常慢。没跑了下载地址放百度云盘吧 链接:https://pan.baidu.com/s/1vhSNR_UjkBzb5u4oPbZhjQ 提取码:8888 复制这段内容后打开百度网盘手机App,操作更方便哦 
总条数:20 到第
上滑加载中