-
对接“语音通知呼叫状态通知API” 的时候接收到状态消息为:{"statusInfo":{"sessionId":"ac2ae0f9-49a1-4028-8384-d48a7d7d2dd4_15709478$$fe0410ac","timestamp":"2025-09-14 11:15:53","caller":"","called":"","userData":"","stateCode":551,"stateDesc":"Click to call the first way to receive OXX message."},"eventType":"disconnect"}在文档中没有找到这个状态码 想知道什么场景会返回这个状态码?
-
回调函数中得到的音频码流数据,如何进行解码操作能正常播放
-
【问题现象】通过rtsp over udp模式,开启和ivs1800的语音对讲,setup信令返回server_port=0-1,客户端发流后设备无声音。【协议抓包如下】DESCRIBE rtsp://192.168.119.20:554/01810889059775540501?DstCode=01&ServiceType=5&ClientType=1&StreamID=1&SrcTP=2&DstTP=1&SrcPP=0&DstPP=1&MediaTransMode=0&BroadcastType=0&SV=0&Token=SBGH3cMHPAJgdbR1WomaLFp3nXbtDB1KpYok7rUVKAA=& RTSP/1.0CSeq: 2Accept: application/sdpUser-Agent: RTSP-CLIENT v1.0.1.20230325Require: www.onvif.org/ver20/backchannelRTSP/1.0 200 OKCSeq: 2Session: 04ab2aa8cc9411ed800010c3abfd5918Date: Mon Mar 27 11:39:23 2023 GMTServer: HUAWEI MDU/R002C02Content-Length: 271Content-Type: application/sdpv=0o=01810889059775540101 1679917163 1679917163 IN IP4 192.168.124.12s=Playi=Play to Puu=rtsp://192.168.124.12:0/04abb84ccc9411ed800010c3abfd5918.sdpc=IN IP4 192.168.124.12t=0 0m=audio 20016 RTP/AVP 0a=rtpmap:0 PCMU/8000a=control:trackID=2a=sendrecvSETUP rtsp://192.168.119.20:554/01810889059775540501/trackID=2 RTSP/1.0CSeq: 3Session: 04ab2aa8cc9411ed800010c3abfd5918Transport: RTP/AVP/UDP;unicast;destination=192.168.122.11;client_port=36312-36313User-Agent: RTSP-CLIENT v1.0.1.20230325Require: www.onvif.org/ver20/backchannelRTSP/1.0 200 OKCSeq: 3Session: 04ab2aa8cc9411ed800010c3abfd5918Date: Mon Mar 27 11:39:23 2023 GMTServer: HUAWEI MDU/R002C02Transport: RTP/AVP;unicast;destination=192.168.122.11;client_port=36312-36313;source=192.168.119.20;server_port=0-1【确认内容】 1、ivs1800是否支持基于rtsp的音频对讲功能?如果支持是否支持rtsp over tcp和rtsp over udp模式的对讲? 如果不支持标准的rtsp对讲,有没有详细的对接协议? 2、尤其是对讲过程中,是客户端向ivs1800发送音频流还是客户端向ivs800下的sdc设备直接发送音频流(绕过ivs1800)?
yd_267066179
发表于2023-03-28 09:19:16
2023-03-28 09:19:16
最后回复
Hwei-PAE-luoxi
2023-04-03 10:21:41
110 2 -
落霞与孤鹜齐飞秋水共长天一色
-
【功能模块】本实验基于MindX SDK实现了端到端的自动语音识别(Automatic speech recognition, ASR),主要分为两个步骤:一、声学模型:将语音转换成对应的拼音声学模型:我们采用的模型是Google在2020年提出的Conformer模型:Convolution-augmented Transformer for Speech Recognition ;二、语言模型:将拼音转换成对应的文字语言模型:我们采用的是transformer模型。这两个模型的主要参考代码: https://github.com/Z-yq/TensorflowASR 模型下载:https://mindx.sdk.obs.cn-north-4.myhuaweicloud.com/mindxsdk-referenceapps%20/contrib/ASR%26KWR/AutoSpeechRecognition/model.zip 【操作步骤&问题现象】1、 声学模型转换声学模型的输入是经过预处理后的数据。除了要进行特征提取外,还要与模型的输入维度对齐。声学模型的输入有两个,第一个是经过预处理后的音频数据,第二个是一个表示语音数据识别出文字长度的一个整形数据。cd /root/AutoSpeechRecognition/model/ # 切换至模型存储目录atc --model=./frozen_graph_conform.pb --framework=3 --output=./am_conform_batch_one --input_format=NHWC --input_shape="features:1,1001,80,1;length:1,1" --soc_version=Ascend310 --log=error2、语言模型转换为了简化推理过程,我们直接把声学模型的输出作为语言模型的输入,所以这里语言模型的输入要与声学模型的输出保持一致atc --model=./frozen_graph_transform.pb --framework=3 --output=./lm_transform_batch_one --input_format=ND --input_shape="inputs:1,251" --soc_version=Ascend310 --log=error【截图信息】模型转换成功,如图所示。接下来,使用转换好的模型,替代项目的预置模型进行推理,结果推理失败。项目下载链接:https://ascend-professional-construction-dataset.obs.cn-north-4.myhuaweicloud.com/ASR/AutoSpeechRecognition.zip
-
手机在网状态实时查询就是指客户手机号码的在营运商数据库中标注的状态,有正常使用、停机、销号、未启用、异常、预销户、在网但不可用等一系列状态。而手机在网状态查询接口则就是指通过接入api接口的实时数据对客户的手机号码开展在网状态查询。手机号码在网状态查询主要是为了更好地查询客户的手机号码是不是正常可以用,通过查询可以筛出失效的号,进而提升相关工作人员的工作效能。那么,手机在网状态实时查询的应用场景有哪些方面?1、话务中心电话营销。手机号查询除去无效手机号节约时间成本费和提升工作效能。每一次无效语音通话的人工成本大概1.9元钱,查询接口的查询只需其几十分之一。2、群发短信。企业通过查询并除去无效手机号,让营销推广信息内容发给每一个真正的顾客手机上,极大提高推送效率和转化率。3、打击羊毛党。手机号查询能够为互联网平台用户反作弊行为提供大数据分析能力,高效拦截羊毛党,减少损失提高运营能力。4、网络平台运营。互联网平台租运营过程中,会积累大量的注册用户,却不太了解每个ID的真假和实时状态,通过查询接口能精准筛选出活跃的目标用户,提高运营转化能力。现阶段,天眼数聚api接口服务平台都有提供这一接口产品,适用批量查询手机实时在网状态,接入的数据库由三大运营商提供,实时查询,能确保查询的精确性。更多手机在网查询状态实时查询https://www.tianyandata.cn/productDetail/18
-
-
-
我随手打了一个hello world,太神奇了
-
-
-
-
人工标注对于不同类型的数据,用户可以选择不同的标注类型。当前ModelArts支持如下类型的标注作业: 图片 图像分类:识别一张图片中是否包含某种物体。 物体检测:识别出图片中每个物体的位置及类别。 图像分割:根据图片中的物体划分出不同区域。 音频 声音分类:对声音进行分类。 语音内容:对语音内容进行标注。 语音分割:对语音进行分段标注。 文本 文本分类:对文本的内容按照标签进行分类处理。 命名实体:针对文本中的实体片段进行标注,如“时间”、“地点”等。 文本三元组:针对文本中的实体片段和实体之间的关系进行标注。 视频 视频标注:识别出视频中每个物体的位置及分类。目前仅支持mp4格式。智能标注除了人工标注外,ModelArts还提供了智能标注功能,快速完成数据标注,为您节省70%以上的标注时间。智能标注是指基于当前标注阶段的标签及图片学习训练,选中系统中已有的模型进行智能标注,快速完成剩余图片的标注操作。目前只有“图像分类”和“物体检测”类型的数据集支持智能标注功能。团队标注数据标注任务中,一般由一个人完成,但是针对数据集较大时,需要多人协助完成。ModelArts提供了团队标注功能,可以由多人组成一个标注团队,针对同一个数据集进行标注管理。团队标注功能当前仅支持“图像分类”、“物体检测”、“文本分类”、“命名实体”、“文本三元组”、“语音分割”类型的数据集。不同类型数据集支持的功能列表其中,不同类型的数据集,支持不同的功能数据集类型标注类型人工标注智能标注团队标注图片图像分类支持支持支持物体检测支持支持支持图像分割支持--音频声音分类支持--语音内容支持--语音分割支持-支持文本文本分类支持-支持命名实体支持-支持文本三元组支持-支持视频视频标注支持--自由格式----表格----
-
实验准备:华为云账号(已实名认证),如没有账号信息,请先先注册华为云账号信息,参考实名认证介绍_帐号中心_用户指南_实名认证_华为云 (huaweicloud.com)电脑Chrome浏览器实验过程:点击API Explorer_开发者社区-华为云 (huaweicloud.com),进入API Explorer页面,选择【语音交互服务--语音合成接口--RunTts】在Body体的text输入想要转换的内容,再点击调试按钮。(注意红色*为必填项)调试成功后,会提示提示成功或者失败。失败的话,请仔细查看对应的错误码信息,按照下方链接,找到对应的解决方法错误码_语音交互服务 SIS_API参考_附录_华为云 (huaweicloud.com)在成功界面,复制响应体内容,再打开华为云内置的CloudIDE,体验项目。(若未开通CloudIDE,进入CloudIDE_集成开发环境_WebIDE_华为云 (huaweicloud.com)点击【立即体验】免费开通即可)双击json文件,将上一步复制的响应体内容粘贴进去点击运行温馨提示:刚才复制的响应体内容,建议先下载,在赋值。小编刚通过自带的复制按钮,复制的不全,导致JSON格式异常,运行报错。运行成功后,返回到Explorer下,选择mp3文件,右键,选择download。在电脑中找到刚下载的文件,打开,就能听到转换后的语音内容了。实验过程到此结束,赶快体验吧,5分钟真的可以实现文本到语音的转换,转换后还是个美女小姐姐的声音哦。
-
端午至,粽子香佳节到,祈福愿送上一份有“声”的祝福 敢于开口,方能出“粽”文字转语音,MP3文件上传到回帖,再配上您的体验感受即可具体方法可查看体验API Explore,花样玩转AI语音合成接口期望看到大家精彩的评论:1、体验过程中有哪些优化建议2、还能在哪些场景中使用AI语音合成接口3、期待华为云开发其他哪些接口?【本期微话题】AI语音佳节祈福【活动时间】22年5月28日~22年6月10日【参与方式】1、直接回复本帖,就微话题题目进行回答讨论2、为你觉得优质回复的楼层点赞或发表评论【本期奖品】优质回复奖:奖品抽取数量有效回复楼层数需达到华为三脚架自拍杆无线Pro版(黑色)120华为智选欧普读写台灯 白色140幸运回复奖:奖品抽取数量有效回复楼层数需达到华为云定制雨伞220华为云定制笔记本套装340【活动规则】1、开发者用户回复的内容,必须与本期的微话题相关,回复其他内容均视为无效内容,否则取消该用户获奖资格2、开发者用户回复内容的字数需≥100字,禁止复制其他楼层内容或改编自其它楼层内容(包括本人发布在其他楼层的内容),如经发现,取消该用户获奖资格3、本次活动不限用户的总回复数及连续回复数,但需保证回复质量,如华为云社区小编认定参与用户有恶意刷楼嫌疑,则取消该用户获奖资格 【评奖方式】1、在本帖所有有效回复的用户中抽取若干名幸运开发者获得幸运回复奖,奖品及数量见上方示例。2、在所有参加回复的用户中,根据其回复质量及被回复的数量,综合评选优秀奖,奖品见上方示例。3、本次活动将根据实际参与情况发放奖励,包括但不限于用户百分之百中奖或奖项轮空的情况。4、每期活动预计于结束后三天内完成奖项公示,并于结束后15个工作日内完成邮寄。 【温馨提示】1、请务必使用个人实名账号参与活动(IAM、企业账号等账号参与无效)。如一个实名认证对应多个账号,只有一个账号可领取奖励,若同一账号填写多个不同收件人或不同账号填写同一收件人,均不予发放奖励。2、所有获得奖品的获奖用户,请于获奖后3日内完成实名认证,否则视为放弃奖励。
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签