实时语音识别_标签_开发者_华为云

博客(24)
视频(0)
论坛(23)
云声(4)
代码示例(0)

语音识别-声学模型
关于声学模型，主要有两个问题，分别是特征向量序列的可变长和音频信号的丰富变化性。可变长特征向量序列问题在学术上通常有动态时间规划（Dynamic Time Warping, DTW）和隐马尔科夫模型（Hidden Markov Model, HMM）方法来解决。而音频信号的丰富变化性是由说话人的各种复杂特性或者说话风格与语速、环境噪声、信道干扰、方言差异等因素引起的。声学模型需要足够的鲁棒性...

可爱又积极
发表于2021-09-07 14:46:06
5223 0 0

5.2k 0 0

关于声学模型，主要有两个问题，分别是特征向量序列的可变长和音频信号的丰富变化性。可变长特征向量序列问题在学术上通常有动态时间规划（Dynamic Time Warping, DTW）和隐马尔科夫模型（Hidden Markov Model, HMM）方法来解决。而音频信号的丰富变化性是由说话人的各种复杂特性或者说话风格与语速、环境噪声、信道干扰、方言差异等因素引起的。声学模型需要足够的鲁棒性...
实时语音识别机器学习神经网络
以kaldi中的yesno为例谈谈transition
在基于GMM-HMM的传统语音识别里，比音素（phone）更小的单位是状态（state）。一般每个音素由三个状态组成，特殊的是静音（SIL）由五个状态组成。这里所说的状态就是指HMM里的隐藏的状态，而每帧数据就是指HMM里的观测值。每个状态可以用一个GMM模型表示（这个GMM模型的参数是通过训练得到的）。在识别时把每帧数据对应的特征值放进每个状态的GMM里算概率，概率最大的那个就是这帧对应的...

可爱又积极
发表于2021-09-07 14:35:48
5216 0 0

5.2k 0 0

在基于GMM-HMM的传统语音识别里，比音素（phone）更小的单位是状态（state）。一般每个音素由三个状态组成，特殊的是静音（SIL）由五个状态组成。这里所说的状态就是指HMM里的隐藏的状态，而每帧数据就是指HMM里的观测值。每个状态可以用一个GMM模型表示（这个GMM模型的参数是通过训练得到的）。在识别时把每帧数据对应的特征值放进每个状态的GMM里算概率，概率最大的那个就是这帧对应的...
实时语音识别机器学习
N-gram语言模型的平滑算法全解析
平滑技术用于解决N-gram语言模型训练过程中存在的数据稀疏或零概率问题，是提高语言模型性能的核心技术。本文介绍了几种常用的平滑算法，并对SRILM的平滑参数及ARPA格式的语言模型进行了解析。

tudousi
发表于2020-07-30 20:00:54
8840 0 0

8.8k 0 0

平滑技术用于解决N-gram语言模型训练过程中存在的数据稀疏或零概率问题，是提高语言模型性能的核心技术。本文介绍了几种常用的平滑算法，并对SRILM的平滑参数及ARPA格式的语言模型进行了解析。
一句话识别实时语音识别 EI企业智能 EI智能体 SIS
语言模型重打分
图1语音识别中的语言模型重打分从公式 (1) 中可以看出，语言模型在语音识别任务中是作为一个先验项的，在贝叶斯公式中也确然如此。声学模型是为了找出能产生声学信号的最有可能的，但是在隐马尔科夫模型中我们可知实际上声学模型找到的是每一帧语音对应的最大概率的文本，因此只用声学模型得到文本序列是不考虑语义信息的，由于同音字词的存在识别结果往往很差；而语言模型就是在正常语料上训练，在声...

可爱又积极
发表于2022-03-16 17:24:01
6971 0 0

6.9k 0 0

图1语音识别中的语言模型重打分从公式 (1) 中可以看出，语言模型在语音识别任务中是作为一个先验项的，在贝叶斯公式中也确然如此。声学模型是为了找出能产生声学信号的最有可能的，但是在隐马尔科夫模型中我们可知实际上声学模型找到的是每一帧语音对应的最大概率的文本，因此只用声学模型得到文本序列是不考虑语义信息的，由于同音字词的存在识别结果往往很差；而语言模型就是在正常语料上训练，在声...
实时语音识别深度学习语音通话 VoiceCall
espnet安装--kaldi安装
一、Ubuntu镜像上传到集群1.下载镜像代码如下（示例）： docker pull ecpe4s/ubuntu20.04-spack2.查看镜像是否下载完成代码如下（示例）：docker images3.更改镜像名称代码如下（示例）：docker tag tensorflow/ecpe4s/ubuntu20.04-spack 211.82.236.15:8888/liu2yang/ubun...

可爱又积极
发表于2021-11-18 15:40:33
4810 0 0

4.8k 0 0

一、Ubuntu镜像上传到集群1.下载镜像代码如下（示例）： docker pull ecpe4s/ubuntu20.04-spack2.查看镜像是否下载完成代码如下（示例）：docker images3.更改镜像名称代码如下（示例）：docker tag tensorflow/ecpe4s/ubuntu20.04-spack 211.82.236.15:8888/liu2yang/ubun...
实时语音识别神经网络镜像服务 IMS
人工智能基础概述

Tianyi_Li
发表于2021-06-16 10:25:10
8489 0 1

8.4k 0 1

人工智能内容审核-文本实时语音识别机器学习深度学习
电子设计——简易数字合成信号发生器（完整代码暂未提供）

Tianyi_Li
发表于2021-06-16 10:22:41
7910 0 1

7.9k 0 1

人工智能内容审核-文本实时语音识别机器学习深度学习
具有模态特定因子的低秩多模态融合

Tianyi_Li
发表于2021-06-14 16:18:59
7645 0 1

7.6k 0 1

人工智能内容审核-文本实时语音识别机器学习深度学习
华为云语音交互服务-实时语音转写于2019年5月18日00:00（北京时间）转商通知
华为云语音交互服务-实时语音转写于2019年5月18日00:00（北京时间）转商通知

华为云客户服务中心
发表于2019-05-10 15:22:06
5246 0 0

5.2k 0 0

华为云语音交互服务-实时语音转写于2019年5月18日00:00（北京时间）转商通知
语言理解语音通话 VoiceCall 实时语音识别
GPT5发布倒计时：人工智能新一代将如何重塑世界？
据说GPT5将于今年12月完成训练，并且OpenAI期望实现人工通用智能，这意味着我们都将激烈辩论它是否真的达到了人工通用智能，这意味着它将会。

AI意识觉醒
发表于2023-10-17 12:52:47
808 0 0

808 0 0

据说GPT5将于今年12月完成训练，并且OpenAI期望实现人工通用智能，这意味着我们都将激烈辩论它是否真的达到了人工通用智能，这意味着它将会。
AIGC ChatGPT 人工智能实时语音识别机器人
ChatGPT 4 图片功能：超越预期的全新体验!
期待已久的照片上传功能终于来到了ChatGPT。经过数月的等待，我们现在终于拥有了上传照片到ChatGPT并就照片展开对话的实际能力，我有一些令人惊叹的案例想要与大家分享。

AI意识觉醒
发表于2023-10-09 12:00:01
1261 0 0

1.2k 0 0

期待已久的照片上传功能终于来到了ChatGPT。经过数月的等待，我们现在终于拥有了上传照片到ChatGPT并就照片展开对话的实际能力，我有一些令人惊叹的案例想要与大家分享。
AIGC ChatGPT 人工智能实时语音识别网站
马斯克的X AI 能否对抗OpenAI ChatGPT吗？
在Open AI刚刚起步的时候，马斯克看到了公司想要在AI领域做的事情的潜力，他渴望参与这一技术革命，所以这位亿万富翁投资了惊人的5000万美元给Open AI。但在意料之外的结果后，他开始担心自己犯了个可怕的错误。你帮助了Open AI的创建，是的，50,000,000美元是很大一笔钱。我想出了“Open AI”这个名字，意指开源，因为初衷是什么，与谷歌相反，它将是一个开源非盈利组织，因为谷歌是

AI意识觉醒
发表于2023-10-09 11:54:49
715 0 0

715 0 0

在Open AI刚刚起步的时候，马斯克看到了公司想要在AI领域做的事情的潜力，他渴望参与这一技术革命，所以这位亿万富翁投资了惊人的5000万美元给Open AI。但在意料之外的结果后，他开始担心自己犯了个可怕的错误。你帮助了Open AI的创建，是的，50,000,000美元是很大一笔钱。我想出了“Open AI”这个名字，意指开源，因为初衷是什么，与谷歌相反，它将是一个开源非盈利组织，因为谷歌是
AIGC ChatGPT 人工智能实时语音识别虚拟化
基于MindX SDK的中文语音识别推理实验--swjtu寒假特别版
关于基于MindX SDK的中文语音识别推理实验这个实验，首先是完成ECS环境搭建，再次推荐大家去看昇腾官方视频，里面有详细的步骤，我看的是B站的视频，在此把视频链接放出来，大家可以去看一下【【昇腾小姐姐教你趣味实验】昇腾工业质检应用实践】 https://www.bilibili.com/video/BV1ir4y1V7aK/?p=11&share_source=copy_web&vd...

aubrey_zhangzh
发表于2023-01-31 10:01:03
5061 0 2

5.0k 0 2

关于基于MindX SDK的中文语音识别推理实验这个实验，首先是完成ECS环境搭建，再次推荐大家去看昇腾官方视频，里面有详细的步骤，我看的是B站的视频，在此把视频链接放出来，大家可以去看一下【【昇腾小姐姐教你趣味实验】昇腾工业质检应用实践】 https://www.bilibili.com/video/BV1ir4y1V7aK/?p=11&share_source=copy_web&vd...
API/SDK 实时语音识别
基于双线性池化的多模态融合方法

Tianyi_Li
发表于2021-06-15 11:06:35
9058 0 0

9.0k 0 0

人工智能内容审核-文本实时语音识别机器学习深度学习
多模态融合之张量融合

Tianyi_Li
发表于2021-06-15 11:04:29
8080 0 0

8.0k 0 0

人工智能内容审核-文本实时语音识别机器学习深度学习

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript