- 关于声学模型,主要有两个问题,分别是特征向量序列的可变长和音频信号的丰富变化性。可变长特征向量序列问题在学术上通常有动态时间规划(Dynamic Time Warping, DTW)和隐马尔科夫模型(Hidden Markov Model, HMM)方法来解决。而音频信号的丰富变化性是由说话人的各种复杂特性或者说话风格与语速、环境噪声、信道干扰、方言差异等因素引起的。声学模型需要足够的鲁棒性... 关于声学模型,主要有两个问题,分别是特征向量序列的可变长和音频信号的丰富变化性。可变长特征向量序列问题在学术上通常有动态时间规划(Dynamic Time Warping, DTW)和隐马尔科夫模型(Hidden Markov Model, HMM)方法来解决。而音频信号的丰富变化性是由说话人的各种复杂特性或者说话风格与语速、环境噪声、信道干扰、方言差异等因素引起的。声学模型需要足够的鲁棒性...
- 在基于GMM-HMM的传统语音识别里,比音素(phone)更小的单位是状态(state)。一般每个音素由三个状态组成,特殊的是静音(SIL)由五个状态组成。这里所说的状态就是指HMM里的隐藏的状态,而每帧数据就是指HMM里的观测值。每个状态可以用一个GMM模型表示(这个GMM模型的参数是通过训练得到的)。在识别时把每帧数据对应的特征值放进每个状态的GMM里算概率,概率最大的那个就是这帧对应的... 在基于GMM-HMM的传统语音识别里,比音素(phone)更小的单位是状态(state)。一般每个音素由三个状态组成,特殊的是静音(SIL)由五个状态组成。这里所说的状态就是指HMM里的隐藏的状态,而每帧数据就是指HMM里的观测值。每个状态可以用一个GMM模型表示(这个GMM模型的参数是通过训练得到的)。在识别时把每帧数据对应的特征值放进每个状态的GMM里算概率,概率最大的那个就是这帧对应的...
- 平滑技术用于解决N-gram语言模型训练过程中存在的数据稀疏或零概率问题,是提高语言模型性能的核心技术。本文介绍了几种常用的平滑算法,并对SRILM的平滑参数及ARPA格式的语言模型进行了解析。 平滑技术用于解决N-gram语言模型训练过程中存在的数据稀疏或零概率问题,是提高语言模型性能的核心技术。本文介绍了几种常用的平滑算法,并对SRILM的平滑参数及ARPA格式的语言模型进行了解析。
- 图1语音识别中的语言模型重打分从公式 (1) 中可以看出,语言模型 在语音识别任务中是作为一个先验项的,在贝叶斯公式中也确然如此。声学模型 是为了找出能产生声学信号 的最有可能的 ,但是在隐马尔科夫模型中我们可知实际上声学模型找到的是每一帧语音对应的最大概率的文本,因此只用声学模型得到文本序列是不考虑语义信息的,由于同音字词的存在识别结果往往很差;而语言模型就是在正常语料上训练,在声... 图1语音识别中的语言模型重打分从公式 (1) 中可以看出,语言模型 在语音识别任务中是作为一个先验项的,在贝叶斯公式中也确然如此。声学模型 是为了找出能产生声学信号 的最有可能的 ,但是在隐马尔科夫模型中我们可知实际上声学模型找到的是每一帧语音对应的最大概率的文本,因此只用声学模型得到文本序列是不考虑语义信息的,由于同音字词的存在识别结果往往很差;而语言模型就是在正常语料上训练,在声...
- 一、Ubuntu镜像上传到集群1.下载镜像代码如下(示例): docker pull ecpe4s/ubuntu20.04-spack2.查看镜像是否下载完成代码如下(示例):docker images3.更改镜像名称代码如下(示例):docker tag tensorflow/ecpe4s/ubuntu20.04-spack 211.82.236.15:8888/liu2yang/ubun... 一、Ubuntu镜像上传到集群1.下载镜像代码如下(示例): docker pull ecpe4s/ubuntu20.04-spack2.查看镜像是否下载完成代码如下(示例):docker images3.更改镜像名称代码如下(示例):docker tag tensorflow/ecpe4s/ubuntu20.04-spack 211.82.236.15:8888/liu2yang/ubun...
- 华为云语音交互服务-实时语音转写于2019年5月18日00:00(北京时间)转商通知 华为云语音交互服务-实时语音转写于2019年5月18日00:00(北京时间)转商通知
- 据说GPT5将于今年12月完成训练,并且OpenAI期望实现人工通用智能,这意味着我们都将激烈辩论它是否真的达到了人工通用智能,这意味着它将会。 据说GPT5将于今年12月完成训练,并且OpenAI期望实现人工通用智能,这意味着我们都将激烈辩论它是否真的达到了人工通用智能,这意味着它将会。
- 期待已久的照片上传功能终于来到了ChatGPT。经过数月的等待,我们现在终于拥有了上传照片到ChatGPT并就照片展开对话的实际能力,我有一些令人惊叹的案例想要与大家分享。 期待已久的照片上传功能终于来到了ChatGPT。经过数月的等待,我们现在终于拥有了上传照片到ChatGPT并就照片展开对话的实际能力,我有一些令人惊叹的案例想要与大家分享。
- 在Open AI刚刚起步的时候,马斯克看到了公司想要在AI领域做的事情的潜力,他渴望参与这一技术革命,所以这位亿万富翁投资了惊人的5000万美元给Open AI。但在意料之外的结果后,他开始担心自己犯了个可怕的错误。你帮助了Open AI的创建,是的,50,000,000美元是很大一笔钱。我想出了“Open AI”这个名字,意指开源,因为初衷是什么,与谷歌相反,它将是一个开源非盈利组织,因为谷歌是 在Open AI刚刚起步的时候,马斯克看到了公司想要在AI领域做的事情的潜力,他渴望参与这一技术革命,所以这位亿万富翁投资了惊人的5000万美元给Open AI。但在意料之外的结果后,他开始担心自己犯了个可怕的错误。你帮助了Open AI的创建,是的,50,000,000美元是很大一笔钱。我想出了“Open AI”这个名字,意指开源,因为初衷是什么,与谷歌相反,它将是一个开源非盈利组织,因为谷歌是
- 关于 基于MindX SDK的中文语音识别推理实验 这个实验,首先是完成ECS环境搭建,再次推荐大家去看昇腾官方视频,里面有详细的步骤,我看的是B站的视频,在此把视频链接放出来,大家可以去看一下【【昇腾小姐姐教你趣味实验】昇腾工业质检应用实践】 https://www.bilibili.com/video/BV1ir4y1V7aK/?p=11&share_source=copy_web&vd... 关于 基于MindX SDK的中文语音识别推理实验 这个实验,首先是完成ECS环境搭建,再次推荐大家去看昇腾官方视频,里面有详细的步骤,我看的是B站的视频,在此把视频链接放出来,大家可以去看一下【【昇腾小姐姐教你趣味实验】昇腾工业质检应用实践】 https://www.bilibili.com/video/BV1ir4y1V7aK/?p=11&share_source=copy_web&vd...
上滑加载中
推荐直播
-
华为云IoT开源专家实践分享:开源让物联网平台更开放、易用
2024/05/22 周三 16:30-18:00
张俭 华为云IoT DTSE技术布道师
开源,意味着开放、共享、互助、共赢。作为万物上云及各行业数字化的物联网底座,华为云IoT积极拥抱开源,借助行业开源的最佳实践,构建可靠、易用的物联网平台,并通过开放南北向SDK,助力开发者快速构建物联网应用。本期直播,华为云IoT开源专家、物联网平台资深“程序猿”张俭,带你了解华为云IoT的开源生态,并手把手教你玩转开源社区!
去报名 -
华为云开发者日·广州站
2024/05/23 周四 14:30-17:30
华为云专家团
华为云开发者日HDC.Cloud Day是面向全球开发者的旗舰活动,汇聚来自千行百业、高校及科研院所的开发人员。致力于打造开发者专属的技术盛宴,全方位服务与赋能开发者围绕华为云生态“知、学、用、创、商”的成长路径。通过前沿的技术分享、场景化的动手体验、优秀的应用创新推介,为开发者提供沉浸式学习与交流平台。开放创新,与开发者共创、共享、共赢未来。
去报名
热门标签