- 关于声学模型,主要有两个问题,分别是特征向量序列的可变长和音频信号的丰富变化性。可变长特征向量序列问题在学术上通常有动态时间规划(Dynamic Time Warping, DTW)和隐马尔科夫模型(Hidden Markov Model, HMM)方法来解决。而音频信号的丰富变化性是由说话人的各种复杂特性或者说话风格与语速、环境噪声、信道干扰、方言差异等因素引起的。声学模型需要足够的鲁棒性... 关于声学模型,主要有两个问题,分别是特征向量序列的可变长和音频信号的丰富变化性。可变长特征向量序列问题在学术上通常有动态时间规划(Dynamic Time Warping, DTW)和隐马尔科夫模型(Hidden Markov Model, HMM)方法来解决。而音频信号的丰富变化性是由说话人的各种复杂特性或者说话风格与语速、环境噪声、信道干扰、方言差异等因素引起的。声学模型需要足够的鲁棒性...
- 在基于GMM-HMM的传统语音识别里,比音素(phone)更小的单位是状态(state)。一般每个音素由三个状态组成,特殊的是静音(SIL)由五个状态组成。这里所说的状态就是指HMM里的隐藏的状态,而每帧数据就是指HMM里的观测值。每个状态可以用一个GMM模型表示(这个GMM模型的参数是通过训练得到的)。在识别时把每帧数据对应的特征值放进每个状态的GMM里算概率,概率最大的那个就是这帧对应的... 在基于GMM-HMM的传统语音识别里,比音素(phone)更小的单位是状态(state)。一般每个音素由三个状态组成,特殊的是静音(SIL)由五个状态组成。这里所说的状态就是指HMM里的隐藏的状态,而每帧数据就是指HMM里的观测值。每个状态可以用一个GMM模型表示(这个GMM模型的参数是通过训练得到的)。在识别时把每帧数据对应的特征值放进每个状态的GMM里算概率,概率最大的那个就是这帧对应的...
- 平滑技术用于解决N-gram语言模型训练过程中存在的数据稀疏或零概率问题,是提高语言模型性能的核心技术。本文介绍了几种常用的平滑算法,并对SRILM的平滑参数及ARPA格式的语言模型进行了解析。 平滑技术用于解决N-gram语言模型训练过程中存在的数据稀疏或零概率问题,是提高语言模型性能的核心技术。本文介绍了几种常用的平滑算法,并对SRILM的平滑参数及ARPA格式的语言模型进行了解析。
- 图1语音识别中的语言模型重打分从公式 (1) 中可以看出,语言模型 在语音识别任务中是作为一个先验项的,在贝叶斯公式中也确然如此。声学模型 是为了找出能产生声学信号 的最有可能的 ,但是在隐马尔科夫模型中我们可知实际上声学模型找到的是每一帧语音对应的最大概率的文本,因此只用声学模型得到文本序列是不考虑语义信息的,由于同音字词的存在识别结果往往很差;而语言模型就是在正常语料上训练,在声... 图1语音识别中的语言模型重打分从公式 (1) 中可以看出,语言模型 在语音识别任务中是作为一个先验项的,在贝叶斯公式中也确然如此。声学模型 是为了找出能产生声学信号 的最有可能的 ,但是在隐马尔科夫模型中我们可知实际上声学模型找到的是每一帧语音对应的最大概率的文本,因此只用声学模型得到文本序列是不考虑语义信息的,由于同音字词的存在识别结果往往很差;而语言模型就是在正常语料上训练,在声...
- 一、Ubuntu镜像上传到集群1.下载镜像代码如下(示例): docker pull ecpe4s/ubuntu20.04-spack2.查看镜像是否下载完成代码如下(示例):docker images3.更改镜像名称代码如下(示例):docker tag tensorflow/ecpe4s/ubuntu20.04-spack 211.82.236.15:8888/liu2yang/ubun... 一、Ubuntu镜像上传到集群1.下载镜像代码如下(示例): docker pull ecpe4s/ubuntu20.04-spack2.查看镜像是否下载完成代码如下(示例):docker images3.更改镜像名称代码如下(示例):docker tag tensorflow/ecpe4s/ubuntu20.04-spack 211.82.236.15:8888/liu2yang/ubun...
- 华为云语音交互服务-实时语音转写于2019年5月18日00:00(北京时间)转商通知 华为云语音交互服务-实时语音转写于2019年5月18日00:00(北京时间)转商通知
- 据说GPT5将于今年12月完成训练,并且OpenAI期望实现人工通用智能,这意味着我们都将激烈辩论它是否真的达到了人工通用智能,这意味着它将会。 据说GPT5将于今年12月完成训练,并且OpenAI期望实现人工通用智能,这意味着我们都将激烈辩论它是否真的达到了人工通用智能,这意味着它将会。
- 期待已久的照片上传功能终于来到了ChatGPT。经过数月的等待,我们现在终于拥有了上传照片到ChatGPT并就照片展开对话的实际能力,我有一些令人惊叹的案例想要与大家分享。 期待已久的照片上传功能终于来到了ChatGPT。经过数月的等待,我们现在终于拥有了上传照片到ChatGPT并就照片展开对话的实际能力,我有一些令人惊叹的案例想要与大家分享。
- 在Open AI刚刚起步的时候,马斯克看到了公司想要在AI领域做的事情的潜力,他渴望参与这一技术革命,所以这位亿万富翁投资了惊人的5000万美元给Open AI。但在意料之外的结果后,他开始担心自己犯了个可怕的错误。你帮助了Open AI的创建,是的,50,000,000美元是很大一笔钱。我想出了“Open AI”这个名字,意指开源,因为初衷是什么,与谷歌相反,它将是一个开源非盈利组织,因为谷歌是 在Open AI刚刚起步的时候,马斯克看到了公司想要在AI领域做的事情的潜力,他渴望参与这一技术革命,所以这位亿万富翁投资了惊人的5000万美元给Open AI。但在意料之外的结果后,他开始担心自己犯了个可怕的错误。你帮助了Open AI的创建,是的,50,000,000美元是很大一笔钱。我想出了“Open AI”这个名字,意指开源,因为初衷是什么,与谷歌相反,它将是一个开源非盈利组织,因为谷歌是
- 关于 基于MindX SDK的中文语音识别推理实验 这个实验,首先是完成ECS环境搭建,再次推荐大家去看昇腾官方视频,里面有详细的步骤,我看的是B站的视频,在此把视频链接放出来,大家可以去看一下【【昇腾小姐姐教你趣味实验】昇腾工业质检应用实践】 https://www.bilibili.com/video/BV1ir4y1V7aK/?p=11&share_source=copy_web&vd... 关于 基于MindX SDK的中文语音识别推理实验 这个实验,首先是完成ECS环境搭建,再次推荐大家去看昇腾官方视频,里面有详细的步骤,我看的是B站的视频,在此把视频链接放出来,大家可以去看一下【【昇腾小姐姐教你趣味实验】昇腾工业质检应用实践】 https://www.bilibili.com/video/BV1ir4y1V7aK/?p=11&share_source=copy_web&vd...
上滑加载中
推荐直播
-
计算机核心课程贯通式实践教学体系介绍
2025/01/05 周日 09:00-12:00
华为开发者布道师、湖南大学二级教授、博士生导师赵欢
1月5日上午,华为开发者布道师直播间将迎来重磅嘉宾!赵欢老师,计算机教育创新先锋,其 “小而全系统” 教学方案重塑计算机类专业课程与实践,融合鲲鹏生态技术知识,斩获国家级教学成果奖。杨科华老师专注小型全系统实践,在香橙派鲲鹏 Pro 开发板构建精妙 mini 系统,带您直击计算机底层奥秘。还有香橙派系统开发部李博经理,精通开发板硬件与应用,将全方位揭秘开发板使用及 FPGA 开发实战案例。三位大咖齐聚,为高校师生开启计算机系统能力提升的知识宝库,精彩即将上线,速速预约!
即将直播 -
GaussDB数据库介绍
2025/01/07 周二 16:00-18:00
Steven 华为云学堂技术讲师
本期直播将介绍GaussDB数据库的发展历程、优势、架构、关键特性和部署模式等,旨在帮助开发者了解GaussDB数据库,并通过手把手实验教大家如何在华为云部署GaussDB数据库和使用gsql连接GaussDB数据库。
去报名 -
DTT年度收官盛典:华为开发者空间大咖汇,共探云端开发创新
2025/01/08 周三 16:30-18:00
Yawei 华为云开发工具和效率首席专家 Edwin 华为开发者空间产品总监
数字化转型进程持续加速,驱动着技术革新发展,华为开发者空间如何巧妙整合鸿蒙、昇腾、鲲鹏等核心资源,打破平台间的壁垒,实现跨平台协同?在科技迅猛发展的今天,开发者们如何迅速把握机遇,实现高效、创新的技术突破?DTT 年度收官盛典,将与大家共同探索华为开发者空间的创新奥秘。
去报名
热门标签