- 语音识别ASR,前处理包含哪些工作,以及简单的实现方案。 语音识别ASR,前处理包含哪些工作,以及简单的实现方案。
- 最大互信息(MMI)作为区分性训练中一个重要的统计量,在语音识别任务中取得很好的效果,本篇文章将系统的描述MMI在语音识别系统中的作为损失函数的数据理论依据,以及Lattice Free MMI在传统声学模型和端到端声学模型中的技术沿袭。 最大互信息(MMI)作为区分性训练中一个重要的统计量,在语音识别任务中取得很好的效果,本篇文章将系统的描述MMI在语音识别系统中的作为损失函数的数据理论依据,以及Lattice Free MMI在传统声学模型和端到端声学模型中的技术沿袭。
- 基于Kaldi源码构建软件的的方法。 基于Kaldi源码构建软件的的方法。
- 语音识别相关的分析。 语音识别相关的分析。
- 1 介绍 Kaldi是当前最流行的开源语音识别工具(Toolkit),它使用WFST来实现解码算法。Kaldi的主要代码是C++编写,在此之上使用bash和python脚本做了一些工具。 本文档以“Kaldi最新版本”为例进行说明。 2 安装准备 华为云购买一台鲲鹏服务器 本文以云服务器KC1实例搭建,云服务器配置如表1-1所示。 ... 1 介绍 Kaldi是当前最流行的开源语音识别工具(Toolkit),它使用WFST来实现解码算法。Kaldi的主要代码是C++编写,在此之上使用bash和python脚本做了一些工具。 本文档以“Kaldi最新版本”为例进行说明。 2 安装准备 华为云购买一台鲲鹏服务器 本文以云服务器KC1实例搭建,云服务器配置如表1-1所示。 ...
推荐直播
-
华为开发者空间玩转DeepSeek
2025/03/13 周四 19:00-20:30
马欣 山东商业职业技术学院云计算专业讲师,山东大学、山东建筑大学等多所本科学校学生校外指导老师
同学们,想知道如何利用华为开发者空间部署自己的DeepSeek模型吗?想了解如何用DeepSeek在云主机上探索好玩的应用吗?想探讨如何利用DeepSeek在自己的专有云主机上辅助编程吗?让我们来一场云和AI的盛宴。
即将直播 -
华为云Metastudio×DeepSeek与RAG检索优化分享
2025/03/14 周五 16:00-17:30
大海 华为云学堂技术讲师 Cocl 华为云学堂技术讲师
本次直播将带来DeepSeek数字人解决方案,以及如何使用Embedding与Rerank实现检索优化实践,为开发者与企业提供参考,助力场景落地。
去报名
热门标签