- 开发者
- SIS
#SIS#
- 弹性搜索的简介,安装与Hello World 弹性搜索的简介,安装与Hello World
- 从上一篇简化的贝叶斯公式出发,将语音识别的问题转化为求概率的问题。引入隐马尔可夫链模型用于解决输入输出序列不定长的建模。并推导使用GMM或DNN来表示概率,从而建立声学模型。之后介绍了n元法和RNN用于语言模型的表示。最后介绍了加权有限状态转换机WSFT用于找出最优概率。 从上一篇简化的贝叶斯公式出发,将语音识别的问题转化为求概率的问题。引入隐马尔可夫链模型用于解决输入输出序列不定长的建模。并推导使用GMM或DNN来表示概率,从而建立声学模型。之后介绍了n元法和RNN用于语言模型的表示。最后介绍了加权有限状态转换机WSFT用于找出最优概率。
- 语音转写文字ASR技术的基本概念与数学原理简介。 语音转写文字ASR技术的基本概念与数学原理简介。
- 《WeNet云端推理部署代码解析(上)》一文对WeNet云端推理代码进行探索,介绍了代码结构、前端和解码器部分代码。在本文中,笔者将继续解析WeNet云端部署代码,由于流式ASR服务需要在客户端和服务端之间进行双向的流式数据传输,WeNet实现了两种支持双向流式通信的服务化接口,分别基于WebSocket和gRPC。 《WeNet云端推理部署代码解析(上)》一文对WeNet云端推理代码进行探索,介绍了代码结构、前端和解码器部分代码。在本文中,笔者将继续解析WeNet云端部署代码,由于流式ASR服务需要在客户端和服务端之间进行双向的流式数据传输,WeNet实现了两种支持双向流式通信的服务化接口,分别基于WebSocket和gRPC。
- 前两篇文章都是从Encoder-Decoder的模型入手,这篇文章我们介绍一个结合CTC与WFST (weighted finite-state transducers) 的工作:《EESEN: END-TO-END SPEECH RECOGNITION USING DEEP RNN MODELS AND WFST-BASED DECODING》。 前两篇文章都是从Encoder-Decoder的模型入手,这篇文章我们介绍一个结合CTC与WFST (weighted finite-state transducers) 的工作:《EESEN: END-TO-END SPEECH RECOGNITION USING DEEP RNN MODELS AND WFST-BASED DECODING》。
- 本文从《Shallow-Fusion End-to-End Contextual Biasing》入手,探索解决专有领域的端到端ASR。 本文从《Shallow-Fusion End-to-End Contextual Biasing》入手,探索解决专有领域的端到端ASR。
- GlusterFS的安装与维护 GlusterFS的安装与维护
- wenet语音识别onnxruntime内存泄露定位 wenet语音识别onnxruntime内存泄露定位
- 音频处理神器 FFmpeg安装与使用 音频处理神器 FFmpeg安装与使用
- 端到端ASR神器 WeNet系列之前沿知识 CMake语法 端到端ASR神器 WeNet系列之前沿知识 CMake语法
- 因为语音和文字之间序列不一一对应,因此我们在前面博文中并未直接使用语料去端到端训练语音识别模型,但是如果能找到一个比较合适的数学形式来表示输入输出,则可以端对端实现语音识别。本文介绍了常见的几种端对端结构的语音识别模型,包括CTC和注意力机制等。 因为语音和文字之间序列不一一对应,因此我们在前面博文中并未直接使用语料去端到端训练语音识别模型,但是如果能找到一个比较合适的数学形式来表示输入输出,则可以端对端实现语音识别。本文介绍了常见的几种端对端结构的语音识别模型,包括CTC和注意力机制等。
- 语音技术里面声音检测VAD和话者分离模块非常基础,因此本文将整理这两个模块相关的概念和衡量指标。 语音技术里面声音检测VAD和话者分离模块非常基础,因此本文将整理这两个模块相关的概念和衡量指标。
- WeNet是一款开源端到端ASR工具包,它与ESPnet等开源语音项目相比,最大的优势在于提供了从训练到部署的一整套工具链,使ASR服务的工业落地更加简单。本系列将对WeNet云端推理部署代码进行解析。 WeNet是一款开源端到端ASR工具包,它与ESPnet等开源语音项目相比,最大的优势在于提供了从训练到部署的一整套工具链,使ASR服务的工业落地更加简单。本系列将对WeNet云端推理部署代码进行解析。
- 本文从《DEEP CONTEXT: END-TO-END CONTEXTUAL SPEECH RECOGNITION》出发,继续讲解如何解决语境偏移。 本文从《DEEP CONTEXT: END-TO-END CONTEXTUAL SPEECH RECOGNITION》出发,继续讲解如何解决语境偏移。
- 平滑技术用于解决N-gram语言模型训练过程中存在的数据稀疏或零概率问题,是提高语言模型性能的核心技术。本文介绍了几种常用的平滑算法,并对SRILM的平滑参数及ARPA格式的语言模型进行了解析。 平滑技术用于解决N-gram语言模型训练过程中存在的数据稀疏或零概率问题,是提高语言模型性能的核心技术。本文介绍了几种常用的平滑算法,并对SRILM的平滑参数及ARPA格式的语言模型进行了解析。
推荐直播
-
Ascend C算子编程之旅:基础入门篇
2024/11/22 周五 16:00-17:30
莫老师 昇腾CANN专家
介绍Ascend C算子基本概念、异构计算架构CANN和Ascend C基本概述,以及Ascend C快速入门,夯实Ascend C算子编程基础
回顾中 -
深入解析:华为全栈AI解决方案与云智能开放能力
2024/11/22 周五 18:20-20:20
Alex 华为云学堂技术讲师
本期直播我们将重点为大家介绍华为全栈全场景AI解决方案以和华为云企业智能AI开放能力。旨在帮助开发者深入理解华为AI解决方案,并能够更加熟练地运用这些技术。通过洞悉华为解决方案,了解人工智能完整生态链条的构造。
回顾中 -
华为云DataArts+DWS助力企业数据治理一站式解决方案及应用实践
2024/11/27 周三 16:30-18:00
Walter.chi 华为云数据治理DTSE技术布道师
想知道数据治理项目中,数据主题域如何合理划分?数据标准及主数据标准如何制定?数仓分层模型如何合理规划?华为云DataArts+DWS助力企业数据治理项目一站式解决方案和应用实践告诉您答案!本期将从数据趋势、数据治理方案、数据治理规划及落地,案例分享四个方面来助力企业数据治理项目合理咨询规划及顺利实施。
去报名
热门标签