- 开发者
- SIS
#SIS#
- 弹性搜索的简介,安装与Hello World 弹性搜索的简介,安装与Hello World
- 从上一篇简化的贝叶斯公式出发,将语音识别的问题转化为求概率的问题。引入隐马尔可夫链模型用于解决输入输出序列不定长的建模。并推导使用GMM或DNN来表示概率,从而建立声学模型。之后介绍了n元法和RNN用于语言模型的表示。最后介绍了加权有限状态转换机WSFT用于找出最优概率。 从上一篇简化的贝叶斯公式出发,将语音识别的问题转化为求概率的问题。引入隐马尔可夫链模型用于解决输入输出序列不定长的建模。并推导使用GMM或DNN来表示概率,从而建立声学模型。之后介绍了n元法和RNN用于语言模型的表示。最后介绍了加权有限状态转换机WSFT用于找出最优概率。
- 语音转写文字ASR技术的基本概念与数学原理简介。 语音转写文字ASR技术的基本概念与数学原理简介。
- 《WeNet云端推理部署代码解析(上)》一文对WeNet云端推理代码进行探索,介绍了代码结构、前端和解码器部分代码。在本文中,笔者将继续解析WeNet云端部署代码,由于流式ASR服务需要在客户端和服务端之间进行双向的流式数据传输,WeNet实现了两种支持双向流式通信的服务化接口,分别基于WebSocket和gRPC。 《WeNet云端推理部署代码解析(上)》一文对WeNet云端推理代码进行探索,介绍了代码结构、前端和解码器部分代码。在本文中,笔者将继续解析WeNet云端部署代码,由于流式ASR服务需要在客户端和服务端之间进行双向的流式数据传输,WeNet实现了两种支持双向流式通信的服务化接口,分别基于WebSocket和gRPC。
- 前两篇文章都是从Encoder-Decoder的模型入手,这篇文章我们介绍一个结合CTC与WFST (weighted finite-state transducers) 的工作:《EESEN: END-TO-END SPEECH RECOGNITION USING DEEP RNN MODELS AND WFST-BASED DECODING》。 前两篇文章都是从Encoder-Decoder的模型入手,这篇文章我们介绍一个结合CTC与WFST (weighted finite-state transducers) 的工作:《EESEN: END-TO-END SPEECH RECOGNITION USING DEEP RNN MODELS AND WFST-BASED DECODING》。
- 本文从《Shallow-Fusion End-to-End Contextual Biasing》入手,探索解决专有领域的端到端ASR。 本文从《Shallow-Fusion End-to-End Contextual Biasing》入手,探索解决专有领域的端到端ASR。
- GlusterFS的安装与维护 GlusterFS的安装与维护
- wenet语音识别onnxruntime内存泄露定位 wenet语音识别onnxruntime内存泄露定位
- 音频处理神器 FFmpeg安装与使用 音频处理神器 FFmpeg安装与使用
- 端到端ASR神器 WeNet系列之前沿知识 CMake语法 端到端ASR神器 WeNet系列之前沿知识 CMake语法
- 因为语音和文字之间序列不一一对应,因此我们在前面博文中并未直接使用语料去端到端训练语音识别模型,但是如果能找到一个比较合适的数学形式来表示输入输出,则可以端对端实现语音识别。本文介绍了常见的几种端对端结构的语音识别模型,包括CTC和注意力机制等。 因为语音和文字之间序列不一一对应,因此我们在前面博文中并未直接使用语料去端到端训练语音识别模型,但是如果能找到一个比较合适的数学形式来表示输入输出,则可以端对端实现语音识别。本文介绍了常见的几种端对端结构的语音识别模型,包括CTC和注意力机制等。
- 语音技术里面声音检测VAD和话者分离模块非常基础,因此本文将整理这两个模块相关的概念和衡量指标。 语音技术里面声音检测VAD和话者分离模块非常基础,因此本文将整理这两个模块相关的概念和衡量指标。
- WeNet是一款开源端到端ASR工具包,它与ESPnet等开源语音项目相比,最大的优势在于提供了从训练到部署的一整套工具链,使ASR服务的工业落地更加简单。本系列将对WeNet云端推理部署代码进行解析。 WeNet是一款开源端到端ASR工具包,它与ESPnet等开源语音项目相比,最大的优势在于提供了从训练到部署的一整套工具链,使ASR服务的工业落地更加简单。本系列将对WeNet云端推理部署代码进行解析。
- 本文从《DEEP CONTEXT: END-TO-END CONTEXTUAL SPEECH RECOGNITION》出发,继续讲解如何解决语境偏移。 本文从《DEEP CONTEXT: END-TO-END CONTEXTUAL SPEECH RECOGNITION》出发,继续讲解如何解决语境偏移。
- 平滑技术用于解决N-gram语言模型训练过程中存在的数据稀疏或零概率问题,是提高语言模型性能的核心技术。本文介绍了几种常用的平滑算法,并对SRILM的平滑参数及ARPA格式的语言模型进行了解析。 平滑技术用于解决N-gram语言模型训练过程中存在的数据稀疏或零概率问题,是提高语言模型性能的核心技术。本文介绍了几种常用的平滑算法,并对SRILM的平滑参数及ARPA格式的语言模型进行了解析。
推荐直播
-
华为云 x DeepSeek:AI驱动云上应用创新
2025/02/26 周三 16:00-18:00
华为云 AI专家大咖团
在 AI 技术飞速发展之际,DeepSeek 备受关注。它凭借哪些技术与理念脱颖而出?华为云与 DeepSeek 合作,将如何重塑产品与应用模式,助力企业数字化转型?在华为开发者空间,怎样高效部署 DeepSeek,搭建专属服务器?基于华为云平台,又该如何挖掘 DeepSeek 潜力,实现智能化升级?本期直播围绕DeepSeek在云上的应用案例,与DTSE布道师们一起探讨如何利用AI 驱动云上应用创新。
回顾中 -
智能观测进化论系列沙龙(第一期)
2025/02/28 周五 14:00-16:30
华为及外部讲师团
本期直播就智能化可观测技术的融合与创新、落地与实践、瓶颈与未来等业界关心的话题进行深入探讨。
回顾中 -
聚焦Deepseek,洞察开发者生态发展
2025/02/28 周五 19:00-20:30
蒋涛 csdn创始人
深入剖析Deepseek爆发后,中国开发者生态潜藏的巨大发展潜能与未来走向,精准提炼出可供大家把握的时代机遇,干货满满,不容错过。
回顾中
热门标签