- Kaldi的nnet3网络结构。xconfig: 类似于keras,简洁的网络定义,xconfig覆盖了大部分常用的神经网络layerconfig: kaldi实际使用的config, 基于node定义网络结构,如果xconfig无法满足需求,可在config层实现。C++: 如果某些网络无法用config构建,或者想提高效率,则可以在C++层实现。(Kaldi本身的LSTM可以通过conf... Kaldi的nnet3网络结构。xconfig: 类似于keras,简洁的网络定义,xconfig覆盖了大部分常用的神经网络layerconfig: kaldi实际使用的config, 基于node定义网络结构,如果xconfig无法满足需求,可在config层实现。C++: 如果某些网络无法用config构建,或者想提高效率,则可以在C++层实现。(Kaldi本身的LSTM可以通过conf...
- GMM(Gaussian mixture model),高斯混合模型,也可以简写成MOG.高斯模型就是用高斯概率密度函数(正态分布曲线)精确地量化事物,将一个事物分解为若干的基于高斯概率密度函数(正态分布曲线)形成的模型。GMM已经在数值逼近、语音识别、图像分类、图像去噪、图像重构、故障诊断、视频分析、邮件过滤、密度估计、目标识别与跟踪等领域取得了良好的效果。实际上,GMM的目的就是找到一个... GMM(Gaussian mixture model),高斯混合模型,也可以简写成MOG.高斯模型就是用高斯概率密度函数(正态分布曲线)精确地量化事物,将一个事物分解为若干的基于高斯概率密度函数(正态分布曲线)形成的模型。GMM已经在数值逼近、语音识别、图像分类、图像去噪、图像重构、故障诊断、视频分析、邮件过滤、密度估计、目标识别与跟踪等领域取得了良好的效果。实际上,GMM的目的就是找到一个...
- 本博文主要结合实际例子讲述自然语言处理在词性标注和命名实体识别等方面的应用。 本博文主要结合实际例子讲述自然语言处理在词性标注和命名实体识别等方面的应用。
- 自然语言处理是人类语言的机器处理,旨在教授机器如何处理和理解人类的语言,从而在人与机器之间建立一个简单的沟通渠道。自然语言处理有三种广泛的应用,它们是语音识别、自然语言理解和自然语言生成。 自然语言处理是人类语言的机器处理,旨在教授机器如何处理和理解人类的语言,从而在人与机器之间建立一个简单的沟通渠道。自然语言处理有三种广泛的应用,它们是语音识别、自然语言理解和自然语言生成。
- 自然语言处理 — BERT AbstractBERT 全称为 Bidirectional Encoder Representations from Transformers. BERT 旨在通过对所有层的左右上下文进行联合调节,从未标记的文本中预训练深度双向表示. 因此,预训练的 BERT 模型可以仅通过一个额外的输出层进行微调,从而为各种任务(例如问答和语言推理)创建最先进的模型,而无需... 自然语言处理 — BERT AbstractBERT 全称为 Bidirectional Encoder Representations from Transformers. BERT 旨在通过对所有层的左右上下文进行联合调节,从未标记的文本中预训练深度双向表示. 因此,预训练的 BERT 模型可以仅通过一个额外的输出层进行微调,从而为各种任务(例如问答和语言推理)创建最先进的模型,而无需...
- 本文介绍了信息抽取任务中的属性抽取。文章简要描述了属性抽取的数据、标注方式、抽取流程,以及相关模型,并对比了与命名实体识别任务的异同。 本文介绍了信息抽取任务中的属性抽取。文章简要描述了属性抽取的数据、标注方式、抽取流程,以及相关模型,并对比了与命名实体识别任务的异同。
- 近日,华为云AI团队获得第9届国际自然语言处理与中文计算会议NLPCC 2020 轻量级预训练中文语言模型测评第一名。NLPCC 由中国计算机学会主办,是自然语言处理(NLP)和中文计算(CC)领域的顶级国际前沿会议,每年会议都秉承国际化和一流化的严格标准来进行自然语言处理任务的开放评测,推动相关任务的研究和发展。NLPCC 2020吸引了康奈尔大学、伦敦大学、普林斯顿大学等海内外近600位... 近日,华为云AI团队获得第9届国际自然语言处理与中文计算会议NLPCC 2020 轻量级预训练中文语言模型测评第一名。NLPCC 由中国计算机学会主办,是自然语言处理(NLP)和中文计算(CC)领域的顶级国际前沿会议,每年会议都秉承国际化和一流化的严格标准来进行自然语言处理任务的开放评测,推动相关任务的研究和发展。NLPCC 2020吸引了康奈尔大学、伦敦大学、普林斯顿大学等海内外近600位...
- 在目前基于深度学习的语言模型结构主要包括三个类别:基于RNN的语言模型,基于CNN的语言模型和基于Transformer的语言模型。接下来我会对它们进行依次介绍,并且逐一分析他们的优缺点。 在目前基于深度学习的语言模型结构主要包括三个类别:基于RNN的语言模型,基于CNN的语言模型和基于Transformer的语言模型。接下来我会对它们进行依次介绍,并且逐一分析他们的优缺点。
- 赛题背景:“事件抽取”是舆情分析领域和金融领域的重要任务之一,“事件”在金融领域是投资分析,资产管理的重要决策参考。“事件抽取”的挑战体现在文本的复杂和任务的复杂。文本的复杂体现在事件抽取的输入文本可能是句子、段落或者篇章,不定长度的文本使得限制文本长度的模型无法使用;任务的复杂体现在事件识别的任务包括:事件类型识别,和事件要素抽取。 “CCKS 2020面向金融领域的篇章事件要素抽取比赛”... 赛题背景:“事件抽取”是舆情分析领域和金融领域的重要任务之一,“事件”在金融领域是投资分析,资产管理的重要决策参考。“事件抽取”的挑战体现在文本的复杂和任务的复杂。文本的复杂体现在事件抽取的输入文本可能是句子、段落或者篇章,不定长度的文本使得限制文本长度的模型无法使用;任务的复杂体现在事件识别的任务包括:事件类型识别,和事件要素抽取。 “CCKS 2020面向金融领域的篇章事件要素抽取比赛”...
- 关于 PV 操作基本都是结合进程管理的前驱图来进行考察,历年以来,无论是软考还是操作系统的单独考试,占有很大的比重。今天我们总结两种在考试中常考的类型。一种是单线前驱图,即串联进程,另一种是多线前驱图,即并联进程。并联进程下又细分为两类:一种逐渐向后合并(进程趋于合并),另一种是前驱图逐渐向后展开。两种类型你都掌握了应试也就毫无问题了。 关于 PV 操作基本都是结合进程管理的前驱图来进行考察,历年以来,无论是软考还是操作系统的单独考试,占有很大的比重。今天我们总结两种在考试中常考的类型。一种是单线前驱图,即串联进程,另一种是多线前驱图,即并联进程。并联进程下又细分为两类:一种逐渐向后合并(进程趋于合并),另一种是前驱图逐渐向后展开。两种类型你都掌握了应试也就毫无问题了。
- 定义:判断两段文本所包含语义信息是否相同。1. 语义a) 如何对文本进行划分b) 如何表达每个token今天下雨,我骑车差点摔倒,好在我一把把把把住了。校长说:校服上除了校徽别别别的,让你们别别别的别别别的你非得别别的2. 匹配a) 分类问题:不同文本之间是否相似b) 回归问题:不同文本之间有多相... 定义:判断两段文本所包含语义信息是否相同。1. 语义a) 如何对文本进行划分b) 如何表达每个token今天下雨,我骑车差点摔倒,好在我一把把把把住了。校长说:校服上除了校徽别别别的,让你们别别别的别别别的你非得别别的2. 匹配a) 分类问题:不同文本之间是否相似b) 回归问题:不同文本之间有多相...
- 未完待续... 未完待续...
- 与常规方法的区别:传统以空格为主无法处理未知或罕见的词汇不利于学习词缀间的关系,例如love,lovely单个字母粒度又过细Byte Pair Encoding思路:拆分为最小的语义单元,然后依次确定频率最高的单词,循环统计;优点:较好的平衡词汇表大小和所需的token数量缺点:不能提供带概率的多个分片结果算法准备足够大的训练语料确定期望的subword词表大小将单词拆分为字符序列并在末尾添... 与常规方法的区别:传统以空格为主无法处理未知或罕见的词汇不利于学习词缀间的关系,例如love,lovely单个字母粒度又过细Byte Pair Encoding思路:拆分为最小的语义单元,然后依次确定频率最高的单词,循环统计;优点:较好的平衡词汇表大小和所需的token数量缺点:不能提供带概率的多个分片结果算法准备足够大的训练语料确定期望的subword词表大小将单词拆分为字符序列并在末尾添...
- 本节书摘来自华章计算机《TensorFlow自然语言处理》一书中的第3章,第3.5节,[澳] 图珊·加内格达拉(Thushan Ganegedara) 著 马恩驰 陆 健 译。 本节书摘来自华章计算机《TensorFlow自然语言处理》一书中的第3章,第3.5节,[澳] 图珊·加内格达拉(Thushan Ganegedara) 著 马恩驰 陆 健 译。
上滑加载中
推荐直播
-
全面解析华为云EI-API服务:理论基础与实践应用指南
2024/11/29 周五 18:20-20:20
Alex 华为云学堂技术讲师
本期直播给大家带来的是理论与实践结合的华为云EI-API的服务介绍。从“主要功能,应用场景,实践案例,调用流程”四个维度来深入解析“语音交互API,文字识别API,自然语言处理API,图像识别API及图像搜索API”五大场景下API服务,同时结合实验,来加深开发者对API服务理解。
回顾中 -
企业员工、应届毕业生、在读研究生共探项目实践
2024/12/02 周一 19:00-21:00
姚圣伟 在职软件工程师 昇腾社区优秀开发者 华为云云享专家 HCDG天津地区发起人
大神带你一键了解和掌握LeakyReLU自定义算子在ONNX网络中应用和优化技巧,在线分享如何入门,以及在工作中如何结合实际项目进行学习
即将直播 -
昇腾云服务ModelArts深度解析:理论基础与实践应用指南
2024/12/03 周二 14:30-16:30
Alex 华为云学堂技术讲师
如何快速创建和部署模型,管理全周期AI工作流呢?本期直播聚焦华为昇腾云服务ModelArts一站式AI开发平台功能介绍,同时结合基于ModelArts 的实践性实验,帮助开发者从理论到实验更好地理解和使用ModelArts。
去报名
热门标签