深度学习_标签_开发者_华为云

博客(3.1k)
视频(7)
论坛(0)
云声(0)
代码示例(0)

SENet双塔模型：在推荐领域召回粗排的应用及其它
前言目前，双塔结构在推荐领域里已经是个常规方法了，在召回和粗排环节的模型选型中，被广泛采用。其实，不仅仅是在推荐领域，在其它领域，双塔结构也已经被越来越多得用起来了。比如，在当代搜索引擎的召回环节，除了常见的经典倒排索引来对Query和Document进行文本字面匹配外，经常也会增加一路基于Bert模型的双塔结构，将用户查询Quer...

格图洛书
发表于2021-11-19 00:50:22
3177 0 0

3.1k 0 0

前言目前，双塔结构在推荐领域里已经是个常规方法了，在召回和粗排环节的模型选型中，被广泛采用。其实，不仅仅是在推荐领域，在其它领域，双塔结构也已经被越来越多得用起来了。比如，在当代搜索引擎的召回环节，除了常见的经典倒排索引来对Query和Document进行文本字面匹配外，经常也会增加一路基于Bert模型的双塔结构，将用户查询Quer...
深度学习
深度学习核心技术精讲100篇（二十四）-简单谈下深度学习在中文分词中的应用
前言随着深度学习的普及，有越来越多的研究应用新模型到中文分词上，让人直呼“手快有，手慢无”。不过这些神经网络方法的真实水平如何？具体数值多少？以Sighan05中的PKU数据集为例，真像一些论文所言，一个LSTM-CRF就有96.5%吗？或者像某些工业界人士那样，动辄“基于深度学习的98%准确率”，“99% 的分词成功率”吗？如...

格图洛书
发表于2021-11-19 00:47:11
6203 0 0

6.2k 0 0

前言随着深度学习的普及，有越来越多的研究应用新模型到中文分词上，让人直呼“手快有，手慢无”。不过这些神经网络方法的真实水平如何？具体数值多少？以Sighan05中的PKU数据集为例，真像一些论文所言，一个LSTM-CRF就有96.5%吗？或者像某些工业界人士那样，动辄“基于深度学习的98%准确率”，“99% 的分词成功率”吗？如...
中文分词深度学习
深度学习核心技术精讲100篇（十二）-DCGAN(对抗生成网络）算法应用及代码实现
前言一次偶然看到一个换脸的视频，觉得实在是很神奇，于是饶有兴致的去了解一下换脸算法。原来背后有一个极为有意思的算法思想——对抗生成。随后各种各样的GAN算法以指数级增长的方式涌现出来，比如WGAN（Wasserstein GAN），CGAN（condition gan），SRGAN（super resolution gan）等。...

格图洛书
发表于2021-11-19 00:46:42
2556 0 0

2.5k 0 0

前言一次偶然看到一个换脸的视频，觉得实在是很神奇，于是饶有兴致的去了解一下换脸算法。原来背后有一个极为有意思的算法思想——对抗生成。随后各种各样的GAN算法以指数级增长的方式涌现出来，比如WGAN（Wasserstein GAN），CGAN（condition gan），SRGAN（super resolution gan）等。...
深度学习
深度学习核心技术精讲100篇（五十）-爱奇艺逗芽表情搜索分析与实践
前言随着互联网时代的发展，表情包成为现在大家网上交流的必备工具，针对表情搜索的产品需求，经历了从ElasticSearch到Lucene再到结合语义的搜索实践之路。不同阶段的技术选型可能可以为大家提供一些中小体量业务垂直领域搜索的落地思路。   逗芽表情搜索   爱奇艺逗芽表情（https://douya...

格图洛书
发表于2021-11-19 00:42:17
2513 0 0

2.5k 0 0

前言随着互联网时代的发展，表情包成为现在大家网上交流的必备工具，针对表情搜索的产品需求，经历了从ElasticSearch到Lucene再到结合语义的搜索实践之路。不同阶段的技术选型可能可以为大家提供一些中小体量业务垂直领域搜索的落地思路。   逗芽表情搜索   爱奇艺逗芽表情（https://douya...
深度学习
深度学习核心技术精讲100篇（八十）-脏数据如何处理？置信学习解决方案
前言   在实际工作中，你是否遇到过这样一个问题或痛点：无论是通过哪种方式获取的标注数据，数据标注质量可能不过关，存在一些错误？亦或者是数据标注的标准不统一、存在一些歧义？特别是badcase反馈回来，发现训练集标注的居然和badcase一样？如下图所示，QuickDraw、MNIST和Amazon Reviews数据集中...

格图洛书
发表于2021-11-19 00:38:06
3307 0 0

3.3k 0 0

前言   在实际工作中，你是否遇到过这样一个问题或痛点：无论是通过哪种方式获取的标注数据，数据标注质量可能不过关，存在一些错误？亦或者是数据标注的标准不统一、存在一些歧义？特别是badcase反馈回来，发现训练集标注的居然和badcase一样？如下图所示，QuickDraw、MNIST和Amazon Reviews数据集中...
深度学习
深度学习核心技术精讲100篇（十九）--GBDT(梯度提升树) 和 Resnet (残差网络)的原理
残差残差在数理统计中是指实际观察值与估计值（拟合值）之间的差。在集成学习中可以通过基模型拟合残差，使得集成的模型变得更精确；在深度学习中也有人利用layer去拟合残差将深度神经网络的性能提高变强。这里博主选了Gradient Boosting和Resnet两个算法试图让大家更感性的认识到拟合残差的作用机理。 Gradient Bo...

格图洛书
发表于2021-11-19 00:35:00
2863 0 0

2.8k 0 0

残差残差在数理统计中是指实际观察值与估计值（拟合值）之间的差。在集成学习中可以通过基模型拟合残差，使得集成的模型变得更精确；在深度学习中也有人利用layer去拟合残差将深度神经网络的性能提高变强。这里博主选了Gradient Boosting和Resnet两个算法试图让大家更感性的认识到拟合残差的作用机理。 Gradient Bo...
机器学习深度学习
深度学习核心技术精讲100篇（二十六）-如何运用大数据定量刻画用户画像？
前言在互联网步入大数据时代后，用户行为给企业的产品和服务带来了一系列的改变和重塑，其中最大的变化在于，用户的一切行为在企业面前是可“追溯”“分析”的。企业内保存了大量的原始数据和各种业务数据，这是企业经营活动的真实记录，如何更加有效地利用这些数据进行分析和评估，成为企业基于更大数据量背景的问题所在。随着大数据技术的深入研究与应用，企...

格图洛书
发表于2021-11-19 00:31:31
2957 0 0

2.9k 0 0

前言在互联网步入大数据时代后，用户行为给企业的产品和服务带来了一系列的改变和重塑，其中最大的变化在于，用户的一切行为在企业面前是可“追溯”“分析”的。企业内保存了大量的原始数据和各种业务数据，这是企业经营活动的真实记录，如何更加有效地利用这些数据进行分析和评估，成为企业基于更大数据量背景的问题所在。随着大数据技术的深入研究与应用，企...
大数据深度学习
深度学习核心技术精讲100篇（十四）-一文带你看懂GPflow的前世今生
什么是GPflow GPflow是一个高斯过程的工具包，接口部分由python实现，内部的部分计算则由Tensorflow实现。主要特点有二个：一是使用变分推理作为近似方法，二是使用自动微分进行求导。安装首先到GPflow官方页面将代码包下载到本地，然后进入代码包根目录，在终端输入pip install . 即可安装。 ...

格图洛书
发表于2021-11-19 00:25:41
3329 0 0

3.3k 0 0

什么是GPflow GPflow是一个高斯过程的工具包，接口部分由python实现，内部的部分计算则由Tensorflow实现。主要特点有二个：一是使用变分推理作为近似方法，二是使用自动微分进行求导。安装首先到GPflow官方页面将代码包下载到本地，然后进入代码包根目录，在终端输入pip install . 即可安装。 ...
TensorFlow 深度学习
深度学习核心技术精讲100篇（十八）-巨量数据下美团是如何实现数据治理的？
背景   大数据时代的到来，让越来越多的企业看到了数据资产的价值。将数据视为企业的重要资产，已经成为业界的一种共识，企业也在快速探索应用场景和商业模式，并开始建设技术平台。但这里要特别强调一下，如果在大数据“拼图”中遗忘了数据治理，可能再多的技术投入也是一种徒劳。因为没有数据治理这一环节，其带来后果往往是：随处可见的数...

格图洛书
发表于2021-11-19 00:22:56
2909 0 0

2.9k 0 0

背景   大数据时代的到来，让越来越多的企业看到了数据资产的价值。将数据视为企业的重要资产，已经成为业界的一种共识，企业也在快速探索应用场景和商业模式，并开始建设技术平台。但这里要特别强调一下，如果在大数据“拼图”中遗忘了数据治理，可能再多的技术投入也是一种徒劳。因为没有数据治理这一环节，其带来后果往往是：随处可见的数...
大数据深度学习
深度学习核心技术精讲100篇（三十三）-微博推荐算法实践与机器学习平台演进
前言微博作为全球领先的中文广场社交平台，拥有海量用户与数据。在从海量数据中挖掘有价值的信息，为业务赋能的过程中，微博的推荐算法经历了数次升级换代，积累了许多经验。今天跟大家分享下，在此过程中遇到的问题，并且在长期改进与积累的过程中，微博机器学习平台的演进过程，以及当前架构如何更好的发挥算法的优势，为业务产生更多有价值的支撑。主要...

格图洛书
发表于2021-11-19 00:17:38
4060 0 0

4.0k 0 0

前言微博作为全球领先的中文广场社交平台，拥有海量用户与数据。在从海量数据中挖掘有价值的信息，为业务赋能的过程中，微博的推荐算法经历了数次升级换代，积累了许多经验。今天跟大家分享下，在此过程中遇到的问题，并且在长期改进与积累的过程中，微博机器学习平台的演进过程，以及当前架构如何更好的发挥算法的优势，为业务产生更多有价值的支撑。主要...
机器学习深度学习云学院
深度学习核心技术精讲100篇（十一）-Google利器超强特征提取网络（Transformer）
前言谷歌于2017年提出 Transformer网络架构，此网络一经推出就引爆学术界。目前，在NLP领域，Transformer模型被认为是比CNN，RNN都要更强的特征提取器。 Transformer算法简介 Transformer引入了self-attention机制，同时还借鉴了CNN领域中残差机制（Residuals），...

格图洛书
发表于2021-11-19 00:15:53
2866 0 0

2.8k 0 0

前言谷歌于2017年提出 Transformer网络架构，此网络一经推出就引爆学术界。目前，在NLP领域，Transformer模型被认为是比CNN，RNN都要更强的特征提取器。 Transformer算法简介 Transformer引入了self-attention机制，同时还借鉴了CNN领域中残差机制（Residuals），...
深度学习
深度学习核心技术精讲100篇（三十七）-利用Contrastive Learning对抗数据噪声：对比学习在微博场景的实践
前言对比学习最近一年比较火，它的应用范围，已经从最初的图像领域，逐步拓展到了自然语言处理以及多模态等很多其它领域。本文介绍微博在自然语言处理以及多模态方面，应用对比学习的经验。后文将要介绍的两个模型：CD-TOM和W-CLIP，CD-TOM是关于纯文本方面的对比学习模型；W-CLIP是关于<文本，图片>多模态数据方面...

格图洛书
发表于2021-11-19 00:13:17
3037 0 0

3.0k 0 0

前言对比学习最近一年比较火，它的应用范围，已经从最初的图像领域，逐步拓展到了自然语言处理以及多模态等很多其它领域。本文介绍微博在自然语言处理以及多模态方面，应用对比学习的经验。后文将要介绍的两个模型：CD-TOM和W-CLIP，CD-TOM是关于纯文本方面的对比学习模型；W-CLIP是关于<文本，图片>多模态数据方面...
机器学习深度学习
深度学习核心技术精讲100篇（七十五）-集成学习
前言在解决分类问题时，假如分类模型不够强大，对样本的分类结果就不会很理想。这时如果我们多找一些分类模型，让它们一起做决策，模型强度会不会高一点呢？集成学习就是把多种分类器按策略组合起来，并根据所有分类器的分类结果做出最后的判断。如下图，三种分类器的分类结果都有一点点错误，如果把三类组合在一起就可以完美地把所有形状都区...

格图洛书
发表于2021-11-19 00:12:47
3064 0 0

3.0k 0 0

前言在解决分类问题时，假如分类模型不够强大，对样本的分类结果就不会很理想。这时如果我们多找一些分类模型，让它们一起做决策，模型强度会不会高一点呢？集成学习就是把多种分类器按策略组合起来，并根据所有分类器的分类结果做出最后的判断。如下图，三种分类器的分类结果都有一点点错误，如果把三类组合在一起就可以完美地把所有形状都区...
深度学习
深度学习核心技术精讲100篇（二十七）-如何利用NLP技术对ASR的query文本进行预处理纠错？
前言语音系统中语音内容识别 ( ASR ) 的精准性，是影响智能语音产品发展的关键制约因素，用户query的文本，通常是由ASR系统将用户的语音命令转换而成，但由于技术上的原因，这些由ASR生成的文本可能包含错误，继而导致后续的用户意图理解出现偏差。如何利用NLP技术对ASR的query文本进行预处理纠错成了一个亟待解决的问题。 ...

格图洛书
发表于2021-11-19 00:10:22
5645 0 0

5.6k 0 0

前言语音系统中语音内容识别 ( ASR ) 的精准性，是影响智能语音产品发展的关键制约因素，用户query的文本，通常是由ASR系统将用户的语音命令转换而成，但由于技术上的原因，这些由ASR生成的文本可能包含错误，继而导致后续的用户意图理解出现偏差。如何利用NLP技术对ASR的query文本进行预处理纠错成了一个亟待解决的问题。 ...
深度学习自然语言处理基础
深度学习核心技术精讲100篇（三十八）-滴滴司机调度系统实践
前言随着移动互联网的兴起，网约车逐渐成为了大众常用的一个出行选择。但在网约车平台上经常出现这种情况：有时候乘客抱怨打不到车，与此同时其他地方的司机却没有订单接，长时间空驶。这就是典型的供需不平衡问题，即乘客和司机的自然分布出现了错配。这一方面让很多乘客的出行需求得不到满足，另一方面也让很多司机空驶等待，运力资源没有充分利用。如何解决...

格图洛书
发表于2021-11-19 00:09:12
3081 0 0

3.0k 0 0

前言随着移动互联网的兴起，网约车逐渐成为了大众常用的一个出行选择。但在网约车平台上经常出现这种情况：有时候乘客抱怨打不到车，与此同时其他地方的司机却没有订单接，长时间空驶。这就是典型的供需不平衡问题，即乘客和司机的自然分布出现了错配。这一方面让很多乘客的出行需求得不到满足，另一方面也让很多司机空驶等待，运力资源没有充分利用。如何解决...
深度学习

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript