- 前言 许多刚入门数据分析的小伙伴对一些数据指标或者数据本身的概念很模糊,尤其是当跟运营、数据分析师扯需求的时候,会被这些密密麻麻的指标给弄糊涂。 作为互联网从业人员,目前看来对数据指标、指标的运用还是需要再深入学习下。终于挤出一些时间重新梳理了关于数据指标相关的一些知识,先梳理下数据指标基础知识... 前言 许多刚入门数据分析的小伙伴对一些数据指标或者数据本身的概念很模糊,尤其是当跟运营、数据分析师扯需求的时候,会被这些密密麻麻的指标给弄糊涂。 作为互联网从业人员,目前看来对数据指标、指标的运用还是需要再深入学习下。终于挤出一些时间重新梳理了关于数据指标相关的一些知识,先梳理下数据指标基础知识...
- 前言 随着在线音乐商城及流媒体音乐服务的出现,数字音乐分发已经使得音乐触手可及。然而,面对突然出现的海量可收听内容,听众很容易面临信息过载的问题。因此,本次分享的主题音乐推荐系统,将为那些面临海量内容的用户提供一些引导。本文将重点介绍其中的两种音乐推荐系统:基于内容和上下文的音乐推荐。 01基于内容的音乐推荐 内容信息涵盖了任何可... 前言 随着在线音乐商城及流媒体音乐服务的出现,数字音乐分发已经使得音乐触手可及。然而,面对突然出现的海量可收听内容,听众很容易面临信息过载的问题。因此,本次分享的主题音乐推荐系统,将为那些面临海量内容的用户提供一些引导。本文将重点介绍其中的两种音乐推荐系统:基于内容和上下文的音乐推荐。 01基于内容的音乐推荐 内容信息涵盖了任何可...
- 前言 广告是支撑互联网高速发展的经济基石,也是很多互联网公司的重要收入来源。字节跳动的广告平台管理着 EB 量级的数据和服务着数以千万的商业用户,其中 ClickHouse 作为核心引擎支撑了海量数据在线分析的需求。本次分享,将介绍 ClickHouse 在字节跳动广告业务上的应用与实践,包含人群预估、数据分析、人群画像等多个场景。并... 前言 广告是支撑互联网高速发展的经济基石,也是很多互联网公司的重要收入来源。字节跳动的广告平台管理着 EB 量级的数据和服务着数以千万的商业用户,其中 ClickHouse 作为核心引擎支撑了海量数据在线分析的需求。本次分享,将介绍 ClickHouse 在字节跳动广告业务上的应用与实践,包含人群预估、数据分析、人群画像等多个场景。并...
- 前言 关联规则分析就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。 “啤酒与尿布”的例子相信很多人都听说过吧,故事是这样的:在一家超市中,人们发现了一个特别有趣的现象,尿布与啤酒这两种风马牛不相及的商品居然摆在一起。但这一奇怪的举措居然使尿布和啤酒的销... 前言 关联规则分析就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。 “啤酒与尿布”的例子相信很多人都听说过吧,故事是这样的:在一家超市中,人们发现了一个特别有趣的现象,尿布与啤酒这两种风马牛不相及的商品居然摆在一起。但这一奇怪的举措居然使尿布和啤酒的销...
- 本文主要在Spark平台下实现一个机器学习应用,该应用主要涉及LDA主题模型以及K-means聚类。通过本文你可以了解到: 文本挖掘的基本流程 LDA主题模型算法 K-means算法 Spark平台下LDA主题模型实现 Spark平台下基于LDA的K-means算法实现 1.文本挖掘模块设计 1.... 本文主要在Spark平台下实现一个机器学习应用,该应用主要涉及LDA主题模型以及K-means聚类。通过本文你可以了解到: 文本挖掘的基本流程 LDA主题模型算法 K-means算法 Spark平台下LDA主题模型实现 Spark平台下基于LDA的K-means算法实现 1.文本挖掘模块设计 1....
- 前言 有人离职是因为“世界那么大,我想去看看”,也有人觉得“怀有绝技在身,不怕天下无路”。 文中涉及完整源码请参见, Python源码集锦-员工离职预测模型 员工离职对于企业而言有什么影响呢? 数据分析精华案例-员工流失建模与预测实例 要知道,业培养人才需要大量的成本,为了防止人才再次流失,员工流失分析就显得十分重要了。... 前言 有人离职是因为“世界那么大,我想去看看”,也有人觉得“怀有绝技在身,不怕天下无路”。 文中涉及完整源码请参见, Python源码集锦-员工离职预测模型 员工离职对于企业而言有什么影响呢? 数据分析精华案例-员工流失建模与预测实例 要知道,业培养人才需要大量的成本,为了防止人才再次流失,员工流失分析就显得十分重要了。...
- 前言 以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟! MATLAB-30天带你从入门到精通 MATLAB深入理解高级教程(附源码) tableau可视化数据分析高级教程 01部分结论:TikTok的大幅上涨来源 1. 供给侧 ( 努力 ) 内容量大幅提升:主要来自于开放跟拍... 前言 以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟! MATLAB-30天带你从入门到精通 MATLAB深入理解高级教程(附源码) tableau可视化数据分析高级教程 01部分结论:TikTok的大幅上涨来源 1. 供给侧 ( 努力 ) 内容量大幅提升:主要来自于开放跟拍...
- 前言 近年来,随着 GDPR 通用数据保护条例出台以及一些互联网公司数据隐私泄漏等事件的发生,数据隐私的保护问题在行业应用中备受关注。与数据密切相关的机器学习算法的安全性成为一个巨大挑战。本文将介绍在机器学习领域中数据隐私安全的相关工作,并介绍第四范式在差分隐私算法效果提升上所做的工作。 主要和大家分享数据隐私的3方面: 隐... 前言 近年来,随着 GDPR 通用数据保护条例出台以及一些互联网公司数据隐私泄漏等事件的发生,数据隐私的保护问题在行业应用中备受关注。与数据密切相关的机器学习算法的安全性成为一个巨大挑战。本文将介绍在机器学习领域中数据隐私安全的相关工作,并介绍第四范式在差分隐私算法效果提升上所做的工作。 主要和大家分享数据隐私的3方面: 隐...
- 前言 58同城作为分类信息网站,服务覆盖多个领域,如房屋租售、招聘求职、二手买卖等等,不同的业务有不同的特点,这使得多业务融合推荐成为一大挑战。如何准确挖掘用户的需求?如何平衡各业务之间的流量分配?如何增加多样性提升用户体验? 以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟! MATLAB... 前言 58同城作为分类信息网站,服务覆盖多个领域,如房屋租售、招聘求职、二手买卖等等,不同的业务有不同的特点,这使得多业务融合推荐成为一大挑战。如何准确挖掘用户的需求?如何平衡各业务之间的流量分配?如何增加多样性提升用户体验? 以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟! MATLAB...
- 一、决策树 所谓决策树,就是自顶而下树形的结构,每一个节点都是一个属性。用决策树解决问题就是根据数据属性一层一层做决策的过程 好处:结构清晰,模仿人类思考的流程。 以下为某商品经过推销后,收集回来的客户信息,包括居住地区、住房类型、收入、是否老客户四种属性,最后一列代表该客户买没买。 1.用树状的结构表示上面的信息表... 一、决策树 所谓决策树,就是自顶而下树形的结构,每一个节点都是一个属性。用决策树解决问题就是根据数据属性一层一层做决策的过程 好处:结构清晰,模仿人类思考的流程。 以下为某商品经过推销后,收集回来的客户信息,包括居住地区、住房类型、收入、是否老客户四种属性,最后一列代表该客户买没买。 1.用树状的结构表示上面的信息表...
- 前言 目前,双塔结构在推荐领域里已经是个常规方法了,在召回和粗排环节的模型选型中,被广泛采用。其实,不仅仅是在推荐领域,在其它领域,双塔结构也已经被越来越多得用起来了。比如,在当代搜索引擎的召回环节,除了常见的经典倒排索引来对Query和Document进行文本字面匹配外,经常也会增加一路基于Bert模型的双塔结构,将用户查询Quer... 前言 目前,双塔结构在推荐领域里已经是个常规方法了,在召回和粗排环节的模型选型中,被广泛采用。其实,不仅仅是在推荐领域,在其它领域,双塔结构也已经被越来越多得用起来了。比如,在当代搜索引擎的召回环节,除了常见的经典倒排索引来对Query和Document进行文本字面匹配外,经常也会增加一路基于Bert模型的双塔结构,将用户查询Quer...
- 前言 随着深度学习的普及,有越来越多的研究应用新模型到中文分词上,让人直呼“手快有,手慢无”。不过这些神经网络方法的真实水平如何?具体数值多少?以Sighan05中的PKU数据集为例,真像一些论文所言,一个LSTM-CRF就有96.5%吗?或者像某些工业界人士那样,动辄“基于深度学习的98%准确率”,“99% 的分词成功率”吗? 如... 前言 随着深度学习的普及,有越来越多的研究应用新模型到中文分词上,让人直呼“手快有,手慢无”。不过这些神经网络方法的真实水平如何?具体数值多少?以Sighan05中的PKU数据集为例,真像一些论文所言,一个LSTM-CRF就有96.5%吗?或者像某些工业界人士那样,动辄“基于深度学习的98%准确率”,“99% 的分词成功率”吗? 如...
- 前言 一次偶然看到一个换脸的视频,觉得实在是很神奇,于是饶有兴致的去了解一下换脸算法。原来背后有一个极为有意思的算法思想——对抗生成。 随后各种各样的GAN算法以指数级增长的方式涌现出来,比如WGAN(Wasserstein GAN),CGAN(condition gan),SRGAN(super resolution gan)等。... 前言 一次偶然看到一个换脸的视频,觉得实在是很神奇,于是饶有兴致的去了解一下换脸算法。原来背后有一个极为有意思的算法思想——对抗生成。 随后各种各样的GAN算法以指数级增长的方式涌现出来,比如WGAN(Wasserstein GAN),CGAN(condition gan),SRGAN(super resolution gan)等。...
- 前言 随着互联网时代的发展,表情包成为现在大家网上交流的必备工具,针对表情搜索的产品需求,经历了从ElasticSearch到Lucene再到结合语义的搜索实践之路。不同阶段的技术选型可能可以为大家提供一些中小体量业务垂直领域搜索的落地思路。 逗芽表情搜索 爱奇艺逗芽表情(https://douya... 前言 随着互联网时代的发展,表情包成为现在大家网上交流的必备工具,针对表情搜索的产品需求,经历了从ElasticSearch到Lucene再到结合语义的搜索实践之路。不同阶段的技术选型可能可以为大家提供一些中小体量业务垂直领域搜索的落地思路。 逗芽表情搜索 爱奇艺逗芽表情(https://douya...
- 前言 在实际工作中,你是否遇到过这样一个问题或痛点:无论是通过哪种方式获取的标注数据,数据标注质量可能不过关,存在一些错误?亦或者是数据标注的标准不统一、存在一些歧义?特别是badcase反馈回来,发现训练集标注的居然和badcase一样?如下图所示,QuickDraw、MNIST和Amazon Reviews数据集中... 前言 在实际工作中,你是否遇到过这样一个问题或痛点:无论是通过哪种方式获取的标注数据,数据标注质量可能不过关,存在一些错误?亦或者是数据标注的标准不统一、存在一些歧义?特别是badcase反馈回来,发现训练集标注的居然和badcase一样?如下图所示,QuickDraw、MNIST和Amazon Reviews数据集中...
上滑加载中
推荐直播
-
昇腾AI算法挑战赛-核心算子如何优化?专家带你深度解析2025/11/17 周一 16:00-17:00
王老师 华为算子专家
昇腾AI算法挑战赛进阶赛战鼓催征!本期直播间,我们特邀华为算子专家王老师,为你深度剖析Matmul、wholereducesum等核心算子的底层原理与优化技巧,直击赛题核心。想提升代码效率、冲击更高排名?锁定直播,带你破局!
回顾中 -
AI编码实干派,“码”力全开2026/02/26 周四 15:00-16:30
谈宗玮/于邦旭/丁俊卿/陈云亮/王一男
【中国,深圳,2026年2月26日】,以“AI编码实干派,码力全开”为主题的华为云码道(CodeArts)代码智能体新春发布会在线上成功召开。华为云码道公测版正式发布,为开发者和企业提供具备工程化能力的智能编码解决方案。
回顾中 -
华为云码道-玩转OpenClaw,在线养虾2026/03/11 周三 19:00-21:00
刘昱,华为云高级工程师/谈心,华为云技术专家/李海仑,上海圭卓智能科技有限公司CEO
OpenClaw 火爆开发者圈,华为云码道最新推出 Skill ——开发者只需输入一句口令,即可部署一个功能完整的「小龙虾」智能体。直播带你玩转华为云码道,玩转OpenClaw
回顾中
热门标签