- “探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的第一篇文章,将深入介绍推荐引擎的工作原理,... “探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的第一篇文章,将深入介绍推荐引擎的工作原理,...
- 在用户对自己需求相对明确的时候,用搜索引擎很方便的通过关键字搜索很快的找到自己需要的信息。但搜索引擎并不能完全满足用户对信息发现的需求,那是因为在很多情况下,用户其实并不明确自己的需要,或者他们的需求很难用简单的关键字来表述。又或者他们需要更加符合他们个人口味和喜好的结果,因此出现了推荐系统,与搜索引擎对应,大家也习惯称... 在用户对自己需求相对明确的时候,用搜索引擎很方便的通过关键字搜索很快的找到自己需要的信息。但搜索引擎并不能完全满足用户对信息发现的需求,那是因为在很多情况下,用户其实并不明确自己的需要,或者他们的需求很难用简单的关键字来表述。又或者他们需要更加符合他们个人口味和喜好的结果,因此出现了推荐系统,与搜索引擎对应,大家也习惯称...
- 假设一个 mp3 搜索引擎收录了 2^24 首歌曲,并记录了可收听这些歌曲的 2^30 条 URL,但每首歌的 URL 不超过 2^10 个。系统会定期检查这些 URL,如果一个 URL 不可用则不出现在搜索结果中。现在歌曲名和 URL 分别通过整型的 SONG_ID 和 URL_ID 唯一确定。对该系统有如下需求: 1) 通过 SO... 假设一个 mp3 搜索引擎收录了 2^24 首歌曲,并记录了可收听这些歌曲的 2^30 条 URL,但每首歌的 URL 不超过 2^10 个。系统会定期检查这些 URL,如果一个 URL 不可用则不出现在搜索结果中。现在歌曲名和 URL 分别通过整型的 SONG_ID 和 URL_ID 唯一确定。对该系统有如下需求: 1) 通过 SO...
- chrome窗口和标签页快捷键: Ctrl+N 打开新窗口 Ctrl+T 打开新标签页 Ctrl+Shift+N 在隐身模式下打开新窗口 Ctrl+O,然后选择文件 在谷歌浏览器中打开计算机上的文件 按住 Ctrl 键,然后点击链接 从后... chrome窗口和标签页快捷键: Ctrl+N 打开新窗口 Ctrl+T 打开新标签页 Ctrl+Shift+N 在隐身模式下打开新窗口 Ctrl+O,然后选择文件 在谷歌浏览器中打开计算机上的文件 按住 Ctrl 键,然后点击链接 从后...
- 前言 Indri是Lemur项目衍生的一个基于语言模型的新的搜索引擎,由University of Massachusetts和Carnegie Mellon University合作开发。 安装 下载。下载Indri并进入indri文件夹的顶层目录!!! 修改configure文件权限。确认其中的configure文件的权... 前言 Indri是Lemur项目衍生的一个基于语言模型的新的搜索引擎,由University of Massachusetts和Carnegie Mellon University合作开发。 安装 下载。下载Indri并进入indri文件夹的顶层目录!!! 修改configure文件权限。确认其中的configure文件的权...
- 搜索引擎是信息检索(IR)系统的通俗叫法。虽然研究和开发人员看待IR系统的眼光更宽一些,但用户想到它们更多的是根据他们期望系统能做的功能 — 即搜索网络,或者企业内部网,或者一个数据库。 事实上用户会更喜欢一个发现引擎,而不仅仅是一个搜索引擎。 搜索引擎匹配查询到它们创建的索引上。这个索引包含每个文档的单词,和能指向文儿当地址的指针... 搜索引擎是信息检索(IR)系统的通俗叫法。虽然研究和开发人员看待IR系统的眼光更宽一些,但用户想到它们更多的是根据他们期望系统能做的功能 — 即搜索网络,或者企业内部网,或者一个数据库。 事实上用户会更喜欢一个发现引擎,而不仅仅是一个搜索引擎。 搜索引擎匹配查询到它们创建的索引上。这个索引包含每个文档的单词,和能指向文儿当地址的指针...
- <template> <div class="hello"> <el-input v-model="title" placeholder="请输入内容">&... <template> <div class="hello"> <el-input v-model="title" placeholder="请输入内容">&...
- lucene的基本说明 /// lucene.net:全文检索的工具包,不是应用,只是个类库,完成了全文检索的功能 /// 就是把数据拆分—存起来—查询时—拆分—匹配—结果 /// /// Analys... lucene的基本说明 /// lucene.net:全文检索的工具包,不是应用,只是个类库,完成了全文检索的功能 /// 就是把数据拆分—存起来—查询时—拆分—匹配—结果 /// /// Analys...
- 文章目录 前言 I 、禁止收录机制 II、搜索引擎蜘蛛就相当于一个禁用了Cookies的浏览器 III、动态URL应尽量避免,因为它不利于搜索引擎蜘蛛爬行 IV、尽量不... 文章目录 前言 I 、禁止收录机制 II、搜索引擎蜘蛛就相当于一个禁用了Cookies的浏览器 III、动态URL应尽量避免,因为它不利于搜索引擎蜘蛛爬行 IV、尽量不...
- 【NLP】⚠️学不会打我! 半小时学会基本操作 1⚠️ 分词 概述分词器 jieba安装精确分词全模式搜索引擎模式获取词性 概述 从今天开始我们将开启一段自然语言处理 (NLP) 的旅程.... 【NLP】⚠️学不会打我! 半小时学会基本操作 1⚠️ 分词 概述分词器 jieba安装精确分词全模式搜索引擎模式获取词性 概述 从今天开始我们将开启一段自然语言处理 (NLP) 的旅程....
- 目录 文章目录 目录 日志与审计 监控与告警 配置中心 文档中心 日志与审计 日志分析组件应该在微服务兴起之前就被广泛使用了。即使单体应用架构,当访问数变大、或服务器规模增多时,日志文件的大小会膨胀到难以用文本编辑器进行访问,更糟的是它们分散在多台服务器上面。排查一个问题,需要登录到各台服务器去获取日志文件,一个一个... 目录 文章目录 目录 日志与审计 监控与告警 配置中心 文档中心 日志与审计 日志分析组件应该在微服务兴起之前就被广泛使用了。即使单体应用架构,当访问数变大、或服务器规模增多时,日志文件的大小会膨胀到难以用文本编辑器进行访问,更糟的是它们分散在多台服务器上面。排查一个问题,需要登录到各台服务器去获取日志文件,一个一个...
- 搜索引擎原理第三阶段之排名 文章目录 搜索引擎原理第三阶段之排名 前言 一、搜索词处理 1、中文分词 2、去停止词 3、指令处理 4、拼写错误矫正 5、整合搜索触发 6、搜索框提示 二、文件匹配 三、初始子集的选择 四、相关性计算 1、关键词常用程度 2、词频及密度 3、关键词位置及形式 4、关键词距离 ... 搜索引擎原理第三阶段之排名 文章目录 搜索引擎原理第三阶段之排名 前言 一、搜索词处理 1、中文分词 2、去停止词 3、指令处理 4、拼写错误矫正 5、整合搜索触发 6、搜索框提示 二、文件匹配 三、初始子集的选择 四、相关性计算 1、关键词常用程度 2、词频及密度 3、关键词位置及形式 4、关键词距离 ...
- 搜索引擎原理第一阶段之爬行和抓取 文章目录 搜索引擎原理第一阶段之爬行和抓取 前言 一、蜘蛛 二、跟踪链接 三、吸引蜘蛛 四、地址库 五、文件存储 六、爬行时的复制内容检测 前言 搜索引擎工作过程非常复杂,接下来的我用三篇文章简单介绍搜索引擎是怎样实现网页排名的。这里介绍的内容相对于真正的搜索... 搜索引擎原理第一阶段之爬行和抓取 文章目录 搜索引擎原理第一阶段之爬行和抓取 前言 一、蜘蛛 二、跟踪链接 三、吸引蜘蛛 四、地址库 五、文件存储 六、爬行时的复制内容检测 前言 搜索引擎工作过程非常复杂,接下来的我用三篇文章简单介绍搜索引擎是怎样实现网页排名的。这里介绍的内容相对于真正的搜索...
- 搜索引擎之链接原理 文章目录 搜索引擎之链接原理 前言 一、李彦宏超链分析专利 二、HITS算法 三、TrustRank算法 四、Google PR 1. PR的概念和计算 2.PR的两个比喻模型 3.工具条PR 4.关于PR的几个误解 5.PR的意义 五、Hilltop算法 前言 在... 搜索引擎之链接原理 文章目录 搜索引擎之链接原理 前言 一、李彦宏超链分析专利 二、HITS算法 三、TrustRank算法 四、Google PR 1. PR的概念和计算 2.PR的两个比喻模型 3.工具条PR 4.关于PR的几个误解 5.PR的意义 五、Hilltop算法 前言 在...
- PageRanke算法的工作原理 PageRank的作用是评价网页的重要性,以此作为搜索结果的排序重要依据之一。 早期的搜索引擎的做法: 一、根本不评价结果重要性: 直接按照某自然顺序(例如时间顺序或编号顺序)返回结果,只能适用于结果集比较少的情况。 二、基于检索词的评价 TF-IDF: 基于检索词评价的思想非常朴素: 检索词匹配度越高的页面重要性越高。 “... PageRanke算法的工作原理 PageRank的作用是评价网页的重要性,以此作为搜索结果的排序重要依据之一。 早期的搜索引擎的做法: 一、根本不评价结果重要性: 直接按照某自然顺序(例如时间顺序或编号顺序)返回结果,只能适用于结果集比较少的情况。 二、基于检索词的评价 TF-IDF: 基于检索词评价的思想非常朴素: 检索词匹配度越高的页面重要性越高。 “...
上滑加载中
推荐直播
-
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中 -
华为云码道全新升级,多会话并行与多智能体协作2026/05/08 周五 19:00-21:00
王一男-华为云码道产品专家;张嘉冉-华为云码道工程师;胡琦-华为云HCDE;程诗杰-华为云HCDG
华为云码道4月份版本全新升级,此次直播深度解读4月份产品特性,通过“特性解读+实操演示+实战案例+设计创新”的组合,全方位展现码道在多会话并行与多智能体协作方面的能力,赋能开发者提升效率
正在直播
热门标签