- [toc] 思考 对于这一组电影数据, 如果我们希望统计电影分类 ( genre ) 的情况, 应该如何处理数据? 思路: 重新构造一个全为 0 的数组, 类名为分类, 如果某一条数据中分类出现过, 就让 0 变为 1. 执行结果: [toc] 思考 对于这一组电影数据, 如果我们希望统计电影分类 ( genre ) 的情况, 应该如何处理数据? 思路: 重新构造一个全为 0 的数组, 类名为分类, 如果某一条数据中分类出现过, 就让 0 变为 1. 执行结果:
- 回归算法之回归 概述sklearn.linear_model.Ridge方法属性 概述 具有 L2 正则化的线性最小二乘法. 岭回归是一种专用于共线数据分析的有便估计回归方法, 实质上是一... 回归算法之回归 概述sklearn.linear_model.Ridge方法属性 概述 具有 L2 正则化的线性最小二乘法. 岭回归是一种专用于共线数据分析的有便估计回归方法, 实质上是一...
- 【NLP】⚠️学不会打我! 半小时学会基本操作 4⚠️词向量模型 概述词向量词向量维度Word2VecCBOW 模型Skip-Gram 模型 负采样模型词向量的训练过程1. 初始化词向量矩阵2... 【NLP】⚠️学不会打我! 半小时学会基本操作 4⚠️词向量模型 概述词向量词向量维度Word2VecCBOW 模型Skip-Gram 模型 负采样模型词向量的训练过程1. 初始化词向量矩阵2...
- 基于协同过滤的推荐系统 概述用户行为数据简介用户行为分析基于物品的协同过滤算法计算物品相似度计算被推荐物品的兴趣 概述 为了让推荐结果符合用户口味, 我们需要深入了解用户和物品. 用户... 基于协同过滤的推荐系统 概述用户行为数据简介用户行为分析基于物品的协同过滤算法计算物品相似度计算被推荐物品的兴趣 概述 为了让推荐结果符合用户口味, 我们需要深入了解用户和物品. 用户...
- [toc] 练习三 现在我们有 2015 到 2017 年 25 万条 911 的紧急电话的数据, 请统计出不同月份不同类型紧急电话的次数的变化情况. 执行结果: [toc] 练习三 现在我们有 2015 到 2017 年 25 万条 911 的紧急电话的数据, 请统计出不同月份不同类型紧急电话的次数的变化情况. 执行结果:
- [toc] 练习二 现在我们有 2015 到 2017 年 25 万条 911 的紧急电话的数据, 请统计出不同季度的电话次数. 执行结果: strftime() 方法 strftime() 函数接收以时间元组, 并返回以可读字符串表示的当地时间, 格式由参数 format 决定. [toc] 练习二 现在我们有 2015 到 2017 年 25 万条 911 的紧急电话的数据, 请统计出不同季度的电话次数. 执行结果: strftime() 方法 strftime() 函数接收以时间元组, 并返回以可读字符串表示的当地时间, 格式由参数 format 决定.
- 回归算法 概述 概述 回归是统计学中最有力的工具之一. 机器学习监督学习算法分类算法和回归算法两种. 其实就是根据类别标签分类型为离散型, 连续性而定义的. 回归算法用于连续型分布预测, ... 回归算法 概述 概述 回归是统计学中最有力的工具之一. 机器学习监督学习算法分类算法和回归算法两种. 其实就是根据类别标签分类型为离散型, 连续性而定义的. 回归算法用于连续型分布预测, ...
- [toc] Pandas 之读取外部数据 现在假设我们有一组关于狗的名字的统计数据, 那么为了观察这组数据的情况, 我们应该怎么做呢? 我们的这组数据存在csv中, 我们可以使用 pd.read csv 即可 执行结果: 和我们想象的有些差别, 我们以为他会是一个 Series 类型,但是他是一个 DataFram... [toc] Pandas 之读取外部数据 现在假设我们有一组关于狗的名字的统计数据, 那么为了观察这组数据的情况, 我们应该怎么做呢? 我们的这组数据存在csv中, 我们可以使用 pd.read csv 即可 执行结果: 和我们想象的有些差别, 我们以为他会是一个 Series 类型,但是他是一个 DataFram...
- 欠拟合与过拟合 概述线性回归逻辑回归解决过拟合的方法欠拟合过拟合 概述 机器学习中的泛化. 泛化即是, 模型学习到的概念在它处于学习的过程中时的模型没有遇见过的样本时候的表现. 在机器... 欠拟合与过拟合 概述线性回归逻辑回归解决过拟合的方法欠拟合过拟合 概述 机器学习中的泛化. 泛化即是, 模型学习到的概念在它处于学习的过程中时的模型没有遇见过的样本时候的表现. 在机器...
- [toc] 什么是机器学习 对于某给定的任务 T, 在合理的性能度量方案 P 的前提下, 某计算机程序可以自主学习任务 T 的经验 E. 随着提供合适, 优质, 大量的经验 E, 该程序对于任务 T 的性能逐步提高. 换个表述: 机器学习是人工智能的一个分支. 我们使用计算机设计一个系统, 使它能够根据提供的训练数... [toc] 什么是机器学习 对于某给定的任务 T, 在合理的性能度量方案 P 的前提下, 某计算机程序可以自主学习任务 T 的经验 E. 随着提供合适, 优质, 大量的经验 E, 该程序对于任务 T 的性能逐步提高. 换个表述: 机器学习是人工智能的一个分支. 我们使用计算机设计一个系统, 使它能够根据提供的训练数...
- [toc] 练习一 现在我们有 2015 到 2017 年 25 万条 911 的紧急电话的数据, 请统计出这些数据中不同类型的紧急情况的次数. 执行结果: [toc] 练习一 现在我们有 2015 到 2017 年 25 万条 911 的紧急电话的数据, 请统计出这些数据中不同类型的紧急情况的次数. 执行结果:
- [toc] 练习一 让我们尝试一下刚刚的方法去统计狗狗名字的数据 很多同学肯定想知道使用次数最高的前几个名字是什呢? 执行结果: 如果我的数据有 10 列, 我想按照其中的第一, 第三, 第八列排序, 怎么办? ( 查看 ipython 的帮助文档 ) [toc] 练习一 让我们尝试一下刚刚的方法去统计狗狗名字的数据 很多同学肯定想知道使用次数最高的前几个名字是什呢? 执行结果: 如果我的数据有 10 列, 我想按照其中的第一, 第三, 第八列排序, 怎么办? ( 查看 ipython 的帮助文档 )
- [toc] PeriodIndex 之前所学习的 DatatimeIndex 可以理解为时间戳. 那么现在我们要学习的 PeriodIndex 可以理解为时间段. 执行结果: 那么如果给这个时间段降采样呢? 执行结果: [toc] PeriodIndex 之前所学习的 DatatimeIndex 可以理解为时间戳. 那么现在我们要学习的 PeriodIndex 可以理解为时间段. 执行结果: 那么如果给这个时间段降采样呢? 执行结果:
- 练习四 现在我们有北上广, 深圳, 和沈阳 5 个城市的 PM2.5 随时间的变化情况. 观察这组数据中的时间结构, 并不是字符串, 这个时候我们应该怎么办? 执行结果: 练习四 现在我们有北上广, 深圳, 和沈阳 5 个城市的 PM2.5 随时间的变化情况. 观察这组数据中的时间结构, 并不是字符串, 这个时候我们应该怎么办? 执行结果:
- [toc] 练习二 对于一组电影数据, 如果我们想 rating, runtime 的分布情况, 应该如何呈现数据? 执行结果: 执行结果: [toc] 练习二 对于一组电影数据, 如果我们想 rating, runtime 的分布情况, 应该如何呈现数据? 执行结果: 执行结果:
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签