- 欠拟合与过拟合 概述线性回归逻辑回归解决过拟合的方法欠拟合过拟合 概述 机器学习中的泛化. 泛化即是, 模型学习到的概念在它处于学习的过程中时的模型没有遇见过的样本时候的表现. 在机器... 欠拟合与过拟合 概述线性回归逻辑回归解决过拟合的方法欠拟合过拟合 概述 机器学习中的泛化. 泛化即是, 模型学习到的概念在它处于学习的过程中时的模型没有遇见过的样本时候的表现. 在机器...
- [toc] 什么是机器学习 对于某给定的任务 T, 在合理的性能度量方案 P 的前提下, 某计算机程序可以自主学习任务 T 的经验 E. 随着提供合适, 优质, 大量的经验 E, 该程序对于任务 T 的性能逐步提高. 换个表述: 机器学习是人工智能的一个分支. 我们使用计算机设计一个系统, 使它能够根据提供的训练数... [toc] 什么是机器学习 对于某给定的任务 T, 在合理的性能度量方案 P 的前提下, 某计算机程序可以自主学习任务 T 的经验 E. 随着提供合适, 优质, 大量的经验 E, 该程序对于任务 T 的性能逐步提高. 换个表述: 机器学习是人工智能的一个分支. 我们使用计算机设计一个系统, 使它能够根据提供的训练数...
- [toc] 练习一 现在我们有 2015 到 2017 年 25 万条 911 的紧急电话的数据, 请统计出这些数据中不同类型的紧急情况的次数. 执行结果: [toc] 练习一 现在我们有 2015 到 2017 年 25 万条 911 的紧急电话的数据, 请统计出这些数据中不同类型的紧急情况的次数. 执行结果:
- [toc] 练习一 让我们尝试一下刚刚的方法去统计狗狗名字的数据 很多同学肯定想知道使用次数最高的前几个名字是什呢? 执行结果: 如果我的数据有 10 列, 我想按照其中的第一, 第三, 第八列排序, 怎么办? ( 查看 ipython 的帮助文档 ) [toc] 练习一 让我们尝试一下刚刚的方法去统计狗狗名字的数据 很多同学肯定想知道使用次数最高的前几个名字是什呢? 执行结果: 如果我的数据有 10 列, 我想按照其中的第一, 第三, 第八列排序, 怎么办? ( 查看 ipython 的帮助文档 )
- [toc] PeriodIndex 之前所学习的 DatatimeIndex 可以理解为时间戳. 那么现在我们要学习的 PeriodIndex 可以理解为时间段. 执行结果: 那么如果给这个时间段降采样呢? 执行结果: [toc] PeriodIndex 之前所学习的 DatatimeIndex 可以理解为时间戳. 那么现在我们要学习的 PeriodIndex 可以理解为时间段. 执行结果: 那么如果给这个时间段降采样呢? 执行结果:
- 练习四 现在我们有北上广, 深圳, 和沈阳 5 个城市的 PM2.5 随时间的变化情况. 观察这组数据中的时间结构, 并不是字符串, 这个时候我们应该怎么办? 执行结果: 练习四 现在我们有北上广, 深圳, 和沈阳 5 个城市的 PM2.5 随时间的变化情况. 观察这组数据中的时间结构, 并不是字符串, 这个时候我们应该怎么办? 执行结果:
- [toc] 练习二 对于一组电影数据, 如果我们想 rating, runtime 的分布情况, 应该如何呈现数据? 执行结果: 执行结果: [toc] 练习二 对于一组电影数据, 如果我们想 rating, runtime 的分布情况, 应该如何呈现数据? 执行结果: 执行结果:
- [toc] Numpy 读取数据 CSV: Comma-Separated Value, 逗号分隔文件 显示: 表格状态 源文件: 换行和逗号分隔行列的格式化文本, 每一行的数据表示一条记录 由于 csv 便于展示, 读取和写入, 所以很多地方也是用 csv 的格式存储和传输中小型的数据, 为了方便教学, 我们会经常操作 cs... [toc] Numpy 读取数据 CSV: Comma-Separated Value, 逗号分隔文件 显示: 表格状态 源文件: 换行和逗号分隔行列的格式化文本, 每一行的数据表示一条记录 由于 csv 便于展示, 读取和写入, 所以很多地方也是用 csv 的格式存储和传输中小型的数据, 为了方便教学, 我们会经常操作 cs...
- [toc] Pandas 之取行或者列 刚刚我们知道了如何给数据按照某一行或者排序, 那么现在我们想单独研究使用次数前 100 的数据, 应该如何做? 我们具体要选择某一行该怎么选择呢? 我们要同时选择和列该怎么办? pandas 之 loc 1. df.loc 通过标签索引行数据 2. df.iloc 通过位置获取行数据... [toc] Pandas 之取行或者列 刚刚我们知道了如何给数据按照某一行或者排序, 那么现在我们想单独研究使用次数前 100 的数据, 应该如何做? 我们具体要选择某一行该怎么选择呢? 我们要同时选择和列该怎么办? pandas 之 loc 1. df.loc 通过标签索引行数据 2. df.iloc 通过位置获取行数据...
- [toc] Pandas 之时间序列 为什么要学习 pandas 中的时间序列 不管在什么行业, 时间序列都是一种非常重要的数据形式, 很多统计数据以及数据的规律也都和时间序列有着非常重要的联系, 而且在 pandas 中处理时间序列是非常简单的. 生成一段时间范围 start 和 end 以及 freq 配合能够生成 s... [toc] Pandas 之时间序列 为什么要学习 pandas 中的时间序列 不管在什么行业, 时间序列都是一种非常重要的数据形式, 很多统计数据以及数据的规律也都和时间序列有着非常重要的联系, 而且在 pandas 中处理时间序列是非常简单的. 生成一段时间范围 start 和 end 以及 freq 配合能够生成 s...
- [toc] Pandas 之 DataFrame 和一个 ndarray 一样, 我们通过 shape, ndim, dtype 了解这个 ndarray 的基本信息, 那么对于 DataFarme 我们有什么方法了解呢? DataFrame 的基础属性 df.shape # 行数 列数 df.dtypes # 列数据类型 ... [toc] Pandas 之 DataFrame 和一个 ndarray 一样, 我们通过 shape, ndim, dtype 了解这个 ndarray 的基本信息, 那么对于 DataFarme 我们有什么方法了解呢? DataFrame 的基础属性 df.shape # 行数 列数 df.dtypes # 列数据类型 ...
- 分类器性能评估 概述sklearn.metrics.classification_report 概述 在许多实际问题中, 衡量分类器任务的成功程度是通过固定的性能指标来获取. 一般常见使用... 分类器性能评估 概述sklearn.metrics.classification_report 概述 在许多实际问题中, 衡量分类器任务的成功程度是通过固定的性能指标来获取. 一般常见使用...
- [toc] Numpy 索引和切片 对于刚刚加载出来的数据, 我如果只想选择其中的某一列 ( 行 ) 我们应该怎么做呢? 其实操作很简单, 和 Python 中列表的操作一样 执行结果: 执行结果: 执行结果: 执行结果: [toc] Numpy 索引和切片 对于刚刚加载出来的数据, 我如果只想选择其中的某一列 ( 行 ) 我们应该怎么做呢? 其实操作很简单, 和 Python 中列表的操作一样 执行结果: 执行结果: 执行结果: 执行结果:
- [toc] 练习一 现在我们有一组关于全球星巴克店铺的统计数据, 如果我想知道美国的星巴克数量和中国的哪个多, 那么应该怎么办? 思路: 遍历一遍, 每次加 1? 执行结果: 分组和聚合 在 pandas 中类似的分组的操作我们有很简单的方式来完成. 调用 groupy 方法之后返回的是什么内容? ... [toc] 练习一 现在我们有一组关于全球星巴克店铺的统计数据, 如果我想知道美国的星巴克数量和中国的哪个多, 那么应该怎么办? 思路: 遍历一遍, 每次加 1? 执行结果: 分组和聚合 在 pandas 中类似的分组的操作我们有很简单的方式来完成. 调用 groupy 方法之后返回的是什么内容? ...
- 推荐系统 概述什么是推荐系统 工作原理个性化推荐系统的应用 概述 在研究图和涉及推荐系统之前, 了解上面是好的推荐系统至关重要. 什么是推荐系统 假设以下, 如果你想买牛肉干, 你... 推荐系统 概述什么是推荐系统 工作原理个性化推荐系统的应用 概述 在研究图和涉及推荐系统之前, 了解上面是好的推荐系统至关重要. 什么是推荐系统 假设以下, 如果你想买牛肉干, 你...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签