- [toc] Pandas 之读取外部数据 现在假设我们有一组关于狗的名字的统计数据, 那么为了观察这组数据的情况, 我们应该怎么做呢? 我们的这组数据存在csv中, 我们可以使用 pd.read csv 即可 执行结果: 和我们想象的有些差别, 我们以为他会是一个 Series 类型,但是他是一个 DataFram... [toc] Pandas 之读取外部数据 现在假设我们有一组关于狗的名字的统计数据, 那么为了观察这组数据的情况, 我们应该怎么做呢? 我们的这组数据存在csv中, 我们可以使用 pd.read csv 即可 执行结果: 和我们想象的有些差别, 我们以为他会是一个 Series 类型,但是他是一个 DataFram...
- 欠拟合与过拟合 概述线性回归逻辑回归解决过拟合的方法欠拟合过拟合 概述 机器学习中的泛化. 泛化即是, 模型学习到的概念在它处于学习的过程中时的模型没有遇见过的样本时候的表现. 在机器... 欠拟合与过拟合 概述线性回归逻辑回归解决过拟合的方法欠拟合过拟合 概述 机器学习中的泛化. 泛化即是, 模型学习到的概念在它处于学习的过程中时的模型没有遇见过的样本时候的表现. 在机器...
- [toc] 什么是机器学习 对于某给定的任务 T, 在合理的性能度量方案 P 的前提下, 某计算机程序可以自主学习任务 T 的经验 E. 随着提供合适, 优质, 大量的经验 E, 该程序对于任务 T 的性能逐步提高. 换个表述: 机器学习是人工智能的一个分支. 我们使用计算机设计一个系统, 使它能够根据提供的训练数... [toc] 什么是机器学习 对于某给定的任务 T, 在合理的性能度量方案 P 的前提下, 某计算机程序可以自主学习任务 T 的经验 E. 随着提供合适, 优质, 大量的经验 E, 该程序对于任务 T 的性能逐步提高. 换个表述: 机器学习是人工智能的一个分支. 我们使用计算机设计一个系统, 使它能够根据提供的训练数...
- [toc] 练习一 现在我们有 2015 到 2017 年 25 万条 911 的紧急电话的数据, 请统计出这些数据中不同类型的紧急情况的次数. 执行结果: [toc] 练习一 现在我们有 2015 到 2017 年 25 万条 911 的紧急电话的数据, 请统计出这些数据中不同类型的紧急情况的次数. 执行结果:
- [toc] 练习一 让我们尝试一下刚刚的方法去统计狗狗名字的数据 很多同学肯定想知道使用次数最高的前几个名字是什呢? 执行结果: 如果我的数据有 10 列, 我想按照其中的第一, 第三, 第八列排序, 怎么办? ( 查看 ipython 的帮助文档 ) [toc] 练习一 让我们尝试一下刚刚的方法去统计狗狗名字的数据 很多同学肯定想知道使用次数最高的前几个名字是什呢? 执行结果: 如果我的数据有 10 列, 我想按照其中的第一, 第三, 第八列排序, 怎么办? ( 查看 ipython 的帮助文档 )
- [toc] PeriodIndex 之前所学习的 DatatimeIndex 可以理解为时间戳. 那么现在我们要学习的 PeriodIndex 可以理解为时间段. 执行结果: 那么如果给这个时间段降采样呢? 执行结果: [toc] PeriodIndex 之前所学习的 DatatimeIndex 可以理解为时间戳. 那么现在我们要学习的 PeriodIndex 可以理解为时间段. 执行结果: 那么如果给这个时间段降采样呢? 执行结果:
- 练习四 现在我们有北上广, 深圳, 和沈阳 5 个城市的 PM2.5 随时间的变化情况. 观察这组数据中的时间结构, 并不是字符串, 这个时候我们应该怎么办? 执行结果: 练习四 现在我们有北上广, 深圳, 和沈阳 5 个城市的 PM2.5 随时间的变化情况. 观察这组数据中的时间结构, 并不是字符串, 这个时候我们应该怎么办? 执行结果:
- [toc] 练习二 对于一组电影数据, 如果我们想 rating, runtime 的分布情况, 应该如何呈现数据? 执行结果: 执行结果: [toc] 练习二 对于一组电影数据, 如果我们想 rating, runtime 的分布情况, 应该如何呈现数据? 执行结果: 执行结果:
- [toc] Numpy 读取数据 CSV: Comma-Separated Value, 逗号分隔文件 显示: 表格状态 源文件: 换行和逗号分隔行列的格式化文本, 每一行的数据表示一条记录 由于 csv 便于展示, 读取和写入, 所以很多地方也是用 csv 的格式存储和传输中小型的数据, 为了方便教学, 我们会经常操作 cs... [toc] Numpy 读取数据 CSV: Comma-Separated Value, 逗号分隔文件 显示: 表格状态 源文件: 换行和逗号分隔行列的格式化文本, 每一行的数据表示一条记录 由于 csv 便于展示, 读取和写入, 所以很多地方也是用 csv 的格式存储和传输中小型的数据, 为了方便教学, 我们会经常操作 cs...
- [toc] Pandas 之取行或者列 刚刚我们知道了如何给数据按照某一行或者排序, 那么现在我们想单独研究使用次数前 100 的数据, 应该如何做? 我们具体要选择某一行该怎么选择呢? 我们要同时选择和列该怎么办? pandas 之 loc 1. df.loc 通过标签索引行数据 2. df.iloc 通过位置获取行数据... [toc] Pandas 之取行或者列 刚刚我们知道了如何给数据按照某一行或者排序, 那么现在我们想单独研究使用次数前 100 的数据, 应该如何做? 我们具体要选择某一行该怎么选择呢? 我们要同时选择和列该怎么办? pandas 之 loc 1. df.loc 通过标签索引行数据 2. df.iloc 通过位置获取行数据...
- [toc] Pandas 之时间序列 为什么要学习 pandas 中的时间序列 不管在什么行业, 时间序列都是一种非常重要的数据形式, 很多统计数据以及数据的规律也都和时间序列有着非常重要的联系, 而且在 pandas 中处理时间序列是非常简单的. 生成一段时间范围 start 和 end 以及 freq 配合能够生成 s... [toc] Pandas 之时间序列 为什么要学习 pandas 中的时间序列 不管在什么行业, 时间序列都是一种非常重要的数据形式, 很多统计数据以及数据的规律也都和时间序列有着非常重要的联系, 而且在 pandas 中处理时间序列是非常简单的. 生成一段时间范围 start 和 end 以及 freq 配合能够生成 s...
- [toc] Pandas 之 DataFrame 和一个 ndarray 一样, 我们通过 shape, ndim, dtype 了解这个 ndarray 的基本信息, 那么对于 DataFarme 我们有什么方法了解呢? DataFrame 的基础属性 df.shape # 行数 列数 df.dtypes # 列数据类型 ... [toc] Pandas 之 DataFrame 和一个 ndarray 一样, 我们通过 shape, ndim, dtype 了解这个 ndarray 的基本信息, 那么对于 DataFarme 我们有什么方法了解呢? DataFrame 的基础属性 df.shape # 行数 列数 df.dtypes # 列数据类型 ...
- 分类器性能评估 概述sklearn.metrics.classification_report 概述 在许多实际问题中, 衡量分类器任务的成功程度是通过固定的性能指标来获取. 一般常见使用... 分类器性能评估 概述sklearn.metrics.classification_report 概述 在许多实际问题中, 衡量分类器任务的成功程度是通过固定的性能指标来获取. 一般常见使用...
- [toc] Numpy 索引和切片 对于刚刚加载出来的数据, 我如果只想选择其中的某一列 ( 行 ) 我们应该怎么做呢? 其实操作很简单, 和 Python 中列表的操作一样 执行结果: 执行结果: 执行结果: 执行结果: [toc] Numpy 索引和切片 对于刚刚加载出来的数据, 我如果只想选择其中的某一列 ( 行 ) 我们应该怎么做呢? 其实操作很简单, 和 Python 中列表的操作一样 执行结果: 执行结果: 执行结果: 执行结果:
- [toc] 练习一 现在我们有一组关于全球星巴克店铺的统计数据, 如果我想知道美国的星巴克数量和中国的哪个多, 那么应该怎么办? 思路: 遍历一遍, 每次加 1? 执行结果: 分组和聚合 在 pandas 中类似的分组的操作我们有很简单的方式来完成. 调用 groupy 方法之后返回的是什么内容? ... [toc] 练习一 现在我们有一组关于全球星巴克店铺的统计数据, 如果我想知道美国的星巴克数量和中国的哪个多, 那么应该怎么办? 思路: 遍历一遍, 每次加 1? 执行结果: 分组和聚合 在 pandas 中类似的分组的操作我们有很简单的方式来完成. 调用 groupy 方法之后返回的是什么内容? ...
上滑加载中
推荐直播
-
华为云码道-AI时代应用开发利器2026/03/18 周三 19:00-20:00
童得力,华为云开发者生态运营总监/姚圣伟,华为云HCDE开发者专家
本次直播由华为专家带你实战应用开发,看华为云码道(CodeArts)代码智能体如何在AI时代让你的创意应用快速落地。更有华为云HCDE开发者专家带你用码道玩转JiuwenClaw,让小艺成为你的AI助理。
回顾中 -
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中 -
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中
热门标签