- 赛题详情 在出行问题上,中国市场人数多、人口密度大,总体的出行频率远高于其他国家,这种情况在大城市尤为明显。然而,截至目前中国拥有汽车的人口只有不到10%,这意味着在中国人们的出行更加依赖于出租车、公共交通等市场提供的服务。另一方面,滴滴出行占领了国内绝大部分的网络呼叫出行市场,面对着巨大的数据量以及与日俱增的数据处理需求。截... 赛题详情 在出行问题上,中国市场人数多、人口密度大,总体的出行频率远高于其他国家,这种情况在大城市尤为明显。然而,截至目前中国拥有汽车的人口只有不到10%,这意味着在中国人们的出行更加依赖于出租车、公共交通等市场提供的服务。另一方面,滴滴出行占领了国内绝大部分的网络呼叫出行市场,面对着巨大的数据量以及与日俱增的数据处理需求。截...
- 上一篇介绍了关联规则挖掘的一些基本概念和经典的Apriori算法,Aprori算法利用频繁集的两个特性,过滤了很多无关的集合,效率提高不少,但是我们发现Apriori算法是一个候选消除算法,每一次消除都需要扫描一次所有数据记录,造成整个算法在面临大数据集时显得无能为力。今天我们介绍一个新的算法挖掘频繁项集,效率比Aprori算法高很多... 上一篇介绍了关联规则挖掘的一些基本概念和经典的Apriori算法,Aprori算法利用频繁集的两个特性,过滤了很多无关的集合,效率提高不少,但是我们发现Apriori算法是一个候选消除算法,每一次消除都需要扫描一次所有数据记录,造成整个算法在面临大数据集时显得无能为力。今天我们介绍一个新的算法挖掘频繁项集,效率比Aprori算法高很多...
- 3-Groupby分组统计 In [2]: ... 3-Groupby分组统计 In [2]: ...
- 上一篇介绍了用开源数据挖掘软件weka做关联规则挖掘,weka方便实用,但不能处理大数据集,因为内存放不下,给它再多的时间也是无用,因此需要进行分布式计算,mahout是一个基于hadoop的分布式数据挖掘开源项目(mahout本来是指一个骑在大象上的人)。掌握了关联规则的基本算法和使用,加上分布式关联规则挖掘后,就可以处理基本的关联... 上一篇介绍了用开源数据挖掘软件weka做关联规则挖掘,weka方便实用,但不能处理大数据集,因为内存放不下,给它再多的时间也是无用,因此需要进行分布式计算,mahout是一个基于hadoop的分布式数据挖掘开源项目(mahout本来是指一个骑在大象上的人)。掌握了关联规则的基本算法和使用,加上分布式关联规则挖掘后,就可以处理基本的关联...
- 聚类分析 什么是聚类分析? 聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。所以,在很多应用中,一个簇中的数据对象可以被作为一个整体来对待,从而减少计算量或者提高计算质量。 其实聚类是一个人们日常生活的常见行为... 聚类分析 什么是聚类分析? 聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。所以,在很多应用中,一个簇中的数据对象可以被作为一个整体来对待,从而减少计算量或者提高计算质量。 其实聚类是一个人们日常生活的常见行为...
- Pandas数据分析 import pandas as pd df = pd.read_csv('C:/JupyterWork/data/titanic.csv') dfPassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked0 1 ... Pandas数据分析 import pandas as pd df = pd.read_csv('C:/JupyterWork/data/titanic.csv') dfPassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked0 1 ...
- 第三章 numpy的常用函数 1.savetxt 2.loadtxt (converters): datetime.datetime.strptime [p46] 3.average 4.mean 5.max 6.min 7.ptp 8.median 9.msort/sort 10.var 11.diff 12.std 13.wh... 第三章 numpy的常用函数 1.savetxt 2.loadtxt (converters): datetime.datetime.strptime [p46] 3.average 4.mean 5.max 6.min 7.ptp 8.median 9.msort/sort 10.var 11.diff 12.std 13.wh...
- 创建DataFrame格式数据,指定他的行索引名称和列索引名称 In [3]: ... 创建DataFrame格式数据,指定他的行索引名称和列索引名称 In [3]: ...
- 不同的产品要给不同的人员使用,一份完整的用户画像不仅包含整整个用户的信息,也包含用户的媒体属相和用户的标签化语义。今天AAA教育小编就来带大家看看,产品经理应该如何获得用户画像。其实,「用户画像」这个词,其实在国内的互联网大概率是错用的。这里有两个英文词,第一个叫「PERSONA」,这是Allen Cooper提出来的一种通过调研和问卷... 不同的产品要给不同的人员使用,一份完整的用户画像不仅包含整整个用户的信息,也包含用户的媒体属相和用户的标签化语义。今天AAA教育小编就来带大家看看,产品经理应该如何获得用户画像。其实,「用户画像」这个词,其实在国内的互联网大概率是错用的。这里有两个英文词,第一个叫「PERSONA」,这是Allen Cooper提出来的一种通过调研和问卷...
- 从这篇开始,我将介绍分类问题,主要介绍决策树算法、朴素贝叶斯、支持向量机、BP神经网络、懒惰学习算法、随机森林与自适应增强算法、分类模型选择和结果评价。总共7篇,欢迎关注和交流。 这篇先介绍分类问题的一些基本知识,然后主要讲述决策树算法的原理、实现,最后利用决策树算法做一个泰坦尼克号船员生存预测应用。 ... 从这篇开始,我将介绍分类问题,主要介绍决策树算法、朴素贝叶斯、支持向量机、BP神经网络、懒惰学习算法、随机森林与自适应增强算法、分类模型选择和结果评价。总共7篇,欢迎关注和交流。 这篇先介绍分类问题的一些基本知识,然后主要讲述决策树算法的原理、实现,最后利用决策树算法做一个泰坦尼克号船员生存预测应用。 ...
- python-pandas之Index数据分析(六) 索引对象 '''数据结构 索引对象• pandas的索引对象负责管理轴标签和其他元数据(比如轴名称等)。构建Series或DataFrame时,所用到的任何数组或其他序列的标签都会被转换成一个Index。• Index对象是不可修改的(immutable),因此用户不能对其进行修... python-pandas之Index数据分析(六) 索引对象 '''数据结构 索引对象• pandas的索引对象负责管理轴标签和其他元数据(比如轴名称等)。构建Series或DataFrame时,所用到的任何数组或其他序列的标签都会被转换成一个Index。• Index对象是不可修改的(immutable),因此用户不能对其进行修...
- python-Numpy数据分析-数组的保存与读取(三) 1. 数组以二进制格式保存 np.save和np.load是读写磁盘数组数据的两个主要函数。默认情况下,数组以未压缩的原始二进制格式保存在扩展名为npy的文件中,以数组a为例 np.save("filename.npy",a)b = np.load("fil... python-Numpy数据分析-数组的保存与读取(三) 1. 数组以二进制格式保存 np.save和np.load是读写磁盘数组数据的两个主要函数。默认情况下,数组以未压缩的原始二进制格式保存在扩展名为npy的文件中,以数组a为例 np.save("filename.npy",a)b = np.load("fil...
- 在了解该文章的前提下,你要把权重的概念要搞清楚! 大家都很关系自己的宝贝在搜索栏中的自然排名,很多店长抱怨淘宝为什么不公开排序算法?排序算法无法公开。不知道有谁知道百度的排序算法是怎么样的?Google的排序算法是怎么样的?排序算法之所以无法公开,有很多原因。其中一个原因正是因为公平才不公开。算法是死的,人是活的。一旦算法公开,很... 在了解该文章的前提下,你要把权重的概念要搞清楚! 大家都很关系自己的宝贝在搜索栏中的自然排名,很多店长抱怨淘宝为什么不公开排序算法?排序算法无法公开。不知道有谁知道百度的排序算法是怎么样的?Google的排序算法是怎么样的?排序算法之所以无法公开,有很多原因。其中一个原因正是因为公平才不公开。算法是死的,人是活的。一旦算法公开,很...
- 显示设置 In [1]: ... 显示设置 In [1]: ...
- Meger合并多个表格中相同字段的数据 In [1]: ... Meger合并多个表格中相同字段的数据 In [1]: ...
上滑加载中
推荐直播
-
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中 -
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
热门标签