- 对电影评分数据进行分析,使用SQL编程,获取电影平均分Top10,要求电影的评分次数大于200 数据展示 代码 package org.example.SQL import org.apache.log4j.{Level, Logger}import org.apache.spark.sql.{DataF... 对电影评分数据进行分析,使用SQL编程,获取电影平均分Top10,要求电影的评分次数大于200 数据展示 代码 package org.example.SQL import org.apache.log4j.{Level, Logger}import org.apache.spark.sql.{DataF...
- 共享变量 广播变量(Broadcast Variables):广播变量用来把变量在所有节点的内存之间进行共享,在每个机器上缓存一个只读的变量,而不是为机器上的每个任务都生成一个副本,简单理解:减少内存,减小计算压力; 累加器(Accumulators):累加器支持在所有不同节点之间进行累加计算(比如计数或者求和); ... 共享变量 广播变量(Broadcast Variables):广播变量用来把变量在所有节点的内存之间进行共享,在每个机器上缓存一个只读的变量,而不是为机器上的每个任务都生成一个副本,简单理解:减少内存,减小计算压力; 累加器(Accumulators):累加器支持在所有不同节点之间进行累加计算(比如计数或者求和); ...
- 文章目录 一、pyspark.sql部分1.窗口函数2.更换列名:3.sql将一个字段根据某个字符拆分成多个字段显示4.pd和spark的dataframe进行转换:5.报错ValueError:... 文章目录 一、pyspark.sql部分1.窗口函数2.更换列名:3.sql将一个字段根据某个字符拆分成多个字段显示4.pd和spark的dataframe进行转换:5.报错ValueError:...
- 文章目录 零、本讲学习目标一、基本数据源(一)文件流1、读取文件流概述2、读取文件流演示 零、本讲学习目标 掌握Spark Streaming基本数据源掌握Spark Strea... 文章目录 零、本讲学习目标一、基本数据源(一)文件流1、读取文件流概述2、读取文件流演示 零、本讲学习目标 掌握Spark Streaming基本数据源掌握Spark Strea...
- 文章目录 零、本讲学习目标一、Spark Streaming概述(一)什么是Spark Streaming(二)Sparing Streaming的主要优点1、易于使用2、易于与Spark体系整合... 文章目录 零、本讲学习目标一、Spark Streaming概述(一)什么是Spark Streaming(二)Sparing Streaming的主要优点1、易于使用2、易于与Spark体系整合...
- 文章目录 零、本讲学习目标一、使用Spark SQL实现词频统计(一)数据源 - words.txt(二)创建Maven项目(三)添加依赖和构建插件(四)修改源目录名称(五)创建日志属性文件(六)... 文章目录 零、本讲学习目标一、使用Spark SQL实现词频统计(一)数据源 - words.txt(二)创建Maven项目(三)添加依赖和构建插件(四)修改源目录名称(五)创建日志属性文件(六)...
- 文章目录 零、本讲学习目标一、Spark SQL内置函数(一)内置函数概述1、10类内置函数2、两种使用方式 (二)内置函数演示1、通过编程方式使用内置函数upper()2、通过SQL语句的... 文章目录 零、本讲学习目标一、Spark SQL内置函数(一)内置函数概述1、10类内置函数2、两种使用方式 (二)内置函数演示1、通过编程方式使用内置函数upper()2、通过SQL语句的...
- 文章目录 零、本讲学习目标一、Spark SQL读取关系数据库二、Spark SQL JDBC连接属性三、创建数据库与表(一)创建数据库(二)创建学生表(二)创建成绩表 四、读取和写入数据库表... 文章目录 零、本讲学习目标一、Spark SQL读取关系数据库二、Spark SQL JDBC连接属性三、创建数据库与表(一)创建数据库(二)创建学生表(二)创建成绩表 四、读取和写入数据库表...
- 文章目录 零、本讲学习目标一、Spark SQL支持读写Hive二、Spark配置hive-site.xml三、准备工作(一)启动Hive的metastore(二)启动Spark Shell ... 文章目录 零、本讲学习目标一、Spark SQL支持读写Hive二、Spark配置hive-site.xml三、准备工作(一)启动Hive的metastore(二)启动Spark Shell ...
- 文章目录 零、本讲学习目标一、读取JSON文件概述二、读取JSON文件案例演示(一)创建JSON文件并上传到HDFS(二)读取JSON文件,创建临时表,进行关联查询1、读取user.json文件,... 文章目录 零、本讲学习目标一、读取JSON文件概述二、读取JSON文件案例演示(一)创建JSON文件并上传到HDFS(二)读取JSON文件,创建临时表,进行关联查询1、读取user.json文件,...
- 文章目录 一、任务描述 二、实现步骤 (一)引入包并构建训练数据集 (二)定义工作流阶段 (三)创建工作流,训练出模型 (四)构建测试... 文章目录 一、任务描述 二、实现步骤 (一)引入包并构建训练数据集 (二)定义工作流阶段 (三)创建工作流,训练出模型 (四)构建测试...
- 文章目录 零、本讲学习目标一、基本操作(一)默认数据源1、默认数据源Parquet2、案例演示读取Parquet文件(1)在Spark Shell中演示(2)通过Scala程序演示 ... 文章目录 零、本讲学习目标一、基本操作(一)默认数据源1、默认数据源Parquet2、案例演示读取Parquet文件(1)在Spark Shell中演示(2)通过Scala程序演示 ...
- 文章目录 一、索引分区映射概述 二、索引分区映射案例 (一)每个元素翻10倍,不显示分区索引 (二)每个元素翻10倍,要显示分区索引 ... 文章目录 一、索引分区映射概述 二、索引分区映射案例 (一)每个元素翻10倍,不显示分区索引 (二)每个元素翻10倍,要显示分区索引 ...
- 文章目录 零、回顾一、使用Spark SQL完成任务1里面的数据筛选二、使用Spark SQL完成任务2里面的统计(列可以不统计)三、使用Spark SQL完成任务3的分组统计 零、回顾 ... 文章目录 零、回顾一、使用Spark SQL完成任务1里面的数据筛选二、使用Spark SQL完成任务2里面的统计(列可以不统计)三、使用Spark SQL完成任务3的分组统计 零、回顾 ...
- 学习总结 文章目录 学习总结一、数据统计1.1 读取文件1.2 保存读取的信息1.3 分析每列的类型,取值个数1.4 分析每列是否包含缺失值 二、分组聚合2.1 学习groupby分组聚合的... 学习总结 文章目录 学习总结一、数据统计1.1 读取文件1.2 保存读取的信息1.3 分析每列的类型,取值个数1.4 分析每列是否包含缺失值 二、分组聚合2.1 学习groupby分组聚合的...
上滑加载中
推荐直播
-
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中 -
华为云码道全新升级,多会话并行与多智能体协作2026/05/08 周五 19:00-21:00
王一男-华为云码道产品专家;张嘉冉-华为云码道工程师;胡琦-华为云HCDE;程诗杰-华为云HCDG
华为云码道4月份版本全新升级,此次直播深度解读4月份产品特性,通过“特性解读+实操演示+实战案例+设计创新”的组合,全方位展现码道在多会话并行与多智能体协作方面的能力,赋能开发者提升效率
正在直播
热门标签