spark_标签_开发者_华为云

博客(672)
视频(2)
论坛(0)
云声(0)
代码示例(0)

Spark 机器学习库 MLlib 编程实践
Spark 机器学习库 MLlib 编程实践介绍Spark MLlib 是 Apache Spark 的一个机器学习库，提供了常用的机器学习算法和工具。MLlib 在分布式环境下运行，可以处理大规模数据集，是构建可扩展机器学习应用程序的理想选择。应用使用场景大数据分析：在大规模数据集上训练机器学习模型，如推荐系统、分类、聚类。实时流处理：结合 Spark Streaming 实现实时数...

鱼弦
发表于2025-03-03 09:49:26
1930 0 0

1.9k 0 0

Spark 机器学习库 MLlib 编程实践介绍Spark MLlib 是 Apache Spark 的一个机器学习库，提供了常用的机器学习算法和工具。MLlib 在分布式环境下运行，可以处理大规模数据集，是构建可扩展机器学习应用程序的理想选择。应用使用场景大数据分析：在大规模数据集上训练机器学习模型，如推荐系统、分类、聚类。实时流处理：结合 Spark Streaming 实现实时数...
spark 机器学习
pyspark中连接mysql
连接mysql查询数据: 初始化mysql的连接信息def init_mysql():url = “jdbc:mysql://ip:port/databasename?&useSSL=false&serverTimezone=GMT%2B8”properties = {“user”: “user”, “password”: “password”, “driver”: “com.mysql....

developer_Li
发表于2025-02-25 18:13:43
1281 0 0

1.2k 0 0

连接mysql查询数据: 初始化mysql的连接信息def init_mysql():url = “jdbc:mysql://ip:port/databasename?&useSSL=false&serverTimezone=GMT%2B8”properties = {“user”: “user”, “password”: “password”, “driver”: “com.mysql....
MySQL Python spark
pyspark中spark初始化的一些操作
spark初始化:class SpsrkConfigInit:@classmethoddef init_spark(cls):“”"初始化spark配置:return: SparkSession“”"# 设置 JAVA_HOME 环境变量os.environ[‘JAVA_HOME’] = ‘C:/Program Files/Huawei/jdk1.8.0_222’os.environ[‘PY...

developer_Li
发表于2025-02-25 17:31:54
1161 0 0

1.1k 0 0

spark初始化:class SpsrkConfigInit:@classmethoddef init_spark(cls):“”"初始化spark配置:return: SparkSession“”"# 设置 JAVA_HOME 环境变量os.environ[‘JAVA_HOME’] = ‘C:/Program Files/Huawei/jdk1.8.0_222’os.environ[‘PY...
spark
Spark Executor 内存分配原理与调优
Spark Executor 内存分配原理与调优介绍Apache Spark 是一个用于大数据处理的集群计算框架，具备快速、通用和可扩展的特点。Executor 是 Spark Job 在工作节点上实际执行任务的进程，负责运行 Task 并存储阶段中间结果。合理配置和调优 Executor 的内存参数至关重要，以便高效利用资源并优化性能。应用使用场景大规模数据分析：Spark 被广泛应...

鱼弦
发表于2025-02-24 09:29:40
6363 0 0

6.3k 0 0

Spark Executor 内存分配原理与调优介绍Apache Spark 是一个用于大数据处理的集群计算框架，具备快速、通用和可扩展的特点。Executor 是 Spark Job 在工作节点上实际执行任务的进程，负责运行 Task 并存储阶段中间结果。合理配置和调优 Executor 的内存参数至关重要，以便高效利用资源并优化性能。应用使用场景大规模数据分析：Spark 被广泛应...
Hadoop spark 机器学习
Java在大数据处理中的应用：从MapReduce到Spark
Java在大数据处理中的应用：从MapReduce到Spark大数据时代的到来让数据的存储、处理和分析变得前所未有的重要。随着数据量的剧增，传统的单机计算方式已经无法满足处理需求。为了解决这个问题，许多分布式计算框架应运而生，其中MapReduce和Apache Spark是两种主流的解决方案。在大数据处理过程中，Java作为一种高效、平台无关的编程语言，扮演了至关重要的角色。本文将带你深...

江南清风起
发表于2025-02-11 14:48:45
1600 0 1

1.6k 0 1

Java在大数据处理中的应用：从MapReduce到Spark大数据时代的到来让数据的存储、处理和分析变得前所未有的重要。随着数据量的剧增，传统的单机计算方式已经无法满足处理需求。为了解决这个问题，许多分布式计算框架应运而生，其中MapReduce和Apache Spark是两种主流的解决方案。在大数据处理过程中，Java作为一种高效、平台无关的编程语言，扮演了至关重要的角色。本文将带你深...
Java MapReduce spark
编译spark，configure: error:--with-readline=yes (default) 错误解决办法
问题描述：编译spark时出现如下错误configure: error:--with-readline=yes (default) and headers/libs are not available解决办法：yum install readline-devel

way
发表于2019-08-22 19:41:10
10357 0 0

10.3k 0 0

问题描述：编译spark时出现如下错误configure: error:--with-readline=yes (default) and headers/libs are not available解决办法：yum install readline-devel
spark
编译spark，Required file not found: sbt-interface.jar 错误解决方法
问题描述：编译spark时出现如下错误> [error] Required file not found: sbt-interface.jar> [error] See zinc -help for information about locating necessary files解决办法：执行如下命令找到进程号，然后kill掉进程：ps -ef|grep sbt-interface.ja...

way
发表于2019-08-22 19:38:47
10569 0 0

10.5k 0 0

问题描述：编译spark时出现如下错误> [error] Required file not found: sbt-interface.jar> [error] See zinc -help for information about locating necessary files解决办法：执行如下命令找到进程号，然后kill掉进程：ps -ef|grep sbt-interface.ja...
JAR spark
SparkStreaming编程模型
SparkStreaming编程模型

Smy1121
发表于2019-06-22 17:00:48
4731 0 0

4.7k 0 0

SparkStreaming编程模型
spark 计算
第一个Spark Streaming例子
Spark Streaming是一种近实时的流式计算模型，它将作业分解成一批一批的短小的批处理任务，然后并行计算，具有可扩展，高容错，高吞吐，实时性高等一系列优点，在某些场景可达到与Storm一样的处理程度或优于storm，也可以无缝集成多重日志收集工具或队列中转器，比如常见的 kakfa，flume，redis，logstash等，计算完后的数据结果，也可以存储到各种存储系统中，如HDFS，数

Smy1121
发表于2019-06-22 16:41:34
5184 0 0

5.1k 0 0

Spark Streaming是一种近实时的流式计算模型，它将作业分解成一批一批的短小的批处理任务，然后并行计算，具有可扩展，高容错，高吞吐，实时性高等一系列优点，在某些场景可达到与Storm一样的处理程度或优于storm，也可以无缝集成多重日志收集工具或队列中转器，比如常见的 kakfa，flume，redis，logstash等，计算完后的数据结果，也可以存储到各种存储系统中，如HDFS，数
spark 计算
Spark Streaming概述
Spark Streaming概述

Smy1121
发表于2019-06-22 16:33:31
4285 0 0

4.2k 0 0

Spark Streaming概述
spark 计算
Spark SQL性能调优
Spark SQL性能调优

Smy1121
发表于2019-06-22 16:26:55
5023 0 0

5.0k 0 0

Spark SQL性能调优
spark 应用性能调优 SQL
Spark SQL编程
Spark SQL编程

Smy1121
发表于2019-06-22 16:19:58
4418 0 0

4.4k 0 0

Spark SQL编程
spark Hive SQL
Spark SQL基本原理
Spark SQL基本原理

Smy1121
发表于2019-06-22 16:01:42
4402 0 0

4.4k 0 0

Spark SQL基本原理
spark SQL
Spark SQL概述
Spark SQL结构化数据处理

Smy1121
发表于2019-06-22 15:59:08
4342 0 0

4.3k 0 0

Spark SQL结构化数据处理
spark SQL
Spark 多语言编程
Spark 同时支持Scala、Python、Java 三种应用程序API编程接口和编程方式，考虑到大数据处理的特性，一般会优先使用Scala进行编程，其次是Python，最后才是Java。

Smy1121
发表于2019-06-22 15:53:35
5273 0 0

5.2k 0 0

Spark 同时支持Scala、Python、Java 三种应用程序API编程接口和编程方式，考虑到大数据处理的特性，一般会优先使用Scala进行编程，其次是Python，最后才是Java。
spark Python

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript