Hadoop_标签_开发者_华为云

博客(764)
视频(1)
论坛(0)
云声(0)
代码示例(0)

利用鲲鹏服务器快速搭建Hadoop全分布式集群
一、Hadoop常见的三种运行模式1、单机模式（独立模式）（Local或Standalone Mode）　　默认情况下Hadoop就是处于该模式，用于开发和调式。不对配置文件进行修改。使用本地文件系统，而不是分布式文件系统。　　Hadoop不会启动NameNode、DataNode、JobTracker、TaskTracker等守护进程，Map()和Reduce()任务作为同一个进程的不同...

Jack20
发表于2022-10-13 11:02:32
235233 1 4

235.2k 1 4

一、Hadoop常见的三种运行模式1、单机模式（独立模式）（Local或Standalone Mode）　　默认情况下Hadoop就是处于该模式，用于开发和调式。不对配置文件进行修改。使用本地文件系统，而不是分布式文件系统。　　Hadoop不会启动NameNode、DataNode、JobTracker、TaskTracker等守护进程，Map()和Reduce()任务作为同一个进程的不同...
Hadoop 分布式大数据鲲鹏
8000 字讲透 OBSA 原理与应用实践
华为云 OBS 存储服务提供了 “对象存储服务” 和” 并行文件系统服务”。

华为云社区精选
发表于2022-07-28 10:50:50
21818 0 2

21.8k 0 2

华为云 OBS 存储服务提供了 “对象存储服务” 和” 并行文件系统服务”。
Hadoop 对象存储服务 OBS
开源工作流引擎Azkaban在MRS中的实践
Azkaban是 Linkedin 开源的一个批量工作流调度器，在数据中台、数据治理、大数据作业管理、调度相关领域使用非常广泛。华为MapReduce服务作为大数据服务领导者，可以为Azkaban提供更高效、更可靠、高可用的任务计算与调度的能力。强强结合，打造最强大数据、数据治理解决方案。本文主要介绍如何在华为云上从0-1搭建azkaban并指导用户如何提交作业至MRS。

啊喔YeYe
发表于2022-05-14 15:21:46
15806 5 2

15.8k 5 2

Azkaban是 Linkedin 开源的一个批量工作流调度器，在数据中台、数据治理、大数据作业管理、调度相关领域使用非常广泛。华为MapReduce服务作为大数据服务领导者，可以为Azkaban提供更高效、更可靠、高可用的任务计算与调度的能力。强强结合，打造最强大数据、数据治理解决方案。本文主要介绍如何在华为云上从0-1搭建azkaban并指导用户如何提交作业至MRS。
Hadoop MapReduce
Spark 教程：实时集群计算框架
在实时数据分析方面，Spark 是所有其他解决方案的首选工具。通过这篇博客，我将向您介绍 Apache Spark 这个令人兴奋的新领域，我们将通过一个完整的用例，使用 Spark 进行地震检测。

Donglian Lin
发表于2021-12-08 19:33:26
10442 0 0

10.4k 0 0

在实时数据分析方面，Spark 是所有其他解决方案的首选工具。通过这篇博客，我将向您介绍 Apache Spark 这个令人兴奋的新领域，我们将通过一个完整的用例，使用 Spark 进行地震检测。
Hadoop spark
MapReduce 教程 – MapReduce 基础知识和 MapReduce 示例
现在，你们对 MapReduce 框架有了基本的了解。您可能已经意识到 MapReduce 框架如何帮助我们编写代码来处理 HDFS 中存在的大量数据。与 Hadoop 1.x 相比，Hadoop 2.x 中的 MapReduce 框架发生了重大变化。这些更改将在本 MapReduce 教程系列的下一篇博客中讨论。我将在那个博客中分享一个可下载的综合指南，它解释了 MapReduce 程序的每个部

Donglian Lin
发表于2021-08-15 13:43:26
12046 0 0

12.0k 0 0

现在，你们对 MapReduce 框架有了基本的了解。您可能已经意识到 MapReduce 框架如何帮助我们编写代码来处理 HDFS 中存在的大量数据。与 Hadoop 1.x 相比，Hadoop 2.x 中的 MapReduce 框架发生了重大变化。这些更改将在本 MapReduce 教程系列的下一篇博客中讨论。我将在那个博客中分享一个可下载的综合指南，它解释了 MapReduce 程序的每个部
Hadoop MapReduce
【云享新鲜】社区周刊·Vol.9-关于华为云盘古大模型，你想了解的都在这里…
本期精彩看点：关于盘古大模型你想问的，两位核心研发员现身答疑；五一假期回程的车票好买吗？技术揭秘12306如何保证车票不超卖；带你抽丝剥茧，完成复杂Gremlin查询的调试…

华为云社区精选
发表于2021-05-06 11:29:55
10727 0 0

10.7k 0 0

本期精彩看点：关于盘古大模型你想问的，两位核心研发员现身答疑；五一假期回程的车票好买吗？技术揭秘12306如何保证车票不超卖；带你抽丝剥茧，完成复杂Gremlin查询的调试…
Hadoop 知识图谱语言理解云数据库 GaussDB(for Redis)
HDFS读写原理和代码简单实现
本文主要研究了hdfs文件系统的读写流程以及基于MRS在windows客户端下读写hdfs文件的实现

剑指南天
发表于2021-01-10 03:50:45
19337 7 5

19.3k 7 5

本文主要研究了hdfs文件系统的读写流程以及基于MRS在windows客户端下读写hdfs文件的实现
EI企业智能 Hadoop MapReduce服务 MRS
入门Hadoop存储与计算：实现单词统计的分布式文件处理系统
入门Hadoop存储与计算：实现单词统计的分布式文件处理系统引言在当今数字化时代，数据量呈爆炸式增长，传统的数据处理和存储技术已经难以应对这种规模的数据企业和研究机构迫切需要一种高效、可扩展且可靠的解决方案来管理和分析这些海量数据Hadoop，作为一种分布式计算框架，凭借其强大的存储和处理能力，成为了大数据领域的明星技术本文将分析官方文档探讨Hadoop的存储、计算原理，设计并实现一个分...

菜菜的后端私房菜
发表于2024-11-19 09:41:31
4178 0 1

4.1k 0 1

入门Hadoop存储与计算：实现单词统计的分布式文件处理系统引言在当今数字化时代，数据量呈爆炸式增长，传统的数据处理和存储技术已经难以应对这种规模的数据企业和研究机构迫切需要一种高效、可扩展且可靠的解决方案来管理和分析这些海量数据Hadoop，作为一种分布式计算框架，凭借其强大的存储和处理能力，成为了大数据领域的明星技术本文将分析官方文档探讨Hadoop的存储、计算原理，设计并实现一个分...
Hadoop Java
从零开始：手摸手教你入门搭建Hadoop
从零开始：手摸手教你入门搭建Hadoop 引言在现代企业中，数据量的快速增长带来了巨大的挑战传统的数据处理和分析工具已经难以应对大规模数据的存储和处理需求特别是在业务团队项目中，面对海量数据的实时处理和分析，如何高效地管理和利用这些数据成为了一个关键问题而Hadoop的出现就能够解决海量数据下的存储与计算然而，Hadoop的安装与配置并非易事，尤其是对于初学者来说，可能会遇到各种困难和挑战...

菜菜的后端私房菜
发表于2024-11-18 09:37:52
4473 0 1

4.4k 0 1

从零开始：手摸手教你入门搭建Hadoop 引言在现代企业中，数据量的快速增长带来了巨大的挑战传统的数据处理和分析工具已经难以应对大规模数据的存储和处理需求特别是在业务团队项目中，面对海量数据的实时处理和分析，如何高效地管理和利用这些数据成为了一个关键问题而Hadoop的出现就能够解决海量数据下的存储与计算然而，Hadoop的安装与配置并非易事，尤其是对于初学者来说，可能会遇到各种困难和挑战...
Hadoop Java
大数据Azkaban（一）：工作流管理器概述
工作流管理器概述无论是在业务开发还是在大数据开发中，工作流管理是必不可少的，在初期可以使用Linux自带的crontab工具来定时调度任务，但是当业务规模变大并且需要可视化监控任务执行的时候，crontab显然已经满足不了需求。为此，针对这种多任务、可视化调度的调度管理需求，Apache以及其他组织提供了一系列工作流管理器。一、工作流调度系统背景一个完整的数据分析系统通常都是由大量任务单元组...

Lansonli
发表于2024-10-26 22:30:04
4272 0 0

4.2k 0 0

工作流管理器概述无论是在业务开发还是在大数据开发中，工作流管理是必不可少的，在初期可以使用Linux自带的crontab工具来定时调度任务，但是当业务规模变大并且需要可视化监控任务执行的时候，crontab显然已经满足不了需求。为此，针对这种多任务、可视化调度的调度管理需求，Apache以及其他组织提供了一系列工作流管理器。一、工作流调度系统背景一个完整的数据分析系统通常都是由大量任务单元组...
Apache Hadoop 大数据
Spark01 —— Spark基础
Spark01 —— Spark基础一、为什么选择Spark？ 1.1 MapReduce编程模型的局限性1、繁杂：只有Map和Reduce两个操作，复杂的逻辑需要大量的样板代码2、处理效率低：2.1、Map中间结果写磁盘，Reduce写HDFS，多个Map通过HDFS交换数据2.2、任务调度与启动开销大3、不适合迭代处理、交互式处理和流式处理 1.2 Spark与MR的区别Spark是...

Byyyi耀
发表于2024-05-06 10:27:51
6281 0 0

6.2k 0 0

Spark01 —— Spark基础一、为什么选择Spark？ 1.1 MapReduce编程模型的局限性1、繁杂：只有Map和Reduce两个操作，复杂的逻辑需要大量的样板代码2、处理效率低：2.1、Map中间结果写磁盘，Reduce写HDFS，多个Map通过HDFS交换数据2.2、任务调度与启动开销大3、不适合迭代处理、交互式处理和流式处理 1.2 Spark与MR的区别Spark是...
Hadoop spark Yarn
GaussDB (DWS)的SQL ON ANYWHERE技术解密
GaussDB DWS的SQL ON ANYWHERE技术解密 GaussDB DWS的SQL ON ANYWHERE技术解密 1. 前言 2. 什么是SQL On Anywhere 3. GaussDB(DWS)SQL On Anywhere的作用及其应用场景 4. GaussDB(DWS)SQL On Anywhere的实现方式 3.1 利用FDW访问HDFS/OBS数据 3.2 通...

tooooooooooomy
发表于2024-04-01 17:30:52
8255 0 0

8.2k 0 0

GaussDB DWS的SQL ON ANYWHERE技术解密 GaussDB DWS的SQL ON ANYWHERE技术解密 1. 前言 2. 什么是SQL On Anywhere 3. GaussDB(DWS)SQL On Anywhere的作用及其应用场景 4. GaussDB(DWS)SQL On Anywhere的实现方式 3.1 利用FDW访问HDFS/OBS数据 3.2 通...
Hadoop SQL
Hadoop集群化服务实践
本项目使用了华为云服务提供的基于鲲鹏计算架构的远程ECS主机和OBS对象存储服务，完成了Hadoop集群搭建、HDFS环境配置和系统功能验证等实验任务，并通过多个ECS主机作为Hadoop集群节点，了解Hadoop的工作原理和环境构建过程。实验结束后，成功在4个ECS服务器节点上部署运行了HDFS，且可以通过SSH协议正常访问。

MJ_C
发表于2023-11-10 21:01:36
8937 0 0

8.9k 0 0

本项目使用了华为云服务提供的基于鲲鹏计算架构的远程ECS主机和OBS对象存储服务，完成了Hadoop集群搭建、HDFS环境配置和系统功能验证等实验任务，并通过多个ECS主机作为Hadoop集群节点，了解Hadoop的工作原理和环境构建过程。实验结束后，成功在4个ECS服务器节点上部署运行了HDFS，且可以通过SSH协议正常访问。
Hadoop 弹性云服务器 ECS
华为云之使用ECS弹性云服务器部署Hadoop环境【玩转华为云】
华为云之使用ECS弹性云服务器部署Hadoop环境【玩转华为云】

江湖有缘
发表于2023-07-28 11:14:32
6195 0 0

6.1k 0 0

华为云之使用ECS弹性云服务器部署Hadoop环境【玩转华为云】
Hadoop 云端实践弹性云服务器 ECS
大数据Flink进阶（十一）：Flink History Server配置使用
Flink History Server配置使用基于Standalone或者Yarn模式提交Flink任务后，当任务执行失败、取消或者完成后，可以在WebUI中查看对应任务的统计信息，这些统计信息在生产环境中对我们来说非常重要，可以知道一个任务异常挂掉前发生了什么，便于定位问题。当基于Standalone session模式提交相应任务时，集群重启后我们没有办法查看集群之前运行任务的情况，...

Lansonli
发表于2023-04-09 22:26:49
6174 2 0

6.1k 2 0

Flink History Server配置使用基于Standalone或者Yarn模式提交Flink任务后，当任务执行失败、取消或者完成后，可以在WebUI中查看对应任务的统计信息，这些统计信息在生产环境中对我们来说非常重要，可以知道一个任务异常挂掉前发生了什么，便于定位问题。当基于Standalone session模式提交相应任务时，集群重启后我们没有办法查看集群之前运行任务的情况，...
Flink Hadoop 大数据

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript