Hadoop_标签_开发者_华为云

博客(12.2k)
视频(1)
论坛(0)
云声(0)
代码示例(0)

大数据面试题（四）：Yarn核心高频面试题
Yarn核心高频面试题一、简述Hadoop1与Hadoop2的架构异同加入了yarn解决了资源调度的问题。加入了对zookeeper的支持实现比较可靠的高可用。二、为什么会产生yarn，它解决了什么问题，有什么优势？Yarn最主要的功能就是解决运行的用户程序与yarn框架完全解耦。Yarn上可以运行各种类型的分布式运算程序（mapreduce只是其中的一种），比如mapreduce、sto...

Lansonli
发表于2022-12-12 21:44:30
4079 0 0

4.0k 0 0

Yarn核心高频面试题一、简述Hadoop1与Hadoop2的架构异同加入了yarn解决了资源调度的问题。加入了对zookeeper的支持实现比较可靠的高可用。二、为什么会产生yarn，它解决了什么问题，有什么优势？Yarn最主要的功能就是解决运行的用户程序与yarn框架完全解耦。Yarn上可以运行各种类型的分布式运算程序（mapreduce只是其中的一种），比如mapreduce、sto...
Hadoop Yarn 大数据
KAFKA EAGLE 监控MRS kafka之操作实践
[Kafka eagle](https://www.kafka-eagle.org/) 是一款分布式、高可用的kafka监控软件，提供丰富的kafka监控指标，例如：Kafka集群的Broker数、Topic数、Consumer数、Topic LogSize Top10、Topic Capacity Top10、Lag挤压情况，CPU/Memory监控等。

啊喔YeYe
发表于2022-12-06 20:33:20
8781 1 2

8.7k 1 2

[Kafka eagle](https://www.kafka-eagle.org/) 是一款分布式、高可用的kafka监控软件，提供丰富的kafka监控指标，例如：Kafka集群的Broker数、Topic数、Consumer数、Topic LogSize Top10、Topic Capacity Top10、Lag挤压情况，CPU/Memory监控等。
Hadoop MapReduce
Flink on Yarn三部曲之二：部署和设置
本文是《Flink on Yarn三部曲》系列的第二篇，前面已经为部署做好了准备，现在可以一起来部署和启动Yarn环境了

程序员欣宸
发表于2022-12-03 15:17:36
4029 0 0

4.0k 0 0

本文是《Flink on Yarn三部曲》系列的第二篇，前面已经为部署做好了准备，现在可以一起来部署和启动Yarn环境了
Flink Hadoop Yarn
实时即未来，大数据项目车联网之车辆数据统计意义分析（12）
theme: smartblue持续创作，加速成长！这是我参与「掘金日新计划 · 10 月更文挑战」的第12天，点击查看活动详情实时读取流数据的步骤原始数据实时ETL任务分析 Hive 将HDFS数据映射到Hive表需要指定的HDFS的目录回忆如何映射HDFS数据到Hive表中① 创建表 create external table maynor_src (…) row formate...

Maynor学长
发表于2022-10-31 12:30:51
3871 0 0

3.8k 0 0

theme: smartblue持续创作，加速成长！这是我参与「掘金日新计划 · 10 月更文挑战」的第12天，点击查看活动详情实时读取流数据的步骤原始数据实时ETL任务分析 Hive 将HDFS数据映射到Hive表需要指定的HDFS的目录回忆如何映射HDFS数据到Hive表中① 创建表 create external table maynor_src (…) row formate...
Hadoop HBase 数据库
实时即未来，大数据项目车联网之原始数据实时ETL任务HBase调优（9）
theme: smartblue持续创作，加速成长！这是我参与「掘金日新计划 · 10 月更文挑战」的第9天，点击查看活动详情 1. 原始数据实时ETL任务HBase调优 1.1 数据写入hbase优化上一节写入数据，一条条数据put到表中，对于大量数据的写入，效率极低，因此针对此项进行优化使用hbase客户端写缓存进行批量写入数据到hbase中hbase客户端写缓存对象:Buffer...

Maynor学长
发表于2022-10-31 12:29:27
4041 0 0

4.0k 0 0

theme: smartblue持续创作，加速成长！这是我参与「掘金日新计划 · 10 月更文挑战」的第9天，点击查看活动详情 1. 原始数据实时ETL任务HBase调优 1.1 数据写入hbase优化上一节写入数据，一条条数据put到表中，对于大量数据的写入，效率极低，因此针对此项进行优化使用hbase客户端写缓存进行批量写入数据到hbase中hbase客户端写缓存对象:Buffer...
Hadoop HBase
Hadoop之初识MapReduce
1．MapReduce计算模型介绍 1.1．理解MapReduce思想 1.2．Hadoop MapReduce设计构思 2．官方MapReduce示例 2.1．示例1：评估圆周率π（PI） 2.2．示例2：单词词频统计WordCount 3．MapReduce Python接口接入 3.1．前言 3.3．程序执行

chad_chang
发表于2022-10-30 20:12:13
6568 0 0

6.5k 0 0

1．MapReduce计算模型介绍 1.1．理解MapReduce思想 1.2．Hadoop MapReduce设计构思 2．官方MapReduce示例 2.1．示例1：评估圆周率π（PI） 2.2．示例2：单词词频统计WordCount 3．MapReduce Python接口接入 3.1．前言 3.3．程序执行
Hadoop MapReduce
实时即未来，大数据项目车联网之实时ETL开发的核心逻辑
theme: smartblue持续创作，加速成长！这是我参与「掘金日新计划 · 10 月更文挑战」的第6天，点击查看活动详情 1 实时ETL开发的核心逻辑 1 自定义方法解析json数据读取kafka数据后，对原始数据解析，筛选出解析成功的数据，并把数据转换对象，便于后续逻辑操作。自定义解析json数据为对象：//TODO 7）将json字符串解析成对象SingleOutputStr...

Maynor学长
发表于2022-10-20 14:19:24
4495 0 0

4.4k 0 0

theme: smartblue持续创作，加速成长！这是我参与「掘金日新计划 · 10 月更文挑战」的第6天，点击查看活动详情 1 实时ETL开发的核心逻辑 1 自定义方法解析json数据读取kafka数据后，对原始数据解析，筛选出解析成功的数据，并把数据转换对象，便于后续逻辑操作。自定义解析json数据为对象：//TODO 7）将json字符串解析成对象SingleOutputStr...
Hadoop 弹性文件服务 SFS
大数据入门学习框架
大数据入门学习框架前言利用框架的力量，看懂游戏规则，才是入行的前提大多数人不懂，不会，不做，才是你的机会，你得行动，不能畏首畏尾选择才是拉差距关键，风向，比你流的汗水重要一万倍，逆风划船要累死人的为什么选择学习大数据开发，不选择Java开发？借棋弈做比喻，智商高的不要选择五子琪，要选择围棋，它能长久地吸引你。不都是在棋盘上一颗黑子一颗白子地下吗?因为围棋更复杂，能够掌握如此复杂的技艺、产生...

Lansonli
发表于2022-10-09 20:13:23
1639 0 1

1.6k 0 1

大数据入门学习框架前言利用框架的力量，看懂游戏规则，才是入行的前提大多数人不懂，不会，不做，才是你的机会，你得行动，不能畏首畏尾选择才是拉差距关键，风向，比你流的汗水重要一万倍，逆风划船要累死人的为什么选择学习大数据开发，不选择Java开发？借棋弈做比喻，智商高的不要选择五子琪，要选择围棋，它能长久地吸引你。不都是在棋盘上一颗黑子一颗白子地下吗?因为围棋更复杂，能够掌握如此复杂的技艺、产生...
Hadoop 大数据
数据治理（十六）：Ranger管理HDFS安全
Ranger管理HDFS安全我们还可以使用Ranger对HDFS进行目录权限访问控制。这里需要添加“HDFS-Plugin”插件。一、安装“HDFS-Plugin”插件安装“HDFS-Plugin”插件步骤如下：1）将编译好的“ranger-2.1.0-hdfs-plugin.tar.gz”发送到node1节点，并解压#将node3上编译好的HDFS插件发送到node1上[root@nod...

Lansonli
发表于2022-09-11 02:25:35
3545 0 2

3.5k 0 2

Ranger管理HDFS安全我们还可以使用Ranger对HDFS进行目录权限访问控制。这里需要添加“HDFS-Plugin”插件。一、安装“HDFS-Plugin”插件安装“HDFS-Plugin”插件步骤如下：1）将编译好的“ranger-2.1.0-hdfs-plugin.tar.gz”发送到node1节点，并解压#将node3上编译好的HDFS插件发送到node1上[root@nod...
Hadoop
大数据ClickHouse（十四）：Integration系列表引擎
Integration系列表引擎ClickHouse提供了许多与外部系统集成的方法，包括一些表引擎。这些表引擎与其他类型的表引擎类似，可以用于将外部数据导入到ClickHouse中，或者在ClickHouse中直接操作外部数据源。一、HDFSHDFS引擎支持ClickHouse 直接读取HDFS中特定格式的数据文件，目前文件格式支持Json,Csv文件等，ClickHouse通过HDFS引擎...

Lansonli
发表于2022-08-30 01:08:11
3276 0 1

3.2k 0 1

Integration系列表引擎ClickHouse提供了许多与外部系统集成的方法，包括一些表引擎。这些表引擎与其他类型的表引擎类似，可以用于将外部数据导入到ClickHouse中，或者在ClickHouse中直接操作外部数据源。一、HDFSHDFS引擎支持ClickHouse 直接读取HDFS中特定格式的数据文件，目前文件格式支持Json,Csv文件等，ClickHouse通过HDFS引擎...
Hadoop MySQL 大数据
docker下，极速搭建spark集群(含hdfs集群)
搭建spark和hdfs的集群环境会消耗一些时间和精力，今天咱们就借助docker，极速搭建和体验spark和hdfs的集群环境

程序员欣宸
发表于2022-08-17 00:02:04
1731 0 0

1.7k 0 0

搭建spark和hdfs的集群环境会消耗一些时间和精力，今天咱们就借助docker，极速搭建和体验spark和hdfs的集群环境
Docker Hadoop spark
行为抽象和Lambda分区
MapReduce功能实现系列： MapReduce功能实现一—Hbase和Hdfs之间数据相互转换 MapReduce功能实现二—排序 MapReduce功能实现三—Top N MapReduce功能实现四—小综合(从hbase中读取数据统计并在hdfs中降序输出Top 3) MapReduce功能实现五—去重(Distinct)、计数(C...

xcc-2022
发表于2022-07-22 14:48:56
3075 0 0

3.0k 0 0

MapReduce功能实现系列： MapReduce功能实现一—Hbase和Hdfs之间数据相互转换 MapReduce功能实现二—排序 MapReduce功能实现三—Top N MapReduce功能实现四—小综合(从hbase中读取数据统计并在hdfs中降序输出Top 3) MapReduce功能实现五—去重(Distinct)、计数(C...
Hadoop MapReduce
数据湖（十六）：Structured Streaming实时写入Iceberg
Structured Streaming实时写入Iceberg目前Spark中Structured Streaming只支持实时向Iceberg中写入数据，不支持实时从Iceberg中读取数据，下面案例我们将使用Structured Streaming从Kafka中实时读取数据，然后将结果实时写入到Iceberg中。一、创建Kafka topic启动Kafka集群，创建“kafka-ice...

Lansonli
发表于2022-07-11 10:37:57
1767 0 1

1.7k 0 1

Structured Streaming实时写入Iceberg目前Spark中Structured Streaming只支持实时向Iceberg中写入数据，不支持实时从Iceberg中读取数据，下面案例我们将使用Structured Streaming从Kafka中实时读取数据，然后将结果实时写入到Iceberg中。一、创建Kafka topic启动Kafka集群，创建“kafka-ice...
Hadoop
使用商业智能软件Superset分析MRS数据之最佳实践
Superset是一款由Airbnb开源的“现代化的企业级BI（商业智能） Web应用程序”，其通过创建和分享dashboard，为数据分析提供了轻量级的数据查询和可视化方案。 MRS是华为云提供的一站式大数据平台，覆盖常用的所有Hadoop生态组件，使用Superset可无缝对接MRS进行自助分析

啊喔YeYe
发表于2022-06-06 17:48:20
9498 0 2

9.4k 0 2

Superset是一款由Airbnb开源的“现代化的企业级BI（商业智能） Web应用程序”，其通过创建和分享dashboard，为数据分析提供了轻量级的数据查询和可视化方案。 MRS是华为云提供的一站式大数据平台，覆盖常用的所有Hadoop生态组件，使用Superset可无缝对接MRS进行自助分析
Hadoop MapReduce
数据湖（五）：Hudi与Hive集成
Hudi与Hive集成一、配置HiveServer2Hudi与Hive集成原理是通过代码方式将数据写入到HDFS目录中，那么同时映射Hive表，让Hive表映射的数据对应到此路径上，这时Hudi需要通过JDBC方式连接Hive进行元数据操作，这时需要配置HiveServer2。1、在Hive服务端配置hive-site.xml#在Hive 服务端 $HIVE_HOME/con...

Lansonli
发表于2022-06-06 13:12:19
5232 0 0

5.2k 0 0

Hudi与Hive集成一、配置HiveServer2Hudi与Hive集成原理是通过代码方式将数据写入到HDFS目录中，那么同时映射Hive表，让Hive表映射的数据对应到此路径上，这时Hudi需要通过JDBC方式连接Hive进行元数据操作，这时需要配置HiveServer2。1、在Hive服务端配置hive-site.xml#在Hive 服务端 $HIVE_HOME/con...
Hadoop Hive

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript