Hadoop_标签_开发者_华为云

博客(764)
视频(1)
论坛(0)
云声(0)
代码示例(0)

hive数据迁移到clickhouse—使用Waterdrop工具
hive数据迁移到clickhouse—使用Waterdrop工具参考链接基于荣耀客户的需求，测试Waterdrop从云EI的hive-spark集群上迁移数据到clickhouse集群 hive数据迁移到clickhouse—使用Waterdrop工具 Waterdrop hive-spark集群 clickhouse集群 batch.conf 数据迁移迁移结果 waterdrop性能...

陈方业
发表于2021-05-25 14:33:36
11973 0 1

11.9k 0 1

hive数据迁移到clickhouse—使用Waterdrop工具参考链接基于荣耀客户的需求，测试Waterdrop从云EI的hive-spark集群上迁移数据到clickhouse集群 hive数据迁移到clickhouse—使用Waterdrop工具 Waterdrop hive-spark集群 clickhouse集群 batch.conf 数据迁移迁移结果 waterdrop性能...
ClickHouse Hadoop Hive 数据迁移
图文详解 HDFS 组成框架
介绍了HDFS是什么、HDFS的优缺点，NameNode节点、DataNode节点、SecondaryNameNode节点的定义及功能介绍。

烟雨江南
发表于2021-05-19 02:33:00
21461 0 0

21.4k 0 0

介绍了HDFS是什么、HDFS的优缺点，NameNode节点、DataNode节点、SecondaryNameNode节点的定义及功能介绍。
Hadoop 分布式大数据
【大数据全栈成长计划 Hadoop学习篇】第三阶段最终积分排行榜和最终考核成绩出炉！
各位进阶中的开发者们，大数据全栈成长计划第三阶段所有学习任务都已经结束大家心心念念的最终积分排行榜也已经出炉我们设置学习任务的目的就是想让大家在听课之余，用作业和心得来检验自己的学习成果最终积分排名会按照活动帖中符合条件的1-50名有实体奖品当排名节点处出现同分时，我们的评判标准为：阶段考核>问答官>分享转发>每周学习笔记>每章随堂测验；根据每个项目打卡时间的先后顺序排名积分统计依据：序号阶...

7号小助手
发表于2021-05-02 17:24:05
6879 0 0

6.8k 0 0

各位进阶中的开发者们，大数据全栈成长计划第三阶段所有学习任务都已经结束大家心心念念的最终积分排行榜也已经出炉我们设置学习任务的目的就是想让大家在听课之余，用作业和心得来检验自己的学习成果最终积分排名会按照活动帖中符合条件的1-50名有实体奖品当排名节点处出现同分时，我们的评判标准为：阶段考核>问答官>分享转发>每周学习笔记>每章随堂测验；根据每个项目打卡时间的先后顺序排名积分统计依据：序号阶...
Hadoop 大数据
搭建HDFS的HA环境(HBase安装及配置,启动)
1、在软件包所在目录解压Hbase压缩包[root@win1 soft]# tar -zxvf hbase-1.3.2-bin.tar.gz[root@win1 soft]# lshadoop-2.7.7 hbase-1.3.2 jdk1.8.0_161 zookeeper-3.4.12hadoop-2.7.7.tar.gz hbase-...

菜鸟级攻城狮
发表于2021-02-28 08:32:34
6701 0 1

6.7k 0 1

1、在软件包所在目录解压Hbase压缩包[root@win1 soft]# tar -zxvf hbase-1.3.2-bin.tar.gz[root@win1 soft]# lshadoop-2.7.7 hbase-1.3.2 jdk1.8.0_161 zookeeper-3.4.12hadoop-2.7.7.tar.gz hbase-...
Hadoop HBase 大数据
大数据基础学习四：伪分布式 Hadoop 在 Ubuntu 上的安装流程完整步骤、易错点分析及需要注意的问题
大数据基础学习四：伪分布式 Hadoop 在 Ubuntu 上的安装流程完整步骤、易错点分析及需要注意的问题（以 ubuntu-18.04.3、hadoop-3.2.1-tar.gz 为例），本系列的其他文章可以移步本人大数据专栏进行查看。对于本篇文章，我个人是很有自信的，一篇文章掌握一门课程核心技术点。

白鹿第一帅
发表于2021-02-07 16:28:23
8242 0 1

8.2k 0 1

大数据基础学习四：伪分布式 Hadoop 在 Ubuntu 上的安装流程完整步骤、易错点分析及需要注意的问题（以 ubuntu-18.04.3、hadoop-3.2.1-tar.gz 为例），本系列的其他文章可以移步本人大数据专栏进行查看。对于本篇文章，我个人是很有自信的，一篇文章掌握一门课程核心技术点。
Hadoop Ubuntu 分布式大数据
解决 Apache Hadoop 启动时 DataNode 没有启动的问题（注意这会删除 HDFS 中原有的所有数据）
解决 Apache Hadoop 启动时 DataNode 没有启动的问题（注意这会删除 HDFS 中原有的所有数据，如果原有的数据很重要请不要这样做）。

白鹿第一帅
发表于2021-02-07 15:33:38
8919 0 0

8.9k 0 0

解决 Apache Hadoop 启动时 DataNode 没有启动的问题（注意这会删除 HDFS 中原有的所有数据，如果原有的数据很重要请不要这样做）。
Apache Hadoop
【大数据计算】(一) HDFS操作方法和基础编程
1. HDFS操作常用Shell命令 1.1 查看命令使用方法启动Hadoop start-dfs.sh 1 查看各种命令 hdfs dfs -help 1 1.2 HDFS目录操作 ...

小生凡一
发表于2021-10-15 22:03:43
5710 0 0

5.7k 0 0

1. HDFS操作常用Shell命令 1.1 查看命令使用方法启动Hadoop start-dfs.sh 1 查看各种命令 hdfs dfs -help 1 1.2 HDFS目录操作 ...
Hadoop 大数据
如何避免Spark SQL做数据导入时产生大量小文件
01什么是小文件？生产上，我们往往将Spark SQL作为Hive的替代方案，来获得SQL on Hadoop更出色的性能。因此，本文所讲的是指存储于HDFS中小文件，即指文件的大小远小于HDFS上块（dfs.block.size）大小的文件。02小文件问题的影响一方面，大量的小文件会给Hadoop集群的扩展性和性能带来严重的影响。NameNode在内存中维护整个文件系统的元数据镜像，用户...

数据湖爱好者
发表于2021-05-13 15:40:29
14904 0 0

14.9k 0 0

01什么是小文件？生产上，我们往往将Spark SQL作为Hive的替代方案，来获得SQL on Hadoop更出色的性能。因此，本文所讲的是指存储于HDFS中小文件，即指文件的大小远小于HDFS上块（dfs.block.size）大小的文件。02小文件问题的影响一方面，大量的小文件会给Hadoop集群的扩展性和性能带来严重的影响。NameNode在内存中维护整个文件系统的元数据镜像，用户...
EI企业智能 Hadoop spark 数据湖探索 DLI 智能数据
【详解】HadoopCouldnotlocateexecutablenull解决办法
Hadoop Could not locate executable null 解决办法在使用Hadoop进行大数据处理时，可能会遇到“Could not locate executable null”这样的错误。这个错误通常出现在执行MapReduce任务时，表示Hadoop无法找到某个可执行文件。本文将探讨该问题的可能原因及解决方法。1. 错误现象当你尝试运行一个MapReduce作业时...

皮牙子抓饭
发表于2025-01-05 22:11:56
9505 0 0

9.5k 0 0

Hadoop Could not locate executable null 解决办法在使用Hadoop进行大数据处理时，可能会遇到“Could not locate executable null”这样的错误。这个错误通常出现在执行MapReduce任务时，表示Hadoop无法找到某个可执行文件。本文将探讨该问题的可能原因及解决方法。1. 错误现象当你尝试运行一个MapReduce作业时...
Hadoop Java
Python与HDFS的结合：高效处理分布式数据
在大数据处理领域，Hadoop分布式文件系统（HDFS）是一种非常常用的存储解决方案，尤其适用于存储和管理大量的结构化或非结构化数据。HDFS的分布式特性和高容错能力使其成为处理大规模数据集的首选平台。而Python作为一种流行的编程语言，拥有丰富的生态系统，可以与HDFS进行无缝集成，用于大规模数据的存储、管理和处理。本文将介绍如何使用Python与HDFS结合，以高效处理分布式数据。我们...

数字扫地僧
发表于2024-12-20 14:18:18
5974 0 0

5.9k 0 0

在大数据处理领域，Hadoop分布式文件系统（HDFS）是一种非常常用的存储解决方案，尤其适用于存储和管理大量的结构化或非结构化数据。HDFS的分布式特性和高容错能力使其成为处理大规模数据集的首选平台。而Python作为一种流行的编程语言，拥有丰富的生态系统，可以与HDFS进行无缝集成，用于大规模数据的存储、管理和处理。本文将介绍如何使用Python与HDFS结合，以高效处理分布式数据。我们...
Hadoop Python 分布式
Python与大数据：Hadoop与PySpark的整合
在现代大数据应用中，Hadoop和Spark作为两种主流的大数据处理框架，广泛用于数据存储、处理和分析。Hadoop主要用于分布式存储（通过HDFS）和分布式计算（通过MapReduce），而Spark则提供了更高效、易用的处理能力，特别适合批量和流数据的处理。Python作为一种易于学习和使用的编程语言，结合Hadoop和Spark的能力，可以大大提升大数据处理的效率和便捷性。本文将介绍如...

数字扫地僧
发表于2024-12-03 13:06:31
4132 0 0

4.1k 0 0

在现代大数据应用中，Hadoop和Spark作为两种主流的大数据处理框架，广泛用于数据存储、处理和分析。Hadoop主要用于分布式存储（通过HDFS）和分布式计算（通过MapReduce），而Spark则提供了更高效、易用的处理能力，特别适合批量和流数据的处理。Python作为一种易于学习和使用的编程语言，结合Hadoop和Spark的能力，可以大大提升大数据处理的效率和便捷性。本文将介绍如...
Hadoop Python 大数据
详解WARN util.NativeCodeLoader: Unable to load native-hadoop libra
详解WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable最近，你在使用Hadoop开源分布式处理框架时，可能会遇到如下警告信息：plaintextCopy codeWARN util.Na...

皮牙子抓饭
发表于2024-11-29 10:37:07
4012 0 0

4.0k 0 0

详解WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable最近，你在使用Hadoop开源分布式处理框架时，可能会遇到如下警告信息：plaintextCopy codeWARN util.Na...
Hadoop 大数据
【大数据技术基础 | 实验五】ZooKeeper实验：部署ZooKeeper
本实验介绍部署ZooKeeper的原理和实验步骤。部署三个节点的ZooKeeper集群，通过ZooKeeper客户端连接ZooKeeper集群，并用Shell命令练习创建目录，查询目录等。

Francek Chen
发表于2024-11-11 19:40:26
5746 0 0

5.7k 0 0

本实验介绍部署ZooKeeper的原理和实验步骤。部署三个节点的ZooKeeper集群，通过ZooKeeper客户端连接ZooKeeper集群，并用Shell命令练习创建目录，查询目录等。
Hadoop ZooKeeper 分布式大数据
【大数据技术基础 | 实验四】HDFS实验：读写HDFS文件
本文介绍HDFS读写文件的相关原理和实验步骤。搭建HDFS开发环境，分别在master服务器上和Eclipse环境中编写了HDFS写、读代码，在master机上执行了该写、读程序。通过实验了解HDFS读写文件的调用流程，理解HDFS读写文件的原理。

Francek Chen
发表于2024-11-11 19:34:47
7220 0 0

7.2k 0 0

本文介绍HDFS读写文件的相关原理和实验步骤。搭建HDFS开发环境，分别在master服务器上和Eclipse环境中编写了HDFS写、读代码，在master机上执行了该写、读程序。通过实验了解HDFS读写文件的调用流程，理解HDFS读写文件的原理。
Hadoop hdfs 分布式大数据
【大数据技术基础 | 实验三】HDFS实验：部署HDFS
本文介绍部署HDFS相关原理和实验步骤。理解HDFS体系架构和master/slave架构，学会逐一启动HDFS和统一启动HDFS，并完成在HDFS中新建目录和上传文件。

Francek Chen
发表于2024-11-11 19:24:23
5551 0 0

5.5k 0 0

本文介绍部署HDFS相关原理和实验步骤。理解HDFS体系架构和master/slave架构，学会逐一启动HDFS和统一启动HDFS，并完成在HDFS中新建目录和上传文件。
Hadoop hdfs 分布式大数据

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript