Hadoop_标签_开发者

博客(12.2k)
视频(1)
论坛(0)
云声(0)
代码示例(0)

大数据面试题（二）：Hadoop的联邦机制核心高频面试题
Hadoop的联邦机制核心高频面试题一、为什么会出现联邦Hadoop的NN所使用的资源受所在服务的物理限制，不能满足实际生产需求。二、联邦的实现采用多台NN组成联邦。NN是独立的，NN之间不需要相互调用。NN是联合的，同属于一个联邦，所管理的DN作为block的公共存储。如下图：图中概念：block pool的概念，每一个namespace都有一个pool，datanodes会存储集群中所...

Lansonli
发表于2022-12-14 14:00:34
1272 0 0

1.2k 0 0

Hadoop的联邦机制核心高频面试题一、为什么会出现联邦Hadoop的NN所使用的资源受所在服务的物理限制，不能满足实际生产需求。二、联邦的实现采用多台NN组成联邦。NN是独立的，NN之间不需要相互调用。NN是联合的，同属于一个联邦，所管理的DN作为block的公共存储。如下图：图中概念：block pool的概念，每一个namespace都有一个pool，datanodes会存储集群中所...
Hadoop 大数据
大数据面试题（二）：Hadoop的联邦机制核心高频面试题
Hadoop的联邦机制核心高频面试题一、为什么会出现联邦Hadoop的NN所使用的资源受所在服务的物理限制，不能满足实际生产需求。二、联邦的实现采用多台NN组成联邦。NN是独立的，NN之间不需要相互调用。NN是联合的，同属于一个联邦，所管理的DN作为block的公共存储。如下图：图中概念：block pool的概念，每一个namespace都有一个pool，datanodes会存储集群中所...

Lansonli
发表于2022-12-12 21:41:18
1256 0 0

1.2k 0 0

Hadoop的联邦机制核心高频面试题一、为什么会出现联邦Hadoop的NN所使用的资源受所在服务的物理限制，不能满足实际生产需求。二、联邦的实现采用多台NN组成联邦。NN是独立的，NN之间不需要相互调用。NN是联合的，同属于一个联邦，所管理的DN作为block的公共存储。如下图：图中概念：block pool的概念，每一个namespace都有一个pool，datanodes会存储集群中所...
Hadoop 大数据
CDH+Kylin三部曲之一：准备工作
本文是《CDH+Kylin三部曲》的第一篇，主要是为后面的安装和启动做好准备工作

程序员欣宸
发表于2022-12-05 08:18:46
1195 0 0

1.1k 0 0

本文是《CDH+Kylin三部曲》的第一篇，主要是为后面的安装和启动做好准备工作
Hadoop
超简单的CDH6部署和体验(单机版)
借助ansible，和已经调试好的playbook，快速部署和体验单机版CDH6

程序员欣宸
发表于2022-12-01 14:47:08
1427 0 0

1.4k 0 0

借助ansible，和已经调试好的playbook，快速部署和体验单机版CDH6
Hadoop spark
大数据Kudu（一）：什么是Kudu
什么是Kudu前言结构化数据存储在Hadoop生态系统中，分为静态数据和动态数据两类。静态数据指的是需要进行数据分析的数据，这种分析针对的数据量一般很大，例如：统计全年每个地区总营业额。动态数据指的是数据需要实时动态插入、更新、读取的数据。例如业务系统中海量用户基本信息的存储。静态数据：对于大批量数据分析场景，为了便于数据分析，Hadoop生态系统中一般将数据存储在HDFS中，HDFS设计...

Lansonli
发表于2022-11-28 11:13:59
1312 0 0

1.3k 0 0

什么是Kudu前言结构化数据存储在Hadoop生态系统中，分为静态数据和动态数据两类。静态数据指的是需要进行数据分析的数据，这种分析针对的数据量一般很大，例如：统计全年每个地区总营业额。动态数据指的是数据需要实时动态插入、更新、读取的数据。例如业务系统中海量用户基本信息的存储。静态数据：对于大批量数据分析场景，为了便于数据分析，Hadoop生态系统中一般将数据存储在HDFS中，HDFS设计...
Hadoop 大数据
hadoop2.7集群初始化之后没有DataNode的问题
修复hadoop2.7集群初始化之后没有DataNode的问题

程序员欣宸
发表于2022-11-05 00:06:35
1160 0 0

1.1k 0 0

修复hadoop2.7集群初始化之后没有DataNode的问题
Hadoop
Mac部署hadoop3(伪分布式)
实战Mac部署hadoop3(伪分布式)

程序员欣宸
发表于2022-11-02 08:38:43
3530 0 0

3.5k 0 0

实战Mac部署hadoop3(伪分布式)
Hadoop macOS 分布式
查看Spark任务的详细信息
在学习Spark的过程中，查看任务的DAG、stage、task等详细信息是学习的重要手段，在此做个小结

程序员欣宸
发表于2022-10-31 07:33:41
1306 0 0

1.3k 0 0

在学习Spark的过程中，查看任务的DAG、stage、task等详细信息是学习的重要手段，在此做个小结
Hadoop spark
Hadoop之HDFS的集群之间的数据复制、归档机制和安全模式
1．不同集群之间的数据复制在我们实际工作当中，极有可能会遇到将测试集群的数据拷贝到生产环境集群，或者将生产环境集群的数据拷贝到测试集群，那么就需要我们在多个集群之间进行数据的==远程拷贝==，hadoop自带也有命令可以帮我们实现这个功能。 1.1．集群内部文件拷贝scpcd /export/softwares/scp -r jdk-8u141-linux-x64.tar.gz root@...

chad_chang
发表于2022-10-29 21:34:59
6677 0 0

6.6k 0 0

1．不同集群之间的数据复制在我们实际工作当中，极有可能会遇到将测试集群的数据拷贝到生产环境集群，或者将生产环境集群的数据拷贝到测试集群，那么就需要我们在多个集群之间进行数据的==远程拷贝==，hadoop自带也有命令可以帮我们实现这个功能。 1.1．集群内部文件拷贝scpcd /export/softwares/scp -r jdk-8u141-linux-x64.tar.gz root@...
Hadoop 数据复制服务 DRS
大数据入门学习指南
大数据入门核心技术栏目是为初学者精心打造入门大数据必学知识整理，内容十分丰富，集合将近200篇高质文章带你轻松学习。但是由于文章很多，集合很多不同系列的知识点，在栏目里面难以标注顺序，这次博主花时间整理一份详细的学习指南，对于刚学习大数据的初学者是非常友好的。只要跟着学，想进入大数据做开发是很容易的，前提你得自律加坚持。

Lansonli
发表于2022-07-10 10:40:35
1598 0 1

1.5k 0 1

大数据入门核心技术栏目是为初学者精心打造入门大数据必学知识整理，内容十分丰富，集合将近200篇高质文章带你轻松学习。但是由于文章很多，集合很多不同系列的知识点，在栏目里面难以标注顺序，这次博主花时间整理一份详细的学习指南，对于刚学习大数据的初学者是非常友好的。只要跟着学，想进入大数据做开发是很容易的，前提你得自律加坚持。
Hadoop Hive 大数据
hdfs fsck 常用命令
hdfs fsck命令是用来检查HDFS中的文件。使用方法：hdfs fsck <path> [-list-corruptfileblocks | [-move | -delete | -openforwrite] [-files [-blocks [-locations | -racks]]]]<path>：fsck文件检查路径。-move：将损坏的文件移动到/lost+found。-de...

nia nia
发表于2022-05-23 10:26:39
2735 0 0

2.7k 0 0

hdfs fsck命令是用来检查HDFS中的文件。使用方法：hdfs fsck <path> [-list-corruptfileblocks | [-move | -delete | -openforwrite] [-files [-blocks [-locations | -racks]]]]<path>：fsck文件检查路径。-move：将损坏的文件移动到/lost+found。-de...
Hadoop
hdfs dfsadmin 常用命令
hdfs dfsadmin命令是HDFS中的管理命令，通过该命令可以对HDFS进行管理操作：以下将对比较常见的命令做重点介绍：report使用方法：hdfs dfsadmin -report该命令将获取HDFS整体健康概况和每个DataNode节点的使用概况。举例说明：该命令首先列出HDFS整体的健康状况。例如，DFS Used表示当前HDFS存储空间的已使用空间余量，Block with ...

nia nia
发表于2022-05-23 10:25:47
3852 0 0

3.8k 0 0

hdfs dfsadmin命令是HDFS中的管理命令，通过该命令可以对HDFS进行管理操作：以下将对比较常见的命令做重点介绍：report使用方法：hdfs dfsadmin -report该命令将获取HDFS整体健康概况和每个DataNode节点的使用概况。举例说明：该命令首先列出HDFS整体的健康状况。例如，DFS Used表示当前HDFS存储空间的已使用空间余量，Block with ...
Hadoop
Hadoop快速入门——第四章、zookeeper(集群)
Hadoop快速入门——第四章、zookeeper集群前置条件：配置ssh免密登录&hadoop分布式1、上传【zookeeper-3.4.6.tar.gz】文件2、解压文件tar -zxvf zookeeper-3.4.6.tar.gz3、修改文件名称方便操作 mv zookeeper-3.4.6 zookeeper4、编辑脚本文件vi /etc/profile.d/hadoop...

红目香薰
发表于2022-04-30 23:40:50
3830 0 0

3.8k 0 0

Hadoop快速入门——第四章、zookeeper集群前置条件：配置ssh免密登录&hadoop分布式1、上传【zookeeper-3.4.6.tar.gz】文件2、解压文件tar -zxvf zookeeper-3.4.6.tar.gz3、修改文件名称方便操作 mv zookeeper-3.4.6 zookeeper4、编辑脚本文件vi /etc/profile.d/hadoop...
Hadoop ZooKeeper
Hadoop快速入门——第四章、zookeeper安装
Hadoop快速入门——第四章、zookeeper安装压缩包下载地址：【https://download.csdn.net/download/feng8403000/85227883】目录1、上传【zookeeper-3.4.6.tar.gz】文件2、解压文件3、修改文件名称方便操作 4、编辑脚本文件5、执行脚本文件6、修改配置文件7、在【/opt/zookeeper】下创建【dat...

红目香薰
发表于2022-04-30 23:40:22
3875 0 0

3.8k 0 0

Hadoop快速入门——第四章、zookeeper安装压缩包下载地址：【https://download.csdn.net/download/feng8403000/85227883】目录1、上传【zookeeper-3.4.6.tar.gz】文件2、解压文件3、修改文件名称方便操作 4、编辑脚本文件5、执行脚本文件6、修改配置文件7、在【/opt/zookeeper】下创建【dat...
Hadoop ZooKeeper
HDFS文件错误导致上传到HDFS失败
适用版本6.5.x。问题背景与现象用hadoop dfs -put把本地文件拷贝到HDFS上，有报错。上传部分文件后，报错失败，从NameNode原生页面看，临时文件大小不再变化。原因分析查看NameNode日志“/var/log/Bigdata/hdfs/nn/hadoop-omm-namenode-主机名.log”，发现该文件一直在被尝试写，直到最终失败。2015-07-13 10:05...

xxlla
发表于2022-04-23 16:40:53
2539 0 0

2.5k 0 0

适用版本6.5.x。问题背景与现象用hadoop dfs -put把本地文件拷贝到HDFS上，有报错。上传部分文件后，报错失败，从NameNode原生页面看，临时文件大小不再变化。原因分析查看NameNode日志“/var/log/Bigdata/hdfs/nn/hadoop-omm-namenode-主机名.log”，发现该文件一直在被尝试写，直到最终失败。2015-07-13 10:05...
Hadoop

上滑加载中

推荐直播

0.25

华为云Metastudio×DeepSeek与RAG检索优化分享
2025/03/14 周五 16:00-17:30

大海华为云学堂技术讲师 Cocl 华为云学堂技术讲师

本次直播将带来DeepSeek数字人解决方案，以及如何使用Embedding与Rerank实现检索优化实践，为开发者与企业提供参考，助力场景落地。
去报名
融合算子设计原理与实现系列（九）
2025/03/13 周四 15:00-17:00

姚宇昇腾CANN生态技术专家

典型输入场景的FA算子开发-核函数实现详解
回顾中
华为开发者空间玩转DeepSeek
2025/03/13 周四 19:00-20:30

马欣山东商业职业技术学院云计算专业讲师，山东大学、山东建筑大学等多所本科学校学生校外指导老师

同学们，想知道如何利用华为开发者空间部署自己的DeepSeek模型吗？想了解如何用DeepSeek在云主机上探索好玩的应用吗？想探讨如何利用DeepSeek在自己的专有云主机上辅助编程吗？让我们来一场云和AI的盛宴。
回顾中
华为云Metastudio×DeepSeek与RAG检索优化分享
2025/03/14 周五 16:00-17:30

大海华为云学堂技术讲师 Cocl 华为云学堂技术讲师

本次直播将带来DeepSeek数字人解决方案，以及如何使用Embedding与Rerank实现检索优化实践，为开发者与企业提供参考，助力场景落地。
去报名
融合算子设计原理与实现系列（九）
2025/03/13 周四 15:00-17:00

姚宇昇腾CANN生态技术专家

典型输入场景的FA算子开发-核函数实现详解
回顾中

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript

开发者空间

了解空间

工作台

开发工具

实战案例

空间活动

空间论坛

开发平台

软件开发生产线 CodeArts

AI平台ModelArts

数据治理中心 DataArts Studio

数字内容生产线 MetaStudio

精选服务

云数据库 GaussDB

云数据库 RDS for MySQL

MapReduce服务 MRS

数据仓库服务 DWS

分布式缓存服务Redis版

分布式消息服务 DMS

华为云实时音视频 SparkRTC

媒体处理 MPC

主机迁移服务 SMS

对象存储迁移服务 OMS

云消息服务 KooMessage

云手机服务 KooPhone

企业搜索服务 KooSearch

云地图服务 KooMap

更多开放能力

开发工具

API生态

CodeArts API

API Explorer

Terraform Explorer

KooCLI

API 中心

SDK 中心

开发服务

Codelabs

DevStar

低代码平台Astro

CodeArts IDE

Huawei Cloud Toolkit

Classroom

开发资源

开源镜像站

开源资源

开发语言

开发实践

入门精选

分发资源

企业应用中心

企业通用专区

教育专区

华为应用专区

政务云专区

硬件云服务商城

医疗健康专区

跳蚤市场

华为云开发者日

直播专区

开发者精品活动

DTSE Tech Talk

加入HCDE

加入HCDG

加入HCSD

加入HCWD

鲁班会

沃土云创计划·企业

沃土云创计划·高校

沃土云创计划·个人

沃土云创计划·开源共创

博客

论坛

专题

开发者榜单

学习路径

在线课程

动手实验

考试认证

培训服务