Hadoop_标签_开发者_华为云

博客(12.2k)
视频(1)
论坛(0)
云声(0)
代码示例(0)

HDFS客户端写文件close失败
适用版本6.5.x。问题背景与现象客户端写文件close失败，客户端提示数据块没有足够副本数。日志如下：2015-05-27 19:00:52.811 [pool-2-thread-3] ERROR: /tsp/nedata/collect/UGW/ugwufdr/20150527/10/6_20150527105000_20150527105500_SR5S14_1432723806338...

xxlla
发表于2022-04-23 16:39:00
2886 0 0

2.8k 0 0

适用版本6.5.x。问题背景与现象客户端写文件close失败，客户端提示数据块没有足够副本数。日志如下：2015-05-27 19:00:52.811 [pool-2-thread-3] ERROR: /tsp/nedata/collect/UGW/ugwufdr/20150527/10/6_20150527105000_20150527105500_SR5S14_1432723806338...
Hadoop
HDFS 文件最大打开句柄数设置太小导致读写文件异常
适用版本6.5.x。问题背景与现象文件最大打开句柄数设置太小，导致文件句柄不足。写文件到HDFS很慢，或者写文件失败。原因分析DataNode日志“/var/log/Bigdata/hdfs/dn/hadoop-omm-datanode-XXX.log”，存在异常提示java.io.IOException: Too many open files。2016-05-19 17:18:59,12...

xxlla
发表于2022-04-23 16:36:48
2842 0 0

2.8k 0 0

适用版本6.5.x。问题背景与现象文件最大打开句柄数设置太小，导致文件句柄不足。写文件到HDFS很慢，或者写文件失败。原因分析DataNode日志“/var/log/Bigdata/hdfs/dn/hadoop-omm-datanode-XXX.log”，存在异常提示java.io.IOException: Too many open files。2016-05-19 17:18:59,12...
Hadoop
HDFS DataNode的数据线程不足
适用版本6.5.x。问题背景与现象当用户在HDFS上执行写操作时，出现“Failed to place enough replicas:expected…”信息。原因分析DataNode的数据接受器不可用。此时DataNode会有如下日志：2016-03-17 18:51:44,721 | WARN | org.apache.hadoop.hdfs.server.datanode.DataX...

xxlla
发表于2022-04-23 16:35:02
1949 0 0

1.9k 0 0

适用版本6.5.x。问题背景与现象当用户在HDFS上执行写操作时，出现“Failed to place enough replicas:expected…”信息。原因分析DataNode的数据接受器不可用。此时DataNode会有如下日志：2016-03-17 18:51:44,721 | WARN | org.apache.hadoop.hdfs.server.datanode.DataX...
Hadoop
HDFS备NameNode长期故障，如何客户端手动checkpoint
适用版本6.5.x。问题背景与现象在备NameNode长期异常的情况下，会积攒大量的editlog，此时如果重启HDFS或者主NameNode，主NameNode会读取大量的未合并的editlog，导致耗时启动较长，甚至启动失败。原因分析备NameNode会周期性做合并editlog，生成fsimage文件的过程叫做checkpoint。备NameNode在新生成fsimage后，会将fsi...

xxlla
发表于2022-04-23 16:33:33
2442 0 0

2.4k 0 0

适用版本6.5.x。问题背景与现象在备NameNode长期异常的情况下，会积攒大量的editlog，此时如果重启HDFS或者主NameNode，主NameNode会读取大量的未合并的editlog，导致耗时启动较长，甚至启动失败。原因分析备NameNode会周期性做合并editlog，生成fsimage文件的过程叫做checkpoint。备NameNode在新生成fsimage后，会将fsi...
Hadoop
HDFS异常下电后，DataNode实例状态异常（文件损坏）
适用版本6.5.x。问题背景与现象DataNode 实例状态异常，查看日志发现无法访问磁盘上某些文件。使用“ll 文件名”命令查看文件的属性为“??”。其他非HDFS文件读取失败，文件属性为“??”也可以参考此案例执行。可能原因对应DataNode节点的磁盘有坏道。原因分析进入服务实例，确认故障的节点使用PuTTY登录该节点，执行如下命令（这里/export/data1目录是DataNode...

xxlla
发表于2022-04-23 16:31:08
1937 0 0

1.9k 0 0

适用版本6.5.x。问题背景与现象DataNode 实例状态异常，查看日志发现无法访问磁盘上某些文件。使用“ll 文件名”命令查看文件的属性为“??”。其他非HDFS文件读取失败，文件属性为“??”也可以参考此案例执行。可能原因对应DataNode节点的磁盘有坏道。原因分析进入服务实例，确认故障的节点使用PuTTY登录该节点，执行如下命令（这里/export/data1目录是DataNode...
Hadoop
hadoop distcp命令使用指导
DistCp（分布式拷贝）是用于大规模集群内部和集群之间拷贝的工具。它使用Map/Reduce实现文件分发，错误处理和恢复，以及报告生成。它把文件和目录的列表作为map任务的输入，每个任务会完成源列表中部分文件的拷贝。

泽及天下不为仁
发表于2022-04-14 18:02:30
11898 0 1

11.8k 0 1

DistCp（分布式拷贝）是用于大规模集群内部和集群之间拷贝的工具。它使用Map/Reduce实现文件分发，错误处理和恢复，以及报告生成。它把文件和目录的列表作为map任务的输入，每个任务会完成源列表中部分文件的拷贝。
EI企业智能 Hadoop MapReduce MapReduce服务 MRS
大数据开发岗面试复习30天冲刺 - 日积月累，每日五题【Day01】——Hadoop和Linux
前言大家好，我是程序员manor。作为一名大数据专业学生、爱好者，深知面试重要性，正值金三银四的春招接下来我准备用30天时间，基于大数据开发岗面试中的高频面试题，以每日5题的形式，带你过一遍常见面试题及恰如其分的解答。相信只要一路走来，日积月累，我们终会在最高处见。以古人的话共勉：道阻且长，行则将至；行而不辍，未来可期！ Hadoop相关总结1.2.1 Hadoop常用端口号dfs.na...

Maynor学长
发表于2022-03-04 20:10:10
1986 0 0

1.9k 0 0

前言大家好，我是程序员manor。作为一名大数据专业学生、爱好者，深知面试重要性，正值金三银四的春招接下来我准备用30天时间，基于大数据开发岗面试中的高频面试题，以每日5题的形式，带你过一遍常见面试题及恰如其分的解答。相信只要一路走来，日积月累，我们终会在最高处见。以古人的话共勉：道阻且长，行则将至；行而不辍，未来可期！ Hadoop相关总结1.2.1 Hadoop常用端口号dfs.na...
Hadoop Linux 大数据
[hadoop3.x]HDFS之银行海量转账数据分层案例(八)
银行每一天都有大量的转账、交易需要保存、处理。用户每进行一笔交易或者转账，银行都需要将用户转账的所有相关信息保存下来。四大银行：银行有非常多的用户，四大银行拥有数10亿的用户。要保存的数据量可想而知。如果说有的数据，都同等对待，为了保证使用数据的性能，采用的是高性能存储，这将是一笔不小的资源浪费。实际上，超过一定时间的数据，数据访问的频率要低得多。例如：用户查询5年前的转账记录、要比查询1年...

Maynor学长
发表于2022-03-04 19:50:12
1871 0 0

1.8k 0 0

银行每一天都有大量的转账、交易需要保存、处理。用户每进行一笔交易或者转账，银行都需要将用户转账的所有相关信息保存下来。四大银行：银行有非常多的用户，四大银行拥有数10亿的用户。要保存的数据量可想而知。如果说有的数据，都同等对待，为了保证使用数据的性能，采用的是高性能存储，这将是一笔不小的资源浪费。实际上，超过一定时间的数据，数据访问的频率要低得多。例如：用户查询5年前的转账记录、要比查询1年...
Hadoop
[hadoop3.x]HDFS中的内存存储支持(七)概述
目前博客Hadoop文章大都停留在Hadoop2.x阶段，本系列将依据黑马程序员大数据Hadoop3.x全套教程，对2.x没有的新特性进行补充更新，一键三连加关注，下次不迷路！

Maynor学长
发表于2022-03-04 19:48:59
1953 0 0

1.9k 0 0

目前博客Hadoop文章大都停留在Hadoop2.x阶段，本系列将依据黑马程序员大数据Hadoop3.x全套教程，对2.x没有的新特性进行补充更新，一键三连加关注，下次不迷路！
Hadoop
RDD有哪些特点
RDD有哪些特点顾名思义，从字面理解RDD就是 Resillient Distributed Dataset，即弹性分布式数据集。它是Spark提供的核心抽象。RDD在抽象上来讲是一种抽象的分布式的数据集。它是被分区的，每个分区分布在集群中的不同的节点上。从而可以让数据进行并行的计算rdd 分布式弹性数据集，简单的理解成一种数据结构，是 spark 框架上的通用货币。所有算子都是基于 rd...

孙中明
发表于2022-02-23 08:27:09
1857 0 0

1.8k 0 0

RDD有哪些特点顾名思义，从字面理解RDD就是 Resillient Distributed Dataset，即弹性分布式数据集。它是Spark提供的核心抽象。RDD在抽象上来讲是一种抽象的分布式的数据集。它是被分区的，每个分区分布在集群中的不同的节点上。从而可以让数据进行并行的计算rdd 分布式弹性数据集，简单的理解成一种数据结构，是 spark 框架上的通用货币。所有算子都是基于 rd...
Hadoop spark
tbase配置hdfs备份
1，系统环境变量配置export JAVA_HOME=/opt/jdk1.8.0_40export HADOOP_HOME=/opt/hadoop-3.3.0export PATH=$PATH:$JAVA_HOME/binexport PATH=$PATH:/opt/hadoop-3.3.0/bin/:/opt/hadoop-3.3.0/sbin2，配置hadoop，使用hadoop用户//...

snowofsummer
发表于2022-01-20 13:42:10
2104 0 0

2.1k 0 0

1，系统环境变量配置export JAVA_HOME=/opt/jdk1.8.0_40export HADOOP_HOME=/opt/hadoop-3.3.0export PATH=$PATH:$JAVA_HOME/binexport PATH=$PATH:/opt/hadoop-3.3.0/bin/:/opt/hadoop-3.3.0/sbin2，配置hadoop，使用hadoop用户//...
Hadoop PostgreSQL
我们一起来了解大数据和其生态圈的软件工具
大数据（BigData）的特点数据量大，数据类型复杂，数据处理快，数据真实性高。大数据的生态软件工具包含：Hadoop，Spark，MapReduce，HDFS，Hive，HBase，Zookeeper，Flume，Kafka，Yarn，Storm，Oozie，Pig，Mahout等。

zekelove
发表于2021-12-19 11:44:30
3410 0 1

3.4k 0 1

大数据（BigData）的特点数据量大，数据类型复杂，数据处理快，数据真实性高。大数据的生态软件工具包含：Hadoop，Spark，MapReduce，HDFS，Hive，HBase，Zookeeper，Flume，Kafka，Yarn，Storm，Oozie，Pig，Mahout等。
Hadoop MapReduce spark 分布式大数据
Hadoop hdfs客户端配置
hdfs单节点安装配置参考：https://bbs.huaweicloud.com/blogs/315874新建用户tdsql,并解压hadoop软件：#地址修改hdfs 的地址。修改配置文件：（core-site.xml）<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://1...

snowofsummer
发表于2021-12-14 11:29:46
2445 0 0

2.4k 0 0

hdfs单节点安装配置参考：https://bbs.huaweicloud.com/blogs/315874新建用户tdsql,并解压hadoop软件：#地址修改hdfs 的地址。修改配置文件：（core-site.xml）<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://1...
Hadoop
FusionInsight Loader基本原理
Loader是在开源Sqoop组件的基础上进行了一些扩展，实现MRS与关系型数据库、文件系统之间交换“数据”、“文件”，同时也可以将数据从关系型数据库或者文件服务器导入到HDFS/HBase中，或者反过来从HDFS/HBase导出到关系型数据库或者文件服务器中。

一枚核桃
发表于2021-11-30 14:49:32
7804 0 0

7.8k 0 0

Loader是在开源Sqoop组件的基础上进行了一些扩展，实现MRS与关系型数据库、文件系统之间交换“数据”、“文件”，同时也可以将数据从关系型数据库或者文件服务器导入到HDFS/HBase中，或者反过来从HDFS/HBase导出到关系型数据库或者文件服务器中。
EI企业智能 FusionInsight Hadoop
【对接工具】Power BI工具对接HetuEngine
Power BI工具对接HetuEngine1 适用版本MRS 811、MRS 8122 预制条件MRS集群各组件运行正常。Power BI工具包（exe）已下载至本地，软件下载地址：https://powerbi.microsoft.com/zh-cn/getting-started-with-power-bi/ 下载连接HetuEngine驱动包，下载地址：https...

李松
发表于2021-11-29 22:15:21
8717 0 0

8.7k 0 0

Power BI工具对接HetuEngine1 适用版本MRS 811、MRS 8122 预制条件MRS集群各组件运行正常。Power BI工具包（exe）已下载至本地，软件下载地址：https://powerbi.microsoft.com/zh-cn/getting-started-with-power-bi/ 下载连接HetuEngine驱动包，下载地址：https...
EI企业智能 FusionInsight Hadoop

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript