hdfs_标签_开发者

博客(178)
视频(0)
论坛(11)
云声(0)
代码示例(0)

[运维管理] 线下 HD 651版本，当日志出现 Waited 19016 ms (timeout=20000 ms) fo for a response for senddits, No responses yet.时

线下 HD 651版本，当日志出现 Waited 19016 ms (timeout=20000 ms) fo for a response for senddits, No responses yet.时是/srv/BigData/namenode磁盘慢还是/srv/BigData/journalnode磁盘慢？

pack 发表于2024-12-23 11:44:03 2024-12-23 11:44:03 最后回复 Jack20 2024-12-26 11:25:43
82 7

hdfs MapReduce服务 MRS
[基础组件] HDFS节点滚动重启时，HBase集群的RegionServer WAL写，偶现超时卡住

HDFS的DataNode在低频率重启过程中，HBase集群的RegionServer WAL写流程，会偶现以下WAL超时卡住错误，如何解决呢：2024-08-26 15:35:13,294 ERROR [RS_CLOSE_REGION-regionserver/cqbs028:60020-1] executor.EventHandler: Caught throwable while processing event M_RS_CLOSE_REGIONjava.lang.RuntimeException: org.apache.hadoop.hbase.exceptions.TimeoutIOException: Failed to get sync result after 300000 ms for txid=818811, WAL system stuck?at org.apache.hadoop.hbase.regionserver.handler.CloseRegionHandler.process(CloseRegionHandler.java:116)at org.apache.hadoop.hbase.executor.EventHandler.run(EventHandler.java:104)Caused by: org.apache.hadoop.hbase.exceptions.TimeoutIOException: Failed to get sync result after 300000 ms for txid=818811, WAL system stuck?at org.apache.hadoop.hbase.regionserver.wal.SyncFuture.get(SyncFuture.java:148)at org.apache.hadoop.hbase.regionserver.wal.AbstractFSWAL.blockOnSync(AbstractFSWAL.java:711)at org.apache.hadoop.hbase.regionserver.wal.AsyncFSWAL.sync(AsyncFSWAL.java:631)at org.apache.hadoop.hbase.regionserver.wal.WALUtil.doFullAppendTransaction(WALUtil.java:158)at org.apache.hadoop.hbase.regionserver.wal.WALUtil.writeMarker(WALUtil.java:136)at org.apache.hadoop.hbase.regionserver.wal.WALUtil.writeRegionEventMarker(WALUtil.java:101)at org.apache.hadoop.hbase.regionserver.HRegion.writeRegionCloseMarker(HRegion.java:1145)at org.apache.hadoop.hbase.regionserver.HRegion.doClose(HRegion.java:1684)at org.apache.hadoop.hbase.regionserver.HRegion.close(HRegion.java:1501)at org.apache.hadoop.hbase.regionserver.handler.CloseRegionHandler.process(CloseRegionHandler.java:104)在停止RegionServer的过程中，也有可能会因为WAL卡住，停止RegionServer慢：java.lang.RuntimeException: org.apache.hadoop.hbase.exceptions.TimeoutIOException: Failed to get sync result after 300000 ms for txid=818767, WAL system stuck?at org.apache.hadoop.hbase.regionserver.handler.CloseRegionHandler.process(CloseRegionHandler.java:116)at org.apache.hadoop.hbase.executor.EventHandler.run(EventHandler.java:104)at java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1128)at java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:628)at java.base/java.lang.Thread.run(Thread.java:829)Caused by: org.apache.hadoop.hbase.exceptions.TimeoutIOException: Failed to get sync result after 300000 ms for txid=818767, WAL system stuck?at org.apache.hadoop.hbase.regionserver.wal.SyncFuture.get(SyncFuture.java:148)at org.apache.hadoop.hbase.regionserver.wal.AbstractFSWAL.blockOnSync(AbstractFSWAL.java:711)at org.apache.hadoop.hbase.regionserver.wal.AsyncFSWAL.sync(AsyncFSWAL.java:631)at org.apache.hadoop.hbase.regionserver.wal.WALUtil.doFullAppendTransaction(WALUtil.java:158)at org.apache.hadoop.hbase.regionserver.wal.WALUtil.writeMarker(WALUtil.java:136)at org.apache.hadoop.hbase.regionserver.wal.WALUtil.writeRegionEventMarker(WALUtil.java:101)at org.apache.hadoop.hbase.regionserver.HRegion.writeRegionCloseMarker(HRegion.java:1145)at org.apache.hadoop.hbase.regionserver.HRegion.doClose(HRegion.java:1684)at org.apache.hadoop.hbase.regionserver.HRegion.close(HRegion.java:1501)at org.apache.hadoop.hbase.regionserver.handler.CloseRegionHandler.process(CloseRegionHandler.java:104)

yd_279396828 发表于2024-08-28 10:28:40 2024-08-28 10:28:40 最后回复赫塔穆勒 2024-09-02 09:14:19
139 4

hdfs MapReduce服务 MRS HBase Hadoop FusionInsight
开启HDFS NodeLabel ，有哪些坑？需要重点注意那块影响？

环境：FusionInsight HD 6513背景： 1. 原集群datanode 机器基本为ARM,且配置较高，设备较新； 2. 现有一批低性能、低配置X86主机，需扩容到集群中；计划：启动HDFS NodeLabel 功能，对HDFS 目录进行打标签，将后扩容主机设置成指定标签目录的主机，以此来规避机器异构可能出现的负载不均等问题。需求: 1. 帮忙确认一下该方案是否可行，是否有更好的方案。 2. 如果此方案可行，是否有需要注意的方向，是否有踩坑案例(越详细越好)可以提供一下。烦请社区的大佬，帮帮忙！

Ming2370 发表于2024-03-19 17:01:23 2024-03-19 17:01:23 最后回复 jinxiaohui 2024-05-07 16:04:41
89 3

hdfs MapReduce服务 MRS Hadoop FusionInsight MapReduce
[问题求助] spark写高斯数据库异常提示

采用spark将计算好的数据写入高斯数据库，提示invalid input syntax for type oid:"xxxxx"。导致部分数据无法写入oid这个是系统表中对数据库资源的标志吧，sql中没有修改这个字段。这个异常具体怎么回事，有大神能够帮忙解释一下吗？

yd_261851218 发表于2024-01-05 12:49:18 2024-01-05 12:49:18 最后回复 yd_223987260 2024-09-02 15:48:57
242 4

big data hdfs 大数据
[运维管理] FusionInsight HD 6513 在线升级 FusionInsight HD 6517版本需要多长时间？怎么评估的？

FusionInsight HD 6513 在线升级 FusionInsight HD 6517版本需要多长时间？怎么评估的？

pack 发表于2024-01-04 17:15:55 2024-01-04 17:15:55 最后回复晋红轻 2024-01-15 15:47:57
153 2

hdfs spark FusionInsight Kafka
[运维管理] FusionInsight HD 6513升级 FusionInsight HD 6517版本，是否支持部分组件(如kafka 、zookeeper)在线升级，其他组件离线升级？

FusionInsight HD 6513升级 FusionInsight HD 6517版本，是否支持部分组件在线升级，其他组件离线升级？

pack 发表于2024-01-04 10:26:47 2024-01-04 10:26:47 最后回复 pack 2024-01-04 17:24:20
109 3

hdfs spark HBase FusionInsight Kafka
[运维管理] HD 线下6.5.1.7版本集群，hdfs 将副本临时调整1后再调回3会发生什么现象？

HD 线下6.5.1.7版本集群，hdfs 将副本临时调整1后再调回3会发生什么现象？

pack 发表于2023-10-31 11:09:35 2023-10-31 11:09:35 最后回复晋红轻 2023-10-31 11:42:25
98 2

hdfs FusionInsight
[基础组件] Python 读hdfs写hudi

Python 读写入hdfs代码import sys sys.path.insert(0, '/opt/140client/Spark2x/spark/python') sys.path.insert(0, '/opt/140client/Spark2x/spark/python/lib/py4j-0.10.9-src.zip') import os os.environ["PYSPARK_PYTHON"]="/usr/anaconda3/bin/python3" import pyspark from pyspark.sql import SparkSession from pyspark import SparkConf from pyspark import SparkContext os.system('source /opt/140client/bigdata_env') from pyspark.sql.types import StructType, StructField, StringType, IntegerType spark = SparkSession.builder \ .appName("Generate Parquet File") \ .getOrCreate() data = [("Alice", 25, "2023-08-29"), ("Bob", 30, "2023-08-30")] schema = StructType([ StructField("Name", StringType(), nullable=False), StructField("Age", IntegerType(), nullable=False), StructField("ts", StringType(), nullable=True) ]) df = spark.createDataFrame(data, schema) output_path = "/tmp/sandbox/output.parquet" df.write.parquet(output_path)操作步骤执行命令source /opt/140client/bigdata_env spark-submit --master yarn /opt/sandbox/parquet.py --keytab /opt/sandbox/user.keytab --principal username查看生成文件 python读hdfs写hudi创建hudi表代码create table if not exists hudi0829( Name string, Age int, ts string ) using hudi location '/tmp/sandbox/hudi0829' options ( type = 'mor', primaryKey = 'Name', preCombineField = 'ts' );查看表读hdfs写入hudi代码import sys sys.path.insert(0, '/opt/140client/Spark2x/spark/python') sys.path.insert(0, '/opt/140client/Spark2x/spark/python/lib/py4j-0.10.9-src.zip') import os os.environ["PYSPARK_PYTHON"]="/usr/anaconda3/bin/python3" sys.path.append('/opt/140client/Hudi/hudi/lib/') import pyspark from pyspark.sql import SparkSession from pyspark import SparkConf from pyspark import SparkContext #from hudi.config import HoodieConfig #from hudi.dataframe import create_hudi_dataset os.system('source /opt/140client/bigdata_env') spark = SparkSession.builder \ .appName("Write Parquet to Hudi") \ .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer") \ .getOrCreate() parquet_df = spark.read.parquet("hdfs://hacluster/tmp/sandbox/output.parquet") hudi_table_path = "hdfs://hacluster/tmp/sandbox/hudi0829" parquet_df.write \ .format("org.apache.hudi") \ .option("hoodie.datasource.write.recordkey.field", "Name") \ .option("hoodie.datasource.write.partitionpath.field", "ts") \ .option("hoodie.table.name", "hudi0829") \ .option("hoodie.datasource.write.operation", "upsert") \ .mode("append") \ .save(hudi_table_path)执行命令spark-submit --master yarn /opt/sandbox/parquet_hudi.py --keytab /opt/sandbox/user.keytab --principal username

Ivan-agatha 发表于2023-10-26 14:46:36 2023-10-26 14:46:36 最后回复林欣 2023-10-30 08:40:31
168 2

hdfs Python
[运维管理] 线下HD 6517版本集群，业务客户端到集群之前的端口22禁用对使用上有没有影响？

线下HD 6517版本集群，业务客户端到集群之前的端口22禁用对使用上有没有影响？

pack 发表于2023-10-20 14:02:41 2023-10-20 14:02:41 最后回复
99 2

hdfs HBase
[环境搭建] 为什么不建议Flume和DataNode部署在同一节点？为什么会存在数据不均衡的风险？

为什么不建议Flume和DataNode部署在同一节点？为什么会存在数据不均衡的风险？

pack 发表于2023-08-22 11:20:14 2023-08-22 11:20:14 最后回复侠客岛 2023-08-22 17:07:41
89 2

hdfs FusionInsight

推荐直播

0.5

从AI基础到昇腾：大模型初探、DeepSeek解析与昇腾入门
2025/04/02 周三 16:00-17:30

不易 / 华为云学堂技术讲师

昇腾是华为研发的AI芯片，其具有哪些能力？我们如何基于其进行开发？本期直播将从AI以及大模型基础知识开始，介绍人工智能核心概念、昇腾AI基础软硬件平台以及昇腾专区，旨在为零基础或入门级学习者搭建从AI基础知识到昇腾技术的完整学习路径。
回顾中
基于开源鸿蒙+海思星闪开发板：嵌入式系统开发实战（Day1）
2025/03/29 周六 09:00-18:00

华为开发者布道师

本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用，涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容，旨在帮助学员全面掌握相关技术并进行实际操作
回顾中
基于开源鸿蒙+海思星闪开发板：嵌入式系统开发实战（Day2）
2025/03/30 周日 09:00-12:00

华为开发者布道师

本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用，涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容，旨在帮助学员全面掌握相关技术并进行实际操作
回顾中
从AI基础到昇腾：大模型初探、DeepSeek解析与昇腾入门
2025/04/02 周三 16:00-17:30

不易 / 华为云学堂技术讲师

昇腾是华为研发的AI芯片，其具有哪些能力？我们如何基于其进行开发？本期直播将从AI以及大模型基础知识开始，介绍人工智能核心概念、昇腾AI基础软硬件平台以及昇腾专区，旨在为零基础或入门级学习者搭建从AI基础知识到昇腾技术的完整学习路径。
回顾中
基于开源鸿蒙+海思星闪开发板：嵌入式系统开发实战（Day1）
2025/03/29 周六 09:00-18:00

华为开发者布道师

本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用，涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容，旨在帮助学员全面掌握相关技术并进行实际操作
回顾中

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript

开发者空间

了解空间

工作台

开发工具

实战案例

空间活动

空间论坛

开发平台

软件开发生产线 CodeArts

AI平台ModelArts

数据治理中心 DataArts Studio

数字内容生产线 MetaStudio

精选服务

云数据库 GaussDB

云数据库 RDS for MySQL

MapReduce服务 MRS

数据仓库服务 DWS

分布式缓存服务Redis版

分布式消息服务 DMS

华为云实时音视频 SparkRTC

媒体处理 MPC

主机迁移服务 SMS

对象存储迁移服务 OMS

云消息服务 KooMessage

云手机服务 KooPhone

企业搜索服务 KooSearch

云地图服务 KooMap

更多开放能力

开发工具

API生态

CodeArts API

API Explorer

Terraform Explorer

KooCLI

API 中心

SDK 中心

开发服务

Codelabs

DevStar

低代码平台Astro

CodeArts IDE

Huawei Cloud Toolkit

Classroom

开发资源

开源镜像站

开源资源

开发语言

开发实践

入门精选

分发资源

企业应用中心

企业通用专区

教育专区

华为应用专区

政务云专区

硬件云服务商城

医疗健康专区

跳蚤市场

华为云开发者日

直播专区

开发者精品活动

DTSE Tech Talk

加入HCDE

加入HCDG

加入HCSD

加入HCWD

鲁班会

沃土云创计划·企业

沃土云创计划·高校

沃土云创计划·个人

沃土云创计划·开源共创

博客

论坛

专题

开发者榜单

学习路径

在线课程

动手实验

考试认证

培训服务