FusionInsight_标签_开发者

spark读写hudi表流程

Spark dataSourceV1查询hudi表：MOR表读流程：MOR表的读包括3个分支：1）普通MOR表读；2）clustering数据读；3）compaction时读；4）metatable表读；5）hive inputFormat读最终读接口为：\Hudi_Kernel\hudi-common\src\main\java\org\apache\hudi\common\table\l...

小兔子615

发表于2021-05-29 18:25:26

14017 0 0

14.0k 0 0

Spark dataSourceV1查询hudi表：MOR表读流程：MOR表的读包括3个分支：1）普通MOR表读；2）clustering数据读；3）compaction时读；4）metatable表读；5）hive inputFormat读最终读接口为：\Hudi_Kernel\hudi-common\src\main\java\org\apache\hudi\common\table\l...

EI企业智能 FusionInsight spark

数字世界里的时空交错 - 时空智能（智慧城市系列）

时空大数据是智慧系列应用（智慧交通，智慧水利，智慧农业，智慧气象，智慧楼宇，智慧园区，乃至于更广泛意义上的智慧城市）中的关键技术。本文讲述时空大数据的场景、业界现状、华为目前的实践、在智慧城市系列中时空大数据遇到的问题和挑战。

小兔子615

发表于2021-05-29 18:19:01

11126 0 0

11.1k 0 0

时空大数据是智慧系列应用（智慧交通，智慧水利，智慧农业，智慧气象，智慧楼宇，智慧园区，乃至于更广泛意义上的智慧城市）中的关键技术。本文讲述时空大数据的场景、业界现状、华为目前的实践、在智慧城市系列中时空大数据遇到的问题和挑战。

EI企业智能 FusionInsight 城市智能运营中心大数据

【Hadoop】【Yarn】查看Yarn作业日志的方法

【Yarn日志归档流程】Yarn作业运行的过程中，container运行在各个nodemanager上面，会将作业中产生的日志归档在其运行的nodemanager节点的指定路径下。通过配置项：yarn.nodemanager.log-dirs进行配置。华为云MRS服务中，默认的路径为/srv/Bigdata/hadoop/data1/nm/containerlogs中。如果开启了日志归集特性...

沙漠里的果果酱

发表于2021-05-28 18:01:22

10558 0 0

10.5k 0 0

【Yarn日志归档流程】Yarn作业运行的过程中，container运行在各个nodemanager上面，会将作业中产生的日志归档在其运行的nodemanager节点的指定路径下。通过配置项：yarn.nodemanager.log-dirs进行配置。华为云MRS服务中，默认的路径为/srv/Bigdata/hadoop/data1/nm/containerlogs中。如果开启了日志归集特性...

EI智能体 FusionInsight MapReduce Yarn

Kafka使用最佳实践-Kafka常见的使用误区

1. kafka集群单个节点磁盘挂载的越多越好业界Kafka的标准使用方式是作为临时缓存使用。因此，很多人会误以为，kafka的每个节点只要存储够大就行，不用关心其他的指标。官方并不建议kafka单节点关在多个磁盘，因为磁盘越多，表示需要更多的处理线程去管理（num.io.thread决定），CPU的压力将非常大，如果磁盘数大于了CPU逻辑核数，kafka的CPU将因为非常繁忙导致数据落盘失...

FI小粉丝

发表于2021-05-28 15:06:50

7569 0 0

7.5k 0 0

1. kafka集群单个节点磁盘挂载的越多越好业界Kafka的标准使用方式是作为临时缓存使用。因此，很多人会误以为，kafka的每个节点只要存储够大就行，不用关心其他的指标。官方并不建议kafka单节点关在多个磁盘，因为磁盘越多，表示需要更多的处理线程去管理（num.io.thread决定），CPU的压力将非常大，如果磁盘数大于了CPU逻辑核数，kafka的CPU将因为非常繁忙导致数据落盘失...

EI企业智能 FusionInsight Kafka ZooKeeper

【使用分享】Hive分区表那些事

一、静态分区1.创建静态分区格式:create table employees ( name string, salary float, subordinated array<string>, deductions map<string,float>, address struct<street:string,city:string,state:string,zip:int> ) ...

蓝极光

发表于2021-05-28 14:48:03

9636 0 0

9.6k 0 0

一、静态分区1.创建静态分区格式:create table employees ( name string, salary float, subordinated array<string>, deductions map<string,float>, address struct<street:string,city:string,state:string,zip:int> ) ...

EI企业智能 FusionInsight Hive

【算法分析】Hive GroupingId计算算法分析

对于grouping sets的操作获取的Grouping__id的值在hive-1.2.1前和hive-3.0后版本不同；Hive-1.2.1计算时根据group by指定的列的序列进行分组，凡是出现在grouping sets中的列，以二进制1标识，没有出现在grouping sets中的列以二级制0标识，按照锁得到的二进制数的反码计算grouping__id的值。Hive-3.1....

蓝极光

发表于2021-05-28 14:32:52

7212 0 0

7.2k 0 0

对于grouping sets的操作获取的Grouping__id的值在hive-1.2.1前和hive-3.0后版本不同；Hive-1.2.1计算时根据group by指定的列的序列进行分组，凡是出现在grouping sets中的列，以二进制1标识，没有出现在grouping sets中的列以二级制0标识，按照锁得到的二进制数的反码计算grouping__id的值。Hive-3.1....

EI企业智能 FusionInsight Hive

【Hadoop】如何调整某一个类的日志级别

Hadoop如何调整某一个类的日志级别

沙漠里的果果酱

发表于2021-05-26 11:03:42

7593 0 0

7.5k 0 0

Hadoop如何调整某一个类的日志级别

EI智能体 FusionInsight Hadoop MapReduce Yarn

【Hadoop】【Yarn】ResourceManager频繁主备倒换，导致Yarn上作业大量积压

【MRS】【Yarn】ResourceManager频繁主备倒换，导致Yarn上作业大量积压

沙漠里的果果酱

发表于2021-05-25 20:36:07

8375 0 0

8.3k 0 0

【MRS】【Yarn】ResourceManager频繁主备倒换，导致Yarn上作业大量积压

EI企业智能 FusionInsight MapReduce Yarn 云容灾

Kafka网络请求处理流程及优化指导

Kafka、SocketServer、RequestHandler、性能优化

尘枫

发表于2021-05-25 20:23:44

9454 0 0

9.4k 0 0

Kafka、SocketServer、RequestHandler、性能优化

EI企业智能 FusionInsight Kafka

SmartBI对接FusionInsight MRS hetu

思迈特软件是知名国产BI品牌,专注于商业智能BI与大数据BI分析平台软件产业的研发及服务。本文介绍如何对接FusionInisght MRS hetu

晋红轻

发表于2021-05-25 18:11:05

5377 0 0

5.3k 0 0

思迈特软件是知名国产BI品牌,专注于商业智能BI与大数据BI分析平台软件产业的研发及服务。本文介绍如何对接FusionInisght MRS hetu

EI企业智能 FusionInsight

SmartBI对接FusionInsight MRS hive

思迈特软件是知名国产BI品牌,专注于商业智能BI与大数据BI分析平台软件产业的研发及服务。本文介绍如何对接FusionInisght MRS hive

晋红轻

发表于2021-05-25 18:04:29

5013 0 2

5.0k 0 2

思迈特软件是知名国产BI品牌,专注于商业智能BI与大数据BI分析平台软件产业的研发及服务。本文介绍如何对接FusionInisght MRS hive

EI企业智能 FusionInsight

Kafka使用最佳实践-Kafka生产问题分析思路与解决方案

一、生产问题分析思路二、数据无法正常写入，使用客户端无法正常生产数据首先使用生产命令进行生产测试。看是否是C80版本，确认是否有打入kafka死锁补丁，如果没有请打入。Kafka的服务端节点是否开启了DNS，如果开启请参照《kafka启动候不定时出现"恢复中"状态》解决。根据章节查看topic是否正常（2.2章节），如果不正常优先恢复topic，参考维护宝典Topic操作常见故障章节...

FI小粉丝

发表于2021-05-25 17:25:29

5381 0 0

5.3k 0 0

一、生产问题分析思路二、数据无法正常写入，使用客户端无法正常生产数据首先使用生产命令进行生产测试。看是否是C80版本，确认是否有打入kafka死锁补丁，如果没有请打入。Kafka的服务端节点是否开启了DNS，如果开启请参照《kafka启动候不定时出现"恢复中"状态》解决。根据章节查看topic是否正常（2.2章节），如果不正常优先恢复topic，参考维护宝典Topic操作常见故障章节...

EI企业智能 FusionInsight Kafka

Kafka使用最佳实践-Kafka集群操作规范

Kafka集群在使用过程中会出现各种各样的操作场景，修改配置参数、集群异常等各种重启场景等，操作过程中需要注意一些注意事项。离线重启kafka集群如果需要修改kafka服务端的配置，点击保存配置后，不要勾选“重新启动受影响的服务或实例”。重启kafka进程前，需要停止生产端的业务，否则很容易出现kafka由于数据不同步导致的无法启动或者启动缓慢。停止生产端业务后，等待1~2分钟，停止kaf...

FI小粉丝

发表于2021-05-25 17:05:58

6769 0 0

6.7k 0 0

Kafka集群在使用过程中会出现各种各样的操作场景，修改配置参数、集群异常等各种重启场景等，操作过程中需要注意一些注意事项。离线重启kafka集群如果需要修改kafka服务端的配置，点击保存配置后，不要勾选“重新启动受影响的服务或实例”。重启kafka进程前，需要停止生产端的业务，否则很容易出现kafka由于数据不同步导致的无法启动或者启动缓慢。停止生产端业务后，等待1~2分钟，停止kaf...

EI企业智能 FusionInsight Kafka

FusionInsight MRS组件FTP-Server基本原理

FTP-Server简介FusionInsight MRS的FTP-Server服务是一个纯Java的、基于现有开放的FTP协议的FTP服务。FTP-Server支持FTP、FTPS协议，每个服务都支持PORT、PASSIVE数据通信协议。用户或业务组件可通过通用的FTP客户端、FTP协议对HDFS文件系统进行基本的操作，如：文件上传，文件下载，目录查看，目录创建，目录删除，文件权限修改等...

一枚核桃

发表于2021-05-25 16:10:35

7149 0 0

7.1k 0 0

FTP-Server简介FusionInsight MRS的FTP-Server服务是一个纯Java的、基于现有开放的FTP协议的FTP服务。FTP-Server支持FTP、FTPS协议，每个服务都支持PORT、PASSIVE数据通信协议。用户或业务组件可通过通用的FTP客户端、FTP协议对HDFS文件系统进行基本的操作，如：文件上传，文件下载，目录查看，目录创建，目录删除，文件权限修改等...

EI企业智能 FTP FusionInsight MapReduce

使用Apache Superset对接FusionInsight MRS中的ClickHouse组件进行报表分析

背景Apache Superset是一款由 Airbnb 开源的、现代的、轻量级BI分析工具，能够对接多种数据源、拥有丰富的图标展示形式、支持自定义仪表盘，且拥有友好的用户界面，十分易用。由于Superset能够对接常用的大数据分析工具，如Hive、Kylin、Druid、ClickHouse等，且支持自定义仪表盘，可作为可视化工具来使用。前提条件完成Apache Superset的安装...

一枚核桃

发表于2021-05-25 11:37:57

7928 0 0

7.9k 0 0

背景Apache Superset是一款由 Airbnb 开源的、现代的、轻量级BI分析工具，能够对接多种数据源、拥有丰富的图标展示形式、支持自定义仪表盘，且拥有友好的用户界面，十分易用。由于Superset能够对接常用的大数据分析工具，如Hive、Kylin、Druid、ClickHouse等，且支持自定义仪表盘，可作为可视化工具来使用。前提条件完成Apache Superset的安装...

ClickHouse EI企业智能 FusionInsight