EI企业智能_标签_开发者

FusionInsight MRS HDFS组件数据存储策略配置指导

操作场景默认情况下，HDFS NameNode自动选择DataNode保存数据的副本。在实际业务中，可能存在以下场景：DataNode上可能存在不同的存储设备，数据需要选择一个合适的存储设备分级存储数据。DataNode不同目录中的数据重要程度不同，数据需要根据目录标签选择一个合适的DataNode节点保存。DataNode集群使用了异构服务器，关键数据需要保存在具有高度可靠性的机架组中。对...

一枚核桃

发表于2021-10-29 11:04:35

10266 0 0

10.2k 0 0

操作场景默认情况下，HDFS NameNode自动选择DataNode保存数据的副本。在实际业务中，可能存在以下场景：DataNode上可能存在不同的存储设备，数据需要选择一个合适的存储设备分级存储数据。DataNode不同目录中的数据重要程度不同，数据需要根据目录标签选择一个合适的DataNode节点保存。DataNode集群使用了异构服务器，关键数据需要保存在具有高度可靠性的机架组中。对...

EI企业智能 FusionInsight Hadoop MapReduce

FusionInsight MRS透明加密方案

概述传统大数据集群中，用户数据明文保存在HDFS中，集群的维护人员或者恶意攻击者可在OS层面绕过HDFS的权限控制机制或者窃取磁盘直接访问用户数据。FusionInsight MRS引入了Hadoop KMS服务并进行增强，通过对接第三方KMS，可实现数据的透明加密，保障用户数据安全。HDFS支持透明加密，Hive、HBase等在HDFS保存数据的上层组件也将通过HDFS加密保护，加密密钥通...

一枚核桃

发表于2021-10-29 09:15:24

11125 0 0

11.1k 0 0

概述传统大数据集群中，用户数据明文保存在HDFS中，集群的维护人员或者恶意攻击者可在OS层面绕过HDFS的权限控制机制或者窃取磁盘直接访问用户数据。FusionInsight MRS引入了Hadoop KMS服务并进行增强，通过对接第三方KMS，可实现数据的透明加密，保障用户数据安全。HDFS支持透明加密，Hive、HBase等在HDFS保存数据的上层组件也将通过HDFS加密保护，加密密钥通...

EI企业智能 FusionInsight MapReduce

GaussDB(DWS)集群状态异常问题处理套路

使用Gaussdb（DWS）集群过程中经常会因为一些网络、磁盘等故障造成集群降级甚至不可用的情况；也会经常碰到实例状态出现catchup；某个实例xlog目录占用几百G甚至上T空间。本篇总结现网碰到以上问题处理套路，以便应急处理。

上官寒雨

发表于2021-10-28 10:56:12

11077 0 2

11.0k 0 2

使用Gaussdb（DWS）集群过程中经常会因为一些网络、磁盘等故障造成集群降级甚至不可用的情况；也会经常碰到实例状态出现catchup；某个实例xlog目录占用几百G甚至上T空间。本篇总结现网碰到以上问题处理套路，以便应急处理。

EI企业智能云数据仓库 GaussDB(DWS) Gauss AP

DBeaver对接FusionInsight MRS Spark2x

dbeaver是免费和开源为开发人员和数据库管理员通用数据库工具。本文介绍如何配置dbeaver对接FusionInsigth MRS Spark2x

晋红轻

发表于2021-10-27 19:21:33

14216 0 0

14.2k 0 0

dbeaver是免费和开源为开发人员和数据库管理员通用数据库工具。本文介绍如何配置dbeaver对接FusionInsigth MRS Spark2x

EI企业智能 FusionInsight MapReduce spark

如何使用GES进行社交关系考据？---GES查询能力介绍

开发者`李雷`小朋友维护了一个自己的关系链图数据库，他怎么能从图数据库中查询出与他互相关注且年龄大于30的朋友呢？这里先介绍几种图原生查询语言写法：1.gremlin ... 2.cypher ... 以上两种写法等价，只是使用的图查询语言有区别。前者使用gremlin（Apache软件基金会下TinkerPop开发的graph traversal language）编写, 后者为Neo4j...

弓乙

发表于2021-10-19 17:16:11

17612 0 2

17.6k 0 2

开发者`李雷`小朋友维护了一个自己的关系链图数据库，他怎么能从图数据库中查询出与他互相关注且年龄大于30的朋友呢？这里先介绍几种图原生查询语言写法：1.gremlin ... 2.cypher ... 以上两种写法等价，只是使用的图查询语言有区别。前者使用gremlin（Apache软件基金会下TinkerPop开发的graph traversal language）编写, 后者为Neo4j...

EI企业智能图引擎服务 GES 数据库

attach partition from 和 move partition to

attach partition from 和 move partition to在数据迁移过程中，我们常常使用到clickhouse的这两种DDL将源表的数据迁移到目标表，这两块代码入口函数分别是：StorageReplicatedMergeTree::replacePartitionFrom和StorageReplicatedMergeTree::movePartitionToTabl...

陈方业

发表于2021-10-15 17:03:21

8263 0 0

8.2k 0 0

attach partition from 和 move partition to在数据迁移过程中，我们常常使用到clickhouse的这两种DDL将源表的数据迁移到目标表，这两块代码入口函数分别是：StorageReplicatedMergeTree::replacePartitionFrom和StorageReplicatedMergeTree::movePartitionToTabl...

ClickHouse EI企业智能 ZooKeeper

【技术分享】FlinkSQL消费Kafka写Redis

前提条件 MRS集群中包含kafka\flink\redis且各个服务运行正常数据流向&业务逻辑本样例是将kafka读的数据通过Flink解析后，统计不同account账号总消费金额，然后将结果缓存进redis，通过Redis查询最终的消费统计结果。样例数据 {"account": "A6","costs":"35"} {"account": "A7","costs":"36"...

南派三叔

发表于2021-09-30 17:08:54

10680 0 0

10.6k 0 0

前提条件 MRS集群中包含kafka\flink\redis且各个服务运行正常数据流向&业务逻辑本样例是将kafka读的数据通过Flink解析后，统计不同account账号总消费金额，然后将结果缓存进redis，通过Redis查询最终的消费统计结果。样例数据 {"account": "A6","costs":"35"} {"account": "A7","costs":"36"...

EI企业智能 FusionInsight

[技术干货-最佳实践] Elasticsearch同义词插件安装与功能验证

南派三叔

发表于2021-09-30 14:38:00

10619 0 0

10.6k 0 0

EI企业智能 Elasticsearch FusionInsight

CM功能介绍：日志压缩与回收

cm_agent组件具备日志文件压缩和回收的能力，避免日志占用过多的磁盘空间。本篇博文对cm_agent组件的日志压缩删除功能及常见问题的规避定位进行了介绍。

起个名字11111

发表于2021-09-30 11:01:46

12317 0 1

12.3k 0 1

cm_agent组件具备日志文件压缩和回收的能力，避免日志占用过多的磁盘空间。本篇博文对cm_agent组件的日志压缩删除功能及常见问题的规避定位进行了介绍。

EI企业智能云数据仓库 GaussDB(DWS) Gauss AP

DLI Flink OpenSource SQL中用户自定义sink的使用

在DLI的Flink OpenSource SQL语句中针对用户不同的使用场景，为用户提供了较多的connector以供用户使用，如DWS connector、kafka connector、RDS connector、Hbase connector和elasticsearch connector等。虽然这些connector足够应付大多数主流使用场景，但是仍然有可能不能够满...

潇湘暮雨

发表于2021-09-30 09:05:56

10315 0 0

10.3k 0 0

在DLI的Flink OpenSource SQL语句中针对用户不同的使用场景，为用户提供了较多的connector以供用户使用，如DWS connector、kafka connector、RDS connector、Hbase connector和elasticsearch connector等。虽然这些connector足够应付大多数主流使用场景，但是仍然有可能不能够满...

EI企业智能数据湖探索 DLI 智能数据

ClickHouse通过文件导入数据（字段中带有引号、回车）

将其他关系型数据库中的数据导出成CSV文件，再导入Clickhouse，由于原数据库中的数据许多字段包含双引号以及换行符，为了区分数据内容中的双引号和换行符，需要从原数据库中导出CSV文件时，指定分隔符为特殊字符'ESC'，在导入到Clickhouse时，我们需要指定format_csv_delimiter为该字符。原始的CSV文件中一条数据的格式如图所示：1、首先我们需要先根据所给的数据字...

小霸王

发表于2021-09-29 19:57:12

19123 0 0

19.1k 0 0

将其他关系型数据库中的数据导出成CSV文件，再导入Clickhouse，由于原数据库中的数据许多字段包含双引号以及换行符，为了区分数据内容中的双引号和换行符，需要从原数据库中导出CSV文件时，指定分隔符为特殊字符'ESC'，在导入到Clickhouse时，我们需要指定format_csv_delimiter为该字符。原始的CSV文件中一条数据的格式如图所示：1、首先我们需要先根据所给的数据字...

ClickHouse EI企业智能 FusionInsight

初次接触OpenLookeng

openLooKeng是华为的一款性能强大的引擎，基于业界著名的开源SQL引擎Presto来提供交互式查询分析基础能力，用于支持数据探索、即席查询和批处理，具有100+毫秒至分钟级的近实时时延，而无需移动数据。openLooKeng还支持层次化部署，使地理上远程的openLooKeng集群能够参与相同的查询。利用其跨区域查询计划优化能力，涉及远程数据的查询可以接近“本地”的性能

我爱次火锅锅

发表于2021-09-29 17:30:20

11778 0 0

11.7k 0 0

openLooKeng是华为的一款性能强大的引擎，基于业界著名的开源SQL引擎Presto来提供交互式查询分析基础能力，用于支持数据探索、即席查询和批处理，具有100+毫秒至分钟级的近实时时延，而无需移动数据。openLooKeng还支持层次化部署，使地理上远程的openLooKeng集群能够参与相同的查询。利用其跨区域查询计划优化能力，涉及远程数据的查询可以接近“本地”的性能

EI企业智能 SQL 大数据数据湖探索 DLI 智能数据

【CarbonData】CarbonData误删恢复（防误删功能）

1.1 CarbonData如果执行了CarbonData误删除操作，并且core-site.xml中提前配置有fs.trash.interval值（hdfs回收站文件过期时间），并且未超出回收站文件过期时间，则可以分以下场景进行数据恢复。恢复HDFS回收站的数据，需要先知道hdfs回收站目录，一般情况下为“/user/${用户名}/.Trash”。 1.1.1 使用drop table误删...

小兔子615

发表于2021-09-29 16:31:17

11082 0 0

11.0k 0 0

1.1 CarbonData如果执行了CarbonData误删除操作，并且core-site.xml中提前配置有fs.trash.interval值（hdfs回收站文件过期时间），并且未超出回收站文件过期时间，则可以分以下场景进行数据恢复。恢复HDFS回收站的数据，需要先知道hdfs回收站目录，一般情况下为“/user/${用户名}/.Trash”。 1.1.1 使用drop table误删...

EI企业智能 FusionInsight spark SQL

Flink对接HBase常见问题

1.1.1 Flink任务运行一段时间后卡住但未失败问题现象Flink的运行日志发现，任务运行一段时间后持续打印以下日志：RPC Server Kerberos principal name for service=ClientService is hbase/xxxx.xxxx.xxx.com并且没有出现其它错误。可能原因HBase在认证过程中缓存中的票据信息没有更新，导致HBase一直...

FI小粉丝

发表于2021-09-29 14:59:45

5331 0 0

5.3k 0 0

1.1.1 Flink任务运行一段时间后卡住但未失败问题现象Flink的运行日志发现，任务运行一段时间后持续打印以下日志：RPC Server Kerberos principal name for service=ClientService is hbase/xxxx.xxxx.xxx.com并且没有出现其它错误。可能原因HBase在认证过程中缓存中的票据信息没有更新，导致HBase一直...

EI企业智能 Flink FusionInsight HBase

GaussDB(DWS) HDFS外表支持联邦

一、背景： HDFS已支持联邦，现场HDFS切换成联邦模式，对应hdfs上数据目录及namenode地址发生变化导致原GaussDB(DWS)外表无法正常访问。客户通过重建server以及对应数据的目录，新增联邦配置文件，创建对应联邦namenode HDFS Server，新建外表，维护成本太高。 GaussDB(DWS)支持联邦后，通过指定多个router地址，访...

ACBD

发表于2021-09-29 09:37:19

10237 0 0

10.2k 0 0

一、背景： HDFS已支持联邦，现场HDFS切换成联邦模式，对应hdfs上数据目录及namenode地址发生变化导致原GaussDB(DWS)外表无法正常访问。客户通过重建server以及对应数据的目录，新增联邦配置文件，创建对应联邦namenode HDFS Server，新建外表，维护成本太高。 GaussDB(DWS)支持联邦后，通过指定多个router地址，访...

EI企业智能云数据仓库 GaussDB(DWS) Gauss AP