数据湖探索 DLI_标签_开发者_华为云

博客(117)
视频(2)
论坛(0)
云声(33)
代码示例(4)

DLI中Flink使用场景样例介绍（一）
该文章主要对DLI中Flink OpenSource SQL的使用场景样例进行介绍。

数据湖爱好者
发表于2021-05-08 11:38:26
8343 0 1

8.3k 0 1

该文章主要对DLI中Flink OpenSource SQL的使用场景样例进行介绍。
Flink SQL 大数据数据湖探索 DLI 智能数据
你的Parquet该升级了：IOException: totalValueCount == 0问题定位之旅
1. 问题描述使用Spark SQL进行ETL任务，在读取某张表的时候报错：“IOException: totalValueCount == 0”，但该表在写入时，并没有什么异常。2. 初步分析该表的结果是由两表join后生成。经分析，join的结果产生了数据倾斜，且倾斜key为null。Join后每个task写一个文件，所以partition key为null的那个task将大量的null...

数据湖爱好者
发表于2021-04-30 16:22:10
7296 2 0

7.2k 2 0

1. 问题描述使用Spark SQL进行ETL任务，在读取某张表的时候报错：“IOException: totalValueCount == 0”，但该表在写入时，并没有什么异常。2. 初步分析该表的结果是由两表join后生成。经分析，join的结果产生了数据倾斜，且倾斜key为null。Join后每个task写一个文件，所以partition key为null的那个task将大量的null...
大数据数据湖探索 DLI 智能数据
DWS对接DLI Flink实现实时数据接入
当前实时数据的接入和处理在DWS承载的业务中所占的比例越来越大，DWS可以和DLI Flink结合，实现实时数据处理结果的报表展示。同时，DWS可以作为Flink维表引擎，存储维表数据，共Flink关联时使用。下面介绍DWS如何与DLI Flink相结合，实现实时数据的存储和查询。一、创建DLI Flink作业在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Fli...

idle_in_transaction
发表于2021-04-30 15:09:15
9484 0 0

9.4k 0 0

当前实时数据的接入和处理在DWS承载的业务中所占的比例越来越大，DWS可以和DLI Flink结合，实现实时数据处理结果的报表展示。同时，DWS可以作为Flink维表引擎，存储维表数据，共Flink关联时使用。下面介绍DWS如何与DLI Flink相结合，实现实时数据的存储和查询。一、创建DLI Flink作业在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Fli...
EI企业智能 Flink 云数据仓库 GaussDB(DWS) 数据湖探索 DLI Gauss AP
Flink作业重启后，如何保证数据不丢失？
DLI Flink提供了完整可靠的Checkpoint/Savepoint机制，您可以利用该机制，保证在手动重启或者作业异常重启场景下，数据不丢失。

数据湖爱好者
发表于2021-04-28 09:32:36
10420 0 0

10.4k 0 0

DLI Flink提供了完整可靠的Checkpoint/Savepoint机制，您可以利用该机制，保证在手动重启或者作业异常重启场景下，数据不丢失。
Flink 数据湖探索 DLI
你的Parquet该升级了：IOException: totalValueCount == 0问题定位之旅
使用Spark SQL进行ETL任务，在读取某张表的时候报错：“IOException: totalValueCount == 0”，但该表在写入时，并没有什么异常。

wzhfy
发表于2021-03-29 20:35:36
12409 0 2

12.4k 0 2

使用Spark SQL进行ETL任务，在读取某张表的时候报错：“IOException: totalValueCount == 0”，但该表在写入时，并没有什么异常。
spark SQL 大数据数据湖探索 DLI
数据湖探索DLI“三箭齐发”，关于数据分析的这些技术你了解吗？
关于数据分析的这些技术你了解吗？

技术火炬手
发表于2020-10-30 14:41:33
7199 0 0

7.1k 0 0

关于数据分析的这些技术你了解吗？
数据湖探索 DLI
MySQL性能优化——执行计划分析
一、执行计划是什么，有什么作用SQL语句在数据库中，经过SQL解析器时，解析器会分析SQL语句，并根据索引等信息，制定数据查询的步骤顺序。我们可以通过在SQL语句前添加 EXPLAIN关键字来输出执行计划。通过分析执行计划，我们可以了解到：SQL的索引使用情况。连接查询的执行顺序。查询扫描的数据函数。二、SQL执行顺序分析在了解执行计划之前，首先要清楚数据库SQL的执行顺序。SQL书写顺序：...

数据湖爱好者
发表于2021-05-20 10:36:36
11331 0 1

11.3k 0 1

一、执行计划是什么，有什么作用SQL语句在数据库中，经过SQL解析器时，解析器会分析SQL语句，并根据索引等信息，制定数据查询的步骤顺序。我们可以通过在SQL语句前添加 EXPLAIN关键字来输出执行计划。通过分析执行计划，我们可以了解到：SQL的索引使用情况。连接查询的执行顺序。查询扫描的数据函数。二、SQL执行顺序分析在了解执行计划之前，首先要清楚数据库SQL的执行顺序。SQL书写顺序：...
EI企业智能 MySQL SQL 数据湖探索 DLI 智能数据
如何避免Spark SQL做数据导入时产生大量小文件
01什么是小文件？生产上，我们往往将Spark SQL作为Hive的替代方案，来获得SQL on Hadoop更出色的性能。因此，本文所讲的是指存储于HDFS中小文件，即指文件的大小远小于HDFS上块（dfs.block.size）大小的文件。02小文件问题的影响一方面，大量的小文件会给Hadoop集群的扩展性和性能带来严重的影响。NameNode在内存中维护整个文件系统的元数据镜像，用户...

数据湖爱好者
发表于2021-05-13 15:40:29
15000 0 0

15.0k 0 0

01什么是小文件？生产上，我们往往将Spark SQL作为Hive的替代方案，来获得SQL on Hadoop更出色的性能。因此，本文所讲的是指存储于HDFS中小文件，即指文件的大小远小于HDFS上块（dfs.block.size）大小的文件。02小文件问题的影响一方面，大量的小文件会给Hadoop集群的扩展性和性能带来严重的影响。NameNode在内存中维护整个文件系统的元数据镜像，用户...
EI企业智能 Hadoop spark 数据湖探索 DLI 智能数据
Apache Doris + Iceberg 快速搭建指南｜Lakehouse 使用手册（三）
湖仓一体（Data Lakehouse）融合了数据仓库的高性能、实时性以及数据湖的低成本、灵活性等优势，能够更加便捷地满足各种数据处理分析的需求。Apache Doris 持续加深与数据湖的融合，已演进出一套成熟的湖仓一体解决方案。我们将通过一系列文章介绍 Apache Doris 与各类主流数据湖格式及存储系统的湖仓一体架构搭建指南，包括 Hudi、Paimon、Iceberg、OSS、D...

SelectDB技术团队
发表于2024-08-02 17:19:54
4599 0 0

4.5k 0 0

湖仓一体（Data Lakehouse）融合了数据仓库的高性能、实时性以及数据湖的低成本、灵活性等优势，能够更加便捷地满足各种数据处理分析的需求。Apache Doris 持续加深与数据湖的融合，已演进出一套成熟的湖仓一体解决方案。我们将通过一系列文章介绍 Apache Doris 与各类主流数据湖格式及存储系统的湖仓一体架构搭建指南，包括 Hudi、Paimon、Iceberg、OSS、D...
数据分析数据处理数据库数据湖数据湖探索 DLI
大数据解决方案FAQ-华为云大数据主要计算服务对比(MRS、DLI、DWS、CSS)
　MRSDLIDWSCSS简述半托管式Hadoop全家桶，包含hadoop core、hive、spark、flink、kafka、hbase等主要hadoop生态组件。Hadoop生态Serverless化批(Spark)/流(Flink)/交互式(Presto)融合的云原生大数据处理分析服务。高性能关系型分布式数据仓库。基于开源ES自研改进的搜索服务对标服务/产品A1EMRAthena/...

服务伙伴知识管理社区
发表于2024-05-15 15:54:24
9572 0 0

9.5k 0 0

　MRSDLIDWSCSS简述半托管式Hadoop全家桶，包含hadoop core、hive、spark、flink、kafka、hbase等主要hadoop生态组件。Hadoop生态Serverless化批(Spark)/流(Flink)/交互式(Presto)融合的云原生大数据处理分析服务。高性能关系型分布式数据仓库。基于开源ES自研改进的搜索服务对标服务/产品A1EMRAthena/...
MapReduce 大数据数据湖探索 DLI
数据湖（一）：数据湖概念
数据湖概念一、什么是数据湖数据湖是一个集中式的存储库，允许你以任意规模存储多个来源、所有结构化和非结构化数据，可以按照原样存储数据，无需对数据进行结构化处理，并运行不同类型的分析对数据进行加工，例如：大数据处理、实时分析、机器学习，以指导做出更好地决策。二、大数据为什么需要数据湖当前基于Hive的离线数据仓库已经非常成熟，在传统的离线数据仓库中对记录级别的数据进行更新是非常麻烦的，需要对待...

Lansonli
发表于2022-05-29 16:31:14
7369 0 3

7.3k 0 3

数据湖概念一、什么是数据湖数据湖是一个集中式的存储库，允许你以任意规模存储多个来源、所有结构化和非结构化数据，可以按照原样存储数据，无需对数据进行结构化处理，并运行不同类型的分析对数据进行加工，例如：大数据处理、实时分析、机器学习，以指导做出更好地决策。二、大数据为什么需要数据湖当前基于Hive的离线数据仓库已经非常成熟，在传统的离线数据仓库中对记录级别的数据进行更新是非常麻烦的，需要对待...
Kafka 大数据数据湖探索 DLI
hive语法创建分区表，方便CDM做增量导出
背景：数据湖里面建表，可以使用DataSource语法或Hive语法，两种建表语法创建的OBS表（即外表）在运行job时，在分区表下的文件夹路径会有所不同，DataSource语法创建的OBS分区表路径生成无规律，不利于CDM做数据的增量导出。

roger_0936
发表于2022-03-28 19:09:15
10416 0 0

10.4k 0 0

背景：数据湖里面建表，可以使用DataSource语法或Hive语法，两种建表语法创建的OBS表（即外表）在运行job时，在分区表下的文件夹路径会有所不同，DataSource语法创建的OBS分区表路径生成无规律，不利于CDM做数据的增量导出。
Hive spark 云数据迁移 CDM 数据湖探索 DLI
华为云DLI SQL作业初体验丨【我的华为云体验之旅】
本案例是《大数据全栈成长计划-第二期》的一个实操任务，本实验通过使用DLI SQL作业，体验会SQL就会大数据分析。一、实验目的1、快速熟悉华为云大数据serverless服务DLI。2、掌握使用DLI创建表、读写表。二、实验步骤如下 1、领取免费试用《数据湖探索服务DLI》（1）前往活动页领取DLI免费实验资源：https://activity.huaweicloud.com/Date...

lwq1228
发表于2021-12-28 12:01:02
12180 0 0

12.1k 0 0

本案例是《大数据全栈成长计划-第二期》的一个实操任务，本实验通过使用DLI SQL作业，体验会SQL就会大数据分析。一、实验目的1、快速熟悉华为云大数据serverless服务DLI。2、掌握使用DLI创建表、读写表。二、实验步骤如下 1、领取免费试用《数据湖探索服务DLI》（1）前往活动页领取DLI免费实验资源：https://activity.huaweicloud.com/Date...
SQL 数据湖探索 DLI
基于华为云DLI运行Spark作业
概述数据湖探索（Data Lake Insight，简称DLI）是完全兼容Apache Spark、Apache Flink、openLooKeng（基于Apache Presto）生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需要管理任何服务器，即开即用。支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格...

lyssg
发表于2021-11-08 16:08:08
10206 0 0

10.2k 0 0

概述数据湖探索（Data Lake Insight，简称DLI）是完全兼容Apache Spark、Apache Flink、openLooKeng（基于Apache Presto）生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需要管理任何服务器，即开即用。支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格...
数据湖探索 DLI
DLI Flink OpenSource SQL中用户自定义sink的使用
在DLI的Flink OpenSource SQL语句中针对用户不同的使用场景，为用户提供了较多的connector以供用户使用，如DWS connector、kafka connector、RDS connector、Hbase connector和elasticsearch connector等。虽然这些connector足够应付大多数主流使用场景，但是仍然有可能不能够满...

潇湘暮雨
发表于2021-09-30 09:05:56
10555 0 0

10.5k 0 0

在DLI的Flink OpenSource SQL语句中针对用户不同的使用场景，为用户提供了较多的connector以供用户使用，如DWS connector、kafka connector、RDS connector、Hbase connector和elasticsearch connector等。虽然这些connector足够应付大多数主流使用场景，但是仍然有可能不能够满...
EI企业智能数据湖探索 DLI 智能数据

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript