大数据_标签_开发者

Google Earth Engine——1999-2019年墨累全球潮汐湿地变化 v1 数据集

The Murray Global Tidal Wetland Change Dataset contains maps of the global extent of tidal wetlands and their change. The maps were developed from a three stage classification that sought to (i) e...

此星光明

发表于2022-06-24 10:24:27

6796 0 0

6.7k 0 0

The Murray Global Tidal Wetland Change Dataset contains maps of the global extent of tidal wetlands and their change. The maps were developed from a three stage classification that sought to (i) e...

大数据数据可视化数据库数据挖掘数据采集

大数据物流项目：Kudu 操作命令（五.五）

11-[掌握]-Java 操作 Kudu之创建表(范围分区)为了提供可扩展性，Kudu 表被划分为称为 tablets 的单元，并分布在许多 tablet servers 上。1）、哈希分区：Hash Partitioning哈希分区通过哈希值，将行分配到不同的 buckets ( 存储桶 )中；哈希分区是一种有效的策略，当不需要对表进行有序访问时，哈希分区对于在 tablet 之间随机散...

Maynor学长

发表于2022-06-21 20:55:51

3272 0 0

3.2k 0 0

11-[掌握]-Java 操作 Kudu之创建表(范围分区)为了提供可扩展性，Kudu 表被划分为称为 tablets 的单元，并分布在许多 tablet servers 上。1）、哈希分区：Hash Partitioning哈希分区通过哈希值，将行分配到不同的 buckets ( 存储桶 )中；哈希分区是一种有效的策略，当不需要对表进行有序访问时，哈希分区对于在 tablet 之间随机散...

spark 大数据智慧物流

大数据物流项目：业务服务器和大数据服务器（四）

theme: smartblue持续创作，加速成长！这是我参与「掘金日新计划 · 6 月更文挑战」的第8天，点击查看活动详情业务服务器和大数据服务器 01-[复习]-上次课程内容回顾主要讲解2个方面内容：物流项目业务数据（数据库部署）和OGG 实时采集Oracle数据库表的数据。1、物流项目业务数据实际物流快递公司来说，有很多业务系统，使用不同类型数据库存储数据，在此仅仅以2个业务系统...

Maynor学长

发表于2022-06-21 20:46:40

3620 0 0

3.6k 0 0

theme: smartblue持续创作，加速成长！这是我参与「掘金日新计划 · 6 月更文挑战」的第8天，点击查看活动详情业务服务器和大数据服务器 01-[复习]-上次课程内容回顾主要讲解2个方面内容：物流项目业务数据（数据库部署）和OGG 实时采集Oracle数据库表的数据。1、物流项目业务数据实际物流快递公司来说，有很多业务系统，使用不同类型数据库存储数据，在此仅仅以2个业务系统...

MySQL 大数据数据库智慧物流

Google Earth Engine（GEE）——全球内陆水体数数据集

全球内陆水域数据集显示了内陆地表水体，包括淡水和咸水湖泊、河流和水库。从 GLS 2000 时期开始，已确定了 3,650,723 平方公里的内陆水域，其中约四分之三位于北美和亚洲。北方森林和苔原拥有最大的内陆水域，约占全球总量的 40%。该数据与 MODIS 数据集以及美国和加拿大的 30 米分辨率数据集表现出强线性相关性。残留误差主要是由于水覆盖、冰雪和残留云的季节性。数据集包含每个可...

此星光明

发表于2022-06-18 15:40:36

8624 1 0

8.6k 1 0

全球内陆水域数据集显示了内陆地表水体，包括淡水和咸水湖泊、河流和水库。从 GLS 2000 时期开始，已确定了 3,650,723 平方公里的内陆水域，其中约四分之三位于北美和亚洲。北方森林和苔原拥有最大的内陆水域，约占全球总量的 40%。该数据与 MODIS 数据集以及美国和加拿大的 30 米分辨率数据集表现出强线性相关性。残留误差主要是由于水覆盖、冰雪和残留云的季节性。数据集包含每个可...

JavaScript 大数据数据库数据采集深度学习

大数据随笔——Hbase如是说

Apache HBase™ 是 Hadoop 数据库，一种分布式、可扩展的大数据存储。

顾槐九

发表于2022-06-15 15:29:28

9326 0 0

9.3k 0 0

Apache HBase™ 是 Hadoop 数据库，一种分布式、可扩展的大数据存储。

HBase 大数据

大数据随笔——当我们在谈论HiveSql时我们在谈论什么

Apache Hive™ 数据仓库软件使用SQL帮助读取、写入和管理驻留在分布式存储中的大型数据集。结构可以投影到已存储的数据上。提供了一个命令行工具和JDBC驱动程序来将用户连接到配置单元。

顾槐九

发表于2022-06-12 22:37:32

6285 0 0

6.2k 0 0

Apache Hive™ 数据仓库软件使用SQL帮助读取、写入和管理驻留在分布式存储中的大型数据集。结构可以投影到已存储的数据上。提供了一个命令行工具和JDBC驱动程序来将用户连接到配置单元。

Hive 大数据

数据湖（一）：数据湖概念

数据湖概念一、什么是数据湖数据湖是一个集中式的存储库，允许你以任意规模存储多个来源、所有结构化和非结构化数据，可以按照原样存储数据，无需对数据进行结构化处理，并运行不同类型的分析对数据进行加工，例如：大数据处理、实时分析、机器学习，以指导做出更好地决策。二、大数据为什么需要数据湖当前基于Hive的离线数据仓库已经非常成熟，在传统的离线数据仓库中对记录级别的数据进行更新是非常麻烦的，需要对待...

Lansonli

发表于2022-05-29 16:31:14

7373 0 3

7.3k 0 3

数据湖概念一、什么是数据湖数据湖是一个集中式的存储库，允许你以任意规模存储多个来源、所有结构化和非结构化数据，可以按照原样存储数据，无需对数据进行结构化处理，并运行不同类型的分析对数据进行加工，例如：大数据处理、实时分析、机器学习，以指导做出更好地决策。二、大数据为什么需要数据湖当前基于Hive的离线数据仓库已经非常成熟，在传统的离线数据仓库中对记录级别的数据进行更新是非常麻烦的，需要对待...

Kafka 大数据数据湖探索 DLI

有什么轻量级的大数据技术

流行的大数据技术有Hadoop, Storm, Hive、Spark等，这些都是大集群方案，适合有海量规模数据的巨大企业。实际上，流行的大数据技术通常也源自这类头部互联网企业。很多场景下，数据虽然也很多，但小集群甚至无集群就足够处理，远没多到这些巨大企业的规模，也没有那么多的硬件设备和维护人员。这种情况下，就需要轻量级的大数据技术了。轻量级的大数据技术不多，集算器SPL是其中的佼佼者。SPL...

红目香薰

发表于2022-05-27 15:26:16

2349 0 0

2.3k 0 0

流行的大数据技术有Hadoop, Storm, Hive、Spark等，这些都是大集群方案，适合有海量规模数据的巨大企业。实际上，流行的大数据技术通常也源自这类头部互联网企业。很多场景下，数据虽然也很多，但小集群甚至无集群就足够处理，远没多到这些巨大企业的规模，也没有那么多的硬件设备和维护人员。这种情况下，就需要轻量级的大数据技术了。轻量级的大数据技术不多，集算器SPL是其中的佼佼者。SPL...

大数据

基于Spark+Grafana可视化电商项目实战，好文收藏

Spark+grafana可视化项目实战，赶快收藏~

大数据兵工厂

发表于2022-05-27 10:06:00

11297 0 0

11.2k 0 0

Spark+grafana可视化项目实战，赶快收藏~

spark 大数据数据可视化数据挖掘数据采集

如何基于MRS-Hudi实现拉链表

拉链表是缓慢变化维的一种实现形式，是数据仓库的常用数据模型。基于传统大数据需要全量覆盖写的模式进行，基于Hudi的能力，实现方案会更加简单，性能更优。

受春柏

发表于2022-05-24 11:12:19

14050 0 0

14.0k 0 0

拉链表是缓慢变化维的一种实现形式，是数据仓库的常用数据模型。基于传统大数据需要全量覆盖写的模式进行，基于Hudi的能力，实现方案会更加简单，性能更优。

EI企业智能 FusionInsight MapReduce服务 MRS spark 大数据

如何构建、部署运行Flink程序

一、构建Flink程序构建一个Flink程序有两种方式方式一：构建 maven 工程，导入流式应用依赖包<dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-java</artifactId> <version>${flink.version}</version> ...

百思不得小赵

发表于2022-05-20 15:12:13

4204 0 0

4.2k 0 0

一、构建Flink程序构建一个Flink程序有两种方式方式一：构建 maven 工程，导入流式应用依赖包<dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-java</artifactId> <version>${flink.version}</version> ...

Flink Hadoop 大数据

FusionInsight MRS HDFS 细粒度锁优化实践

华为云FusionInsight MRS通过FGL对HDFS NameNode锁机制进行优化，有效提升了NameNode的读写吞吐量，从而能够支持更多数据，更多业务请求访问，从而更好的支撑政企客户高效用数，业务洞见更准，价值兑现更快。

milan

发表于2022-05-17 21:07:22

13236 2 5

13.2k 2 5

华为云FusionInsight MRS通过FGL对HDFS NameNode锁机制进行优化，有效提升了NameNode的读写吞吐量，从而能够支持更多数据，更多业务请求访问，从而更好的支撑政企客户高效用数，业务洞见更准，价值兑现更快。

EI企业智能 FusionInsight MapReduce服务 MRS 大数据

MRS3.1.3-LTS 交互式分析引擎HetuEngine新特性之 HSFabric统一入口特性介绍

特性背景1. 实际场景需要支持JDBC客户端跨网络域访问HetuEngine服务端2. 多数据中心的数据互联互通和数据安全管理，是制约数据融合创新，挖掘数据价值的主要矛盾。华为云FusionInsight提供 HetuEngine，将物理分散的数据中心，编织为统一的超级计算网格，让客户告别数据 ETL来回搬迁数据的历史，从单数据湖靠人，迈向安全、高效、智能的跨湖融合与创新特性功能说明1、 ...

HetuEngine九级代言

发表于2022-05-08 12:46:13

10882 0 0

10.8k 0 0

特性背景1. 实际场景需要支持JDBC客户端跨网络域访问HetuEngine服务端2. 多数据中心的数据互联互通和数据安全管理，是制约数据融合创新，挖掘数据价值的主要矛盾。华为云FusionInsight提供 HetuEngine，将物理分散的数据中心，编织为统一的超级计算网格，让客户告别数据 ETL来回搬迁数据的历史，从单数据湖靠人，迈向安全、高效、智能的跨湖融合与创新特性功能说明1、 ...

EI企业智能 FusionInsight HetuEngine MapReduce 大数据

MRS3.1.3-LTS 交互式分析引擎HetuEngine新特性之 Massive Data Exchange

特性背景传统JDBC或者copymanager方式对GaussDB进行数据写入时，数据都是经过GaussDB的Coordinator节点进入集群，会对coordinator节点带来较大压力，并且存在性能瓶颈。因此HetuEngine使用MDE特性来解决这类问题。在使用HetuEngine向GaussDB写入数据时（包含CREATE TABLE AS SELECT和INSERT INTO SE...

HetuEngine九级代言

发表于2022-05-08 12:41:39

9618 0 0

9.6k 0 0

特性背景传统JDBC或者copymanager方式对GaussDB进行数据写入时，数据都是经过GaussDB的Coordinator节点进入集群，会对coordinator节点带来较大压力，并且存在性能瓶颈。因此HetuEngine使用MDE特性来解决这类问题。在使用HetuEngine向GaussDB写入数据时（包含CREATE TABLE AS SELECT和INSERT INTO SE...

EI企业智能 FusionInsight HetuEngine MapReduce 大数据

MRS3.1.3-LTS 交互式分析引擎HetuEngine新特性之支持HUDI Schema演进

一. 什么是Schema演进？Schema演进是指保持表的数据不变，对表的schema进行变换，包括列的位置变更，新增删除列或者列的数据类型变更，查询引擎能正确地处理这些数据与表schema不一致的变更。二．HetuEngine哪些表支持Schema演进？ COW表的schema变更支持MOR表的RT表的schema变更支持MOR表的RO表的schema变更支持三．HetuEng...

HetuEngine九级代言

发表于2022-05-08 12:33:40

6932 0 0

6.9k 0 0

一. 什么是Schema演进？Schema演进是指保持表的数据不变，对表的schema进行变换，包括列的位置变更，新增删除列或者列的数据类型变更，查询引擎能正确地处理这些数据与表schema不一致的变更。二．HetuEngine哪些表支持Schema演进？ COW表的schema变更支持MOR表的RT表的schema变更支持MOR表的RO表的schema变更支持三．HetuEng...

EI企业智能 FusionInsight HetuEngine MapReduce 大数据