大数据_标签_开发者_华为云

博客(3.2k)
视频(24)
论坛(0)
云声(0)
代码示例(0)

Flume中 File Channel 的优化
Flume中 File Channel 的优化

WHYBIGDATA
发表于2023-01-18 13:57:56
2161 0 0

2.1k 0 0

Flume中 File Channel 的优化
Java 大数据
Hive执行脚本: Return Code 2 from org.apache.hadoop.hive.ql.exec.MapR
Hive执行脚本: Return Code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask

WHYBIGDATA
发表于2023-01-16 10:41:46
5441 0 0

5.4k 0 0

Hive执行脚本: Return Code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask
Hive 大数据
离线数仓之Kerberos基本使用及问题记录
离线数仓之Kerberos基本使用及问题记录

WHYBIGDATA
发表于2023-01-12 15:39:28
7067 0 0

7.0k 0 0

离线数仓之Kerberos基本使用及问题记录
Hadoop Kerberos 大数据
大数据NiFi（六）：NiFi Processors（处理器）
NiFi Processors（处理器）为了创建高效的数据流处理流程,需要了解可用的处理器（Processors ）类型，NiFi提供了大约近300个现成的处理器。这些处理器提供了可从不同系统中提取数据,路由,转换,处理,拆分和聚合数据以及将数据分发到多个系统的功能。如果还不能满足需求，还可以自定义处理器。每个新的NiFi版本都会有新的处理器，下面将按照功能对处理器分类，介绍一些常用的处理器...

Lansonli
发表于2023-01-08 12:39:07
2619 0 0

2.6k 0 0

NiFi Processors（处理器）为了创建高效的数据流处理流程,需要了解可用的处理器（Processors ）类型，NiFi提供了大约近300个现成的处理器。这些处理器提供了可从不同系统中提取数据,路由,转换,处理,拆分和聚合数据以及将数据分发到多个系统的功能。如果还不能满足需求，还可以自定义处理器。每个新的NiFi版本都会有新的处理器，下面将按照功能对处理器分类，介绍一些常用的处理器...
SQL 大数据
大数据NiFi（五）：NiFi分布式安装
NiFi分布式安装一、为什么需要NiFi集群NiFi DataFlow Manager(DFM)用户可能会发现在单个服务器上使用一个NiFi实例不足以处理他们拥有的数据量。因此，一种解决方案是在多个NiFi服务器上运行相同的数据流。但是，这会产生管理问题，因为每次DFM想要更改或更新数据流时，他们必须在每个服务器上进行这些更改，然后单独监视每个服务器。通过集群NiFi服务器，可以增加处理能...

Lansonli
发表于2023-01-08 12:10:27
2754 0 0

2.7k 0 0

NiFi分布式安装一、为什么需要NiFi集群NiFi DataFlow Manager(DFM)用户可能会发现在单个服务器上使用一个NiFi实例不足以处理他们拥有的数据量。因此，一种解决方案是在多个NiFi服务器上运行相同的数据流。但是，这会产生管理问题，因为每次DFM想要更改或更新数据流时，他们必须在每个服务器上进行这些更改，然后单独监视每个服务器。通过集群NiFi服务器，可以增加处理能...
分布式大数据
深入浅出动态规划算法(上)
动态规划比较适合用来求解最优问题，比如求最大值、最小值等等。它可以非常显著地降低时间复杂度，提高代码的执行效率。它和递归一样都非常难学，主要学习难点在于求解问题的过程不太符合人类常规的思维方式。

嵌入式视觉
发表于2023-01-06 22:36:44
5336 0 0

5.3k 0 0

动态规划比较适合用来求解最优问题，比如求最大值、最小值等等。它可以非常显著地降低时间复杂度，提高代码的执行效率。它和递归一样都非常难学，主要学习难点在于求解问题的过程不太符合人类常规的思维方式。
C++ 二叉树大数据机器学习正则表达式
大数据NiFi（二）：NiFi架构
NiFi架构一、NiFi核心概念NiFi的基本设计理念是基于数据流的编程Flow-Based Programming（FBP），应用是由处理器、连接器组成的网络。数据进入一个节点，由该节点对数据进行处理，根据不同的处理结果将数据路由到后续的其他节点进行处理。这是NiFi的流程比较容易可视化的一个原因。以下是NiFi的一些概念：NiFi术语描述FlowFileFlowFile 是...

Lansonli
发表于2022-12-31 14:33:18
5609 0 0

5.6k 0 0

NiFi架构一、NiFi核心概念NiFi的基本设计理念是基于数据流的编程Flow-Based Programming（FBP），应用是由处理器、连接器组成的网络。数据进入一个节点，由该节点对数据进行处理，根据不同的处理结果将数据路由到后续的其他节点进行处理。这是NiFi的流程比较容易可视化的一个原因。以下是NiFi的一些概念：NiFi术语描述FlowFileFlowFile 是...
ZooKeeper 大数据
Hadoop概述
大数据技术之Hadoop系统前言传统的系统已无法处理结构多变的大数据，而高性能硬件和专用服务器价格昂贵且不灵活，Hadoop因此应运而生。Hadoop使用互连的廉价商业硬件，通过数百甚至数千个低成本服务器协同工作，可有效存储和处理大量数据。一、大数据概念最早提出“大数据”这一概念的是全球知名咨询公司麦肯锡，它是这样定义大数据的：一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件...

Smy1121
发表于2022-12-30 15:27:46
4633 0 0

4.6k 0 0

大数据技术之Hadoop系统前言传统的系统已无法处理结构多变的大数据，而高性能硬件和专用服务器价格昂贵且不灵活，Hadoop因此应运而生。Hadoop使用互连的廉价商业硬件，通过数百甚至数千个低成本服务器协同工作，可有效存储和处理大量数据。一、大数据概念最早提出“大数据”这一概念的是全球知名咨询公司麦肯锡，它是这样定义大数据的：一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件...
Hadoop 大数据
客快物流大数据项目（一百零一）：实时OLAP开发
实时OLAP开发一、实时ETL处理使用ClickHouse分析物流指标数据，必须将数据存储到ClickHouse中。业务流程：二、SparkSQL基于DataSourceV2自定义数据源1、Data Source API V1Spark 1.3 版本开始引入了 Data Source API V1，通过这个 API 我们可以很方便的读取各种来源的数据，而且 Sp...

Lansonli
发表于2022-12-29 16:22:08
3930 0 1

3.9k 0 1

实时OLAP开发一、实时ETL处理使用ClickHouse分析物流指标数据，必须将数据存储到ClickHouse中。业务流程：二、SparkSQL基于DataSourceV2自定义数据源1、Data Source API V1Spark 1.3 版本开始引入了 Data Source API V1，通过这个 API 我们可以很方便的读取各种来源的数据，而且 Sp...
大数据智慧物流
客快物流大数据项目（一百）：ClickHouse的使用
ClickHouse的使用一、使用Java操作ClickHouse1、构建maven工程2、导入依赖<dependency> <groupId>ru.yandex.clickhouse</groupId> <artifactId>clickhouse-jdbc</artifactId> <version>0.2.2</ve...

Lansonli
发表于2022-12-29 16:19:28
3853 0 1

3.8k 0 1

ClickHouse的使用一、使用Java操作ClickHouse1、构建maven工程2、导入依赖<dependency> <groupId>ru.yandex.clickhouse</groupId> <artifactId>clickhouse-jdbc</artifactId> <version>0.2.2</ve...
大数据智慧物流
客快物流大数据项目（一百零二）：业务和指数开发
业务和指数开发一、业务开发实现步骤：在logistics-etl模块cn.it.logistics.etl.realtime程序包下创建CKStreamApp单例对象，继承自StreamApp编写main入口函数，初始化spark的运行环境实现StreamApp基类的两个方法Execute（消费kafka数据，并对消费到的数据转换成对象，过滤每张表的数据写入到CK）Save（实...

Lansonli
发表于2022-12-29 16:14:18
3587 0 1

3.5k 0 1

业务和指数开发一、业务开发实现步骤：在logistics-etl模块cn.it.logistics.etl.realtime程序包下创建CKStreamApp单例对象，继承自StreamApp编写main入口函数，初始化spark的运行环境实现StreamApp基类的两个方法Execute（消费kafka数据，并对消费到的数据转换成对象，过滤每张表的数据写入到CK）Save（实...
大数据智慧物流机器学习
客快物流大数据项目（九十七）：ClickHouse的SQL语法
ClickHouse的SQL语法一、常用的SQL命令作用SQL列出所有数据库show databases;进入某一个数据库use dbName;列出数据库中所有的表show tables;创建数据库create database [if not exists] dbName;删除数据库drop database dbName;创建表create [temporary] table [if n...

Lansonli
发表于2022-12-28 17:33:48
6149 0 1

6.1k 0 1

ClickHouse的SQL语法一、常用的SQL命令作用SQL列出所有数据库show databases;进入某一个数据库use dbName;列出数据库中所有的表show tables;创建数据库create database [if not exists] dbName;删除数据库drop database dbName;创建表create [temporary] table [if n...
MySQL SQL 大数据智慧物流
客快物流大数据项目（九十六）：ClickHouse的VersionedCollapsingMergeTree深入了解
ClickHouse的VersionedCollapsingMergeTree深入了解该引擎继承自 MergeTree 并将折叠行的逻辑添加到合并数据部分的算法中，这个引擎:允许快速写入不断变化的对象状态删除后台中的旧对象状态，这显著降低了存储体积VersionedCollapsingMergeTree 用于相同的目的折叠树，但使用不同的折叠算法，允许以多个线程的任何顺序插入数据。特别...

Lansonli
发表于2022-12-28 17:30:50
5943 0 1

5.9k 0 1

ClickHouse的VersionedCollapsingMergeTree深入了解该引擎继承自 MergeTree 并将折叠行的逻辑添加到合并数据部分的算法中，这个引擎:允许快速写入不断变化的对象状态删除后台中的旧对象状态，这显著降低了存储体积VersionedCollapsingMergeTree 用于相同的目的折叠树，但使用不同的折叠算法，允许以多个线程的任何顺序插入数据。特别...
大数据智慧物流
客快物流大数据项目（九十五）：ClickHouse的CollapsingMergeTree深入了解
ClickHouse的CollapsingMergeTree深入了解在ClickHouse中不支持对数据update和delete操作（不能使用标准的更新和删除语法操作CK），但在增量计算场景下，状态更新是一个常见的现象，此时update操作似乎更符合这种需求。ClickHouse提供了一个CollapsingMergeTree表引擎，它继承于MergeTree引擎，是通过一种变通的方式来...

Lansonli
发表于2022-12-28 17:26:18
6891 0 1

6.8k 0 1

ClickHouse的CollapsingMergeTree深入了解在ClickHouse中不支持对数据update和delete操作（不能使用标准的更新和删除语法操作CK），但在增量计算场景下，状态更新是一个常见的现象，此时update操作似乎更符合这种需求。ClickHouse提供了一个CollapsingMergeTree表引擎，它继承于MergeTree引擎，是通过一种变通的方式来...
大数据智慧物流
客快物流大数据项目（九十四）：ClickHouse的SummingMergeTree深入了解
ClickHouse的SummingMergeTree深入了解ClickHouse通过SummingMergeTree来支持对主键列进行预聚合。在后台合并时，会将主键相同的多行进行sum求和，然后使用一行数据取而代之，从而大幅度降低存储空间占用，提升聚合计算性能。ClickHouse只在后台Compaction时才会进行数据的预先聚合，而compaction的执行时机无法预测，所以可能会存...

Lansonli
发表于2022-12-28 17:25:05
7103 0 1

7.1k 0 1

ClickHouse的SummingMergeTree深入了解ClickHouse通过SummingMergeTree来支持对主键列进行预聚合。在后台合并时，会将主键相同的多行进行sum求和，然后使用一行数据取而代之，从而大幅度降低存储空间占用，提升聚合计算性能。ClickHouse只在后台Compaction时才会进行数据的预先聚合，而compaction的执行时机无法预测，所以可能会存...
大数据智慧物流

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript