_标签_开发者_华为云

博客(236)
视频(0)
论坛(0)
云声(0)
代码示例(0)

Presto性能调优小结Presto性能调优的五大技巧
Presto是一个分布式的查询引擎，本身并不存储数据，但是可以接入多种数据源，并且支持跨数据源的级联查询。

akasugin
发表于2020-06-04 09:54:13
24096 0 2

24.0k 0 2

Presto是一个分布式的查询引擎，本身并不存储数据，但是可以接入多种数据源，并且支持跨数据源的级联查询。
大数据
Apache CarbonData 2.0 Preview（关键特性提前预览）
CarbonData是一种高性能大数据存储方案，已在100+企业生产环境上部署应用，其中最大的单一集群数据规模达到几万亿。针对当前大数据领域分析场景需求各异而导致的存储冗余问题，业务驱动下的数据分析灵活性要求越来越高，CarbonData提供了一种新的融合数据存储方案，以一份数据同时支持多种应用场景，万亿数据规模，查询性能秒级响应。

简单坚持
发表于2020-04-30 17:28:40
24120 0 2

24.1k 0 2

CarbonData是一种高性能大数据存储方案，已在100+企业生产环境上部署应用，其中最大的单一集群数据规模达到几万亿。针对当前大数据领域分析场景需求各异而导致的存储冗余问题，业务驱动下的数据分析灵活性要求越来越高，CarbonData提供了一种新的融合数据存储方案，以一份数据同时支持多种应用场景，万亿数据规模，查询性能秒级响应。
Apache EI 人工智能大数据
唐老师带你秒懂大数据，以及Spark和Flink在干啥咧
花20分钟时间入门一个新领域，唐老师以一个生活中的例子，表达大数据框架Spark和Flink的各自特色。入门总结，请多指教。

tsjsdbd
发表于2019-12-28 18:43:18
10404 1 2

10.4k 1 2

花20分钟时间入门一个新领域，唐老师以一个生活中的例子，表达大数据框架Spark和Flink的各自特色。入门总结，请多指教。
大数据
大数据容器化，头部玩家尝到了甜头？
大数据容器化，大势所趋。头部玩家在进行大数据容器化后，尝到了甜头？

tsjsdbd
发表于2019-12-27 10:21:52
20346 1 2

20.3k 1 2

大数据容器化，大势所趋。头部玩家在进行大数据容器化后，尝到了甜头？
鲲鹏 BigData Pro 大数据容器大数据
Reactive 模式优势与实战
Reactive 编程即反应式编程，随着这些年的发展已经逐步的进入了开发者的视野当中。早在 2014 年社区就有人发起响应式宣言，推动着 Reactive 的发展：响应式宣言Published on September 16 2014. (v2.0) 来自不同领域的组织正在不约而同地发现一些看起来如出一辙的软件构建模式。它们的系统更加稳健，更加有可回复性，更加灵活，并且以更好的定位来满足现代...

鲲鹏小玩家
发表于2020-02-12 14:26:28
11196 0 0

11.1k 0 0

Reactive 编程即反应式编程，随着这些年的发展已经逐步的进入了开发者的视野当中。早在 2014 年社区就有人发起响应式宣言，推动着 Reactive 的发展：响应式宣言Published on September 16 2014. (v2.0) 来自不同领域的组织正在不约而同地发现一些看起来如出一辙的软件构建模式。它们的系统更加稳健，更加有可回复性，更加灵活，并且以更好的定位来满足现代...
架构设计容器运维大数据
手把手教你在华为云编译和使用Apache Impala
这是一个精简版的Apache Impala编译和使用指南，和前一篇的Apache Kudu相同，都是经过作者在华为云平台上实践过的，希望对大数据生态中这两个组件感兴趣的同学起到一定的帮助：）

he lifu
发表于2020-06-10 16:09:30
16673 0 2

16.6k 0 2

这是一个精简版的Apache Impala编译和使用指南，和前一篇的Apache Kudu相同，都是经过作者在华为云平台上实践过的，希望对大数据生态中这两个组件感兴趣的同学起到一定的帮助：）
大数据
手把手教你在华为云编译和使用Apache Kudu
大数据系统又重又复杂，对于很多感兴趣、又想玩一把的同学来讲，门槛着实有点高，今天我选择了Apache Kudu这个项目，来手把手指导大家从源码开始构建一个本地的集群，然后进行简单的数据读写和集群管理。

he lifu
发表于2020-06-09 20:38:53
12051 3 2

12.0k 3 2

大数据系统又重又复杂，对于很多感兴趣、又想玩一把的同学来讲，门槛着实有点高，今天我选择了Apache Kudu这个项目，来手把手指导大家从源码开始构建一个本地的集群，然后进行简单的数据读写和集群管理。
大数据
大数据终极挑战：华为智能数据释放“数据湖”战略价值
面向“数据湖”的FusionData智能数据解决方案将应对大数据的终极挑战。

云科技时代
发表于2019-06-08 12:42:56
14577 0 0

14.5k 0 0

面向“数据湖”的FusionData智能数据解决方案将应对大数据的终极挑战。
人工智能云计算大数据
【教程】大数据平台Hortonworks对接OBSFileSystem操作指南
1 背景介绍Hortonworks公司，由Yahoo和Benchmark Capital于2011年7月联合创建，出身于名门Yahoo，Hortonworks拥有着许多Hadoop架构师和源代码贡献者，这些源代码贡献者以前均效力于Yahoo，而且已经为Apache Hadoop项目贡献了超过80%的源代码。Hortonworks 作为Apache Hadoop2.0社区的开拓者，构...

lanxinliuli
发表于2019-06-04 10:45:39
13253 0 0

13.2k 0 0

1 背景介绍Hortonworks公司，由Yahoo和Benchmark Capital于2011年7月联合创建，出身于名门Yahoo，Hortonworks拥有着许多Hadoop架构师和源代码贡献者，这些源代码贡献者以前均效力于Yahoo，而且已经为Apache Hadoop项目贡献了超过80%的源代码。Hortonworks 作为Apache Hadoop2.0社区的开拓者，构...
OBS 大数据
采用CDM进行HDFS到OBS的数据迁移
1 背景介绍传统的Hadoop和Spark大数据生态，主要是以本地硬盘或云硬盘承载HDFS文件系统进行数据存储，但是存在成本高，扩容难等问题。当前华为云对象存储服务OBS可以与Hadoop和Spark大数据生态进行对接，为用户提供计算存储分离的大数据解决方案。为了实现用户数据平滑上云，可以采用华为云CDM服务进行HDFS到OBS的数据迁移。2 迁移背景和目标已存在集群一采...

lanxinliuli
发表于2019-05-25 09:35:39
15583 0 1

15.5k 0 1

1 背景介绍传统的Hadoop和Spark大数据生态，主要是以本地硬盘或云硬盘承载HDFS文件系统进行数据存储，但是存在成本高，扩容难等问题。当前华为云对象存储服务OBS可以与Hadoop和Spark大数据生态进行对接，为用户提供计算存储分离的大数据解决方案。为了实现用户数据平滑上云，可以采用华为云CDM服务进行HDFS到OBS的数据迁移。2 迁移背景和目标已存在集群一采...
OBS 大数据
记录HBase手动删除Hadoop备份（archive）文件后，引发Hbase写入数据出错等一系列问题处理
由于需要规范HBase数据表命名，对测试环境的数据进行了重命名操作。停掉所有服务后执行下面改名操作# 禁用活跃用户表disable 'DC_XXL:ACTIVE_USERS'# 创建快照snapshot 'DC_XXL:ACTIVE_USERS', 'tony_snapshot'# 克隆快照为新的表（使用新名称）clone_snapshot 'tony_snapshot', ...

AllEmpty
发表于2020-07-07 15:09:34
16308 0 0

16.3k 0 0

由于需要规范HBase数据表命名，对测试环境的数据进行了重命名操作。停掉所有服务后执行下面改名操作# 禁用活跃用户表disable 'DC_XXL:ACTIVE_USERS'# 创建快照snapshot 'DC_XXL:ACTIVE_USERS', 'tony_snapshot'# 克隆快照为新的表（使用新名称）clone_snapshot 'tony_snapshot', ...
hbase 大数据
大数据实践解析（下）：Spark的读写流程分析
本文通过简单的例子来解析，大数据实践中的Spark读写流程，内容主要聚焦于Spark中的高效并行读写以及在写过程中如何保证事务性。

hzjturbo
发表于2020-06-16 09:02:19
19360 1 5

19.3k 1 5

本文通过简单的例子来解析，大数据实践中的Spark读写流程，内容主要聚焦于Spark中的高效并行读写以及在写过程中如何保证事务性。
数据库 Spark 数据存储大数据
大数据组件运维工具之HBase
HBase自带许多运维工具，为用户提供管理、分析、修复和调试功能。本文将列举一些常用HBase工具，开发人员和运维人员可以参考本文内容，利用这些工具对HBase进行日常管理和运维。

护城小兵
发表于2020-06-15 14:42:13
15295 2 4

15.2k 2 4

HBase自带许多运维工具，为用户提供管理、分析、修复和调试功能。本文将列举一些常用HBase工具，开发人员和运维人员可以参考本文内容，利用这些工具对HBase进行日常管理和运维。
运维 hbase 数据 NoSQL数据库大数据
在Hadoop Hive环境下生成数值型唯一ID
基于Hadoop构建的大数据环境，如何生成唯一ID。

JackieAtHome
发表于2020-06-05 23:30:58
13966 0 0

13.9k 0 0

基于Hadoop构建的大数据环境，如何生成唯一ID。
Hadoop 大数据
Spark内存管理解析
Spark是一个基于内存的分布式计算引擎，为了更为高效地利用内存，并减少OOM等内存问题，Spark对JVM内存模型进行了进一步的管理规划，在其之上实现了自己的内存管理模型。本文将基于spark.memory包对Spark内存管理机制进行简要探索。

皮皮猫
发表于2020-05-26 22:43:16
12703 0 2

12.7k 0 2

Spark是一个基于内存的分布式计算引擎，为了更为高效地利用内存，并减少OOM等内存问题，Spark对JVM内存模型进行了进一步的管理规划，在其之上实现了自己的内存管理模型。本文将基于spark.memory包对Spark内存管理机制进行简要探索。
大数据

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript