- 开发者
- 大数据
#大数据#
- Presto是一个分布式的查询引擎,本身并不存储数据,但是可以接入多种数据源,并且支持跨数据源的级联查询。 Presto是一个分布式的查询引擎,本身并不存储数据,但是可以接入多种数据源,并且支持跨数据源的级联查询。
- CarbonData是一种高性能大数据存储方案,已在100+企业生产环境上部署应用,其中最大的单一集群数据规模达到几万亿。针对当前大数据领域分析场景需求各异而导致的存储冗余问题,业务驱动下的数据分析灵活性要求越来越高,CarbonData提供了一种新的融合数据存储方案,以一份数据同时支持多种应用场景,万亿数据规模,查询性能秒级响应。 CarbonData是一种高性能大数据存储方案,已在100+企业生产环境上部署应用,其中最大的单一集群数据规模达到几万亿。针对当前大数据领域分析场景需求各异而导致的存储冗余问题,业务驱动下的数据分析灵活性要求越来越高,CarbonData提供了一种新的融合数据存储方案,以一份数据同时支持多种应用场景,万亿数据规模,查询性能秒级响应。
- 花20分钟时间入门一个新领域,唐老师以一个生活中的例子,表达大数据框架Spark和Flink的各自特色。入门总结,请多指教。 花20分钟时间入门一个新领域,唐老师以一个生活中的例子,表达大数据框架Spark和Flink的各自特色。入门总结,请多指教。
- 大数据容器化,大势所趋。头部玩家在进行大数据容器化后,尝到了甜头? 大数据容器化,大势所趋。头部玩家在进行大数据容器化后,尝到了甜头?
- Reactive 编程即反应式编程,随着这些年的发展已经逐步的进入了开发者的视野当中。早在 2014 年社区就有人发起响应式宣言,推动着 Reactive 的发展:响应式宣言Published on September 16 2014. (v2.0) 来自不同领域的组织正在不约而同地发现一些看起来如出一辙的软件构建模式。它们的系统更加稳健,更加有可回复性,更加灵活,并且以更好的定位来满足现代... Reactive 编程即反应式编程,随着这些年的发展已经逐步的进入了开发者的视野当中。早在 2014 年社区就有人发起响应式宣言,推动着 Reactive 的发展:响应式宣言Published on September 16 2014. (v2.0) 来自不同领域的组织正在不约而同地发现一些看起来如出一辙的软件构建模式。它们的系统更加稳健,更加有可回复性,更加灵活,并且以更好的定位来满足现代...
- 这是一个精简版的Apache Impala编译和使用指南,和前一篇的Apache Kudu相同,都是经过作者在华为云平台上实践过的,希望对大数据生态中这两个组件感兴趣的同学起到一定的帮助:) 这是一个精简版的Apache Impala编译和使用指南,和前一篇的Apache Kudu相同,都是经过作者在华为云平台上实践过的,希望对大数据生态中这两个组件感兴趣的同学起到一定的帮助:)
- 大数据系统又重又复杂,对于很多感兴趣、又想玩一把的同学来讲,门槛着实有点高,今天我选择了Apache Kudu这个项目,来手把手指导大家从源码开始构建一个本地的集群,然后进行简单的数据读写和集群管理。 大数据系统又重又复杂,对于很多感兴趣、又想玩一把的同学来讲,门槛着实有点高,今天我选择了Apache Kudu这个项目,来手把手指导大家从源码开始构建一个本地的集群,然后进行简单的数据读写和集群管理。
- 面向“数据湖”的FusionData智能数据解决方案将应对大数据的终极挑战。 面向“数据湖”的FusionData智能数据解决方案将应对大数据的终极挑战。
- 1 背景介绍Hortonworks公司,由Yahoo和Benchmark Capital于2011年7月联合创建,出身于名门Yahoo,Hortonworks拥有着许多Hadoop架构师和源代码贡献者,这些源代码贡献者以前均效力于Yahoo,而且已经为Apache Hadoop项目贡献了超过80%的源代码。Hortonworks 作为Apache Hadoop2.0社区的开拓者,构... 1 背景介绍Hortonworks公司,由Yahoo和Benchmark Capital于2011年7月联合创建,出身于名门Yahoo,Hortonworks拥有着许多Hadoop架构师和源代码贡献者,这些源代码贡献者以前均效力于Yahoo,而且已经为Apache Hadoop项目贡献了超过80%的源代码。Hortonworks 作为Apache Hadoop2.0社区的开拓者,构...
- 1 背景介绍传统的Hadoop和Spark大数据生态,主要是以本地硬盘或云硬盘承载HDFS文件系统进行数据存储,但是存在成本高,扩容难等问题。当前华为云对象存储服务OBS可以与Hadoop和Spark大数据生态进行对接,为用户提供计算存储分离的大数据解决方案。为了实现用户数据平滑上云,可以采用华为云CDM服务进行HDFS到OBS的数据迁移。2 迁移背景和目标已存在集群一采... 1 背景介绍传统的Hadoop和Spark大数据生态,主要是以本地硬盘或云硬盘承载HDFS文件系统进行数据存储,但是存在成本高,扩容难等问题。当前华为云对象存储服务OBS可以与Hadoop和Spark大数据生态进行对接,为用户提供计算存储分离的大数据解决方案。为了实现用户数据平滑上云,可以采用华为云CDM服务进行HDFS到OBS的数据迁移。2 迁移背景和目标已存在集群一采...
- 由于需要规范HBase数据表命名,对测试环境的数据进行了重命名操作。 停掉所有服务后执行下面改名操作# 禁用活跃用户表disable 'DC_XXL:ACTIVE_USERS'# 创建快照snapshot 'DC_XXL:ACTIVE_USERS', 'tony_snapshot'# 克隆快照为新的表(使用新名称)clone_snapshot 'tony_snapshot', ... 由于需要规范HBase数据表命名,对测试环境的数据进行了重命名操作。 停掉所有服务后执行下面改名操作# 禁用活跃用户表disable 'DC_XXL:ACTIVE_USERS'# 创建快照snapshot 'DC_XXL:ACTIVE_USERS', 'tony_snapshot'# 克隆快照为新的表(使用新名称)clone_snapshot 'tony_snapshot', ...
- 本文通过简单的例子来解析,大数据实践中的Spark读写流程,内容主要聚焦于Spark中的高效并行读写以及在写过程中如何保证事务性。 本文通过简单的例子来解析,大数据实践中的Spark读写流程,内容主要聚焦于Spark中的高效并行读写以及在写过程中如何保证事务性。
- HBase自带许多运维工具,为用户提供管理、分析、修复和调试功能。本文将列举一些常用HBase工具,开发人员和运维人员可以参考本文内容,利用这些工具对HBase进行日常管理和运维。 HBase自带许多运维工具,为用户提供管理、分析、修复和调试功能。本文将列举一些常用HBase工具,开发人员和运维人员可以参考本文内容,利用这些工具对HBase进行日常管理和运维。
- 基于Hadoop构建的大数据环境,如何生成唯一ID。 基于Hadoop构建的大数据环境,如何生成唯一ID。
- Spark是一个基于内存的分布式计算引擎,为了更为高效地利用内存,并减少OOM等内存问题,Spark对JVM内存模型进行了进一步的管理规划,在其之上实现了自己的内存管理模型。本文将基于spark.memory包对Spark内存管理机制进行简要探索。 Spark是一个基于内存的分布式计算引擎,为了更为高效地利用内存,并减少OOM等内存问题,Spark对JVM内存模型进行了进一步的管理规划,在其之上实现了自己的内存管理模型。本文将基于spark.memory包对Spark内存管理机制进行简要探索。
上滑加载中
推荐直播
-
物联网资深专家带你轻松构建AIoT智能场景应用
2024/11/21 周四 16:30-18:00
管老师 华为云IoT DTSE技术布道师
如何轻松构建AIoT智能场景应用?本期直播将聚焦华为云设备接入平台,结合AI、鸿蒙(OpenHarmony)、大数据等技术,实现物联网端云协同创新场景,教您如何打造更有实用性及创新性的AIoT行业标杆应用。
回顾中 -
Ascend C算子编程之旅:基础入门篇
2024/11/22 周五 16:00-17:30
莫老师 昇腾CANN专家
介绍Ascend C算子基本概念、异构计算架构CANN和Ascend C基本概述,以及Ascend C快速入门,夯实Ascend C算子编程基础
即将直播 -
深入解析:华为全栈AI解决方案与云智能开放能力
2024/11/22 周五 18:20-20:20
Alex 华为云学堂技术讲师
本期直播我们将重点为大家介绍华为全栈全场景AI解决方案以和华为云企业智能AI开放能力。旨在帮助开发者深入理解华为AI解决方案,并能够更加熟练地运用这些技术。通过洞悉华为解决方案,了解人工智能完整生态链条的构造。
去报名
热门标签