MapReduce_标签_开发者_华为云

博客(635)
视频(0)
论坛(0)
云声(0)
代码示例(0)

MRS3.1.3-LTS 交互式分析引擎HetuEngine新特性之物化视图的自动刷新功能
一. 为什么要支持自动刷新物化视图？HetuEngine 3.1.3版本支持物化视图的创建和自动使用物化视图对查询SQL进行改写优化能力。使用物化视图提供的预计算能力能极大地提高查询效率，但是预计算也同时带来了数据的一致性问题。为了保证物化视图数据和源数据的一致性，物化视图需要被定时刷新。为了提升物化视图的易用性，减少需要定期刷新物化视图的麻烦，HetuEngine支持创建自动定期刷新的物...

HetuEngine九级代言
发表于2022-05-08 12:37:16
5849 0 0

5.8k 0 0

一. 为什么要支持自动刷新物化视图？HetuEngine 3.1.3版本支持物化视图的创建和自动使用物化视图对查询SQL进行改写优化能力。使用物化视图提供的预计算能力能极大地提高查询效率，但是预计算也同时带来了数据的一致性问题。为了保证物化视图数据和源数据的一致性，物化视图需要被定时刷新。为了提升物化视图的易用性，减少需要定期刷新物化视图的麻烦，HetuEngine支持创建自动定期刷新的物...
EI企业智能 FusionInsight HetuEngine MapReduce 大数据
MapReduce服务初体验【玩转华为云】
1、概述1.1、什么是MapReduce？大数据是人类进入互联网时代以来面临的一个巨大问题：社会生产生活产生的数据量越来越大，数据种类越来越多，数据产生的速度越来越快。传统的数据处理技术，比如说单机存储，关系数据库已经无法解决这些新的大数据问题。为解决以上大数据处理问题，Apache基金会推出了Hadoop大数据处理的开源解决方案。Hadoop是一个开源分布式计算平台，可以充分利用集群的...

nukinsan
发表于2022-04-25 23:14:35
5254 0 0

5.2k 0 0

1、概述1.1、什么是MapReduce？大数据是人类进入互联网时代以来面临的一个巨大问题：社会生产生活产生的数据量越来越大，数据种类越来越多，数据产生的速度越来越快。传统的数据处理技术，比如说单机存储，关系数据库已经无法解决这些新的大数据问题。为解决以上大数据处理问题，Apache基金会推出了Hadoop大数据处理的开源解决方案。Hadoop是一个开源分布式计算平台，可以充分利用集群的...
MapReduce MapReduce服务 MRS 大数据
Spark架构原理
相比MapReduce僵化的Map与Reduce分阶段计算相比，Spark的计算框架更加富有弹性和灵活性，运行性能更佳。 1 Spark的计算阶段MapReduce一个应用一次只运行一个map和一个reduceSpark可根据应用的复杂度，分割成更多的计算阶段（stage），组成一个有向无环图DAG，Spark任务调度器可根据DAG的依赖关系执行计算阶段逻辑回归机器学习性能Spark比Map...

JavaEdge
发表于2022-04-19 20:56:31
4924 0 1

4.9k 0 1

相比MapReduce僵化的Map与Reduce分阶段计算相比，Spark的计算框架更加富有弹性和灵活性，运行性能更佳。 1 Spark的计算阶段MapReduce一个应用一次只运行一个map和一个reduceSpark可根据应用的复杂度，分割成更多的计算阶段（stage），组成一个有向无环图DAG，Spark任务调度器可根据DAG的依赖关系执行计算阶段逻辑回归机器学习性能Spark比Map...
MapReduce spark
Hive如何让MapReduce实现SQL操作
Hive如何让MapReduce实现SQL操作MapReduce简化了大数据编程的难度，使得大数据计算不再是高不可攀的技术圣殿，普通工程师也能使用MapReduce开发大数据程序。但是对于经常需要进行大数据计算的人，比如从事研究商业智能（BI）的数据分析师来说，他们通常使用SQL进行大数据分析和统计，MapReduce编程还是有一定的门槛。而且如果每次统计和分析都开发相应的MapReduce...

JavaEdge
发表于2022-04-15 22:48:24
4224 0 1

4.2k 0 1

Hive如何让MapReduce实现SQL操作MapReduce简化了大数据编程的难度，使得大数据计算不再是高不可攀的技术圣殿，普通工程师也能使用MapReduce开发大数据程序。但是对于经常需要进行大数据计算的人，比如从事研究商业智能（BI）的数据分析师来说，他们通常使用SQL进行大数据分析和统计，MapReduce编程还是有一定的门槛。而且如果每次统计和分析都开发相应的MapReduce...
Hive MapReduce SQL
FusionInsight MRS HetuEngine使用HBase数据源
操作场景本章节指导用户在HSConsole界面添加HBase数据源。前提条件数据源所在集群域名与HetuEngine集群域名不能相同。数据源所在集群与HetuEngine集群节点网络互通。已创建HetuEngine计算实例。数据源所在集群与HetuEngine所在集群上ZooKeeper的SSL通信加密配置需保持一致。FusionInsight Manager 8.1.2之前的版本，SSL通...

一枚核桃
发表于2022-01-14 14:48:47
6830 0 0

6.8k 0 0

操作场景本章节指导用户在HSConsole界面添加HBase数据源。前提条件数据源所在集群域名与HetuEngine集群域名不能相同。数据源所在集群与HetuEngine集群节点网络互通。已创建HetuEngine计算实例。数据源所在集群与HetuEngine所在集群上ZooKeeper的SSL通信加密配置需保持一致。FusionInsight Manager 8.1.2之前的版本，SSL通...
FusionInsight HBase MapReduce
华为FusionInsight MRS实战 - Flink增强特性之可视化开发平台FlinkSever开发学习
华为Flink可视化开发平台FlinkServer作为自研服务，能够提供比原生flinksql接口更强的企业级特性，比如任务的集中管理，可视化开发，多数据源配置等。本文将对比介绍体现flinkserver的优势。

晋红轻
发表于2021-12-29 11:09:52
9903 0 0

9.9k 0 0

华为Flink可视化开发平台FlinkServer作为自研服务，能够提供比原生flinksql接口更强的企业级特性，比如任务的集中管理，可视化开发，多数据源配置等。本文将对比介绍体现flinkserver的优势。
EI企业智能 Flink FusionInsight MapReduce SQL
华为FusionInsight MRS FlinkSQL 复杂嵌套Json解析最佳实践
本文学习如何使用flinksql语法解析复杂嵌套的json格式内容。

晋红轻
发表于2021-12-29 11:05:34
6749 0 0

6.7k 0 0

本文学习如何使用flinksql语法解析复杂嵌套的json格式内容。
EI企业智能 FusionInsight MapReduce
华为FusionInsight MRS Manager rest接口进阶学习
本文学习如何使用rest接口访问FusionInsight MRS 组件界面信息。

晋红轻
发表于2021-12-29 11:03:46
6867 0 0

6.8k 0 0

本文学习如何使用rest接口访问FusionInsight MRS 组件界面信息。
EI企业智能 FusionInsight MapReduce
华为FusionInsight MRS Manager rest接口基础学习
FusionInsight Manager是集群的运维管理系统，为部署在集群内的服务提供统一的集群管理能力。本文学习使用基本的rest接口访问manager。

晋红轻
发表于2021-12-29 11:01:47
8344 0 0

8.3k 0 0

FusionInsight Manager是集群的运维管理系统，为部署在集群内的服务提供统一的集群管理能力。本文学习使用基本的rest接口访问manager。
EI企业智能 FusionInsight MapReduce
FusionInsight MRS Hudi原理解析之Compaction
Hudi的Compaction作用Hudi的Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，Merge-On-Read表可减少数据摄入延迟，更新被记录到增量文件，但是随着行式数据的不断增长，为加快分析效率，需要对列式文件和行式文件的合并（compaction）生成新版本的列式文件，提升数据访问的性能。因而进行Compaction很有意义。Compactio...

一枚核桃
发表于2021-12-28 10:49:30
6499 0 0

6.4k 0 0

Hudi的Compaction作用Hudi的Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，Merge-On-Read表可减少数据摄入延迟，更新被记录到增量文件，但是随着行式数据的不断增长，为加快分析效率，需要对列式文件和行式文件的合并（compaction）生成新版本的列式文件，提升数据访问的性能。因而进行Compaction很有意义。Compactio...
EI企业智能 FusionInsight MapReduce
Flink第一课！使用批处理，流处理，Socket的方式实现经典词频统计
Flink是什么Apache Flink 是一个框架和分布式处理引擎，用于对无界和有界数据流进行状态计算。 Flink的特点支持事件时间（event-time）和处理时间（processing-time）语义精确一次（exactly-once）的状态一致性保证低延迟，每秒处理数百万个事件，毫秒级延迟与众多常用存储系统的连接高可用，动态扩展，实现7*24小时全天候运行 Flink的全球热度 F...

大数据小禅
发表于2021-12-19 22:41:00
4041 0 0

4.0k 0 0

Flink是什么Apache Flink 是一个框架和分布式处理引擎，用于对无界和有界数据流进行状态计算。 Flink的特点支持事件时间（event-time）和处理时间（processing-time）语义精确一次（exactly-once）的状态一致性保证低延迟，每秒处理数百万个事件，毫秒级延迟与众多常用存储系统的连接高可用，动态扩展，实现7*24小时全天候运行 Flink的全球热度 F...
Flink MapReduce Socket编程
【云驻共创】告诉你如何学习Loader数据转换
介绍了Loader的主要功能及其主要特性，然后介绍了Loader的作业管理和监控。大数据平台与外部数据源的交互，通过MapReduce并行处理，完成数据的导入与导出功能。

Mr红凯
发表于2021-12-19 16:09:18
8796 0 0

8.7k 0 0

介绍了Loader的主要功能及其主要特性，然后介绍了Loader的作业管理和监控。大数据平台与外部数据源的交互，通过MapReduce并行处理，完成数据的导入与导出功能。
Hadoop MapReduce
【云驻共创】一文告诉你华为云上大数据处理与分析(详细)
本章主要讲述华为云大数据解决方案，云上大数据处理与分析方法。介绍了华为云EI主流大数据服务，如MRS服务、DWS服务和CSS服务。由此引出两种常见的大数据解决方案，离线处理和实时流处理，并对它们的架构优势、实现原理、应用分析与案例场景进行讲解。最后对DAYU数据运营平台进行了介绍。

菜鸟级攻城狮
发表于2021-12-09 11:55:33
6058 0 0

6.0k 0 0

本章主要讲述华为云大数据解决方案，云上大数据处理与分析方法。介绍了华为云EI主流大数据服务，如MRS服务、DWS服务和CSS服务。由此引出两种常见的大数据解决方案，离线处理和实时流处理，并对它们的架构优势、实现原理、应用分析与案例场景进行讲解。最后对DAYU数据运营平台进行了介绍。
MapReduce 大数据
【云小课】EI第38课 MRS基础原理之YARN组件介绍
为了实现一个Hadoop集群的集群共享、可伸缩性和可靠性，并消除早期MapReduce框架中的JobTracker性能瓶颈，Hadoop社区引入了统一的资源管理框架YARN。YARN是将JobTracker的两个主要功能（资源管理和作业调度/监控）分离，主要方法是创建一个全局的ResourceManager（RM）和若干个针对应用程序的ApplicationMaster（AM）。在原生的YA...

Hi,EI
发表于2021-12-09 11:02:25
6608 0 3

6.6k 0 3

为了实现一个Hadoop集群的集群共享、可伸缩性和可靠性，并消除早期MapReduce框架中的JobTracker性能瓶颈，Hadoop社区引入了统一的资源管理框架YARN。YARN是将JobTracker的两个主要功能（资源管理和作业调度/监控）分离，主要方法是创建一个全局的ResourceManager（RM）和若干个针对应用程序的ApplicationMaster（AM）。在原生的YA...
EI智能体 MapReduce Yarn
带你体验沙箱实验室的基于Spark实现车主驾驶行为分析丨【我的华为云体验之旅】
通过体验沙箱实验室的基于Spark实现车主驾驶行为分析实验后，我们可以从中学习MRS服务的创建过程，学习把文件数据上传到OBS，通过MRS里面创建作业类型为SparkSubmit，实现车主急加速、急刹车、空挡滑行、超速、疲劳驾驶等违法行为的次数的统计分析。

zekelove
发表于2021-12-02 14:29:50
12265 0 1

12.2k 0 1

通过体验沙箱实验室的基于Spark实现车主驾驶行为分析实验后，我们可以从中学习MRS服务的创建过程，学习把文件数据上传到OBS，通过MRS里面创建作业类型为SparkSubmit，实现车主急加速、急刹车、空挡滑行、超速、疲劳驾驶等违法行为的次数的统计分析。
MapReduce spark 对象存储服务 OBS

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript