- Doris的安装 Doris的安装
- Doris初认识 Doris初认识
- HDFS初认识 HDFS初认识
- Canal下载安装一、安装前准备(开启MySQL binlog)对于自建 MySQL , 需要先开启 Binlog 写入功能,配置 binlog-format 为 ROW 模式,开启Mysql binlog日志步骤如下:1、登录mysql查看MySQL是否开启binlog日志[root@node2 ~]# mysql -u root -p123456mysql> show variables... Canal下载安装一、安装前准备(开启MySQL binlog)对于自建 MySQL , 需要先开启 Binlog 写入功能,配置 binlog-format 为 ROW 模式,开启Mysql binlog日志步骤如下:1、登录mysql查看MySQL是否开启binlog日志[root@node2 ~]# mysql -u root -p123456mysql> show variables...
- Apache Flink是什么在当前数据量激增的时代,各种业务场景都有大量的业务数据产生,对于这些不断产生的数据应该如何进行有效的处理,成为当下大多数公司所面临的问题。目前比较流行的大数据处理引擎Apache Spark,基本上已经取代了MapReduce成为当前大数据处理的标准。随着数据的不断增长,人们逐渐意识到对实时数据处理的重要性。相对传统数据处理模式,流式数据处理有着更高的处理效率和... Apache Flink是什么在当前数据量激增的时代,各种业务场景都有大量的业务数据产生,对于这些不断产生的数据应该如何进行有效的处理,成为当下大多数公司所面临的问题。目前比较流行的大数据处理引擎Apache Spark,基本上已经取代了MapReduce成为当前大数据处理的标准。随着数据的不断增长,人们逐渐意识到对实时数据处理的重要性。相对传统数据处理模式,流式数据处理有着更高的处理效率和...
- Kylin构建Cube算法Kylin中Cube的思想是用空间换时间, 通过预先的计算,把索引及结果存储起来,以换取查询时候的高性能。在Kylin v1.5以前,Kylin中的Cube只有一种算法:layered cubing,也称逐层算法,它是逐层由底向上,把所有组合算完的过程。Kylin v1.5以后,推出Fast Cubing,也称快速数据立方算法,是一个新的Cube算法。一、... Kylin构建Cube算法Kylin中Cube的思想是用空间换时间, 通过预先的计算,把索引及结果存储起来,以换取查询时候的高性能。在Kylin v1.5以前,Kylin中的Cube只有一种算法:layered cubing,也称逐层算法,它是逐层由底向上,把所有组合算完的过程。Kylin v1.5以后,推出Fast Cubing,也称快速数据立方算法,是一个新的Cube算法。一、...
- Hadoop集群之模板虚拟机的安装 Hadoop集群之模板虚拟机的安装
- DataX的框架设计和插件体系一、DataX是什么DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、DRDS 等各种异构数据源之间高效的数据同步功能。为了解决异构数据源同步问题,DataX将复杂的网状的... DataX的框架设计和插件体系一、DataX是什么DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、DRDS 等各种异构数据源之间高效的数据同步功能。为了解决异构数据源同步问题,DataX将复杂的网状的...
- HBase是面向列的分布式实时数据库,适合存储非结构化以及半结构化数据。 HBase是面向列的分布式实时数据库,适合存储非结构化以及半结构化数据。
- Hive是基于HDFS的数据仓库,适合存储结构化或半结构化数据。 Hive是基于HDFS的数据仓库,适合存储结构化或半结构化数据。
- MapReduce是大规模并行批处理计算框架,用Map以及Reduce实现基本并行计算任务。 MapReduce是大规模并行批处理计算框架,用Map以及Reduce实现基本并行计算任务。
- DataX和MongoDB之间的数据导入导出案例 DataX和MongoDB之间的数据导入导出案例
- 背景介绍CDH是Apache Hadoop和相关项目的最完整、最受测试和最流行的发行版,常常是许多客户建设IDC大数据平台中的首选。早期CDH版本只提供sentry的权限管理方案,后期新版本提供ranger作为替换方案,而CDH只有商业版本提供sentry升级ranger的服务,开源社区版并未提供这样的能力。本文主要探讨如何平滑解决sentry到ranger升级过程中的权限迁移问题。 Se... 背景介绍CDH是Apache Hadoop和相关项目的最完整、最受测试和最流行的发行版,常常是许多客户建设IDC大数据平台中的首选。早期CDH版本只提供sentry的权限管理方案,后期新版本提供ranger作为替换方案,而CDH只有商业版本提供sentry升级ranger的服务,开源社区版并未提供这样的能力。本文主要探讨如何平滑解决sentry到ranger升级过程中的权限迁移问题。 Se...
- DataX和Oracle使用案例 DataX和Oracle使用案例
- DataX使用之基础案例 DataX使用之基础案例 0. 写在前面 1. 从stream 流读取数据并打印到控制台 2. 读取 MySQL 中的数据存放到 HDFS 2.1 查看官方模板 2.1.1 mysqlreader 参数解析: 2.1.2 hdfswriter 参数解析: 2.2 准备数据 2.3 编写配置文件 2.4 执行任务 2.5 查看 HDFS 2.6 关于 HA 的支持... DataX使用之基础案例 DataX使用之基础案例 0. 写在前面 1. 从stream 流读取数据并打印到控制台 2. 读取 MySQL 中的数据存放到 HDFS 2.1 查看官方模板 2.1.1 mysqlreader 参数解析: 2.1.2 hdfswriter 参数解析: 2.2 准备数据 2.3 编写配置文件 2.4 执行任务 2.5 查看 HDFS 2.6 关于 HA 的支持...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签