- 文章目录 一、复杂数据类型 二、数组类型(array)实战 (一)案例1、单列数组 1、创建文本文件array1.txt ... 文章目录 一、复杂数据类型 二、数组类型(array)实战 (一)案例1、单列数组 1、创建文本文件array1.txt ...
- 文章目录 一、初步了解Hive 1、Hadoop开发存在的问题 2、OLTP系统与OLAP系统 (1)OLTP - 在线... 文章目录 一、初步了解Hive 1、Hadoop开发存在的问题 2、OLTP系统与OLAP系统 (1)OLTP - 在线...
- 文章目录 一、Hive架构图 二、服务端组件 1、Driver组件 2、Metastore组件 3、Thrift服务 三、客户端... 文章目录 一、Hive架构图 二、服务端组件 1、Driver组件 2、Metastore组件 3、Thrift服务 三、客户端...
- 文章目录 一、汇聚去重函数:collect_set (一)案例1:单列数据去重 1、创建数据文件nums.txt 2... 文章目录 一、汇聚去重函数:collect_set (一)案例1:单列数据去重 1、创建数据文件nums.txt 2...
- 文章目录 一、Hive分桶表 1、分桶操作 2、分桶原理 3、注意事项 二、分桶表案例演示 1、创建数据文件c... 文章目录 一、Hive分桶表 1、分桶操作 2、分桶原理 3、注意事项 二、分桶表案例演示 1、创建数据文件c...
- 文章目录 一、字符串函数 1、字符串长度函数:length 2、字符串反转函数:reverse 案例:寻找表中回文字符串... 文章目录 一、字符串函数 1、字符串长度函数:length 2、字符串反转函数:reverse 案例:寻找表中回文字符串...
- 前言 随着 Flink 在流式计算的应用场景逐渐成熟和流行。如果 Flink 能同时把批量计算的应用场景处理好,就能减少用户在使用 Flink 的开发和维护成本,并且能够丰富 Flink 的生态。因为 SQL 是批计算比较常用的工具,所以 Flink 针对于批计算主要以 SQL 为主要接口。本次分享主要针对 Flink 对批处理的设计... 前言 随着 Flink 在流式计算的应用场景逐渐成熟和流行。如果 Flink 能同时把批量计算的应用场景处理好,就能减少用户在使用 Flink 的开发和维护成本,并且能够丰富 Flink 的生态。因为 SQL 是批计算比较常用的工具,所以 Flink 针对于批计算主要以 SQL 为主要接口。本次分享主要针对 Flink 对批处理的设计...
- 在分布式集群环境下,因为程序Bug(包括Hadoop本身的bug),负载不均衡或者资源分布不均等原因,会造成... 在分布式集群环境下,因为程序Bug(包括Hadoop本身的bug),负载不均衡或者资源分布不均等原因,会造成...
- 什么是Hive? Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(HQL)。 2.HIve的意义(最初研发的原因) 减... 什么是Hive? Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(HQL)。 2.HIve的意义(最初研发的原因) 减...
- Hive会将一个查询转化成一个或者多个阶段。这样的阶段可以是MapReduce阶段、抽样阶段、合并阶段、li... Hive会将一个查询转化成一个或者多个阶段。这样的阶段可以是MapReduce阶段、抽样阶段、合并阶段、li...
- Map数 <1>通常情况下,作业会通过input的目录产生一个或者多个map任务。 主要的决定因素有:input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M,可在... Map数 <1>通常情况下,作业会通过input的目录产生一个或者多个map任务。 主要的决定因素有:input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M,可在...
- 本篇博客,小菌为大家带来关于如何将本地的多个文件导入到Hive分区表中对应的分区上的方法。一共有四种方法,本... 本篇博客,小菌为大家带来关于如何将本地的多个文件导入到Hive分区表中对应的分区上的方法。一共有四种方法,本...
- JVM重用是Hadoop调优参数的内容,其对Hive的性能具有非常大的影响,特别是对于很难避免小文件的场景或... JVM重用是Hadoop调优参数的内容,其对Hive的性能具有非常大的影响,特别是对于很难避免小文件的场景或...
- 本篇博客,博主为大家介绍的是关于Kylin的增量构建的步骤过程,以及其与全量构建的差异对比!看完之后,相信你... 本篇博客,博主为大家介绍的是关于Kylin的增量构建的步骤过程,以及其与全量构建的差异对比!看完之后,相信你...
- 本篇博客小菌为大家带来的是关于Hive自定义函数的相关内容! &nbs... 本篇博客小菌为大家带来的是关于Hive自定义函数的相关内容! &nbs...
上滑加载中
推荐直播
-
华为云码道 × 仓颉编程:工程化AI编码探索2026/05/27 周三 19:00-21:00
刘俊杰-华为云仓颉语言专家/李炎-华为云码道技术专家/王智鹏-OpenCangjie开源社区发起人
本场直播围绕华为云仓颉语言与华为云码道的深度结合,展示华为云智能编程从零基础到高效落地的完整生态能力。以华为云码道为引擎,仓颉语言为载体,带给大家日常提效、趣味创新到极速量产的开发体验。
回顾中
热门标签