Hive_标签_开发者_华为云

博客(385)
视频(0)
论坛(0)
云声(0)
代码示例(0)

【详解】Hive索引
Hive索引在大数据处理领域，Apache Hive 是一个广泛使用的数据仓库工具，它允许用户使用类似于 SQL 的查询语言（称为 HiveQL）来查询存储在 Hadoop 分布式文件系统（HDFS）中的数据。为了提高查询性能，Hive 提供了多种优化技术，其中索引是一个重要的功能。本文将探讨 Hive 索引的类型、创建方法及其应用场景。1. 索引的基本概念索引是一种数据结构，用于提高数据库...

皮牙子抓饭
发表于2025-10-20 22:03:10
4809 0 0

4.8k 0 0

Hive索引在大数据处理领域，Apache Hive 是一个广泛使用的数据仓库工具，它允许用户使用类似于 SQL 的查询语言（称为 HiveQL）来查询存储在 Hadoop 分布式文件系统（HDFS）中的数据。为了提高查询性能，Hive 提供了多种优化技术，其中索引是一个重要的功能。本文将探讨 Hive 索引的类型、创建方法及其应用场景。1. 索引的基本概念索引是一种数据结构，用于提高数据库...
Hadoop Hive
MapReduce自定义Partitioner实战经验分享
一、理解Partitioner的核心作用在MapReduce框架中，Partitioner如同数据处理流水线的交通枢纽。它负责将Mapper输出的键值对分配到对应的Reducer，这个看似简单的操作直接影响着任务的负载均衡和执行效率。默认的HashPartitioner通过key.hashCode() % numReduceTasks进行分区，但在实际生产环境中，这种"简单粗暴"的方式往往...

超梦
发表于2025-09-04 12:43:37
1014 0 0

1.0k 0 0

一、理解Partitioner的核心作用在MapReduce框架中，Partitioner如同数据处理流水线的交通枢纽。它负责将Mapper输出的键值对分配到对应的Reducer，这个看似简单的操作直接影响着任务的负载均衡和执行效率。默认的HashPartitioner通过key.hashCode() % numReduceTasks进行分区，但在实际生产环境中，这种"简单粗暴"的方式往往...
Hive MapReduce 大数据
云备份 CBR Hive 备份恢复用户指南
本文档是Hive定时备份恢复用户指南文档，主要描述了如何正确地使用CBR对Hive数据库进行数据备份与数据恢复的方法。

云小敏
发表于2025-08-04 10:54:50
1614 0 0

1.6k 0 0

本文档是Hive定时备份恢复用户指南文档，主要描述了如何正确地使用CBR对Hive数据库进行数据备份与数据恢复的方法。
Hive 云备份 CBR 数据库
大数据不是“偷窥狂”——咱们该咋保护用户隐私？
大数据不是“偷窥狂”——咱们该咋保护用户隐私？

Echo_Wish
发表于2025-07-29 20:05:45
1046 0 0

1.0k 0 0

大数据不是“偷窥狂”——咱们该咋保护用户隐私？
Hive 大数据
【详解】Hive自定义函数
Hive自定义函数Apache Hive 是一个基于 Hadoop 的数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的 SQL 查询功能，可以将 SQL 语句转换为 MapReduce 任务进行运行。其优点是学习成本低，可以通过类 SQL 语法快速分析海量数据。然而，在实际的数据处理过程中，我们可能会遇到一些 Hive 内置函数无法满足需求的情况。这时，就需要使用自定义函...

皮牙子抓饭
发表于2025-07-08 22:37:16
1699 0 0

1.6k 0 0

Hive自定义函数Apache Hive 是一个基于 Hadoop 的数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的 SQL 查询功能，可以将 SQL 语句转换为 MapReduce 任务进行运行。其优点是学习成本低，可以通过类 SQL 语法快速分析海量数据。然而，在实际的数据处理过程中，我们可能会遇到一些 Hive 内置函数无法满足需求的情况。这时，就需要使用自定义函...
Hive
【SQL周周练】：利用行车轨迹分析犯罪分子作案地点
【SQL 破案系列】第一篇：如果监控摄像头拍下了很多车辆的行车轨迹，那么如何利用这些行车轨迹来分析车辆运行的特征，是不是能够分析出犯罪分子“踩点”的位置

蒋点数分
发表于2025-05-17 09:51:16
4759 0 0

4.7k 0 0

【SQL 破案系列】第一篇：如果监控摄像头拍下了很多车辆的行车轨迹，那么如何利用这些行车轨迹来分析车辆运行的特征，是不是能够分析出犯罪分子“踩点”的位置
Hive Python SQL 数据分析数据库
【SQL 周周练】一千条数据需要做一天，怎么用 SQL 处理电表数据（如何动态构造自然月）
题目来自于某位发帖人在某 Excel 论坛的求助，他需要将电表缴费数据按照缴费区间拆开后再按月份汇总。当时用手工处理数据，自称一千条数据就需要处理一天。我将这个问题转化为 SQL 题目。

蒋点数分
发表于2025-05-12 19:39:06
2157 0 0

2.1k 0 0

题目来自于某位发帖人在某 Excel 论坛的求助，他需要将电表缴费数据按照缴费区间拆开后再按月份汇总。当时用手工处理数据，自称一千条数据就需要处理一天。我将这个问题转化为 SQL 题目。
Hive Python SQL 数据分析数据库
大数据仓库之Hive的部署
hive是facebook开源，并捐献给了apache组织，作为apache组织的顶级项目(hive.apache.org)。 hive是一个基于大数据技术的数据仓库(DataWareHouse)技术，主要是通过将用户(程序员)书写的SQL语句翻译成MapReduce代码，然后发布任务给Yarn执行，完成SQL 到 MapReduce的转换。可以将结构化的数据文件映射为一张数据库表，并提供类...

人工智能-张晨光
发表于2025-05-09 16:32:00
2164 0 0

2.1k 0 0

hive是facebook开源，并捐献给了apache组织，作为apache组织的顶级项目(hive.apache.org)。 hive是一个基于大数据技术的数据仓库(DataWareHouse)技术，主要是通过将用户(程序员)书写的SQL语句翻译成MapReduce代码，然后发布任务给Yarn执行，完成SQL 到 MapReduce的转换。可以将结构化的数据文件映射为一张数据库表，并提供类...
BigData Pro 大数据 Hadoop Hive 大数据政务大数据
深度解析之Hive原理
Hive能够把SQL语句转化为MapReduce任务来执行，从而大大降低了学习成本。尽管Hive在数据仓库的统计分析方面表现出色，但它也有其局限性。由于Hive构建在静态批处理的Hadoop之上，而Hadoop本身具有较高的延迟和作业调度开销，因此，在处理大规模数据集时，Hive可能无法实现低延迟的快速查询。

人工智能-张晨光
发表于2025-05-09 16:11:12
2628 0 0

2.6k 0 0

Hive能够把SQL语句转化为MapReduce任务来执行，从而大大降低了学习成本。尽管Hive在数据仓库的统计分析方面表现出色，但它也有其局限性。由于Hive构建在静态批处理的Hadoop之上，而Hadoop本身具有较高的延迟和作业调度开销，因此，在处理大规模数据集时，Hive可能无法实现低延迟的快速查询。
BigData Pro 大数据 Hadoop Hive 大数据政务大数据
【SQL 周周练】爬取短视频发现数据缺失，如何用 SQL 填充
爬虫爬取抖音和快手的短视频数据时，如果遇到数据缺失的情况，如何使用 SQL 语句完成数据的补全。

蒋点数分
发表于2025-05-07 17:42:50
2131 0 0

2.1k 0 0

爬虫爬取抖音和快手的短视频数据时，如果遇到数据缺失的情况，如何使用 SQL 语句完成数据的补全。
Hive Python SQL 数据分析数据挖掘
【SQL周周练】一句 SQL 如何帮助 5 个人买到电影院最好的座位？
这是一道我改编的 SQL 题目，不仅需要你输出连续的空座，还需要你去计算观影的最优位置。经过改编后，我相信是蛮有趣味的一道题。

蒋点数分
发表于2025-04-28 22:30:54
2402 0 0

2.4k 0 0

这是一道我改编的 SQL 题目，不仅需要你输出连续的空座，还需要你去计算观影的最优位置。经过改编后，我相信是蛮有趣味的一道题。
Hive pandas Python SQL 数据分析
【SQL周周练】给你无酸纸、变色油墨，你能伪造多少美金？
根据电影《无双》自创的 SQL 题目：假设伪钞集团每日给你供应随机数量的变色油墨、无酸纸、安全线/防伪线。请你计算每天能制作伪钞多少张，并且根据当天的情况输出第二天最缺少的材料。

蒋点数分
发表于2025-04-27 15:56:12
2465 0 0

2.4k 0 0

根据电影《无双》自创的 SQL 题目：假设伪钞集团每日给你供应随机数量的变色油墨、无酸纸、安全线/防伪线。请你计算每天能制作伪钞多少张，并且根据当天的情况输出第二天最缺少的材料。
Hive pandas Python SQL 数据分析
【Uber 面试真题】SQL ：每个星期连续5星评价最多的司机
大家好，我是“蒋点数分”，多年以来一直从事数据分析工作。从今天开始，与大家持续分享关于数据分析的学习内容。本文是第一篇，也是【SQL 周周练】系列的第一篇。该系列是挑选或自编具有一些难度的 SQL 题目，一周至少更新一篇。后续创作的内容，初步规划的方向包括：后续内容规划1.利用 Streamlit 实现 Hive 元数据展示、SQL 编辑器、结合Docker 沙箱实现数据分析 Agent...

蒋点数分
发表于2025-04-26 21:29:40
2412 0 0

2.4k 0 0

大家好，我是“蒋点数分”，多年以来一直从事数据分析工作。从今天开始，与大家持续分享关于数据分析的学习内容。本文是第一篇，也是【SQL 周周练】系列的第一篇。该系列是挑选或自编具有一些难度的 SQL 题目，一周至少更新一篇。后续创作的内容，初步规划的方向包括：后续内容规划1.利用 Streamlit 实现 Hive 元数据展示、SQL 编辑器、结合Docker 沙箱实现数据分析 Agent...
Hive Numpy pandas SQL 数据分析
一招解决MRS作业中shell节点获取Hive SQL执行结果【玩转华为云】
在DataArts作业中，Shell节点可以通过以下方式获取MRS Hive SQL节点执行的结果：使用EL表达式：当MRS Hive SQL节点的输出结果只有一个字段时，可以使用#{StringUtil.split(StringUtil.split(StringUtil.split(Job.getNodeOutput(\"前一节点名\"),\"]\"),\"[\"),\"\\\\\"\")...

Jack20
发表于2025-04-18 14:34:37
128610 7 7

128.6k 7 7

在DataArts作业中，Shell节点可以通过以下方式获取MRS Hive SQL节点执行的结果：使用EL表达式：当MRS Hive SQL节点的输出结果只有一个字段时，可以使用#{StringUtil.split(StringUtil.split(StringUtil.split(Job.getNodeOutput(\"前一节点名\"),\"]\"),\"[\"),\"\\\\\"\")...
Hive MapReduce SQL 数据治理中心 DataArts Studio
《深入了解Hive SQL：与传统SQL的差异探秘》
Hive SQL是基于Hadoop的大数据查询语言，用于处理存储在HDFS中的海量数据。它将SQL-like查询翻译为MapReduce任务，在大数据分析领域表现出色。与传统SQL相比，Hive SQL适用于分布式存储和大规模并行处理，支持复杂数据类型（如数组、结构体），但在事务支持和实时性上较弱。传统SQL更适合小规模、结构化数据及高频更新场景。

程序员阿伟
发表于2025-03-31 18:15:04
2344 0 0

2.3k 0 0

Hive SQL是基于Hadoop的大数据查询语言，用于处理存储在HDFS中的海量数据。它将SQL-like查询翻译为MapReduce任务，在大数据分析领域表现出色。与传统SQL相比，Hive SQL适用于分布式存储和大规模并行处理，支持复杂数据类型（如数组、结构体），但在事务支持和实时性上较弱。传统SQL更适合小规模、结构化数据及高频更新场景。
Hive SQL

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript