Hive_标签_开发者_华为云

博客(385)
视频(0)
论坛(0)
云声(0)
代码示例(0)

Hive导入数据与导出数据
一、导入数据的几种方法 1. load 语法： load data [local] inpath '路径' [overwrite] into table '表名'; 将本地的test.txt 导入hive的test表： load data local inpath '/test.txt' overwrite into table test; ...

kala_1314
发表于2019-01-18 17:11:54
6440 0 0

6.4k 0 0

一、导入数据的几种方法 1. load 语法： load data [local] inpath '路径' [overwrite] into table '表名'; 将本地的test.txt 导入hive的test表： load data local inpath '/test.txt' overwrite into table test; ...
Hive
Hive存储格式简单介绍
一、 Hive文件存储格式 Hive支持的存储格式有：　textfile、sequencefile、orc和parquet这几种格式。Hive　的存储方式有列式存储和行式存储。 textfile和sequencefile的存储格式是给予行存储的；而orc和parquet是基于列存储的(实质上也不是完全的列存储。关于行式存储和列式存储：行存储的特点: 查询满足条件的一整行数据的时候，...

kala_1314
发表于2019-01-18 16:37:43
6190 0 0

6.1k 0 0

一、 Hive文件存储格式 Hive支持的存储格式有：　textfile、sequencefile、orc和parquet这几种格式。Hive　的存储方式有列式存储和行式存储。 textfile和sequencefile的存储格式是给予行存储的；而orc和parquet是基于列存储的(实质上也不是完全的列存储。关于行式存储和列式存储：行存储的特点: 查询满足条件的一整行数据的时候，...
Hive 存储
Hive数据倾斜
一、什么是数据倾斜：数据倾斜就是key的一些原因，导致分发到不同的reduce上，个别reduce任务特别重，以至于其他reduce都完成了，而这些个别的reduce仍然还需要一些时间才能完成。发生数据倾斜的远因大概有： 1.输入的文件太多或者大小不一 2.hive的参数设置不合理 3.Hive SQL语句本身的缺陷 ...等等当然，肯定还有很多其他的一些原因会导致数据倾斜，这里只是列举一...

kala_1314
发表于2019-01-18 14:20:07
5927 0 0

5.9k 0 0

一、什么是数据倾斜：数据倾斜就是key的一些原因，导致分发到不同的reduce上，个别reduce任务特别重，以至于其他reduce都完成了，而这些个别的reduce仍然还需要一些时间才能完成。发生数据倾斜的远因大概有： 1.输入的文件太多或者大小不一 2.hive的参数设置不合理 3.Hive SQL语句本身的缺陷 ...等等当然，肯定还有很多其他的一些原因会导致数据倾斜，这里只是列举一...
Hive MapReduce
HIVE安装过程
HIVE安装过程

shs
发表于2018-12-17 11:31:34
11030 0 0

11.0k 0 0

HIVE安装过程
Hive
【大数据安全】Apache Kylin 安全配置(Kerberos)
1. 概述本文首先会简单介绍Kylin的安装配置，然后介绍启用Kerberos的CDH集群中如何部署及使用Kylin。Apache Kylin™是一个开源的分布式分析引擎，提供Hadoop/Spark之上的SQL查询接口及多维分析（OLAP）能力以支持超大规模数据，最初由eBay Inc. 开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。1.2 环境说明CDH版本：5.11.2Lin...

mantou
发表于2018-11-12 15:45:52
11693 0 0

11.6k 0 0

1. 概述本文首先会简单介绍Kylin的安装配置，然后介绍启用Kerberos的CDH集群中如何部署及使用Kylin。Apache Kylin™是一个开源的分布式分析引擎，提供Hadoop/Spark之上的SQL查询接口及多维分析（OLAP）能力以支持超大规模数据，最初由eBay Inc. 开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。1.2 环境说明CDH版本：5.11.2Lin...
HBase Kerberos Hive 登录
hive数据迁移
比如需要把生产的hive集群数据迁移到另一个集群，hive提供了2个命令工具，可以实现表的批量迁移。 [export/import] 设置默认需要导出的hive数据库在hive目录/etc/alt...

数据社
发表于2022-09-25 04:48:39
5362 0 0

5.3k 0 0

比如需要把生产的hive集群数据迁移到另一个集群，hive提供了2个命令工具，可以实现表的批量迁移。 [export/import] 设置默认需要导出的hive数据库在hive目录/etc/alt...
Hive 数据迁移
数仓如何选择计算引擎？
公众号推文规则变了，点击上方 "数据社", 设为星标后台回复【加群】，申请加入数据学习交流群图片拍摄于前段时间的上海，相信大家都见过这建筑大家好，我是一哥，之前给大家讲了《ETL的灵魂：调度系统》，今天给大家讲一下数仓中的计算存储系统。大数据计算平台目前主要都是围绕着hadoop生态发展的，运用...

数据社
发表于2022-09-25 04:27:17
2371 0 0

2.3k 0 0

公众号推文规则变了，点击上方 "数据社", 设为星标后台回复【加群】，申请加入数据学习交流群图片拍摄于前段时间的上海，相信大家都见过这建筑大家好，我是一哥，之前给大家讲了《ETL的灵魂：调度系统》，今天给大家讲一下数仓中的计算存储系统。大数据计算平台目前主要都是围绕着hadoop生态发展的，运用...
Hive spark
hive的这些事（一）——hive数据迁移
比如需要把生产的hive集群数据迁移到另一个集群，hive提供了2个命令工具，可以实现表的批量迁移。 [export/import] 设置默认需要导出的hive数据库在hive目录/etc/alternatives/hive-conf下添加.hivercvi ~/.hivercuse test; 创建数据临时目录 hdfs df...

数据社
发表于2022-09-25 03:59:50
6001 0 0

6.0k 0 0

比如需要把生产的hive集群数据迁移到另一个集群，hive提供了2个命令工具，可以实现表的批量迁移。 [export/import] 设置默认需要导出的hive数据库在hive目录/etc/alternatives/hive-conf下添加.hivercvi ~/.hivercuse test; 创建数据临时目录 hdfs df...
Hive 数据迁移
&#X开头的文本，怎么转换为汉字
今天查询hive中的数据发现一个问题，hive客户端查询显示是&#x开头的乱码，查看原数据库中也是这样，但是在浏览器中可以解析这种编码。 &#xxx;‘ 的格式其实是unicode，&a...

数据社
发表于2022-09-25 03:24:10
2739 0 0

2.7k 0 0

今天查询hive中的数据发现一个问题，hive客户端查询显示是&#x开头的乱码，查看原数据库中也是这样，但是在浏览器中可以解析这种编码。 &#xxx;‘ 的格式其实是unicode，&a...
Hive
关于hive数据导入方式的总结
从本地导入数据到hive： load data local inpath '/home/hive/tb_dw_cu_three_type_list_dtal/*.dat' overwrite into table csap.tb_dw_cu_three...

数据社
发表于2022-09-25 02:53:41
2194 0 0

2.1k 0 0

从本地导入数据到hive： load data local inpath '/home/hive/tb_dw_cu_three_type_list_dtal/*.dat' overwrite into table csap.tb_dw_cu_three...
Hive
原来HIVE 还有这样的坑？
1 从调度系统对 HIVE 作业的调度策略聊起大家知道，依托 HIVE 构建数据仓库时，我们一般会通过调度系统精心编排 HIVE SQL 作业，以避免多个作业并发写同一张表或同一个表分区；同时 AD HOC 的数据查询操作，在时间上一般也会尽量避开常规的 ETL 数据写操作，以避免对同一张表或同一个表分区的并发读写操作。 ...

数据社
发表于2022-09-25 02:37:42
2602 0 0

2.6k 0 0

1 从调度系统对 HIVE 作业的调度策略聊起大家知道，依托 HIVE 构建数据仓库时，我们一般会通过调度系统精心编排 HIVE SQL 作业，以避免多个作业并发写同一张表或同一个表分区；同时 AD HOC 的数据查询操作，在时间上一般也会尽量避开常规的 ETL 数据写操作，以避免对同一张表或同一个表分区的并发读写操作。 ...
Hive SQL
收藏，二万字讲解HiveSQL技术原理、优化与面试
 来源：大数据老哥  全文共12336个字，建议收藏阅读本文基本涵盖以下内容： Hive SQL 编译成MapReduce过程Hive 千亿级数据倾斜Hive执行计划Hive 底层执行架构 -  Hive SQL 编译成MapReduce过程 - 编译 SQL ...

数据社
发表于2022-09-25 01:33:59
3381 0 0

3.3k 0 0

 来源：大数据老哥  全文共12336个字，建议收藏阅读本文基本涵盖以下内容： Hive SQL 编译成MapReduce过程Hive 千亿级数据倾斜Hive执行计划Hive 底层执行架构 -  Hive SQL 编译成MapReduce过程 - 编译 SQL ...
Hive MapReduce SQL
Hive 核心知识点灵魂 16 问
全文共6100个字，建议阅读16分钟本文目录 No1. 请谈一下 Hive 的特点No2. Hive 底层与数据库交互原理？No3. Hive 的 HSQL 转换为 MapReduce 的过程？No4. Hive 的两张表关联，使用 MapReduce 怎么实现？No5. 请说明 hive 中 Sort By，Order...

数据社
发表于2022-09-25 01:14:45
2284 0 0

2.2k 0 0

全文共6100个字，建议阅读16分钟本文目录 No1. 请谈一下 Hive 的特点No2. Hive 底层与数据库交互原理？No3. Hive 的 HSQL 转换为 MapReduce 的过程？No4. Hive 的两张表关联，使用 MapReduce 怎么实现？No5. 请说明 hive 中 Sort By，Order...
Hive SQL
火山引擎流批数据质量解决方案和最佳实践
火山引擎的数据质量平台是在多年服务字节跳动今日头条、抖音等业务的过程中打磨出来的。面对今日头条、抖音等不同产品线的复杂数据质量场景，数据质量平台如何满足多样的需求？本文将介绍火山引擎数据质量平台是如何弥合大数据场景下数据质量校验与计算消耗资源大、校验计算时间长的冲突，并介绍数据质量平台是如何用一套架构框架来满足流批方面的数据质...

数据社
发表于2022-09-25 00:12:09
2541 0 0

2.5k 0 0

火山引擎的数据质量平台是在多年服务字节跳动今日头条、抖音等业务的过程中打磨出来的。面对今日头条、抖音等不同产品线的复杂数据质量场景，数据质量平台如何满足多样的需求？本文将介绍火山引擎数据质量平台是如何弥合大数据场景下数据质量校验与计算消耗资源大、校验计算时间长的冲突，并介绍数据质量平台是如何用一套架构框架来满足流批方面的数据质...
Hive spark
Linux安装Hive并测试
一、Node2节点配置二、Master节点配置三、Node1节点配置四、启动Hive并测试下载Hive包:https://cloud.189.cn/t/zqaieevYNrau (访问...

指剑
发表于2022-09-03 00:56:59
2193 0 0

2.1k 0 0

一、Node2节点配置二、Master节点配置三、Node1节点配置四、启动Hive并测试下载Hive包:https://cloud.189.cn/t/zqaieevYNrau (访问...
Hive Linux

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript