Hive_标签_开发者_华为云

博客(385)
视频(0)
论坛(0)
云声(0)
代码示例(0)

Hive基础02、安装Hive
编辑Hive基础02、安装Hive前置开启【hdfs】，六个服务都要在。start-all.shjps编辑安装Hive1、解压【Hive】tar -zxvf apache-hive-2.1.0-bin.tar.gz编辑由于命名不合适，所以更换一下：mv apache-hive-2.1.0-bin/ hive编辑2、修改配置在“/opt/hive/conf”目录下拷贝“hive-...

红目香薰
发表于2022-07-29 10:12:46
2734 0 0

2.7k 0 0

编辑Hive基础02、安装Hive前置开启【hdfs】，六个服务都要在。start-all.shjps编辑安装Hive1、解压【Hive】tar -zxvf apache-hive-2.1.0-bin.tar.gz编辑由于命名不合适，所以更换一下：mv apache-hive-2.1.0-bin/ hive编辑2、修改配置在“/opt/hive/conf”目录下拷贝“hive-...
Hive
Hive基础01、安装MySQL
编辑Hive基础01、安装MySQL目录1、安装需要的包2、卸载不需要的包3、安装MySQL服务端4、安装MySQL客户端5、登录MySQL6、修改密码7、分配master权限8、刷新权限登录测试 1、安装需要的包前置位置有【MySQL-server-5.1.73-1.glibc23.x86_64.rpm】和【MySQL-client-5.1.73-1.glibc23.x86_64.r...

红目香薰
发表于2022-07-29 10:12:13
2587 0 0

2.5k 0 0

编辑Hive基础01、安装MySQL目录1、安装需要的包2、卸载不需要的包3、安装MySQL服务端4、安装MySQL客户端5、登录MySQL6、修改密码7、分配master权限8、刷新权限登录测试 1、安装需要的包前置位置有【MySQL-server-5.1.73-1.glibc23.x86_64.rpm】和【MySQL-client-5.1.73-1.glibc23.x86_64.r...
Hive MySQL
大数据入门学习指南
大数据入门核心技术栏目是为初学者精心打造入门大数据必学知识整理，内容十分丰富，集合将近200篇高质文章带你轻松学习。但是由于文章很多，集合很多不同系列的知识点，在栏目里面难以标注顺序，这次博主花时间整理一份详细的学习指南，对于刚学习大数据的初学者是非常友好的。只要跟着学，想进入大数据做开发是很容易的，前提你得自律加坚持。

Lansonli
发表于2022-07-10 10:40:35
3056 0 1

3.0k 0 1

大数据入门核心技术栏目是为初学者精心打造入门大数据必学知识整理，内容十分丰富，集合将近200篇高质文章带你轻松学习。但是由于文章很多，集合很多不同系列的知识点，在栏目里面难以标注顺序，这次博主花时间整理一份详细的学习指南，对于刚学习大数据的初学者是非常友好的。只要跟着学，想进入大数据做开发是很容易的，前提你得自律加坚持。
Hadoop Hive 大数据
spark SQL配置连接Hive Metastore 3.1.2
Hive Metastore作为元数据管理中心，支持多种计算引擎的读取操作，例如Flink、Presto、Spark等。本文讲述通过spark SQL配置连接Hive Metastore，并以3.1.2版本为例。通过Spark连接Hive Metastore，需要准备如下文件：hive-site.xmlapache-hive-3.1.2-binspark-3.0.3-bin-hadoop3....

从大数据到人工智能
发表于2022-01-15 20:11:26
4473 0 0

4.4k 0 0

Hive Metastore作为元数据管理中心，支持多种计算引擎的读取操作，例如Flink、Presto、Spark等。本文讲述通过spark SQL配置连接Hive Metastore，并以3.1.2版本为例。通过Spark连接Hive Metastore，需要准备如下文件：hive-site.xmlapache-hive-3.1.2-binspark-3.0.3-bin-hadoop3....
Hive spark SQL
MRS Hive列统计信息
Hive列统计信息Hive的列统计信息记录了Hive表字段的元信息，根据字段类型的不同，统计的元信息也是稍有差异的。本文讲述两种常用的字段类型，int和string。int类型有4个统计信息，分别是：min、max、num_nulls、distinct_count；string类型也有4个统计信息，分别是： num_nulls、distinct_count、avg_col_len、max_c...

fzhan
发表于2021-12-28 19:44:05
12166 0 1

12.1k 0 1

Hive列统计信息Hive的列统计信息记录了Hive表字段的元信息，根据字段类型的不同，统计的元信息也是稍有差异的。本文讲述两种常用的字段类型，int和string。int类型有4个统计信息，分别是：min、max、num_nulls、distinct_count；string类型也有4个统计信息，分别是： num_nulls、distinct_count、avg_col_len、max_c...
EI企业智能 FusionInsight Hive
Hive on tez中map任务数的计算
Hive on tez任务计算map任务是在AM中计算，而不是在hiveserver中计算，有别于hive on mr任务。hive on tez中计算map任务个数主要分为两个步骤：一是计算splits个数；二是将splits分组，分组数即为map数量1. 先通过HiveInputFormat.getSplits 初步计算split的个数，实际上是调用FileInputFormat.ge...

lihz
发表于2021-09-30 11:05:50
10305 0 1

10.3k 0 1

Hive on tez任务计算map任务是在AM中计算，而不是在hiveserver中计算，有别于hive on mr任务。hive on tez中计算map任务个数主要分为两个步骤：一是计算splits个数；二是将splits分组，分组数即为map数量1. 先通过HiveInputFormat.getSplits 初步计算split的个数，实际上是调用FileInputFormat.ge...
EI企业智能 FusionInsight Hive
Hive虚拟列的生成与计算【3】
本文主要解析介绍Hive虚拟列INPUT__FILE__NAME相关源码

想要一只猫
发表于2021-09-08 00:17:13
10913 0 0

10.9k 0 0

本文主要解析介绍Hive虚拟列INPUT__FILE__NAME相关源码
EI企业智能 Hadoop Hive 智能数据表格存储服务 CloudTable
Hive虚拟列的生成与计算【2】
本文主要解析介绍Hive虚拟列相关源码

想要一只猫
发表于2021-09-03 01:16:21
10350 0 0

10.3k 0 0

本文主要解析介绍Hive虚拟列相关源码
EI企业智能 Hadoop Hive 智能数据表格存储服务 CloudTable
初始化Hive仓库报错
初始化Hive仓库报错

Kongfu Panda
发表于2021-05-07 10:38:52
9642 0 0

9.6k 0 0

初始化Hive仓库报错
Hive
Hive表分区恢复命令msck repair指导说明
请根据上传内容查阅。

单调函数
发表于2021-01-22 14:52:09
9115 0 0

9.1k 0 0

请根据上传内容查阅。
Hive
2020-08-08：有一批气象观测站，现需要获取这些站点的观测数据，并存储到 Hive 中。但是气象局只提供了 api 查询，
2020-08-08：有一批气象观测站，现需要获取这些站点的观测数据，并存储到 Hive 中。但是气象局只提供了 api 查询，每次只能查询单个观测点。那么如果能够方便快速地获取到所有的观测点的数据？福哥答案2020-08-08：参考答案：A.通过shell 或python 等调用api，结果先暂存本地，最后将本地文件上传到 Hive 中。B.通过 datax 的 httpReader 和 ...

福大大架构师每日一题
发表于2020-08-19 11:18:49
4289 0 0

4.2k 0 0

2020-08-08：有一批气象观测站，现需要获取这些站点的观测数据，并存储到 Hive 中。但是气象局只提供了 api 查询，每次只能查询单个观测点。那么如果能够方便快速地获取到所有的观测点的数据？福哥答案2020-08-08：参考答案：A.通过shell 或python 等调用api，结果先暂存本地，最后将本地文件上传到 Hive 中。B.通过 datax 的 httpReader 和 ...
API Hive
Load将Mysql数据导入Hive样例方案
1.1 业务场景模拟使用Loader工具将客户移动电话系统产生的历史数据从原始数据库Mysql导入到Hive中，进行离线分析。1.2 操作步骤1.2.1 创建用户1. 进入FunsionInsight Manager界面，进去系统，创建本次测试用户，给予最大权限即可。1.2.2 Loader准备工作1. 获取关系型数据库对应的驱...

南派三叔
发表于2020-07-17 17:07:22
6006 0 0

6.0k 0 0

1.1 业务场景模拟使用Loader工具将客户移动电话系统产生的历史数据从原始数据库Mysql导入到Hive中，进行离线分析。1.2 操作步骤1.2.1 创建用户1. 进入FunsionInsight Manager界面，进去系统，创建本次测试用户，给予最大权限即可。1.2.2 Loader准备工作1. 获取关系型数据库对应的驱...
MySQL Hive
Hive 性能调优大全
前言Hive 作为大数据领域常用的数据仓库组件，在平时设计和查询的时候要特别注意效率。影响 Hive 效率的几乎从不是数据量过大，而是数据倾斜、数据冗余、Job或I/O过多、MapReduce 分配不合理等等。对Hive 的调优既包含 Hive 的建表设计方面，对 HiveHQL 语句本身的优化，也包含 Hive 配置参数和底层引擎 MapReduce 方面的调整。为了不盲目地学习...

bigxiang
发表于2024-08-27 11:56:32
4103 0 0

4.1k 0 0

前言Hive 作为大数据领域常用的数据仓库组件，在平时设计和查询的时候要特别注意效率。影响 Hive 效率的几乎从不是数据量过大，而是数据倾斜、数据冗余、Job或I/O过多、MapReduce 分配不合理等等。对Hive 的调优既包含 Hive 的建表设计方面，对 HiveHQL 语句本身的优化，也包含 Hive 配置参数和底层引擎 MapReduce 方面的调整。为了不盲目地学习...
Hive 应用性能调优
关于hive中Map join 时大表left join小表的问题
关于hive中Map join 时大表left join小表的问题在hive中，（启用Map join时）大表left join小表，加载从右向左，所以小表会加载进内存，存储成map键值对，通过大表...

孙中明
发表于2022-06-05 00:59:19
9717 0 0

9.7k 0 0

关于hive中Map join 时大表left join小表的问题在hive中，（启用Map join时）大表left join小表，加载从右向左，所以小表会加载进内存，存储成map键值对，通过大表...
Hive
大数据学习笔记34：Hive - 数据库与表操作
文章目录一、准备工作 1、启动Hadoop 2、启动Hive 二、数据库操作 1、创建数据库 2、查询数据库...

howard2005
发表于2021-11-19 04:17:18
3960 0 0

3.9k 0 0

文章目录一、准备工作 1、启动Hadoop 2、启动Hive 二、数据库操作 1、创建数据库 2、查询数据库...
Hive 大数据数据库

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript