Hive_标签_开发者_华为云

博客(385)
视频(0)
论坛(0)
云声(0)
代码示例(0)

Hive UDF源码解析【1】Create Function
文本主要解析Hive添加UDF的源码流程

想要一只猫
发表于2021-08-28 23:41:36
9091 0 0

9.0k 0 0

文本主要解析Hive添加UDF的源码流程
EI企业智能 Hadoop Hive 智能数据表格存储服务 CloudTable
Hive SQL编译原理（下）
三、过渡1 Driver.compile()2 SemanticAnalyzerFactory是Hive做语义解析的工厂类，用于根据SQL的类型，构建对应的语义解析器。比如：explain走ExplainSemanticAnalyzer，DDL走DDLSemanticAnalyzer，load走LoadSemanticAnalyzer等等，工厂模式可以使这些不同的功能隔离开，在一定程度上解耦...

living
发表于2021-07-30 17:32:44
10859 0 0

10.8k 0 0

三、过渡1 Driver.compile()2 SemanticAnalyzerFactory是Hive做语义解析的工厂类，用于根据SQL的类型，构建对应的语义解析器。比如：explain走ExplainSemanticAnalyzer，DDL走DDLSemanticAnalyzer，load走LoadSemanticAnalyzer等等，工厂模式可以使这些不同的功能隔离开，在一定程度上解耦...
Hive
Hive SQL编译原理（上）
一、编译模块整体介绍1 Hive执行过程回顾client:用户通过客户端提交查询操作Driver:提供执行接口，负责接收查询请求并建立session，创建一系列环境参数等Compiler:Hive的编译器，负责将sql转化为平台可执行的执行计划MetaStore:Hive的元数据服务器Execution Engine:执行引擎，负责提交Compiler 编译好的执行计划到不同的平台上用户通过...

living
发表于2021-07-30 17:07:00
9014 0 1

9.0k 0 1

一、编译模块整体介绍1 Hive执行过程回顾client:用户通过客户端提交查询操作Driver:提供执行接口，负责接收查询请求并建立session，创建一系列环境参数等Compiler:Hive的编译器，负责将sql转化为平台可执行的执行计划MetaStore:Hive的元数据服务器Execution Engine:执行引擎，负责提交Compiler 编译好的执行计划到不同的平台上用户通过...
Hive SQL
Hadoop 入门教程
Hadoop 入门教程

ruochen
发表于2021-06-22 18:52:48
6804 0 9

6.8k 0 9

Hadoop 入门教程
Hadoop Hive Java
hive数据迁移到clickhouse—使用Waterdrop工具
hive数据迁移到clickhouse—使用Waterdrop工具参考链接基于荣耀客户的需求，测试Waterdrop从云EI的hive-spark集群上迁移数据到clickhouse集群 hive数据迁移到clickhouse—使用Waterdrop工具 Waterdrop hive-spark集群 clickhouse集群 batch.conf 数据迁移迁移结果 waterdrop性能...

陈方业
发表于2021-05-25 14:33:36
11793 0 1

11.7k 0 1

hive数据迁移到clickhouse—使用Waterdrop工具参考链接基于荣耀客户的需求，测试Waterdrop从云EI的hive-spark集群上迁移数据到clickhouse集群 hive数据迁移到clickhouse—使用Waterdrop工具 Waterdrop hive-spark集群 clickhouse集群 batch.conf 数据迁移迁移结果 waterdrop性能...
ClickHouse Hadoop Hive 数据迁移
Hive之路-生成tpcds数据
背景前面的文章，基本实现了从0搭建Hive的运行环境。包括Hadoop、Hive，也包括HiveServer2、Tez。距离在Hive上调试开发，还欠缺一套开发环境，待后续补充。而环境有了后，测试什么、用什么表示这个系统可用？大多时候，我们想额外学习一个软件或者开源项目时候，就容易陷入"安装-部署-安装-部署"的循环中。没有实际使用的场景，或者自己构造的场景不足以触发特性（考虑不周），我们...

BUG开发工程师
发表于2021-04-22 16:58:20
15504 0 0

15.5k 0 0

背景前面的文章，基本实现了从0搭建Hive的运行环境。包括Hadoop、Hive，也包括HiveServer2、Tez。距离在Hive上调试开发，还欠缺一套开发环境，待后续补充。而环境有了后，测试什么、用什么表示这个系统可用？大多时候，我们想额外学习一个软件或者开源项目时候，就容易陷入"安装-部署-安装-部署"的循环中。没有实际使用的场景，或者自己构造的场景不足以触发特性（考虑不周），我们...
EI企业智能 Hive Windows 智能数据表格存储服务 CloudTable
HIVE及MySQL安装
安装HIVE编辑hive-env.sh 在HDFS创建数据存储仓库[root@master conf]# hadoop fs -mkdir -p /user/hive/warehouse 启动hive报错如下：原因：jar包冲突，删除低版本jar包即可解决方法：删除/usr/local/src/hadoop/soft/hadoop-2.6.0/share/hadoop/yarn/lib中的...

菜鸟级攻城狮
发表于2021-02-28 08:12:27
5906 0 1

5.9k 0 1

安装HIVE编辑hive-env.sh 在HDFS创建数据存储仓库[root@master conf]# hadoop fs -mkdir -p /user/hive/warehouse 启动hive报错如下：原因：jar包冲突，删除低版本jar包即可解决方法：删除/usr/local/src/hadoop/soft/hadoop-2.6.0/share/hadoop/yarn/lib中的...
Hive MySQL
MRS 1.9.x版本安全集群Presto跨集群查询Hive数据配置指南
假设有两个集群A，B，均开启了Kerberos，本文将说明如何配置使用集群B上的Presto查询集群A1. 配置集群互信，参见配置跨集群互信2. 将集群A上的/opt/Bigdata/MRS_1.9.2/1_XX_Coordinator/etc/core-site.xml和/opt/Bigdata/MRS_1.9.2/1_XX_Coordinator/etc/hdfs-site.xml拷贝...

Lothar
发表于2021-02-24 16:54:49
14347 0 0

14.3k 0 0

假设有两个集群A，B，均开启了Kerberos，本文将说明如何配置使用集群B上的Presto查询集群A1. 配置集群互信，参见配置跨集群互信2. 将集群A上的/opt/Bigdata/MRS_1.9.2/1_XX_Coordinator/etc/core-site.xml和/opt/Bigdata/MRS_1.9.2/1_XX_Coordinator/etc/hdfs-site.xml拷贝...
Hive MapReduce 大数据
浅谈Hive on Spark 与 Spark SQL的区别
Hive On Spark大体与Spark SQL结构类似，只是SQL引擎不同，但是计算引擎都是Spark。将Spark作为计算引擎，性能会比传统的MapReduce快很多。华为云DLI服务全面兼容Spark能力，DLI SQL在封装Spark SQL的同时，集成了carbon和carbondata的全部功能，同时兼容传统的DataSource和hive语法建表，支持跨源访问多个服务的数据，增强了

霞光
发表于2020-06-22 23:33:48
23667 0 1

23.6k 0 1

Hive On Spark大体与Spark SQL结构类似，只是SQL引擎不同，但是计算引擎都是Spark。将Spark作为计算引擎，性能会比传统的MapReduce快很多。华为云DLI服务全面兼容Spark能力，DLI SQL在封装Spark SQL的同时，集成了carbon和carbondata的全部功能，同时兼容传统的DataSource和hive语法建表，支持跨源访问多个服务的数据，增强了
spark Hive SQL
如何整合hive和hbase
Hive和Hbase在大数据架构中处在不同位置，Hive是一个构建在Hadoop基础之上的数据仓库，Hbase是一种NoSQL数据库，非常适用于海量明细数据的随机实时查询, 在大数据架构中，Hive和HBase是协作关系如果两者结合，可以利用MapReduce的优势针对HBase存储的大量内容进行离线的计算和分析。

滕云
发表于2019-03-31 23:50:57
10190 2 1

10.1k 2 1

Hive和Hbase在大数据架构中处在不同位置，Hive是一个构建在Hadoop基础之上的数据仓库，Hbase是一种NoSQL数据库，非常适用于海量明细数据的随机实时查询, 在大数据架构中，Hive和HBase是协作关系如果两者结合，可以利用MapReduce的优势针对HBase存储的大量内容进行离线的计算和分析。
HBase Hive
kettle如何连接hive
文章目录配置测试配置 kettle版本：kettle-6.1.0.1_07270 修改kettle-6.1.0.1_07270\plugins\pentaho-big-data-...

小小明-代码实体
发表于2021-10-12 22:49:44
8208 0 0

8.2k 0 0

文章目录配置测试配置 kettle版本：kettle-6.1.0.1_07270 修改kettle-6.1.0.1_07270\plugins\pentaho-big-data-...
Hive
Hive和Pandas实现wordcount
本文Pandas版本必须为0.25以上才能使用explode，可以通过以下命令看Pandas版本： pip show pandas 可以通过以下命令升级Pandas到最新版： pip install pandas --upgrade 也可以通过以下命令安装指定版本的Pandas： pip install ...

小小明-代码实体
发表于2021-10-11 23:53:21
6105 0 0

6.1k 0 0

本文Pandas版本必须为0.25以上才能使用explode，可以通过以下命令看Pandas版本： pip show pandas 可以通过以下命令升级Pandas到最新版： pip install pandas --upgrade 也可以通过以下命令安装指定版本的Pandas： pip install ...
Hive Python
hive函数大全：11大类、109个函数
磨刀不误砍柴工，学完函数再sql 目录一、关系运算  1. 等值比较: = 2. 不等值比较: <> 3.小于比较: < 4. 小于等于比较: <= 5. 大于比较: > 6. 大于等于比较: >= 7. 空值判断: IS NULL 8. 非空判断: IS NOTNULL 9. LIKE比较: LIKE ...

不吃西红柿
发表于2021-07-15 02:08:32
8494 0 0

8.4k 0 0

磨刀不误砍柴工，学完函数再sql 目录一、关系运算  1. 等值比较: = 2. 不等值比较: <> 3.小于比较: < 4. 小于等于比较: <= 5. 大于比较: > 6. 大于等于比较: >= 7. 空值判断: IS NULL 8. 非空判断: IS NOTNULL 9. LIKE比较: LIKE ...
Hive Python
Hive小文件问题：如何产生、造成影响、解放办法
一、小文件是如何产生的 1.动态分区插入数据，产生大量的小文件，从而导致map数量剧增。 2.reduce数量越多，小文件也越多(reduce的个数和输出文件是对应的)。 3.数据源本身就包含大量的小文件。   二、小文件问题的影响 1.从Hive的角度看，小文件会开很多map，一个map开一个JVM去执行，所以这些任务的初始化，启动，执行会浪费大量的资...

不吃西红柿
发表于2021-07-15 02:02:19
8840 0 0

8.8k 0 0

一、小文件是如何产生的 1.动态分区插入数据，产生大量的小文件，从而导致map数量剧增。 2.reduce数量越多，小文件也越多(reduce的个数和输出文件是对应的)。 3.数据源本身就包含大量的小文件。   二、小文件问题的影响 1.从Hive的角度看，小文件会开很多map，一个map开一个JVM去执行，所以这些任务的初始化，启动，执行会浪费大量的资...
Hive
Hive TextFile数据错行问题解决方案
Hive TextFile数据错行问题解决方案在使用Hive进行数据分析时，有时候会遇到TextFile格式的数据错行的情况，这会导致数据解析出现问题，影响分析结果的准确性。本文将介绍如何处理Hive中TextFile数据错行的情况。问题描述TextFile格式的数据在存储和处理过程中，可能会因为文本文件本身的格式问题或者数据写入时的异常情况，导致数据错行的情况出现。这种情况下，Hive在解...

皮牙子抓饭
发表于2024-08-19 19:15:37
2807 0 0

2.8k 0 0

Hive TextFile数据错行问题解决方案在使用Hive进行数据分析时，有时候会遇到TextFile格式的数据错行的情况，这会导致数据解析出现问题，影响分析结果的准确性。本文将介绍如何处理Hive中TextFile数据错行的情况。问题描述TextFile格式的数据在存储和处理过程中，可能会因为文本文件本身的格式问题或者数据写入时的异常情况，导致数据错行的情况出现。这种情况下，Hive在解...
Hive

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript