Hive_标签_开发者_华为云

博客(374)
视频(0)
论坛(0)
云声(0)
代码示例(0)

把本地的文件数据导入到Hive分区表--系列①Java代码
        本篇博客,小菌为大家带来关于如何将本地的多个文件导入到Hive分区表中对应的分区上的方法。一共有四种方法,本...

大数据梦想家
发表于2021-09-29 00:18:33
3094 0 0

3.0k 0 0

        本篇博客,小菌为大家带来关于如何将本地的多个文件导入到Hive分区表中对应的分区上的方法。一共有四种方法,本...
Hive Java
Hive性能调优之JVM重用(5)
        JVM重用是Hadoop调优参数的内容，其对Hive的性能具有非常大的影响，特别是对于很难避免小文件的场景或...

大数据梦想家
发表于2021-09-28 23:32:04
5488 0 0

5.4k 0 0

        JVM重用是Hadoop调优参数的内容，其对Hive的性能具有非常大的影响，特别是对于很难避免小文件的场景或...
Hive JVM 应用性能调优
原来Kylin的增量构建，大有学问!
        本篇博客，博主为大家介绍的是关于Kylin的增量构建的步骤过程，以及其与全量构建的差异对比！看完之后，相信你...

大数据梦想家
发表于2021-09-28 23:23:59
2677 0 0

2.6k 0 0

        本篇博客，博主为大家介绍的是关于Kylin的增量构建的步骤过程，以及其与全量构建的差异对比！看完之后，相信你...
Hive
Hive的自定义函数与通过reflect调用java方法
        本篇博客小菌为大家带来的是关于Hive自定义函数的相关内容!    &nbs...

大数据梦想家
发表于2021-09-28 23:00:37
2973 0 0

2.9k 0 0

        本篇博客小菌为大家带来的是关于Hive自定义函数的相关内容!    &nbs...
Hive Java
2021年大数据Flink（三十八）：Table与SQL 案例五 FlinkSQL整合Hive
目录案例五 FlinkSQL整合Hive 介绍集成Hive的基本方式准备工作 1.添加hadoop_classpath 2.下载jar并上传至flink/lib目录 3.修改hive配置 4.启动hive元数据服务 SQL CLI 1.修改flinksql配置 2.启...

Lansonli
发表于2021-09-28 22:57:06
3840 1 1

3.8k 1 1

目录案例五 FlinkSQL整合Hive 介绍集成Hive的基本方式准备工作 1.添加hadoop_classpath 2.下载jar并上传至flink/lib目录 3.修改hive配置 4.启动hive元数据服务 SQL CLI 1.修改flinksql配置 2.启...
Flink Hive SQL
Hive性能调优之严格模式(4)
        Hive提供了一个严格模式，可以防止用户执行“高危”的查询。    &nbs...

大数据梦想家
发表于2021-09-27 23:35:46
5020 0 0

5.0k 0 0

        Hive提供了一个严格模式，可以防止用户执行“高危”的查询。    &nbs...
Hive 应用性能调优
2021年大数据Spark（三十一）：Spark On Hive
目录 Spark On Hive spark-sql中集成Hive Spark代码中集成Hive Spark On Hive Spark SQL模块从发展来说，从Apache Hive框架而来，发展历程：Hive（MapReduce）-> Shark (Hive on Spark) -> Spark SQL（Sc...

Lansonli
发表于2021-09-27 23:25:51
3122 0 0

3.1k 0 0

目录 Spark On Hive spark-sql中集成Hive Spark代码中集成Hive Spark On Hive Spark SQL模块从发展来说，从Apache Hive框架而来，发展历程：Hive（MapReduce）-> Shark (Hive on Spark) -> Spark SQL（Sc...
Hive spark 大数据
Hue集成Hive
        上一篇博客为大家介绍了Hue集成HDFS，本篇我们继续,为大家带来Hue如何集成Hive!  &...

大数据梦想家
发表于2021-09-27 23:04:47
3070 0 0

3.0k 0 0

        上一篇博客为大家介绍了Hue集成HDFS，本篇我们继续,为大家带来Hue如何集成Hive!  &...
Hive
Hdfs 导入Hive，时间相关的字段导入后为NULL
CREATE TABLE OFFER_${day_id} ( OFFER_ID BIGINT, ATOM_ACTION_ID BIGINT, PARTY_ID BIGINT, OFFER_...

小工匠
发表于2021-09-10 02:23:19
2862 0 0

2.8k 0 0

CREATE TABLE OFFER_${day_id} ( OFFER_ID BIGINT, ATOM_ACTION_ID BIGINT, PARTY_ID BIGINT, OFFER_...
Hadoop Hive
五、Hive架构，安装和基本使用
@Author ： By Runsen @Date ： 2020/6/21 作者介绍：Runsen目前大三下学期，专业化学工程与工艺，大学沉迷日语，Python， Java和一系列数据分析软件。导致翘课严重，专业排名中下。.在大学60%的时间，都在CSDN。在一月到四月都没怎么写博客，因为决定写书，结果出书方说大学生就是一个菜鸟，看我确实还是一个菜鸟，就更新到博客...

毛利
发表于2021-07-15 03:51:49
2950 0 0

2.9k 0 0

@Author ： By Runsen @Date ： 2020/6/21 作者介绍：Runsen目前大三下学期，专业化学工程与工艺，大学沉迷日语，Python， Java和一系列数据分析软件。导致翘课严重，专业排名中下。.在大学60%的时间，都在CSDN。在一月到四月都没怎么写博客，因为决定写书，结果出书方说大学生就是一个菜鸟，看我确实还是一个菜鸟，就更新到博客...
Hive
五、Hive数据类型和简单使用
Hive使用的语句是Hql，和sql百分之九十都是相近的，因此，只要对SQL比较熟悉的，Hql基本不用怎么学。基本数据类型基本数据类型 tinyint/smallint/int/bigint: 整数类型 float/double: 浮点数类型 boolean：布尔类型 string：字符串类型复杂数据类型 Array：数组类型，由一系...

毛利
发表于2021-07-15 01:16:55
2902 0 0

2.9k 0 0

Hive使用的语句是Hql，和sql百分之九十都是相近的，因此，只要对SQL比较熟悉的，Hql基本不用怎么学。基本数据类型基本数据类型 tinyint/smallint/int/bigint: 整数类型 float/double: 浮点数类型 boolean：布尔类型 string：字符串类型复杂数据类型 Array：数组类型，由一系...
Hive 数据结构
一个sql生成hive日期维度表
目录 1、日期维度表 2、生成语句 3、用例在进行日期处理时，有时候会很麻烦，于是小编开发了一张日期维表，供大家参考。 1、日期维度表 num字段名字段中文名描述数据类型1date日期日期 yyyMMdd格式bigint2week星期，数字型星期，数字型 0-6bigint3week_cn星期中文名星期中文名星期一……string4year_weeks一年中...

不吃西红柿
发表于2021-07-15 00:19:18
6376 0 1

6.3k 0 1

目录 1、日期维度表 2、生成语句 3、用例在进行日期处理时，有时候会很麻烦，于是小编开发了一张日期维表，供大家参考。 1、日期维度表 num字段名字段中文名描述数据类型1date日期日期 yyyMMdd格式bigint2week星期，数字型星期，数字型 0-6bigint3week_cn星期中文名星期中文名星期一……string4year_weeks一年中...
Hive SQL
Hive的优缺点
概述 Hive是基于Hadoop的一个数据仓库工具。可以将结构化的数据文件映射为一张表，并提供完整的sql查询功能底层是将sql语句转换为MapReduce任务进行运行 Hive提供了一系列的工具，可以用来进行数据提取、转化、加载（ETL Extract-Transform-Load ），这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制本质上是一种大...

不吃西红柿
发表于2021-07-15 00:12:21
5631 0 0

5.6k 0 0

概述 Hive是基于Hadoop的一个数据仓库工具。可以将结构化的数据文件映射为一张表，并提供完整的sql查询功能底层是将sql语句转换为MapReduce任务进行运行 Hive提供了一系列的工具，可以用来进行数据提取、转化、加载（ETL Extract-Transform-Load ），这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制本质上是一种大...
Hive
大数据计算引擎：impala对比hive
目录 Impala与Hive的异同数据存储元数据 SQL解释处理执行计划：数据流：内存使用：调度：容错：适用面： Impala相对于Hive所使用的优化技术 Impala的优缺点 Impala与Hive的异同数据存储使用相同的存储数据池都支持把数据储于HDFS, HBase。元数据两者使用相同的元数据。 SQL解释...

不吃西红柿
发表于2021-07-14 23:28:14
5573 0 0

5.5k 0 0

目录 Impala与Hive的异同数据存储元数据 SQL解释处理执行计划：数据流：内存使用：调度：容错：适用面： Impala相对于Hive所使用的优化技术 Impala的优缺点 Impala与Hive的异同数据存储使用相同的存储数据池都支持把数据储于HDFS, HBase。元数据两者使用相同的元数据。 SQL解释...
Hive 大数据
Hive小文件问题：如何产生、造成影响、解放办法
一、小文件是如何产生的 1.动态分区插入数据，产生大量的小文件，从而导致map数量剧增。 2.reduce数量越多，小文件也越多(reduce的个数和输出文件是对应的)。 3.数据源本身就包含大量的小文件。二、小文件问题的影响 1.从Hive的角度看，小文件会开很多map，一个map开一个JVM去执行，所以这些任务的初始化，启动，执行会浪费大量的资源，严重影响...

不吃西红柿
发表于2021-07-14 22:35:11
4519 0 0

4.5k 0 0

一、小文件是如何产生的 1.动态分区插入数据，产生大量的小文件，从而导致map数量剧增。 2.reduce数量越多，小文件也越多(reduce的个数和输出文件是对应的)。 3.数据源本身就包含大量的小文件。二、小文件问题的影响 1.从Hive的角度看，小文件会开很多map，一个map开一个JVM去执行，所以这些任务的初始化，启动，执行会浪费大量的资源，严重影响...
Hive

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript