Hive_标签_开发者

博客(8.3k)
视频(0)
论坛(0)
云声(0)
代码示例(0)

大数据NiFi（十九）：实时Json日志数据导入到Hive
实时Json日志数据导入到Hive案例：使用NiFi将某个目录下产生的json类型的日志文件导入到Hive。这里首先将数据通过NiFi将Json数据解析属性，然后手动设置数据格式，将数据导入到HDFS中，Hive建立外表映射此路径实现外部数据导入到Hive中。使用到的处理器有：“TailFile”、“EvaluateJsonPath”、“ReplaceText”、“PutHDFS”四个处理器...

Lansonli
发表于2023-02-24 10:23:03
4066 0 1

4.0k 0 1

实时Json日志数据导入到Hive案例：使用NiFi将某个目录下产生的json类型的日志文件导入到Hive。这里首先将数据通过NiFi将Json数据解析属性，然后手动设置数据格式，将数据导入到HDFS中，Hive建立外表映射此路径实现外部数据导入到Hive中。使用到的处理器有：“TailFile”、“EvaluateJsonPath”、“ReplaceText”、“PutHDFS”四个处理器...
Hive JSON 大数据
Hive执行脚本: Return Code 2 from org.apache.hadoop.hive.ql.exec.MapR
Hive执行脚本: Return Code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask

WHYBIGDATA
发表于2023-01-16 10:41:46
2462 0 0

2.4k 0 0

Hive执行脚本: Return Code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask
Hive 大数据
Hive sql写法问题导致运行慢问题合集（一）
1. over(partition by order by)语法partition by和order by后字段一致现象:mr任务运行缓慢原因：partition by order by 语法含义为分组后排序组内数据其中的排序算法使用的为快速排序，partition by和order by字段一致会导致分区内全为相同数据，排序性能恶化严重，且p 与o字段相同排序无意义解决方法：1.p...

yd_225577686
发表于2022-12-27 09:58:26
2758 0 0

2.7k 0 0

1. over(partition by order by)语法partition by和order by后字段一致现象:mr任务运行缓慢原因：partition by order by 语法含义为分组后排序组内数据其中的排序算法使用的为快速排序，partition by和order by字段一致会导致分区内全为相同数据，排序性能恶化严重，且p 与o字段相同排序无意义解决方法：1.p...
Hive SQL
大数据Kudu（五）：Kudu基于Cloudera Manager安装及配置
Kudu基于Cloudera Manager安装及配置使用Kudu一般都会和impala进行整合，impala与Hive是强依赖关系，需要安装Hive，安装Hive需要安装HDFS等，以上各个技术组件的版本都需要对应匹配，由于Kudu没有直接的安装包，为了方便我们可以选择基于Cloudera Manager进行安装Kudu及相关大数据组件。这里CM集群节点及角色如下：节点名称节点ip节点角...

Lansonli
发表于2022-12-20 17:22:06
2294 0 0

2.2k 0 0

Kudu基于Cloudera Manager安装及配置使用Kudu一般都会和impala进行整合，impala与Hive是强依赖关系，需要安装Hive，安装Hive需要安装HDFS等，以上各个技术组件的版本都需要对应匹配，由于Kudu没有直接的安装包，为了方便我们可以选择基于Cloudera Manager进行安装Kudu及相关大数据组件。这里CM集群节点及角色如下：节点名称节点ip节点角...
Hive 大数据
我眼中的Hive-你眼中的了?
hive是基于Hadoop的一个数据仓库工具，常用来对数据仓库进行数据统计分析。其中包括我们大家都知道的通过类似SQL语句实现快速MapReduce统计，将数据进行提取、转化、加载。我眼中的Hive-你眼中的了?

风一样的美男子
发表于2022-12-18 12:17:31
6333 0 1

6.3k 0 1

hive是基于Hadoop的一个数据仓库工具，常用来对数据仓库进行数据统计分析。其中包括我们大家都知道的通过类似SQL语句实现快速MapReduce统计，将数据进行提取、转化、加载。我眼中的Hive-你眼中的了?
Hadoop Hive 数据挖掘
Flink on Yarn三部曲之一：准备工作
搭建Flink on Yarn环境并体验，本文是三部曲第一篇，将部署前的准备工作做好

程序员欣宸
发表于2022-12-02 08:48:22
2888 0 0

2.8k 0 0

搭建Flink on Yarn环境并体验，本文是三部曲第一篇，将部署前的准备工作做好
Flink Hive Yarn
安装和体验hive
Hive是种基于Hadoop的数据仓库工具，将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能，今天来一起部署和体验hive

程序员欣宸
发表于2022-11-01 08:26:59
2447 0 0

2.4k 0 0

Hive是种基于Hadoop的数据仓库工具，将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能，今天来一起部署和体验hive
Hive MySQL
湖仓一体电商项目（十八）：业务实现之编写写入DWD层业务代码
业务实现之编写写入DWD层业务代码一、代码编写Flink读取Kafka topic “KAFKA-ODS-TOPIC” 数据写入Iceberg-DWD层也是复用第一个业务代码，这里只需要在代码中加入写入Iceberg-DWD层代码即可，代码如下：//插入 iceberg - dwd 层会员浏览商品日志信息 :DWD_BROWSELOGtblEnv.executeSql( s""" ...

Lansonli
发表于2022-10-23 06:48:05
1315 0 0

1.3k 0 0

业务实现之编写写入DWD层业务代码一、代码编写Flink读取Kafka topic “KAFKA-ODS-TOPIC” 数据写入Iceberg-DWD层也是复用第一个业务代码，这里只需要在代码中加入写入Iceberg-DWD层代码即可，代码如下：//插入 iceberg - dwd 层会员浏览商品日志信息 :DWD_BROWSELOGtblEnv.executeSql( s""" ...
Hive 大数据数据库自建电商
大数据随笔——当我们在谈论HiveSql时我们在谈论什么
Apache Hive™ 数据仓库软件使用SQL帮助读取、写入和管理驻留在分布式存储中的大型数据集。结构可以投影到已存储的数据上。提供了一个命令行工具和JDBC驱动程序来将用户连接到配置单元。

顾槐九
发表于2022-06-12 22:37:32
1924 0 0

1.9k 0 0

Apache Hive™ 数据仓库软件使用SQL帮助读取、写入和管理驻留在分布式存储中的大型数据集。结构可以投影到已存储的数据上。提供了一个命令行工具和JDBC驱动程序来将用户连接到配置单元。
Hive 大数据
数据湖（五）：Hudi与Hive集成
Hudi与Hive集成一、配置HiveServer2Hudi与Hive集成原理是通过代码方式将数据写入到HDFS目录中，那么同时映射Hive表，让Hive表映射的数据对应到此路径上，这时Hudi需要通过JDBC方式连接Hive进行元数据操作，这时需要配置HiveServer2。1、在Hive服务端配置hive-site.xml#在Hive 服务端 $HIVE_HOME/con...

Lansonli
发表于2022-06-06 13:12:19
3584 0 0

3.5k 0 0

Hudi与Hive集成一、配置HiveServer2Hudi与Hive集成原理是通过代码方式将数据写入到HDFS目录中，那么同时映射Hive表，让Hive表映射的数据对应到此路径上，这时Hudi需要通过JDBC方式连接Hive进行元数据操作，这时需要配置HiveServer2。1、在Hive服务端配置hive-site.xml#在Hive 服务端 $HIVE_HOME/con...
Hadoop Hive
从零开发大数据SQL引擎
学习大数据技术的核心原理，掌握一些高效的思考和思维方式，构建自己的技术知识体系。明白了原理，有时甚至不需要学习，顺着原理就可以推导出各种实现细节。各种知识表象看杂乱无章，若只是学习繁杂知识点，固然自己的知识面是有限的，并且遇到问题的应变能力也很难提高。所以有些高手看起来似乎无所不知，不论谈论起什么技术，都能头头是道，其实并不是他们学习、掌握了所有技术，而是他们是在谈到这个问题时，才开始进行推...

JavaEdge
发表于2022-04-27 23:34:34
2928 0 0

2.9k 0 0

学习大数据技术的核心原理，掌握一些高效的思考和思维方式，构建自己的技术知识体系。明白了原理，有时甚至不需要学习，顺着原理就可以推导出各种实现细节。各种知识表象看杂乱无章，若只是学习繁杂知识点，固然自己的知识面是有限的，并且遇到问题的应变能力也很难提高。所以有些高手看起来似乎无所不知，不论谈论起什么技术，都能头头是道，其实并不是他们学习、掌握了所有技术，而是他们是在谈到这个问题时，才开始进行推...
Hive SQL
大数据组件-Hive部署基于derby作为元数据存储
👨🏻‍🎓博主介绍：大家好，我是芝士味的椒盐，一名在校大学生，热爱分享知识，很高兴在这里认识大家🌟🌈擅长领域：Java、大数据、运维、电子🙏🏻如果本文章各位小伙伴们有帮助的话，🍭关注+👍🏻点赞+🗣评论+📦收藏，相应的有空了我也会回访，互助！！！🤝另本人水平有限，旨在创作简单易懂的文章，在文章描述时如有错，恳请各位大佬指正，在此感谢！！！@[TOC]搭建hive的环境需...

芝士味的椒盐
发表于2022-04-19 13:15:29
2949 0 0

2.9k 0 0

👨🏻‍🎓博主介绍：大家好，我是芝士味的椒盐，一名在校大学生，热爱分享知识，很高兴在这里认识大家🌟🌈擅长领域：Java、大数据、运维、电子🙏🏻如果本文章各位小伙伴们有帮助的话，🍭关注+👍🏻点赞+🗣评论+📦收藏，相应的有空了我也会回访，互助！！！🤝另本人水平有限，旨在创作简单易懂的文章，在文章描述时如有错，恳请各位大佬指正，在此感谢！！！@[TOC]搭建hive的环境需...
Hive 大数据
大数据组件-Hive部署基于MySQL作为元数据存储
👨🏻‍🎓博主介绍：大家好，我是芝士味的椒盐，一名在校大学生，热爱分享知识，很高兴在这里认识大家🌟🌈擅长领域：Java、大数据、运维、电子🙏🏻如果本文章各位小伙伴们有帮助的话，🍭关注+👍🏻点赞+🗣评论+📦收藏，相应的有空了我也会回访，互助！！！🤝另本人水平有限，旨在创作简单易懂的文章，在文章描述时如有错，恳请各位大佬指正，在此感谢！！！@[TOC] MySQL安装准备...

芝士味的椒盐
发表于2022-04-19 13:12:57
3025 0 0

3.0k 0 0

👨🏻‍🎓博主介绍：大家好，我是芝士味的椒盐，一名在校大学生，热爱分享知识，很高兴在这里认识大家🌟🌈擅长领域：Java、大数据、运维、电子🙏🏻如果本文章各位小伙伴们有帮助的话，🍭关注+👍🏻点赞+🗣评论+📦收藏，相应的有空了我也会回访，互助！！！🤝另本人水平有限，旨在创作简单易懂的文章，在文章描述时如有错，恳请各位大佬指正，在此感谢！！！@[TOC] MySQL安装准备...
Hive MySQL 大数据
hive 表里面的 restore、parse 是什么？
有时候出现一种情况: 一个业务的表对应的时候会出现三个表结构restore、parse；出现这种情况主要是因为，在对数据抽取的时候，我们需要这种结构ods_xxx_work_restore – 整合总表的数据-json数据ods_xxx_work_parse – 新增的数据的暂时存放-json 数据ods_xxx_work – 整合好的数据所以整个流程就是先 parse → restore ...

孙中明
发表于2022-04-08 09:09:17
2720 0 0

2.7k 0 0

有时候出现一种情况: 一个业务的表对应的时候会出现三个表结构restore、parse；出现这种情况主要是因为，在对数据抽取的时候，我们需要这种结构ods_xxx_work_restore – 整合总表的数据-json数据ods_xxx_work_parse – 新增的数据的暂时存放-json 数据ods_xxx_work – 整合好的数据所以整个流程就是先 parse → restore ...
Hive JSON
hive语法创建分区表，方便CDM做增量导出
背景：数据湖里面建表，可以使用DataSource语法或Hive语法，两种建表语法创建的OBS表（即外表）在运行job时，在分区表下的文件夹路径会有所不同，DataSource语法创建的OBS分区表路径生成无规律，不利于CDM做数据的增量导出。

roger_0936
发表于2022-03-28 19:09:15
5977 0 0

5.9k 0 0

背景：数据湖里面建表，可以使用DataSource语法或Hive语法，两种建表语法创建的OBS表（即外表）在运行job时，在分区表下的文件夹路径会有所不同，DataSource语法创建的OBS分区表路径生成无规律，不利于CDM做数据的增量导出。
Hive spark 云数据迁移 CDM 数据湖探索 DLI

上滑加载中

推荐直播

华为云IoT开源专家实践分享：开源让物联网平台更开放、易用
2024/05/22 周三 16:30-18:00

张俭华为云IoT DTSE技术布道师

开源，意味着开放、共享、互助、共赢。作为万物上云及各行业数字化的物联网底座，华为云IoT积极拥抱开源，借助行业开源的最佳实践，构建可靠、易用的物联网平台，并通过开放南北向SDK，助力开发者快速构建物联网应用。本期直播，华为云IoT开源专家、物联网平台资深“程序猿”张俭，带你了解华为云IoT的开源生态，并手把手教你玩转开源社区！
去报名
数字技术创新与商业愿景--数字化转型战略解读
2024/05/22 周三 19:00-20:30

王纪奎老师华为科学家咨询委员会CTO

数字化转型浪潮下，你是否缺乏对前沿科技的战略洞察、难以将企业转型与国家战略相融合、缺少系统性规划的数字化思维…… 我们特别邀请了华为科学家咨询委员会CTO、战略研究院数字经济与数字化转型首席专家、《数字化转型战略》一书的作者——王纪奎老师。在5月22日（周三）19点，为我们带来一场主题为“数字技术创新与商业愿景--数字化转型战略解决”的精彩直播。
去报名
华为云开发者日·广州站
2024/05/23 周四 14:30-17:30

华为云专家团

华为云开发者日HDC.Cloud Day是面向全球开发者的旗舰活动，汇聚来自千行百业、高校及科研院所的开发人员。致力于打造开发者专属的技术盛宴，全方位服务与赋能开发者围绕华为云生态“知、学、用、创、商”的成长路径。通过前沿的技术分享、场景化的动手体验、优秀的应用创新推介，为开发者提供沉浸式学习与交流平台。开放创新，与开发者共创、共享、共赢未来。
去报名

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript