Hadoop_标签_开发者_华为云

博客(764)
视频(1)
论坛(0)
云声(0)
代码示例(0)

Hive快速入门系列(12) | Hive的数据压缩介绍及使用
此次博主为大家带来的是Hive的数据压缩介绍及使用。目录一. Hadoop源码编译支持Snappy压缩1.1 资源准备1.2 jar包安装1.3 编译源码二. Hadoop压缩配置2.1 MR支持的压缩编码2.2 压缩参数配置三. 开启Map输出阶段压缩四. 开启Reduce输出阶段压缩一. Hadoop源码编译支持Snappy...

不温卜火
发表于2020-12-02 23:47:41
4827 0 0

4.8k 0 0

此次博主为大家带来的是Hive的数据压缩介绍及使用。目录一. Hadoop源码编译支持Snappy压缩1.1 资源准备1.2 jar包安装1.3 编译源码二. Hadoop压缩配置2.1 MR支持的压缩编码2.2 压缩参数配置三. 开启Map输出阶段压缩四. 开启Reduce输出阶段压缩一. Hadoop源码编译支持Snappy...
Hadoop Hive
MapReduce快速入门系列(4) | Hadoop序列化
Hello，大家好，本次为大家带来的是Hadoop的序列化操作。目录一. 序列化的简单介绍1.1. 什么是序列化1.2. 为什么要序列化1.3. 为什么不用Java的序列化二. 自定义bean对象实现序列化接口三. 序列化的实际操作展示3.1. 需求3.2. 需求分析3.3. 编写MapReduce程序1. 编写流量统计的Bean对象2. ...

不温卜火
发表于2020-12-02 23:43:45
7246 0 0

7.2k 0 0

Hello，大家好，本次为大家带来的是Hadoop的序列化操作。目录一. 序列化的简单介绍1.1. 什么是序列化1.2. 为什么要序列化1.3. 为什么不用Java的序列化二. 自定义bean对象实现序列化接口三. 序列化的实际操作展示3.1. 需求3.2. 需求分析3.3. 编写MapReduce程序1. 编写流量统计的Bean对象2. ...
Hadoop MapReduce
Spark Core快速入门系列(11) | 文件中数据的读取和保存
大家好，我是不温卜火，是一名计算机学院大数据专业大二的学生，昵称来源于成语—不温不火，本意是希望自己性情温和。作为一名互联网行业的小白，博主写博客一方面是为了记录自己的学习过程，另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限，博客中难免会有一些错误出现，有纰漏之处恳请各位大佬不吝赐教！暂时只有csdn这一个平台，博客...

不温卜火
发表于2020-12-02 23:22:32
5793 0 0

5.7k 0 0

大家好，我是不温卜火，是一名计算机学院大数据专业大二的学生，昵称来源于成语—不温不火，本意是希望自己性情温和。作为一名互联网行业的小白，博主写博客一方面是为了记录自己的学习过程，另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限，博客中难免会有一些错误出现，有纰漏之处恳请各位大佬不吝赐教！暂时只有csdn这一个平台，博客...
Hadoop spark
HDFS系列(1) | HDFS文件系统的简单介绍
在Hadoop分布式环境搭建(简单高效~)这篇博客中,博主在最后为大家带来了HDFS的初体验。但是当时只是尝试测试一下集群是否有错误，因此，本篇博文为大家带来HDFS的文件系统介绍。在介绍文件系统之前我们首先需要了解HDFS的作用。我们都知道HDFS是Hadoop的一个核心组件，那在Hadoop中HDFS扮演着怎样的一个角色呢？我们可以通过下图直观的了解。...

不温卜火
发表于2020-12-02 23:10:51
6027 0 0

6.0k 0 0

在Hadoop分布式环境搭建(简单高效~)这篇博客中,博主在最后为大家带来了HDFS的初体验。但是当时只是尝试测试一下集群是否有错误，因此，本篇博文为大家带来HDFS的文件系统介绍。在介绍文件系统之前我们首先需要了解HDFS的作用。我们都知道HDFS是Hadoop的一个核心组件，那在Hadoop中HDFS扮演着怎样的一个角色呢？我们可以通过下图直观的了解。...
Hadoop 分布式
HDFS系列(3) | HDFS的Shell常用命令大全
此次更新的的博文是关于HDFS的shell的常用命令，希望大家能够喜欢目录一. 基本语法二. 命令大全三. 常用命令实操1. 常用命令及其作用对比表2. 常用命令的实际操作一. 基本语法 bin/hadoop fs 具体命令 or bin/hdfs dfs 具体命令都是可以的。二. 命令大全在虚拟机内输入：bin/hd...

不温卜火
发表于2020-12-02 23:03:27
11163 0 0

11.1k 0 0

此次更新的的博文是关于HDFS的shell的常用命令，希望大家能够喜欢目录一. 基本语法二. 命令大全三. 常用命令实操1. 常用命令及其作用对比表2. 常用命令的实际操作一. 基本语法 bin/hadoop fs 具体命令 or bin/hdfs dfs 具体命令都是可以的。二. 命令大全在虚拟机内输入：bin/hd...
Hadoop Shell
Spark SQL 快速入门系列(8) | | Hive与Spark SQL的读写操作
大家好，我是不温卜火，是一名计算机学院大数据专业大二的学生，昵称来源于成语—不温不火，本意是希望自己性情温和。作为一名互联网行业的小白，博主写博客一方面是为了记录自己的学习过程，另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限，博客中难免会有一些错误出现，有纰漏之处恳请各位大佬不吝赐教！暂时只有csdn这一个平台，博客...

不温卜火
发表于2020-12-02 23:02:08
5747 0 0

5.7k 0 0

大家好，我是不温卜火，是一名计算机学院大数据专业大二的学生，昵称来源于成语—不温不火，本意是希望自己性情温和。作为一名互联网行业的小白，博主写博客一方面是为了记录自己的学习过程，另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限，博客中难免会有一些错误出现，有纰漏之处恳请各位大佬不吝赐教！暂时只有csdn这一个平台，博客...
Hadoop Hive spark SQL
基于CentOS6.4环境编译Spark-2.1.0源码
基于CentOS6.4环境编译Spark-2.1.0源码 1 写在前面的话有些小伙伴可能会问：Spark官网不是已经提供了Spark针对不同版本的安装包了吗，我们为什么还需要对Spark源码进行编译呢？针对这个问题我们到Spark官网: spark.apache.org来看下，如下图所示: Spark官网的确是提供了一些Hadoop版本的Spark安装包，但...

小米粒-biubiubiu
发表于2020-12-02 22:59:35
7006 0 0

7.0k 0 0

基于CentOS6.4环境编译Spark-2.1.0源码 1 写在前面的话有些小伙伴可能会问：Spark官网不是已经提供了Spark针对不同版本的安装包了吗，我们为什么还需要对Spark源码进行编译呢？针对这个问题我们到Spark官网: spark.apache.org来看下，如下图所示: Spark官网的确是提供了一些Hadoop版本的Spark安装包，但...
CentOS Hadoop spark
HDFS系列(7) | HDFS的 I/O流 API操作
上一篇博文我们分享的API操作HDFS系统都是框架封装好的。那么如果我们想自己实现上述API的操作该怎么实现呢？此次物品们介绍的是采用I/O流的方式实现数据的上传和下载。目录一. HDFS文件上传二. HDFS文件下载三. 定位文件读取一. HDFS文件上传需求：把本地d盘上的lisen.txt文件上传到HDFS根目录 1....

不温卜火
发表于2020-12-02 22:57:07
7091 0 0

7.0k 0 0

上一篇博文我们分享的API操作HDFS系统都是框架封装好的。那么如果我们想自己实现上述API的操作该怎么实现呢？此次物品们介绍的是采用I/O流的方式实现数据的上传和下载。目录一. HDFS文件上传二. HDFS文件下载三. 定位文件读取一. HDFS文件上传需求：把本地d盘上的lisen.txt文件上传到HDFS根目录 1....
API Hadoop
Hive快速入门系列(7) | Hive常见的属性配置
本次博主为大家带来的事Hive常见的属性配置。希望能够帮助大家。目录一. Hive数据仓库位置配置二. 查询后信息显示配置三. Hive运行日志信息配置四. 参数配置方式4.1 查看当前所有的配置信息4.2 参数的配置三种方式一. Hive数据仓库位置配置 1. Default数据仓库的最原始位置是在hdfs上的：/user/hi...

不温卜火
发表于2020-12-02 22:55:05
7370 0 0

7.3k 0 0

本次博主为大家带来的事Hive常见的属性配置。希望能够帮助大家。目录一. Hive数据仓库位置配置二. 查询后信息显示配置三. Hive运行日志信息配置四. 参数配置方式4.1 查看当前所有的配置信息4.2 参数的配置三种方式一. Hive数据仓库位置配置 1. Default数据仓库的最原始位置是在hdfs上的：/user/hi...
Hadoop Hive
Flume快速入门系列(4) | 多路复用
此篇博文讲的是Flume的多路复用。目录 1. 案例需求2. 需求分析3. 实现步骤1. 准备工作2. 创建flume-file-flume.conf3. 创建flume-flume-hdfs.conf4. 创建flume-flume-dir.conf5. 执行配置文件6. 启动Hadoop和Hive7. 检查HDFS上数据8. 检查/opt/modul...

不温卜火
发表于2020-12-02 22:52:26
4234 0 0

4.2k 0 0

此篇博文讲的是Flume的多路复用。目录 1. 案例需求2. 需求分析3. 实现步骤1. 准备工作2. 创建flume-file-flume.conf3. 创建flume-flume-hdfs.conf4. 创建flume-flume-dir.conf5. 执行配置文件6. 启动Hadoop和Hive7. 检查HDFS上数据8. 检查/opt/modul...
Hadoop
Yarn快速系列入门(4) | Yarn调度器
本篇博文，博主为大家介绍Yarn调度器。目录一. Yarn调度器(Scheduler)介绍1.1 FIFO Scheduler （队列调度器）1.2 capacity scheduler（容量调度器，apache版本默认使用的调度器）1.3 Fair Scheduler（公平调度器，CDH版本的hadoop默认使用的调度器）1.4 小结二. yarn...

不温卜火
发表于2020-12-02 22:52:24
9618 0 0

9.6k 0 0

本篇博文，博主为大家介绍Yarn调度器。目录一. Yarn调度器(Scheduler)介绍1.1 FIFO Scheduler （队列调度器）1.2 capacity scheduler（容量调度器，apache版本默认使用的调度器）1.3 Fair Scheduler（公平调度器，CDH版本的hadoop默认使用的调度器）1.4 小结二. yarn...
Hadoop Yarn
在Linux中部署集群(零基础速学！)
博主上篇的文章讲的是伪分布式部署，那么接下来进行分布时的教学，先从搭建集群开始，为分布式开发环境做准备。目录 1. 克隆虚拟机2. 更改系统的mac地址3. 更改网卡信息4. 更改主机名5. 添加别名6. 关闭防火墙7. 关闭selinux8. SCP远程文件拷贝9. SSH 远程登录1. 基于密码的登录2. 无密钥配置(免密登录) 10. 总...

不温卜火
发表于2020-12-02 22:44:32
4479 0 0

4.4k 0 0

博主上篇的文章讲的是伪分布式部署，那么接下来进行分布时的教学，先从搭建集群开始，为分布式开发环境做准备。目录 1. 克隆虚拟机2. 更改系统的mac地址3. 更改网卡信息4. 更改主机名5. 添加别名6. 关闭防火墙7. 关闭selinux8. SCP远程文件拷贝9. SSH 远程登录1. 基于密码的登录2. 无密钥配置(免密登录) 10. 总...
Hadoop Linux
HDFS系列(2) | HDFS优缺点分析
因为在上期的分享中,大家看到的更多是HDFS的底层原理,内部结构,并没有谈到其自身优势和劣势的一个比较！因此,本次博主为大家带来的就是对HDFS的优缺点进行分析。目录一. HDFS的优点1. 高容错性2. 适合处理大数据3. 实用性强二. HDFS的缺点1. 不适合低延时数据访问2. 无法高效的对大量小文件进行存储3. 不支持并发写入、文件...

不温卜火
发表于2020-12-02 22:36:19
6252 0 0

6.2k 0 0

因为在上期的分享中,大家看到的更多是HDFS的底层原理,内部结构,并没有谈到其自身优势和劣势的一个比较！因此,本次博主为大家带来的就是对HDFS的优缺点进行分析。目录一. HDFS的优点1. 高容错性2. 适合处理大数据3. 实用性强二. HDFS的缺点1. 不适合低延时数据访问2. 无法高效的对大量小文件进行存储3. 不支持并发写入、文件...
Hadoop
Flume快速入门系列(1) | Flume的简单介绍
在一个完整的离线大数据处理系统中，除了HDFS+MapReduce+Hive组成分析系统的核心之外，还需要数据采集、结果数据导出、任务调度等不可或缺的辅助系统，而这些辅助工具在hadoop生态体系中都有便捷的开源框架，在此，我们首先来介绍下数据采集部分所用的的开源框架——Flume。目录 1. Flume定义2. Flume的优点3. Flume采集系...

不温卜火
发表于2020-12-02 22:35:04
4690 0 0

4.6k 0 0

在一个完整的离线大数据处理系统中，除了HDFS+MapReduce+Hive组成分析系统的核心之外，还需要数据采集、结果数据导出、任务调度等不可或缺的辅助系统，而这些辅助工具在hadoop生态体系中都有便捷的开源框架，在此，我们首先来介绍下数据采集部分所用的的开源框架——Flume。目录 1. Flume定义2. Flume的优点3. Flume采集系...
Hadoop
Flume快速入门系列(6) | 聚合
此篇博文讲的是Flume的聚合。目录 1. 需求2. 需求分析3. 实现步骤1. 准备工作2. 创建flume1-logger-flume.conf3. 创建flume2-netcat-flume.conf4. 创建flume3-flume-logger.conf5. 执行配置文件6. 在hadoop003上向/opt/module目录下的group.l...

不温卜火
发表于2020-12-02 00:58:30
3845 0 0

3.8k 0 0

此篇博文讲的是Flume的聚合。目录 1. 需求2. 需求分析3. 实现步骤1. 准备工作2. 创建flume1-logger-flume.conf3. 创建flume2-netcat-flume.conf4. 创建flume3-flume-logger.conf5. 执行配置文件6. 在hadoop003上向/opt/module目录下的group.l...
Hadoop

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript