_标签_开发者_华为云

博客(52)
视频(0)
论坛(0)
云声(0)
代码示例(0)

Hadoop CDH部署指南
一、集群环境信息本次安装集群共5台主机，其中一台CM管理节点，2台namonode节点，2台datanode节点。具体信息如下：主机名IP地址集群角色主机配置操作系统版本cm192.168.0.128CM manager4C/16GCentos 6.8namenode1192.168.0.121namonode4C/16GCentos 6.8namenode2192.168.0...

Ben_5003
发表于2019-05-17 13:56:59
13264 1 0

13.2k 1 0

一、集群环境信息本次安装集群共5台主机，其中一台CM管理节点，2台namonode节点，2台datanode节点。具体信息如下：主机名IP地址集群角色主机配置操作系统版本cm192.168.0.128CM manager4C/16GCentos 6.8namenode1192.168.0.121namonode4C/16GCentos 6.8namenode2192.168.0...
大数据 Hadoop
在Hadoop Hive环境下生成数值型唯一ID
基于Hadoop构建的大数据环境，如何生成唯一ID。

JackieAtHome
发表于2020-06-05 23:30:58
13946 0 0

13.9k 0 0

基于Hadoop构建的大数据环境，如何生成唯一ID。
Hadoop 大数据
Hadoop 文件系统操作
本文介绍Hadoop 文件系统的基本操作，主要涉及往Hadoop大数据集群拷文件，下载文件到本地，文件查看，创建等。

老板上茶
发表于2020-05-28 10:42:02
12919 0 0

12.9k 0 0

本文介绍Hadoop 文件系统的基本操作，主要涉及往Hadoop大数据集群拷文件，下载文件到本地，文件查看，创建等。
EI企业智能 Hadoop mrs
MRS HADOOP/SPARK 代码访问OBS方式介绍
MRS HADOOP/SPARK 代码访问OBS方式介绍1 背景描述：MRS样例代码没有介绍如何访问OBS，在默认情况下使用的文件系统都是HDFS；如果访问OBS需要添加一些配置，代码使用过程中也有一些需要注意的地方2 配置OBS相关参数：需要在客户端配置文件core-site.xml里面添加以下参数：<property> <name>fs.obs.access.k...

泽及天下不为仁
发表于2020-05-24 21:19:24
14917 1 0

14.9k 1 0

MRS HADOOP/SPARK 代码访问OBS方式介绍1 背景描述：MRS样例代码没有介绍如何访问OBS，在默认情况下使用的文件系统都是HDFS；如果访问OBS需要添加一些配置，代码使用过程中也有一些需要注意的地方2 配置OBS相关参数：需要在客户端配置文件core-site.xml里面添加以下参数：<property> <name>fs.obs.access.k...
EI企业智能 Hadoop mrs
Maven构建java工程操作hdfs实例
腾科教育以为理论+实操为主的教学，带你进入大数据开发基础。每一步都带着你，让你一步一步实现自已的大数据开发梦想。构建maven工程导入maven类包 <dependencies> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>4.11</vers...

wuweibang
发表于2019-07-27 18:33:35
10460 0 0

10.4k 0 0

腾科教育以为理论+实操为主的教学，带你进入大数据开发基础。每一步都带着你，让你一步一步实现自已的大数据开发梦想。构建maven工程导入maven类包 <dependencies> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>4.11</vers...
Maven Hadoop
大数据相关知识科普
大数据存储系统的特点： ① 在大数据中，通常企业不会买昂贵的高端服务器，而是低端的廉价服务器，组成大规模集群来存储PB级的大量文件，导致硬件失效为常态，所以大数据系统的各模块都具备冗余和容灾机制。 ② 大数据的读写量和计算量都很大，采用的是数据流式访问的方式 ③ 存储数据较大 ④ 大数据系统的底层服务器可能来自于不同的厂商，对于文件系统，则需...

华为云社区精选
发表于2018-04-25 16:50:35
14829 4 1

14.8k 4 1

大数据存储系统的特点： ① 在大数据中，通常企业不会买昂贵的高端服务器，而是低端的廉价服务器，组成大规模集群来存储PB级的大量文件，导致硬件失效为常态，所以大数据系统的各模块都具备冗余和容灾机制。 ② 大数据的读写量和计算量都很大，采用的是数据流式访问的方式 ③ 存储数据较大 ④ 大数据系统的底层服务器可能来自于不同的厂商，对于文件系统，则需...
Hadoop 大数据
Hadoop - 入门
hadoop入门

正本清源
发表于2019-03-21 21:41:04
8250 1 2

8.2k 1 2

hadoop入门
Hadoop
通过Java8的Lambda表达式提升大数据编码速度
拿到大量数据以后，通常需要使用Hadoop/Spark对数据集进行清洗。在这里我整理了Java中Lambda表达式的一些用法，希望能够提高大家的编码速度Lambda在Java 8中添加了Lambda新特性。如果接口中只有一个方法，则可以使用Lambda来完成。例如Runnable接口，只有一个run方法。在Java 8以下中我们需要这么写：new Thread(new Runnable(){...

Tsln
发表于2019-01-18 13:07:07
10459 0 0

10.4k 0 0

拿到大量数据以后，通常需要使用Hadoop/Spark对数据集进行清洗。在这里我整理了Java中Lambda表达式的一些用法，希望能够提高大家的编码速度Lambda在Java 8中添加了Lambda新特性。如果接口中只有一个方法，则可以使用Lambda来完成。例如Runnable接口，只有一个run方法。在Java 8以下中我们需要这么写：new Thread(new Runnable(){...
大数据开发 Hadoop
分布式文件系统HDFS概览
一、HDFS概述及特点Hadoop是基于2003年Google的发表于的GFS论文，而开发形成的一个分布式文件系统（Hadoop Distributed File System），简称HDFS。该分布式文件系统是一款可以部署在廉价硬件上的易拓展、高容错。高吞吐量的大文件存储系统。HDFS在使用中，适用于大文件存储和流式数据访问。而不适用于大量小文件存储、随机写入和低延迟读取。二、HDFS系统...

敲代码的王小明
发表于2018-12-20 16:14:13
10914 0 0

10.9k 0 0

一、HDFS概述及特点Hadoop是基于2003年Google的发表于的GFS论文，而开发形成的一个分布式文件系统（Hadoop Distributed File System），简称HDFS。该分布式文件系统是一款可以部署在廉价硬件上的易拓展、高容错。高吞吐量的大文件存储系统。HDFS在使用中，适用于大文件存储和流式数据访问。而不适用于大量小文件存储、随机写入和低延迟读取。二、HDFS系统...
Hadoop
YARN的基本介绍
YARN调度资源的介绍

清风笑丶
发表于2018-12-20 10:14:33
9449 0 0

9.4k 0 0

YARN调度资源的介绍
分布式 Yarn Hadoop 大数据
HDFS的高级特性
安全模式安全模式是HDFS所处的一种特殊状态，在这种状态下，文件系统只接受读数据请求，而不接受删除、修改等变更请求。在NameNode主节点启动时，HDFS首先进入安全模式，DataNode在启动的时候会向namenode汇报可用的block等状态，让NameNode得到块的位置信息,并对每一个文件对应的数据块副本进行统计,当最小副本条件满足时HDFS自动离开安全模式。如果HDFS出于安全模...

清风笑丶
发表于2018-12-20 10:12:13
11548 0 0

11.5k 0 0

安全模式安全模式是HDFS所处的一种特殊状态，在这种状态下，文件系统只接受读数据请求，而不接受删除、修改等变更请求。在NameNode主节点启动时，HDFS首先进入安全模式，DataNode在启动的时候会向namenode汇报可用的block等状态，让NameNode得到块的位置信息,并对每一个文件对应的数据块副本进行统计,当最小副本条件满足时HDFS自动离开安全模式。如果HDFS出于安全模...
Hadoop 大数据
【Free Style】Hadoop-Yarn之Resource Manager源码分析(三)
接上篇：【Free Style】Hadoop-Yarn之Resource Manager源码分析(二)https://portal.huaweicloud.com/blogs/4abcd5ebc04811e7b8317ca23e93a891 addTransition的四个参数分别表示：当前状态preState，后续状态postStates，触发事件eventType，状态迁移操作接口hook。其

pappy
发表于2017-11-03 16:44:57
8592 0 0

8.5k 0 0

接上篇：【Free Style】Hadoop-Yarn之Resource Manager源码分析(二)https://portal.huaweicloud.com/blogs/4abcd5ebc04811e7b8317ca23e93a891 addTransition的四个参数分别表示：当前状态preState，后续状态postStates，触发事件eventType，状态迁移操作接口hook。其
Hadoop
【Free Style】Hadoop-Yarn之Resource Manager源码分析(二)
接上文：Hadoop-Yarn之Resource Manager源码分析(一)https://portal.huaweicloud.com/blogs/bc5a914ebfb111e7b8317ca23e93a891 3 YARN RM模块分析3.1 事件及服务YARN采用了服务模型，它将各种对象服务化，以便于统一管理（统一启动、关闭等）。YARN中将服务分为两种：单一服务和组

pappy
发表于2017-11-03 11:37:17
9019 0 0

9.0k 0 0

接上文：Hadoop-Yarn之Resource Manager源码分析(一)https://portal.huaweicloud.com/blogs/bc5a914ebfb111e7b8317ca23e93a891 3 YARN RM模块分析3.1 事件及服务YARN采用了服务模型，它将各种对象服务化，以便于统一管理（统一启动、关闭等）。YARN中将服务分为两种：单一服务和组
Hadoop
【Free Style】Hadoop-Yarn之Resource Manager源码分析(一)
1 简介1.1 背景介绍带有MapReduce的Apache Hadoop是分布式数据处理的骨干力量，借助其独特的横向扩展物理集群架构和由 Google 最初开发的精细处理框架，Hadoop 在大数据处理的全新领域迎来了爆炸式增长。此外，Hadoop 还开发了一个丰富多样的应用程序生态系统，包括 Apache Pig（一种强大的脚本语言）和 Apache Hive（一个具有类似

pappy
发表于2017-11-02 17:39:33
9711 0 0

9.7k 0 0

1 简介1.1 背景介绍带有MapReduce的Apache Hadoop是分布式数据处理的骨干力量，借助其独特的横向扩展物理集群架构和由 Google 最初开发的精细处理框架，Hadoop 在大数据处理的全新领域迎来了爆炸式增长。此外，Hadoop 还开发了一个丰富多样的应用程序生态系统，包括 Apache Pig（一种强大的脚本语言）和 Apache Hive（一个具有类似
Hadoop
《从零开始学Hadoop大数据分析（视频教学版）》 —3.5 小结
本节书摘来自华章计算机《从零开始学Hadoop大数据分析（视频教学版）》一书中第3章，第3.5节，作者是温春水毕洁馨。

华章计算机
发表于2019-12-14 23:15:07
8091 1 1

8.0k 1 1

本节书摘来自华章计算机《从零开始学Hadoop大数据分析（视频教学版）》一书中第3章，第3.5节，作者是温春水毕洁馨。
大数据大数据分析 Hadoop 大数据

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript