大数据_标签_开发者_华为云

博客(3.2k)
视频(24)
论坛(0)
云声(0)
代码示例(0)

客快物流大数据项目(四十六)：Spark操作Kudu dataFrame操作kudu
Spark操作Kudu dataFrame操作kudu 一、DataFrameApi读取kudu表中的数据虽然我们可以通过上面显示的KuduContext执行大量操作，但我们还可以直接从默认数据源本身调用读/写API。要设置读取，我们需要为Kudu表指定选项，命名我们要读取的表以及为表提供服务的Kudu集群的Kudu主服务器列...

Lansonli
发表于2022-02-24 00:38:01
5463 0 0

5.4k 0 0

Spark操作Kudu dataFrame操作kudu 一、DataFrameApi读取kudu表中的数据虽然我们可以通过上面显示的KuduContext执行大量操作，但我们还可以直接从默认数据源本身调用读/写API。要设置读取，我们需要为Kudu表指定选项，命名我们要读取的表以及为表提供服务的Kudu集群的Kudu主服务器列...
spark 大数据智慧物流
Big Data
笔记《豌豆公主》的启示：敏感度区分高低贵贱。做事的分寸，说话的轻重，知行合一。敏感度区分平庸和伟大，响鼓不用重锤。付费就是捡便宜，凡是能用钱买来的时间就是便宜的。凡是能用时间换来的注意力...

ReCclay
发表于2022-02-22 01:51:41
2223 0 0

2.2k 0 0

笔记《豌豆公主》的启示：敏感度区分高低贵贱。做事的分寸，说话的轻重，知行合一。敏感度区分平庸和伟大，响鼓不用重锤。付费就是捡便宜，凡是能用钱买来的时间就是便宜的。凡是能用时间换来的注意力...
大数据
客快物流大数据项目(四十四)：Spark操作Kudu创建表
Spark操作Kudu创建表 Spark与KUDU集成支持： DDL操作（创建/删除）本地Kudu RDDNative Kudu数据源，用于DataFrame集成从kudu读取数据从Kudu执行插入/更新/ upsert /删除谓词下推Kudu和Spark SQL之间的模式映射到目前为止，我们已经听说过几个上下文，例如Spark...

Lansonli
发表于2022-02-22 00:02:58
5446 0 0

5.4k 0 0

Spark操作Kudu创建表 Spark与KUDU集成支持： DDL操作（创建/删除）本地Kudu RDDNative Kudu数据源，用于DataFrame集成从kudu读取数据从Kudu执行插入/更新/ upsert /删除谓词下推Kudu和Spark SQL之间的模式映射到目前为止，我们已经听说过几个上下文，例如Spark...
spark 大数据智慧物流
为什么需要推荐系统
文章目录一、提高流量利用率二、挖掘和匹配长尾需求三、提升用户体验四、技术积累推荐系统的作用可以从以下4个方面分析：一、提高流量利用率流量特点：稀缺性：获取流量是有成本的，...

野猪佩奇996
发表于2022-02-20 23:17:26
5461 0 0

5.4k 0 0

文章目录一、提高流量利用率二、挖掘和匹配长尾需求三、提升用户体验四、技术积累推荐系统的作用可以从以下4个方面分析：一、提高流量利用率流量特点：稀缺性：获取流量是有成本的，...
大数据推荐系统
客快物流大数据项目(四十二)：Java代码操作Kudu
目录 Java代码操作Kudu 一、构建maven工程二、导入依赖三、创建包结构四、初始化方法五、创建表六、插入数据七、查询数据八、修改数据九、删除数据十、修改表十一、删除表 ...

Lansonli
发表于2022-02-20 00:40:21
6136 0 0

6.1k 0 0

目录 Java代码操作Kudu 一、构建maven工程二、导入依赖三、创建包结构四、初始化方法五、创建表六、插入数据七、查询数据八、修改数据九、删除数据十、修改表十一、删除表 ...
Java 大数据智慧物流
2022年最新大数据学习路线图
目录 1.JavaSE基础核心 2.Hadoop生态体系阶段 3.Spark生态体系阶段 4.Flink生态体系阶段 5.前沿技术

孙叫兽
发表于2022-02-19 23:47:06
2671 0 0

2.6k 0 0

目录 1.JavaSE基础核心 2.Hadoop生态体系阶段 3.Spark生态体系阶段 4.Flink生态体系阶段 5.前沿技术
大数据
客快物流大数据项目(四十一)：Kudu入门介绍
目录 Kudu入门介绍一、背景介绍二、新的硬件设备三、Kudu是什么四、Kudu的应用场景五、Kudu架构 Kudu入门介绍一、背景介绍在Kudu之前，大数据主要以两种方式存储；静态数据：以 HDFS 引擎作为存储引擎，适用于高吞吐量的离线大数据分析...

Lansonli
发表于2022-02-19 00:24:08
3889 0 0

3.8k 0 0

目录 Kudu入门介绍一、背景介绍二、新的硬件设备三、Kudu是什么四、Kudu的应用场景五、Kudu架构 Kudu入门介绍一、背景介绍在Kudu之前，大数据主要以两种方式存储；静态数据：以 HDFS 引擎作为存储引擎，适用于高吞吐量的离线大数据分析...
Hadoop 大数据智慧物流
redis五大数据结构和使用场景
老规矩，先抛结论后验证 string：有点像java的hashMap，存的时候什么key，取的时候也什么key，常用于做缓存，保存用户信息、查询列表等； hash：这个有点像hashMap的va...

负债程序猿
发表于2022-02-18 22:21:59
2468 0 0

2.4k 0 0

老规矩，先抛结论后验证 string：有点像java的hashMap，存的时候什么key，取的时候也什么key，常用于做缓存，保存用户信息、查询列表等； hash：这个有点像hashMap的va...
Redis 大数据数据结构
客快物流大数据项目(四十)：ETL实现方案
目录 ETL实现方案一、ETL处理流程图二、为什么使用Kudu作为存储介质 ETL实现方案一、ETL处理流程图数据来源：来自于ogg同步到kafka的物流运输数据来自于canal同步到kafka的客户关系数据二、为什么使用Kudu作为存储介质数据库数据上的快速分析目前很多业务使用事...

Lansonli
发表于2022-02-17 22:28:48
6165 0 0

6.1k 0 0

目录 ETL实现方案一、ETL处理流程图二、为什么使用Kudu作为存储介质 ETL实现方案一、ETL处理流程图数据来源：来自于ogg同步到kafka的物流运输数据来自于canal同步到kafka的客户关系数据二、为什么使用Kudu作为存储介质数据库数据上的快速分析目前很多业务使用事...
大数据智慧物流
客快物流大数据项目(三十九)：Hue安装
目录 Hue安装一、Hue概述二、HUE安装步骤 Hue安装一、Hue概述 Hue来源 HUE=Hadoop User Experience（Hadoop用户体验），直白来说就一个开源的Apache Hadoop UI系统，由Cloudera Desktop演化而来，最后Cloudera公...

Lansonli
发表于2022-02-16 23:28:17
5578 0 0

5.5k 0 0

目录 Hue安装一、Hue概述二、HUE安装步骤 Hue安装一、Hue概述 Hue来源 HUE=Hadoop User Experience（Hadoop用户体验），直白来说就一个开源的Apache Hadoop UI系统，由Cloudera Desktop演化而来，最后Cloudera公...
大数据智慧物流
客快物流大数据项目(三十八)：安装Azkaban-3.71.0
目录安装Azkaban-3.71.0 一、下载Azkaban源码并编译二、安装Azkaban 三、测试Azkaban的job 安装Azkaban-3.71.0 一、下载Azkaban源码并编译操作步骤说明 1 下载Azkaban-3.71.0 cd /export/so...

Lansonli
发表于2022-02-15 22:06:57
4702 0 0

4.7k 0 0

目录安装Azkaban-3.71.0 一、下载Azkaban源码并编译二、安装Azkaban 三、测试Azkaban的job 安装Azkaban-3.71.0 一、下载Azkaban源码并编译操作步骤说明 1 下载Azkaban-3.71.0 cd /export/so...
大数据智慧物流
客快物流大数据项目(三十六)：安装ElasticSearch-7.6.1
目录安装ElasticSearch-7.6.1 一、配置ES 二、操作系统配置三、运行ES 安装ElasticSearch-7.6.1 一、配置ES 操作步骤说明 1 进入软件包所在目录 cd /export/softwares 2 下载ES-7.6.1 curl -L -O http...

Lansonli
发表于2022-02-13 23:46:19
5599 0 0

5.5k 0 0

目录安装ElasticSearch-7.6.1 一、配置ES 二、操作系统配置三、运行ES 安装ElasticSearch-7.6.1 一、配置ES 操作步骤说明 1 进入软件包所在目录 cd /export/softwares 2 下载ES-7.6.1 curl -L -O http...
Elasticsearch 大数据智慧物流
客快物流大数据项目(三十五)：CDH使用注意
目录 CDH使用注意一、HDFS使用前配置二、Kafka使用前配置 CDH使用注意一、HDFS使用前配置默认情况下，CDH的HDFS服务是开启权限检查的，为方便使用HDFS，需先将HDFS的dfs.permissions选项取消选中，保存后重启HDFS服务。最终的配置如下：二...

Lansonli
发表于2022-02-12 23:36:24
5399 0 0

5.3k 0 0

目录 CDH使用注意一、HDFS使用前配置二、Kafka使用前配置 CDH使用注意一、HDFS使用前配置默认情况下，CDH的HDFS服务是开启权限检查的，为方便使用HDFS，需先将HDFS的dfs.permissions选项取消选中，保存后重启HDFS服务。最终的配置如下：二...
大数据智慧物流
客快物流大数据项目(二十八)：大数据服务器环境准备
目录大数据服务器环境准备一、服务器规划二、Linux虚拟机环境搭建 1、虚拟机准备 2、SSH免密登录 3、关闭SELINUX 大数据服务器环境准备一、服务器规划服务器主机名操作系统/版本 IP 内存硬盘大数据服务器 node2 Cento...

Lansonli
发表于2022-02-07 00:42:25
5732 0 0

5.7k 0 0

目录大数据服务器环境准备一、服务器规划二、Linux虚拟机环境搭建 1、虚拟机准备 2、SSH免密登录 3、关闭SELINUX 大数据服务器环境准备一、服务器规划服务器主机名操作系统/版本 IP 内存硬盘大数据服务器 node2 Cento...
大数据智慧物流
客快物流大数据项目(二十七)：Cloudera Manager简单介绍
目录 Cloudera Manager简单介绍一、cloudera manager的概念二、cloudera manager的功能三、cloudera manager的架构 Cloudera Manager简单介绍一、cloudera manager的概念 Cloudera Manager是一个拥有...

Lansonli
发表于2022-02-06 23:58:41
5705 0 0

5.7k 0 0

目录 Cloudera Manager简单介绍一、cloudera manager的概念二、cloudera manager的功能三、cloudera manager的架构 Cloudera Manager简单介绍一、cloudera manager的概念 Cloudera Manager是一个拥有...
大数据智慧物流

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript