大数据_标签_开发者_华为云

博客(3.2k)
视频(24)
论坛(0)
云声(0)
代码示例(0)

深度学习核心技术精讲100篇（十八）-巨量数据下美团是如何实现数据治理的？
背景   大数据时代的到来，让越来越多的企业看到了数据资产的价值。将数据视为企业的重要资产，已经成为业界的一种共识，企业也在快速探索应用场景和商业模式，并开始建设技术平台。但这里要特别强调一下，如果在大数据“拼图”中遗忘了数据治理，可能再多的技术投入也是一种徒劳。因为没有数据治理这一环节，其带来后果往往是：随处可见的数...

格图洛书
发表于2021-11-19 00:22:56
2911 0 0

2.9k 0 0

背景   大数据时代的到来，让越来越多的企业看到了数据资产的价值。将数据视为企业的重要资产，已经成为业界的一种共识，企业也在快速探索应用场景和商业模式，并开始建设技术平台。但这里要特别强调一下，如果在大数据“拼图”中遗忘了数据治理，可能再多的技术投入也是一种徒劳。因为没有数据治理这一环节，其带来后果往往是：随处可见的数...
大数据深度学习
JNI调用java接口函数
vim frameworks/base/core/jni/android_hardware_Camera.cpp fields.post_event = GetStaticMethodIDOrDie(env, clazz, "postEventFromNative", //java层函数名    &nbsp...

产品人卫朋
发表于2021-10-29 23:10:49
3202 0 0

3.2k 0 0

vim frameworks/base/core/jni/android_hardware_Camera.cpp fields.post_event = GetStaticMethodIDOrDie(env, clazz, "postEventFromNative", //java层函数名    &nbsp...
Java 大数据
计算机思维:大数据思维、计算机从专用到通用背后的逻辑、为什么算盘是计算机、什么是计算机的数据结构
文章目录引言 I 、计算机从专用到通用背后的逻辑 II、为什么算盘是计算机？ III、计算机从简单到复杂 IV、五级工程师和职业发展- 依据郎道的方法进行分级 ...

iOS逆向
发表于2021-10-16 00:24:07
2868 0 0

2.8k 0 0

文章目录引言 I 、计算机从专用到通用背后的逻辑 II、为什么算盘是计算机？ III、计算机从简单到复杂 IV、五级工程师和职业发展- 依据郎道的方法进行分级 ...
大数据数据结构
2021年大数据Spark（二十九）：SparkSQL案例四开窗函数
目录   案例四：开窗函数概述介绍聚合函数和开窗函数开窗函数分类聚合开窗函数排序开窗函数  ROW_NUMBER顺序排序 RANK跳跃排序  DENSE_RANK连续排序 NTILE分组排名[了解] ...

Lansonli
发表于2021-09-29 01:55:59
4087 0 0

4.0k 0 0

目录   案例四：开窗函数概述介绍聚合函数和开窗函数开窗函数分类聚合开窗函数排序开窗函数  ROW_NUMBER顺序排序 RANK跳跃排序  DENSE_RANK连续排序 NTILE分组排名[了解] ...
spark SQL 大数据
2021年大数据Spark（七）：应用架构基本了解
Spark 应用架构-了解 Driver 和Executors  从图中可以看到Spark Application运行到集群上时，由两部分组成：Driver Program和Executors。第一、Driver Program 相当于AppMaster，整个应用管理者，负责应用中所有Job的调度执行;运行JVM P...

Lansonli
发表于2021-09-29 01:40:31
3301 0 0

3.3k 0 0

Spark 应用架构-了解 Driver 和Executors  从图中可以看到Spark Application运行到集群上时，由两部分组成：Driver Program和Executors。第一、Driver Program 相当于AppMaster，整个应用管理者，负责应用中所有Job的调度执行;运行JVM P...
spark 大数据
2021年大数据Spark（二）：四大特点
目录   Spark 四大特点速度快易于使用通用性强运行方式 Spark 四大特点 Spark 使用Scala语言进行实现，它是一种面向对、函数式编程语言，能够像操作本地集合一样轻松的操作分布式数据集。Spark具有运行速度快、易用性好、通用性强和随处运行等特点。  ...

Lansonli
发表于2021-09-29 01:38:16
4151 0 0

4.1k 0 0

目录   Spark 四大特点速度快易于使用通用性强运行方式 Spark 四大特点 Spark 使用Scala语言进行实现，它是一种面向对、函数式编程语言，能够像操作本地集合一样轻松的操作分布式数据集。Spark具有运行速度快、易用性好、通用性强和随处运行等特点。  ...
spark 大数据
大数据技术为什么快?
        在之前的博客《什么是大数据?看这一篇就足够了!》中,小菌为大家较为详细的介绍了一些关于大数据的知识。其中提到...

大数据梦想家
发表于2021-09-29 01:33:52
3398 0 0

3.3k 0 0

        在之前的博客《什么是大数据?看这一篇就足够了!》中,小菌为大家较为详细的介绍了一些关于大数据的知识。其中提到...
分布式大数据
MapReduce之自定义outputFormat
        现在有一些订单的评论数据，需求:       &...

大数据梦想家
发表于2021-09-29 01:31:12
3623 0 0

3.6k 0 0

        现在有一些订单的评论数据，需求:       &...
MapReduce 大数据
2021年大数据Spark（二十五）：SparkSQL的RDD、DF、DS相关操作
  目录  RDD、DF、DS相关操作 SparkSQL初体验 SparkSession 应用入口获取DataFrame/DataSet 使用样例类指定类型+列名自定义Schema RDD、DF、DS相互转换 RDD、DF、DS相关操作 SparkSQL初体验 Spark...

Lansonli
发表于2021-09-29 01:30:48
4086 0 0

4.0k 0 0

  目录  RDD、DF、DS相关操作 SparkSQL初体验 SparkSession 应用入口获取DataFrame/DataSet 使用样例类指定类型+列名自定义Schema RDD、DF、DS相互转换 RDD、DF、DS相关操作 SparkSQL初体验 Spark...
spark 大数据
大数据技术原理与应用之【Spark】习题
1.Spark是基于内存计算的大数据计算平台，试述Spark的主要特点。答：Spark具有如下4个主要特点： ①运行速度快；②容易使用；③通用性；④运行模式多样。   &nbsp...

大数据梦想家
发表于2021-09-29 01:27:34
3720 0 0

3.7k 0 0

1.Spark是基于内存计算的大数据计算平台，试述Spark的主要特点。答：Spark具有如下4个主要特点： ①运行速度快；②容易使用；③通用性；④运行模式多样。   &nbsp...
spark 大数据
2021年大数据Spark（二十二）：内核原理
目录 Spark内核原理 RDD 依赖窄依赖（Narrow Dependency） Shuffle 依赖（宽依赖 Wide Dependency）如何区分宽窄依赖 DAG和Stage 词汇表 Spark内存迭代所以，我们说Spark比MR效率高主要就是2个原...

Lansonli
发表于2021-09-29 01:25:48
3390 0 0

3.3k 0 0

目录 Spark内核原理 RDD 依赖窄依赖（Narrow Dependency） Shuffle 依赖（宽依赖 Wide Dependency）如何区分宽窄依赖 DAG和Stage 词汇表 Spark内存迭代所以，我们说Spark比MR效率高主要就是2个原...
spark 大数据
2021年大数据Spark（三十七）：SparkStreaming实战案例二 UpdateStateByKey
目录 SparkStreaming实战案例二 UpdateStateByKey 需求 1.updateStateByKey 2.mapWithState 代码实现 SparkStreaming实战案例二 UpdateStateByKey 需求对从Socket接收的数据做WordCount并要求能够和历史数据进行累加!...

Lansonli
发表于2021-09-29 01:23:09
3280 0 0

3.2k 0 0

目录 SparkStreaming实战案例二 UpdateStateByKey 需求 1.updateStateByKey 2.mapWithState 代码实现 SparkStreaming实战案例二 UpdateStateByKey 需求对从Socket接收的数据做WordCount并要求能够和历史数据进行累加!...
spark 大数据
Spark之【RDD编程】详细讲解(No5)——《RDD依赖关系》
        本篇博客是Spark之【RDD编程】系列第五篇，为大家介绍的是RDD依赖关系。   &...

大数据梦想家
发表于2021-09-29 01:21:38
3200 0 0

3.2k 0 0

        本篇博客是Spark之【RDD编程】系列第五篇，为大家介绍的是RDD依赖关系。   &...
spark 大数据
2021年大数据Flink（三）：Flink安装部署 Local本地模式
目录 Flink安装部署 Local本地模式原理操作测试 Flink安装部署 Flink支持多种安装模式 - Local—本地单机模式，学习测试时使用- Standalone—独立集群模式，Flink自带集群，开发测试环境使用- StandaloneHA—独立集群高可用模式，Flink自带集群，开发测试环境使用-...

Lansonli
发表于2021-09-29 01:20:46
4004 0 0

4.0k 0 0

目录 Flink安装部署 Local本地模式原理操作测试 Flink安装部署 Flink支持多种安装模式 - Local—本地单机模式，学习测试时使用- Standalone—独立集群模式，Flink自带集群，开发测试环境使用- StandaloneHA—独立集群高可用模式，Flink自带集群，开发测试环境使用-...
Flink 大数据
2021年大数据Flink（五）：Standalone-HA高可用集群模式
目录 Standalone-HA高可用集群模式原理操作 1.集群规划 2.启动ZooKeeper 3.启动HDFS 4.停止Flink集群 5.修改flink-conf.yaml 6.修改masters 7.同步 8.修改node2上的flink-conf.yaml 9.重新启动Flink集群,node1上执...

Lansonli
发表于2021-09-29 01:14:38
5094 0 0

5.0k 0 0

目录 Standalone-HA高可用集群模式原理操作 1.集群规划 2.启动ZooKeeper 3.启动HDFS 4.停止Flink集群 5.修改flink-conf.yaml 6.修改masters 7.同步 8.修改node2上的flink-conf.yaml 9.重新启动Flink集群,node1上执...
Flink 大数据

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript