- The Murray Global Tidal Wetland Change Dataset contains maps of the global extent of tidal wetlands and their change. The maps were developed from a three stage classification that sought to (i) e... The Murray Global Tidal Wetland Change Dataset contains maps of the global extent of tidal wetlands and their change. The maps were developed from a three stage classification that sought to (i) e...
- 11-[掌握]-Java 操作 Kudu之创建表(范围分区)为了提供可扩展性,Kudu 表被划分为称为 tablets 的单元,并分布在许多 tablet servers 上。1)、哈希分区:Hash Partitioning哈希分区通过哈希值,将行分配到不同的 buckets ( 存储桶 )中;哈希分区是一种有效的策略,当不需要对表进行有序访问时,哈希分区对于在 tablet 之间随机散... 11-[掌握]-Java 操作 Kudu之创建表(范围分区)为了提供可扩展性,Kudu 表被划分为称为 tablets 的单元,并分布在许多 tablet servers 上。1)、哈希分区:Hash Partitioning哈希分区通过哈希值,将行分配到不同的 buckets ( 存储桶 )中;哈希分区是一种有效的策略,当不需要对表进行有序访问时,哈希分区对于在 tablet 之间随机散...
- theme: smartblue持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第8天,点击查看活动详情 业务服务器和大数据服务器 01-[复习]-上次课程内容回顾主要讲解2个方面内容:物流项目业务数据(数据库部署)和OGG 实时采集Oracle数据库表的数据。1、物流项目业务数据 实际物流快递公司来说,有很多业务系统,使用不同类型数据库存储数据,在此仅仅以2个业务系统... theme: smartblue持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第8天,点击查看活动详情 业务服务器和大数据服务器 01-[复习]-上次课程内容回顾主要讲解2个方面内容:物流项目业务数据(数据库部署)和OGG 实时采集Oracle数据库表的数据。1、物流项目业务数据 实际物流快递公司来说,有很多业务系统,使用不同类型数据库存储数据,在此仅仅以2个业务系统...
- 全球内陆水域数据集显示了内陆地表水体,包括淡水和咸水湖泊、河流和水库。从 GLS 2000 时期开始,已确定了 3,650,723 平方公里的内陆水域,其中约四分之三位于北美和亚洲。北方森林和苔原拥有最大的内陆水域,约占全球总量的 40%。该数据与 MODIS 数据集以及美国和加拿大的 30 米分辨率数据集表现出强线性相关性。残留误差主要是由于水覆盖、冰雪和残留云的季节性。数据集包含每个可... 全球内陆水域数据集显示了内陆地表水体,包括淡水和咸水湖泊、河流和水库。从 GLS 2000 时期开始,已确定了 3,650,723 平方公里的内陆水域,其中约四分之三位于北美和亚洲。北方森林和苔原拥有最大的内陆水域,约占全球总量的 40%。该数据与 MODIS 数据集以及美国和加拿大的 30 米分辨率数据集表现出强线性相关性。残留误差主要是由于水覆盖、冰雪和残留云的季节性。数据集包含每个可...
- Apache HBase™ 是 Hadoop 数据库,一种分布式、可扩展的大数据存储。 Apache HBase™ 是 Hadoop 数据库,一种分布式、可扩展的大数据存储。
- Apache Hive™ 数据仓库软件使用SQL帮助读取、写入和管理驻留在分布式存储中的大型数据集。结构可以投影到已存储的数据上。提供了一个命令行工具和JDBC驱动程序来将用户连接到配置单元。 Apache Hive™ 数据仓库软件使用SQL帮助读取、写入和管理驻留在分布式存储中的大型数据集。结构可以投影到已存储的数据上。提供了一个命令行工具和JDBC驱动程序来将用户连接到配置单元。
- 数据湖概念一、什么是数据湖数据湖是一个集中式的存储库,允许你以任意规模存储多个来源、所有结构化和非结构化数据,可以按照原样存储数据,无需对数据进行结构化处理,并运行不同类型的分析对数据进行加工,例如:大数据处理、实时分析、机器学习,以指导做出更好地决策。二、大数据为什么需要数据湖当前基于Hive的离线数据仓库已经非常成熟,在传统的离线数据仓库中对记录级别的数据进行更新是非常麻烦的,需要对待... 数据湖概念一、什么是数据湖数据湖是一个集中式的存储库,允许你以任意规模存储多个来源、所有结构化和非结构化数据,可以按照原样存储数据,无需对数据进行结构化处理,并运行不同类型的分析对数据进行加工,例如:大数据处理、实时分析、机器学习,以指导做出更好地决策。二、大数据为什么需要数据湖当前基于Hive的离线数据仓库已经非常成熟,在传统的离线数据仓库中对记录级别的数据进行更新是非常麻烦的,需要对待...
- 流行的大数据技术有Hadoop, Storm, Hive、Spark等,这些都是大集群方案,适合有海量规模数据的巨大企业。实际上,流行的大数据技术通常也源自这类头部互联网企业。很多场景下,数据虽然也很多,但小集群甚至无集群就足够处理,远没多到这些巨大企业的规模,也没有那么多的硬件设备和维护人员。这种情况下,就需要轻量级的大数据技术了。轻量级的大数据技术不多,集算器SPL是其中的佼佼者。SPL... 流行的大数据技术有Hadoop, Storm, Hive、Spark等,这些都是大集群方案,适合有海量规模数据的巨大企业。实际上,流行的大数据技术通常也源自这类头部互联网企业。很多场景下,数据虽然也很多,但小集群甚至无集群就足够处理,远没多到这些巨大企业的规模,也没有那么多的硬件设备和维护人员。这种情况下,就需要轻量级的大数据技术了。轻量级的大数据技术不多,集算器SPL是其中的佼佼者。SPL...
- Spark+grafana可视化项目实战,赶快收藏~ Spark+grafana可视化项目实战,赶快收藏~
- 拉链表是缓慢变化维的一种实现形式,是数据仓库的常用数据模型。基于传统大数据需要全量覆盖写的模式进行,基于Hudi的能力,实现方案会更加简单,性能更优。 拉链表是缓慢变化维的一种实现形式,是数据仓库的常用数据模型。基于传统大数据需要全量覆盖写的模式进行,基于Hudi的能力,实现方案会更加简单,性能更优。
- 一、构建Flink程序构建一个Flink程序有两种方式方式一:构建 maven 工程,导入流式应用依赖包<!-- 基础依赖 --><dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-java</artifactId> <version>${flink.version}</version> ... 一、构建Flink程序构建一个Flink程序有两种方式方式一:构建 maven 工程,导入流式应用依赖包<!-- 基础依赖 --><dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-java</artifactId> <version>${flink.version}</version> ...
- 华为云FusionInsight MRS通过FGL对HDFS NameNode锁机制进行优化,有效提升了NameNode的读写吞吐量,从而能够支持更多数据,更多业务请求访问,从而更好的支撑政企客户高效用数,业务洞见更准,价值兑现更快。 华为云FusionInsight MRS通过FGL对HDFS NameNode锁机制进行优化,有效提升了NameNode的读写吞吐量,从而能够支持更多数据,更多业务请求访问,从而更好的支撑政企客户高效用数,业务洞见更准,价值兑现更快。
- 特性背景1. 实际场景需要支持JDBC客户端跨网络域访问HetuEngine服务端2. 多数据中心的数据互联互通和数据安全管理,是制约数据融合创新,挖掘数据价值的主要矛盾。华为云FusionInsight提供 HetuEngine,将物理分散的数据中心,编织为统一的超级计算网格,让客户告别数据 ETL来回搬迁数据的历史,从单数据湖靠人,迈向安全、高效、智能的跨湖融合与创新特性功能说明1、 ... 特性背景1. 实际场景需要支持JDBC客户端跨网络域访问HetuEngine服务端2. 多数据中心的数据互联互通和数据安全管理,是制约数据融合创新,挖掘数据价值的主要矛盾。华为云FusionInsight提供 HetuEngine,将物理分散的数据中心,编织为统一的超级计算网格,让客户告别数据 ETL来回搬迁数据的历史,从单数据湖靠人,迈向安全、高效、智能的跨湖融合与创新特性功能说明1、 ...
- 特性背景传统JDBC或者copymanager方式对GaussDB进行数据写入时,数据都是经过GaussDB的Coordinator节点进入集群,会对coordinator节点带来较大压力,并且存在性能瓶颈。因此HetuEngine使用MDE特性来解决这类问题。在使用HetuEngine向GaussDB写入数据时(包含CREATE TABLE AS SELECT和INSERT INTO SE... 特性背景传统JDBC或者copymanager方式对GaussDB进行数据写入时,数据都是经过GaussDB的Coordinator节点进入集群,会对coordinator节点带来较大压力,并且存在性能瓶颈。因此HetuEngine使用MDE特性来解决这类问题。在使用HetuEngine向GaussDB写入数据时(包含CREATE TABLE AS SELECT和INSERT INTO SE...
- 一. 什么是Schema演进?Schema演进是指保持表的数据不变,对表的schema进行变换,包括列的位置变更,新增删除列或者列的数据类型变更,查询引擎能正确地处理这些数据与表schema不一致的变更。 二.HetuEngine哪些表支持Schema演进? COW表的schema变更支持MOR表的RT表的schema变更支持MOR表的RO表的schema变更支持 三.HetuEng... 一. 什么是Schema演进?Schema演进是指保持表的数据不变,对表的schema进行变换,包括列的位置变更,新增删除列或者列的数据类型变更,查询引擎能正确地处理这些数据与表schema不一致的变更。 二.HetuEngine哪些表支持Schema演进? COW表的schema变更支持MOR表的RT表的schema变更支持MOR表的RO表的schema变更支持 三.HetuEng...
上滑加载中
推荐直播
-
华为云码道-玩转OpenClaw,在线养虾2026/03/11 周三 19:00-21:00
刘昱,华为云高级工程师/谈心,华为云技术专家/李海仑,上海圭卓智能科技有限公司CEO
OpenClaw 火爆开发者圈,华为云码道最新推出 Skill ——开发者只需输入一句口令,即可部署一个功能完整的「小龙虾」智能体。直播带你玩转华为云码道,玩转OpenClaw
回顾中 -
华为云码道-AI时代应用开发利器2026/03/18 周三 19:00-20:00
童得力,华为云开发者生态运营总监/姚圣伟,华为云HCDE开发者专家
本次直播由华为专家带你实战应用开发,看华为云码道(CodeArts)代码智能体如何在AI时代让你的创意应用快速落地。更有华为云HCDE开发者专家带你用码道玩转JiuwenClaw,让小艺成为你的AI助理。
回顾中 -
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中
热门标签