- 近日,我们对TrinoDB开源社区近两年发布的版本进行了调研,基于1TB TPC-DS标准测试套的性能测试数据如下图:横坐标:TrinoDB社区版本号纵坐标:执行时长(越小越好) 针对Trino459相较于Trino 399版本的性能提升幅度,我们进一步深入分析后得到如下结论:生产场景性能提升 56%POC场景性能提升 46% 此外,当把测试数据集规模从1TB提升到10TB,观察到Trino... 近日,我们对TrinoDB开源社区近两年发布的版本进行了调研,基于1TB TPC-DS标准测试套的性能测试数据如下图:横坐标:TrinoDB社区版本号纵坐标:执行时长(越小越好) 针对Trino459相较于Trino 399版本的性能提升幅度,我们进一步深入分析后得到如下结论:生产场景性能提升 56%POC场景性能提升 46% 此外,当把测试数据集规模从1TB提升到10TB,观察到Trino...
- Hudi提供了MOR和COW两种存储模型,大数据原有的分区模型等,基于Hudi构建实时数据湖方案过程中,要根据对应的分析场景选择合适的存储模型,提升分析的性能、降低方案复杂度。 Hudi提供了MOR和COW两种存储模型,大数据原有的分区模型等,基于Hudi构建实时数据湖方案过程中,要根据对应的分析场景选择合适的存储模型,提升分析的性能、降低方案复杂度。
- 配置部署在线拍卖数据分析系统所需要的环境,然后把数据集上传到 HDFS 分布式文件系统,利用 Hive 对在线拍卖数据进行分析处理,并利用 Python对分析结果进行可视化展示-基于华为云MapReduce、ModelArts。 配置部署在线拍卖数据分析系统所需要的环境,然后把数据集上传到 HDFS 分布式文件系统,利用 Hive 对在线拍卖数据进行分析处理,并利用 Python对分析结果进行可视化展示-基于华为云MapReduce、ModelArts。
- 湖仓一体(LakeHouse)是一种新的开放式架构,它结合了数据湖和数据仓库的最佳元素,是当下大数据领域的重要发展方向。 华为湖仓一体架构核心基座是 Apache Hudi,所有入湖数据都通过 Apache Hudi 承载,对外通过 HetuEngine(Presto增强版)引擎承担一站式SQL分析角色,因此如何更好的结合 Presto 和 Hudi 使其查询效率接近专业的分布式数仓意义重大。 湖仓一体(LakeHouse)是一种新的开放式架构,它结合了数据湖和数据仓库的最佳元素,是当下大数据领域的重要发展方向。 华为湖仓一体架构核心基座是 Apache Hudi,所有入湖数据都通过 Apache Hudi 承载,对外通过 HetuEngine(Presto增强版)引擎承担一站式SQL分析角色,因此如何更好的结合 Presto 和 Hudi 使其查询效率接近专业的分布式数仓意义重大。
- 本期精彩看点:华为云诚邀广大开发者一起将代码送上太空,报名【华为开发者大赛·代码上太空赛道】,挑战500万元奖金池;数据治理生产线DataArts可以帮助企业解决数据智能化面临的挑战,让数据发挥价值... 本期精彩看点:华为云诚邀广大开发者一起将代码送上太空,报名【华为开发者大赛·代码上太空赛道】,挑战500万元奖金池;数据治理生产线DataArts可以帮助企业解决数据智能化面临的挑战,让数据发挥价值...
- 2022年6月15-16日,让我们一起线上相聚华为伙伴暨开发者大会2022,#勇往直前 做全能开发者# 大会精彩活动不容错过! 2022年6月15-16日,让我们一起线上相聚华为伙伴暨开发者大会2022,#勇往直前 做全能开发者# 大会精彩活动不容错过!
- 本期精彩看点:教你如何利用Python定制属于你的《本草纲目女孩》;通过引入FusionInsight RTD实时决策系统,实现医保费用的全流程管理;使用 Monaco Editor 做一个在线的网页代码编辑器。 本期精彩看点:教你如何利用Python定制属于你的《本草纲目女孩》;通过引入FusionInsight RTD实时决策系统,实现医保费用的全流程管理;使用 Monaco Editor 做一个在线的网页代码编辑器。
- 通过引入FusionInsight RTD实时决策系统,实现医保费用事前预防、事中控制、事后审核的全流程管理。从而将医保监管系统建设成既符合医保智能监管平台需求且具备未来信息化标准拓展能力,同时又能满足国家对智能监控的各项要求,最终实现先进的医保智能监管体系。 通过引入FusionInsight RTD实时决策系统,实现医保费用事前预防、事中控制、事后审核的全流程管理。从而将医保监管系统建设成既符合医保智能监管平台需求且具备未来信息化标准拓展能力,同时又能满足国家对智能监控的各项要求,最终实现先进的医保智能监管体系。
- 为了解决现阶段大数据存算分离痛点问题,华为云大数据推出重量级数据湖Catalog服务。 为了解决现阶段大数据存算分离痛点问题,华为云大数据推出重量级数据湖Catalog服务。
- 本文主要研究了hdfs文件系统的读写流程以及基于MRS在windows客户端下读写hdfs文件的实现 本文主要研究了hdfs文件系统的读写流程以及基于MRS在windows客户端下读写hdfs文件的实现
- 做项目时,需要将负责的服务部署到华为云的mrs上,这部分服务是用pyton开发,用到了mrs中的spark服务,现将部署过程记录一下,供大家参考。 做项目时,需要将负责的服务部署到华为云的mrs上,这部分服务是用pyton开发,用到了mrs中的spark服务,现将部署过程记录一下,供大家参考。
- MRS是一个在华为云上部署和管理Hadoop系统的服务,一键即可部署Hadoop集群。我们可以使用官方文档提供API对MRS服务进行相关操作,如创建集群、删除集群、调整集群节点、创建作业并执行等。支持的全部操作可以参见官方文档API概览。但是如果基于文档去进行API的开发和调试,还是有一定的入门门槛, 依赖本地需要有API调用软件, 如果要开发代码还必须得有开发环境才能测试。例如创建集群的A... MRS是一个在华为云上部署和管理Hadoop系统的服务,一键即可部署Hadoop集群。我们可以使用官方文档提供API对MRS服务进行相关操作,如创建集群、删除集群、调整集群节点、创建作业并执行等。支持的全部操作可以参见官方文档API概览。但是如果基于文档去进行API的开发和调试,还是有一定的入门门槛, 依赖本地需要有API调用软件, 如果要开发代码还必须得有开发环境才能测试。例如创建集群的A...
- 近期工作上开始接触了大量容器化和华为云云容器引擎CCE的内容,因此整理学习了一堆有关容器化的知识,特此进行分享。在学习容器化之前,首先要了解一个内容,为什么要使用容器,好处是什么? 兼容性问题我们在工程实践中,经常会遇到一些兼容性的问题,比如:ISA兼容:目标机器指令集的兼容性ABI兼容:目标系统或者依赖库的二进制兼容性环境兼容: 目标环境的兼容性。例如环境变量、配置、注册中心等。以一个多服... 近期工作上开始接触了大量容器化和华为云云容器引擎CCE的内容,因此整理学习了一堆有关容器化的知识,特此进行分享。在学习容器化之前,首先要了解一个内容,为什么要使用容器,好处是什么? 兼容性问题我们在工程实践中,经常会遇到一些兼容性的问题,比如:ISA兼容:目标机器指令集的兼容性ABI兼容:目标系统或者依赖库的二进制兼容性环境兼容: 目标环境的兼容性。例如环境变量、配置、注册中心等。以一个多服...
- 华为FusionInsight MRS HBase的集群隔离——RSGroup一、HBase RSGroup理解 RSGroup是集群隔离方案。 HBase原有的资源隔离:为多个用户共享同一个HBase集群,提供了资源隔离的能力。NameSpace,将不同业务的表隔离在不同的namespace是一个最简单的资源隔离的方法。【轻量】ACL(Access Control Lists)... 华为FusionInsight MRS HBase的集群隔离——RSGroup一、HBase RSGroup理解 RSGroup是集群隔离方案。 HBase原有的资源隔离:为多个用户共享同一个HBase集群,提供了资源隔离的能力。NameSpace,将不同业务的表隔离在不同的namespace是一个最简单的资源隔离的方法。【轻量】ACL(Access Control Lists)...
- 大数据是人类进入互联网时代以来面临的一个巨大问题:社会生产生活产生的数据量越来越大,数据种类越来越多,数据产生的速度越来越快。传统的数据处理技术,比如说单机存储,关系数据库已经无法解决这些新的大数据问题。为解决以上大数据处理问题,Apache基金会推出了Hadoop大数据处理的开源解决方案。Hadoop是一个开源分布式计算平台,可以充分利用集群的计算和存储能力,完成海量数据的处理。企业自行部... 大数据是人类进入互联网时代以来面临的一个巨大问题:社会生产生活产生的数据量越来越大,数据种类越来越多,数据产生的速度越来越快。传统的数据处理技术,比如说单机存储,关系数据库已经无法解决这些新的大数据问题。为解决以上大数据处理问题,Apache基金会推出了Hadoop大数据处理的开源解决方案。Hadoop是一个开源分布式计算平台,可以充分利用集群的计算和存储能力,完成海量数据的处理。企业自行部...
上滑加载中
推荐直播
-
物联网资深专家带你轻松构建AIoT智能场景应用
2024/11/21 周四 16:30-18:00
管老师 华为云IoT DTSE技术布道师
如何轻松构建AIoT智能场景应用?本期直播将聚焦华为云设备接入平台,结合AI、鸿蒙(OpenHarmony)、大数据等技术,实现物联网端云协同创新场景,教您如何打造更有实用性及创新性的AIoT行业标杆应用。
回顾中 -
Ascend C算子编程之旅:基础入门篇
2024/11/22 周五 16:00-17:30
莫老师 昇腾CANN专家
介绍Ascend C算子基本概念、异构计算架构CANN和Ascend C基本概述,以及Ascend C快速入门,夯实Ascend C算子编程基础
即将直播 -
深入解析:华为全栈AI解决方案与云智能开放能力
2024/11/22 周五 18:20-20:20
Alex 华为云学堂技术讲师
本期直播我们将重点为大家介绍华为全栈全场景AI解决方案以和华为云企业智能AI开放能力。旨在帮助开发者深入理解华为AI解决方案,并能够更加熟练地运用这些技术。通过洞悉华为解决方案,了解人工智能完整生态链条的构造。
去报名
热门标签