- 近日,JSONBench 官网引入了 Apache Doris 的测试成绩,未经调优的测试结果显示,Apache Doris 性能表现位列第三名,仅次于榜单维护方 ClickHouse 的两个版本。 近日,JSONBench 官网引入了 Apache Doris 的测试成绩,未经调优的测试结果显示,Apache Doris 性能表现位列第三名,仅次于榜单维护方 ClickHouse 的两个版本。
- Apache Iceberg 是新一代数据湖表格式,旨在解决传统数据湖(如 Hive)在事务性、并发控制和元数据管理上的不足。它支持 Spark、Flink、Trino 等多种计算引擎,提供 ACID 事务、模式演化、分区演化等核心特性,具备良好的云存储兼容性和高性能查询能力,适用于大规模结构化数据分析场景。 Apache Iceberg 是新一代数据湖表格式,旨在解决传统数据湖(如 Hive)在事务性、并发控制和元数据管理上的不足。它支持 Spark、Flink、Trino 等多种计算引擎,提供 ACID 事务、模式演化、分区演化等核心特性,具备良好的云存储兼容性和高性能查询能力,适用于大规模结构化数据分析场景。
- 一、Apache Doris:面向 Agent 时代的智能数据平台当我们谈论 2025 年时,业界普遍认为这将是"Agent 革命年"(Agentic Revolution)的开端。与传统的人机交互模式不同,AI Agent 作为一个全新的"用户角色"正在重塑整个数据分析领域的使用模式。这些智能代理不再是被动等待指令的工具,而是具备自主决策能力、能够理解上下文、执行复杂任务的智能实体。它们... 一、Apache Doris:面向 Agent 时代的智能数据平台当我们谈论 2025 年时,业界普遍认为这将是"Agent 革命年"(Agentic Revolution)的开端。与传统的人机交互模式不同,AI Agent 作为一个全新的"用户角色"正在重塑整个数据分析领域的使用模式。这些智能代理不再是被动等待指令的工具,而是具备自主决策能力、能够理解上下文、执行复杂任务的智能实体。它们...
- 亲爱的社区小伙伴们,Apache Doris 2.1.10 版本已正式发布。2.1.10 版本对湖仓一体、半结构化数据类型、查询优化器、执行引擎、存储管理进行了若干改进优化。欢迎大家下载使用。 亲爱的社区小伙伴们,Apache Doris 2.1.10 版本已正式发布。2.1.10 版本对湖仓一体、半结构化数据类型、查询优化器、执行引擎、存储管理进行了若干改进优化。欢迎大家下载使用。
- 本文以Java编程为例,讲解了在Java中求解两个字符串的几种方法。通过求解编辑距离、Q-gram Matching、还有余弦相似性计算,通过对比不同的方法,调用Apache 的Common-text中基于余弦的字符相似性得到了比较比错的结果。最后讲解了一个实际的案例,将之前我们采集的漂亮数据库数据和百科的数据进行对齐。 本文以Java编程为例,讲解了在Java中求解两个字符串的几种方法。通过求解编辑距离、Q-gram Matching、还有余弦相似性计算,通过对比不同的方法,调用Apache 的Common-text中基于余弦的字符相似性得到了比较比错的结果。最后讲解了一个实际的案例,将之前我们采集的漂亮数据库数据和百科的数据进行对齐。
- Apache Spark 是一个开源、分布式计算引擎,专为大规模数据处理设计。它以高速、易用和通用为核心目标。通过内存计算、DAG 执行引擎和惰性求值等特性,大幅提升数据处理效率。其核心组件包括 Spark Core、Spark SQL、Spark Streaming、MLlib 和 GraphX,支持批处理、实时流处理、机器学习和图计算。Spark 提供统一编程模型,支持多语言(Scala/Ja Apache Spark 是一个开源、分布式计算引擎,专为大规模数据处理设计。它以高速、易用和通用为核心目标。通过内存计算、DAG 执行引擎和惰性求值等特性,大幅提升数据处理效率。其核心组件包括 Spark Core、Spark SQL、Spark Streaming、MLlib 和 GraphX,支持批处理、实时流处理、机器学习和图计算。Spark 提供统一编程模型,支持多语言(Scala/Ja
- 边缘设备硬件资源差异显著,运行深度学习模型时算子优化面临诸多挑战。传统手动优化耗时费力且易出错,难以适应日益复杂的模型需求。Apache TVM作为开源深度学习编译器栈,通过中间表示(IR)层实现框架与硬件的高效对接,并提供稳定优化平台。 边缘设备硬件资源差异显著,运行深度学习模型时算子优化面临诸多挑战。传统手动优化耗时费力且易出错,难以适应日益复杂的模型需求。Apache TVM作为开源深度学习编译器栈,通过中间表示(IR)层实现框架与硬件的高效对接,并提供稳定优化平台。
- Apache Solr 是一种强大而灵活的开源搜索平台,它基于 Apache Lucene 构建,专门用于处理复杂的全文搜索和信息检索任务。它在许多行业和应用场景中得到了广泛应用,尤其适合需要高效处理大规模数据查询和搜索的系统。Solr 作为一款搜索引擎,提供了高度可扩展、基于 REST API 的功能,并具备分布式搜索、实时索引以及复杂的查询能力,这些特性使得它在现代互联网系统中尤为重要。... Apache Solr 是一种强大而灵活的开源搜索平台,它基于 Apache Lucene 构建,专门用于处理复杂的全文搜索和信息检索任务。它在许多行业和应用场景中得到了广泛应用,尤其适合需要高效处理大规模数据查询和搜索的系统。Solr 作为一款搜索引擎,提供了高度可扩展、基于 REST API 的功能,并具备分布式搜索、实时索引以及复杂的查询能力,这些特性使得它在现代互联网系统中尤为重要。...
- Apache Shiro 简介Apache Shiro 是一个强大且易于使用的 Java 安全框架,旨在简化应用程序的身份验证、授权、加密和会话管理。它提供了全面的安全功能,同时保持了简洁性和灵活性,适用于各种规模的应用程序,从小型独立应用到大型企业级系统。 Shiro 的核心功能Shiro 的核心功能可以归纳为四个主要方面:认证(Authentication)、授权(Authorizat... Apache Shiro 简介Apache Shiro 是一个强大且易于使用的 Java 安全框架,旨在简化应用程序的身份验证、授权、加密和会话管理。它提供了全面的安全功能,同时保持了简洁性和灵活性,适用于各种规模的应用程序,从小型独立应用到大型企业级系统。 Shiro 的核心功能Shiro 的核心功能可以归纳为四个主要方面:认证(Authentication)、授权(Authorizat...
- Apache-2.0 许可证,是 Apache 软件基金会(ASF)发布的一种开源许可证。它为用户和开发者提供了广泛的权利,使他们可以自由地使用、修改和分发软件。但与此同时,Apache-2.0 也对如何合理地运用和共享这些代码提出了一些要求。我们可以逐步剖析这个许可证的内容,从理解其法律语言的本质,到如何应用在实际的软件开发过程中,以保证项目的合规性和高效性。Apache-2.0 的基础特... Apache-2.0 许可证,是 Apache 软件基金会(ASF)发布的一种开源许可证。它为用户和开发者提供了广泛的权利,使他们可以自由地使用、修改和分发软件。但与此同时,Apache-2.0 也对如何合理地运用和共享这些代码提出了一些要求。我们可以逐步剖析这个许可证的内容,从理解其法律语言的本质,到如何应用在实际的软件开发过程中,以保证项目的合规性和高效性。Apache-2.0 的基础特...
- Apache Flink是一款开源流处理框架,由Apache软件基金会进行维护和开发,专为实时数据处理、批处理以及流批一体的大规模数据处理场景而设计。Flink的核心理念是提供了一种统一的数据处理模型,使得无论是实时流处理还是批量处理,都可以在同一个系统中以一致的方式高效执行。Flink的设计基于数据流编程模型,其核心特性包括事件时间处理(Event Time Processing)、精确一... Apache Flink是一款开源流处理框架,由Apache软件基金会进行维护和开发,专为实时数据处理、批处理以及流批一体的大规模数据处理场景而设计。Flink的核心理念是提供了一种统一的数据处理模型,使得无论是实时流处理还是批量处理,都可以在同一个系统中以一致的方式高效执行。Flink的设计基于数据流编程模型,其核心特性包括事件时间处理(Event Time Processing)、精确一...
- Kafka 是个分布式的、持分区的(partition)、多副本的 (replica),基于 zookeeper 协调的分布式消息系统,它最大的特性就是可以实时处理大量数据以满足各类需求场景:日志收集:使用 Kafka 收集各种服务的日志,并通过 kafka 以统一接口服务的方式开放给各种 consumer,例如 hadoop、Hbase、Solr 等消息系统:解耦和生产者和消费者、缓存消息... Kafka 是个分布式的、持分区的(partition)、多副本的 (replica),基于 zookeeper 协调的分布式消息系统,它最大的特性就是可以实时处理大量数据以满足各类需求场景:日志收集:使用 Kafka 收集各种服务的日志,并通过 kafka 以统一接口服务的方式开放给各种 consumer,例如 hadoop、Hbase、Solr 等消息系统:解耦和生产者和消费者、缓存消息...
- 消息队列中间件就是用来存储消息的软件(组件)。举个例子来理解,为了分析网站的用户行为,我们需要记录用户的访问日志。这些一条条的日志,可以看成是一条条的消息,我们可以将它们保存到消息队列中。Kafka作为分布式流处理的代表,通过分区、副本、零拷贝等技术实现了高吞吐量与可靠性,尤其适合大规模数据处理和实时分析场景。其技术生态(如Kafka Streams、KSQL)进一步扩展了应用范围,但在复杂路由和 消息队列中间件就是用来存储消息的软件(组件)。举个例子来理解,为了分析网站的用户行为,我们需要记录用户的访问日志。这些一条条的日志,可以看成是一条条的消息,我们可以将它们保存到消息队列中。Kafka作为分布式流处理的代表,通过分区、副本、零拷贝等技术实现了高吞吐量与可靠性,尤其适合大规模数据处理和实时分析场景。其技术生态(如Kafka Streams、KSQL)进一步扩展了应用范围,但在复杂路由和
- SpringMVC POI 导出 Excel在企业级应用开发中,数据的导入导出是一项常见的需求。Excel 作为最常用的数据处理工具之一,经常被用来存储和展示数据。本文将介绍如何在 SpringMVC 框架中使用 Apache POI 库来实现 Excel 文件的导出功能。1.1.1 添加依赖首先,在项目的 pom.xml 文件中添加 Apache POI 的依赖:<dependen... SpringMVC POI 导出 Excel在企业级应用开发中,数据的导入导出是一项常见的需求。Excel 作为最常用的数据处理工具之一,经常被用来存储和展示数据。本文将介绍如何在 SpringMVC 框架中使用 Apache POI 库来实现 Excel 文件的导出功能。1.1.1 添加依赖首先,在项目的 pom.xml 文件中添加 Apache POI 的依赖:<dependen...
- Storm简单编程案例Apache Storm 是一个免费的开源分布式实时计算系统。它使得处理大量流数据变得容易,能够可靠地处理无限的数据流。本文将通过一个简单的编程案例来介绍如何使用 Apache Storm。1. 环境搭建在开始之前,确保你的开发环境已经安装了以下工具:Java JDK 8 或更高版本Maven 3.0 或更高版本Apache Storm 1.2.3 或更高版本安装步骤安... Storm简单编程案例Apache Storm 是一个免费的开源分布式实时计算系统。它使得处理大量流数据变得容易,能够可靠地处理无限的数据流。本文将通过一个简单的编程案例来介绍如何使用 Apache Storm。1. 环境搭建在开始之前,确保你的开发环境已经安装了以下工具:Java JDK 8 或更高版本Maven 3.0 或更高版本Apache Storm 1.2.3 或更高版本安装步骤安...
上滑加载中
推荐直播
-
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中 -
华为云码道全新升级,多会话并行与多智能体协作2026/05/08 周五 19:00-21:00
王一男-华为云码道产品专家;张嘉冉-华为云码道工程师;胡琦-华为云HCDE;程诗杰-华为云HCDG
华为云码道4月份版本全新升级,此次直播深度解读4月份产品特性,通过“特性解读+实操演示+实战案例+设计创新”的组合,全方位展现码道在多会话并行与多智能体协作方面的能力,赋能开发者提升效率
正在直播
热门标签