Apache_标签_开发者_华为云

博客(775)
视频(1)
论坛(0)
云声(0)
代码示例(0)

Apache Doris 4.0 AI 能力揭秘（一）：AI 函数之 LLM 函数介绍
在即将发布的 Apache Doris 4.0 版本中，我们正式引入了一系列 LLM 函数，将前沿的 AI 能力与日常的数据分析相结合，无论是精准提取文本信息，还是对评论进行情感分类，亦或生成精炼的文本摘要，皆可在数据库内部无缝完成。

SelectDB技术团队
发表于2025-08-19 20:01:37
1345 0 0

1.3k 0 0

在即将发布的 Apache Doris 4.0 版本中，我们正式引入了一系列 LLM 函数，将前沿的 AI 能力与日常的数据分析相结合，无论是精准提取文本信息，还是对评论进行情感分类，亦或生成精炼的文本摘要，皆可在数据库内部无缝完成。
Apache 人工智能函数工作流 FunctionGraph 数据分析数据库
ApacheCon Asia 2025 中国开源年度报告：Apache Doris 国内第一
上周刚落下帷幕的 ApacheCon Asia 2025 中，一个数据让所有人都为之震撼：全球 Apache 基金会项目 OpenRank 排行榜中，Apache Doris 位居第二，在中国 Apache 项目中更是稳居第一。这个排名意味着什么？在 Apache 基金会管理的近 300 个顶级项目中，Doris 已经成为仅次于 Apache Airflow 的全球第二大影响力项目。面对如此...

SelectDB技术团队
发表于2025-08-07 22:12:40
1036 0 0

1.0k 0 0

上周刚落下帷幕的 ApacheCon Asia 2025 中，一个数据让所有人都为之震撼：全球 Apache 基金会项目 OpenRank 排行榜中，Apache Doris 位居第二，在中国 Apache 项目中更是稳居第一。这个排名意味着什么？在 Apache 基金会管理的近 300 个顶级项目中，Doris 已经成为仅次于 Apache Airflow 的全球第二大影响力项目。面对如此...
Apache 大数据应用与数据集成平台 ROMA Connect
Apache InLong：构建10万亿级数据管道的全场景集成框架
Apache InLong是一站式大数据集成框架，支持数据采集、同步和订阅全流程，具备PB级数据处理能力。该项目源于腾讯TubeMQ消息队列，2019年进入Apache孵化器，2022年成为顶级项目。核心特性包括：SaaS化服务、10万亿级数据吞吐、20+协议支持、可视化管控平台。架构包含Agent采集、TubeMQ传输、Sort处理等模块，相比Kafka方案可降低85%传输成本。

Jaxonic
发表于2025-08-04 23:13:28
2469 0 0

2.4k 0 0

Apache InLong是一站式大数据集成框架，支持数据采集、同步和订阅全流程，具备PB级数据处理能力。该项目源于腾讯TubeMQ消息队列，2019年进入Apache孵化器，2022年成为顶级项目。核心特性包括：SaaS化服务、10万亿级数据吞吐、20+协议支持、可视化管控平台。架构包含Agent采集、TubeMQ传输、Sort处理等模块，相比Kafka方案可降低85%传输成本。
Apache 安全架构开发工具开发语言量子计算
Java中的大数据流式计算与Apache Kafka集成！
开篇语哈喽，各位小伙伴们，你们好呀，我是喵手。运营社区：C站/掘金/腾讯云/阿里云/华为云/51CTO；欢迎大家常来逛逛今天我要给大家分享一些自己日常学习到的一些知识点，并以文字的形式跟大家一起交流，互相学习，一个人虽可以走的更快，但一群人可以走的更远。我是一名后端开发爱好者，工作日常接触到最多的就是Java语言啦，所以我都尽量抽业余时间把自己所学到所会的，通过文章的形式进行输出，...

喵手
发表于2025-07-18 21:47:17
1274 0 0

1.2k 0 0

开篇语哈喽，各位小伙伴们，你们好呀，我是喵手。运营社区：C站/掘金/腾讯云/阿里云/华为云/51CTO；欢迎大家常来逛逛今天我要给大家分享一些自己日常学习到的一些知识点，并以文字的形式跟大家一起交流，互相学习，一个人虽可以走的更快，但一群人可以走的更远。我是一名后端开发爱好者，工作日常接触到最多的就是Java语言啦，所以我都尽量抽业余时间把自己所学到所会的，通过文章的形式进行输出，...
Apache Java 大数据
Apache Iceberg数据湖高级特性及性能调优
性能调优涵盖索引优化、排序策略与元数据管理。通过布隆过滤器、位图索引等提升查询效率，结合文件内/间排序优化I/O与压缩，辅以Z-Order实现多维数据聚集。同时，合理配置元数据缓存与清单合并，加速查询规划。适用于点查、全表扫描及高并发写入场景，显著提升系统性能与资源利用率。

yd_295881270
发表于2025-07-12 17:08:43
2258 0 0

2.2k 0 0

性能调优涵盖索引优化、排序策略与元数据管理。通过布隆过滤器、位图索引等提升查询效率，结合文件内/间排序优化I/O与压缩，辅以Z-Order实现多维数据聚集。同时，合理配置元数据缓存与清单合并，加速查询规划。适用于点查、全表扫描及高并发写入场景，显著提升系统性能与资源利用率。
Apache 应用性能调优
十亿 JSON 秒级响应：Apache Doris vs ClickHouse，Elasticsearch，PostgreSQL
近日，JSONBench 官网引入了 Apache Doris 的测试成绩，未经调优的测试结果显示，Apache Doris 性能表现位列第三名，仅次于榜单维护方 ClickHouse 的两个版本。

SelectDB技术团队
发表于2025-07-07 17:43:17
1716 0 0

1.7k 0 0

近日，JSONBench 官网引入了 Apache Doris 的测试成绩，未经调优的测试结果显示，Apache Doris 性能表现位列第三名，仅次于榜单维护方 ClickHouse 的两个版本。
Apache JSON PostgreSQL
Apache Iceberg数据湖基础
Apache Iceberg 是新一代数据湖表格式，旨在解决传统数据湖（如 Hive）在事务性、并发控制和元数据管理上的不足。它支持 Spark、Flink、Trino 等多种计算引擎，提供 ACID 事务、模式演化、分区演化等核心特性，具备良好的云存储兼容性和高性能查询能力，适用于大规模结构化数据分析场景。

yd_295881270
发表于2025-07-06 15:41:49
3176 0 0

3.1k 0 0

Apache Iceberg 是新一代数据湖表格式，旨在解决传统数据湖（如 Hive）在事务性、并发控制和元数据管理上的不足。它支持 Spark、Flink、Trino 等多种计算引擎，提供 ACID 事务、模式演化、分区演化等核心特性，具备良好的云存储兼容性和高性能查询能力，适用于大规模结构化数据分析场景。
Apache
Apache Doris + MCP：Agent 时代的实时数据分析底座
一、Apache Doris：面向 Agent 时代的智能数据平台当我们谈论 2025 年时，业界普遍认为这将是"Agent 革命年"（Agentic Revolution）的开端。与传统的人机交互模式不同，AI Agent 作为一个全新的"用户角色"正在重塑整个数据分析领域的使用模式。这些智能代理不再是被动等待指令的工具，而是具备自主决策能力、能够理解上下文、执行复杂任务的智能实体。它们...

SelectDB技术团队
发表于2025-06-24 19:10:20
1795 0 0

1.7k 0 0

一、Apache Doris：面向 Agent 时代的智能数据平台当我们谈论 2025 年时，业界普遍认为这将是"Agent 革命年"（Agentic Revolution）的开端。与传统的人机交互模式不同，AI Agent 作为一个全新的"用户角色"正在重塑整个数据分析领域的使用模式。这些智能代理不再是被动等待指令的工具，而是具备自主决策能力、能够理解上下文、执行复杂任务的智能实体。它们...
Apache 人工智能数据分析数据库数据挖掘
Apache Doris 2.1.10 版本发布
亲爱的社区小伙伴们，Apache Doris 2.1.10 版本已正式发布。2.1.10 版本对湖仓一体、半结构化数据类型、查询优化器、执行引擎、存储管理进行了若干改进优化。欢迎大家下载使用。

SelectDB技术团队
发表于2025-06-24 18:06:18
1652 0 0

1.6k 0 0

亲爱的社区小伙伴们，Apache Doris 2.1.10 版本已正式发布。2.1.10 版本对湖仓一体、半结构化数据类型、查询优化器、执行引擎、存储管理进行了若干改进优化。欢迎大家下载使用。
Apache 开源数据仓库数据分析数据湖
使用Java调用Apache commons-text求解字符串相似性实战
本文以Java编程为例，讲解了在Java中求解两个字符串的几种方法。通过求解编辑距离、Q-gram Matching、还有余弦相似性计算，通过对比不同的方法，调用Apache 的Common-text中基于余弦的字符相似性得到了比较比错的结果。最后讲解了一个实际的案例，将之前我们采集的漂亮数据库数据和百科的数据进行对齐。

夜郎king
发表于2025-06-19 12:44:27
1232 0 0

1.2k 0 0

本文以Java编程为例，讲解了在Java中求解两个字符串的几种方法。通过求解编辑距离、Q-gram Matching、还有余弦相似性计算，通过对比不同的方法，调用Apache 的Common-text中基于余弦的字符相似性得到了比较比错的结果。最后讲解了一个实际的案例，将之前我们采集的漂亮数据库数据和百科的数据进行对齐。
Apache Java
Apache Spark详解
Apache Spark 是一个开源、分布式计算引擎，专为大规模数据处理设计。它以高速、易用和通用为核心目标。通过内存计算、DAG 执行引擎和惰性求值等特性，大幅提升数据处理效率。其核心组件包括 Spark Core、Spark SQL、Spark Streaming、MLlib 和 GraphX，支持批处理、实时流处理、机器学习和图计算。Spark 提供统一编程模型，支持多语言（Scala/Ja

yd_295881270
发表于2025-06-08 17:14:20
3460 0 0

3.4k 0 0

Apache Spark 是一个开源、分布式计算引擎，专为大规模数据处理设计。它以高速、易用和通用为核心目标。通过内存计算、DAG 执行引擎和惰性求值等特性，大幅提升数据处理效率。其核心组件包括 Spark Core、Spark SQL、Spark Streaming、MLlib 和 GraphX，支持批处理、实时流处理、机器学习和图计算。Spark 提供统一编程模型，支持多语言（Scala/Ja
Apache spark
《当AutoScheduler遇见边缘端：Apache TVM如何重塑模型算子的极限》
边缘设备硬件资源差异显著，运行深度学习模型时算子优化面临诸多挑战。传统手动优化耗时费力且易出错，难以适应日益复杂的模型需求。Apache TVM作为开源深度学习编译器栈，通过中间表示（IR）层实现框架与硬件的高效对接，并提供稳定优化平台。

程序员阿伟
发表于2025-06-03 15:47:18
1335 0 0

1.3k 0 0

边缘设备硬件资源差异显著，运行深度学习模型时算子优化面临诸多挑战。传统手动优化耗时费力且易出错，难以适应日益复杂的模型需求。Apache TVM作为开源深度学习编译器栈，通过中间表示（IR）层实现框架与硬件的高效对接，并提供稳定优化平台。
Apache 深度学习
探索 Apache Solr：功能、架构与现实中的应用场景
Apache Solr 是一种强大而灵活的开源搜索平台，它基于 Apache Lucene 构建，专门用于处理复杂的全文搜索和信息检索任务。它在许多行业和应用场景中得到了广泛应用，尤其适合需要高效处理大规模数据查询和搜索的系统。Solr 作为一款搜索引擎，提供了高度可扩展、基于 REST API 的功能，并具备分布式搜索、实时索引以及复杂的查询能力，这些特性使得它在现代互联网系统中尤为重要。...

汪子熙
发表于2025-06-02 17:33:38
1242 0 0

1.2k 0 0

Apache Solr 是一种强大而灵活的开源搜索平台，它基于 Apache Lucene 构建，专门用于处理复杂的全文搜索和信息检索任务。它在许多行业和应用场景中得到了广泛应用，尤其适合需要高效处理大规模数据查询和搜索的系统。Solr 作为一款搜索引擎，提供了高度可扩展、基于 REST API 的功能，并具备分布式搜索、实时索引以及复杂的查询能力，这些特性使得它在现代互联网系统中尤为重要。...
Apache
Apache Shiro 框架介绍
Apache Shiro 简介Apache Shiro 是一个强大且易于使用的 Java 安全框架，旨在简化应用程序的身份验证、授权、加密和会话管理。它提供了全面的安全功能，同时保持了简洁性和灵活性，适用于各种规模的应用程序，从小型独立应用到大型企业级系统。 Shiro 的核心功能Shiro 的核心功能可以归纳为四个主要方面：认证（Authentication）、授权（Authorizat...

林欣
发表于2025-05-25 18:21:03
1475 0 0

1.4k 0 0

Apache Shiro 简介Apache Shiro 是一个强大且易于使用的 Java 安全框架，旨在简化应用程序的身份验证、授权、加密和会话管理。它提供了全面的安全功能，同时保持了简洁性和灵活性，适用于各种规模的应用程序，从小型独立应用到大型企业级系统。 Shiro 的核心功能Shiro 的核心功能可以归纳为四个主要方面：认证（Authentication）、授权（Authorizat...
Apache
什么是 Apache-2.0 许可证
Apache-2.0 许可证，是 Apache 软件基金会（ASF）发布的一种开源许可证。它为用户和开发者提供了广泛的权利，使他们可以自由地使用、修改和分发软件。但与此同时，Apache-2.0 也对如何合理地运用和共享这些代码提出了一些要求。我们可以逐步剖析这个许可证的内容，从理解其法律语言的本质，到如何应用在实际的软件开发过程中，以保证项目的合规性和高效性。Apache-2.0 的基础特...

汪子熙
发表于2025-05-02 19:03:47
2392 0 0

2.3k 0 0

Apache-2.0 许可证，是 Apache 软件基金会（ASF）发布的一种开源许可证。它为用户和开发者提供了广泛的权利，使他们可以自由地使用、修改和分发软件。但与此同时，Apache-2.0 也对如何合理地运用和共享这些代码提出了一些要求。我们可以逐步剖析这个许可证的内容，从理解其法律语言的本质，到如何应用在实际的软件开发过程中，以保证项目的合规性和高效性。Apache-2.0 的基础特...
Apache

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript