- 浩瀚深度作为国内互联网流量解析与数据智能化领域的领军企业,深耕行业三十余载,持续为国内互联网提供高性能、高精度、高可靠的整体解决方案。公司业务覆盖网络可视化、AI 智能、数据治理、数据价值挖掘及安全防护,是一家集软硬件产品研发、生产、销售和服务于一体的大型高科技企业。顺水云大数据平台(StreamCloud)作为浩瀚深度自主研发的企业级的大数据平台产品,涵盖了从数据采集、数据存储、数据处理、... 浩瀚深度作为国内互联网流量解析与数据智能化领域的领军企业,深耕行业三十余载,持续为国内互联网提供高性能、高精度、高可靠的整体解决方案。公司业务覆盖网络可视化、AI 智能、数据治理、数据价值挖掘及安全防护,是一家集软硬件产品研发、生产、销售和服务于一体的大型高科技企业。顺水云大数据平台(StreamCloud)作为浩瀚深度自主研发的企业级的大数据平台产品,涵盖了从数据采集、数据存储、数据处理、...
- 随着 Apache Doris 用户群体日益壮大,许多用户反馈在学习和掌握 Doris 的过程中缺乏系统性的指导。无论是初次接触 Doris 的新手,还是希望在特定场景下深度应用的用户,都渴望一套从 0 到 1、全面覆盖的学习路径。正是基于这一需求,飞轮科技正式推出 Apache Doris & SelectDB 培训与认证。这套体系旨在为所有 Doris 用户提供完整的学习课程与实践路径,... 随着 Apache Doris 用户群体日益壮大,许多用户反馈在学习和掌握 Doris 的过程中缺乏系统性的指导。无论是初次接触 Doris 的新手,还是希望在特定场景下深度应用的用户,都渴望一套从 0 到 1、全面覆盖的学习路径。正是基于这一需求,飞轮科技正式推出 Apache Doris & SelectDB 培训与认证。这套体系旨在为所有 Doris 用户提供完整的学习课程与实践路径,...
- 数据,是有保质期的。正如冰箱里的牛奶,今天新鲜,明天可能就有点酸,后天直接倒掉。数据的价值,也会随着时间的推移而递减。过去那些“老派”的 OLAP 系统,只能批量处理账目,对实时性要求高的“流水账”就力不从心了。它们在面对高并发实时写入和复杂的分析查询时,常常会露出疲态,数据延迟、查询性能、并发处理和数据更新等问题层出不穷。当所有人都焦虑于如何让数据“快”起来的时候,Apache Doris... 数据,是有保质期的。正如冰箱里的牛奶,今天新鲜,明天可能就有点酸,后天直接倒掉。数据的价值,也会随着时间的推移而递减。过去那些“老派”的 OLAP 系统,只能批量处理账目,对实时性要求高的“流水账”就力不从心了。它们在面对高并发实时写入和复杂的分析查询时,常常会露出疲态,数据延迟、查询性能、并发处理和数据更新等问题层出不穷。当所有人都焦虑于如何让数据“快”起来的时候,Apache Doris...
- 在分布式系统中,复杂并发场景下的数据一致性与流程正确性始终是设计与实现中的核心挑战。Apache Doris 的自动分区功能正是在这一背景下应运而生。然此项技术的实现并非一蹴而就,我们面临多个层面的并发问题,包括 BE 与 FE 之间的元数据竞争、OlapTableSink 与数据发送线程的状态同步等。通过拆解与简化问题,我们设计了串行化分区创建、双重检查线程退出及基于 "锚点分区" 的引用... 在分布式系统中,复杂并发场景下的数据一致性与流程正确性始终是设计与实现中的核心挑战。Apache Doris 的自动分区功能正是在这一背景下应运而生。然此项技术的实现并非一蹴而就,我们面临多个层面的并发问题,包括 BE 与 FE 之间的元数据竞争、OlapTableSink 与数据发送线程的状态同步等。通过拆解与简化问题,我们设计了串行化分区创建、双重检查线程退出及基于 "锚点分区" 的引用...
- 在初步探索了 AI 函数的可能性之后,本次我们将目光投向两个更为核心的函数:AI_AGG 和 EMBED。我们将深入解析这两个函数的设计理念、实现原理及其在业务场景中的应用,展示 Apache Doris 如何通过原生的函数设计,将文本聚合与语义向量分析无缝集成到 SQL 中,为用户提供更强大、更易用的智能数据分析体验。AI_AGG:基于 AI 的文本聚合聚合是数据分析中最常见的操作,但如果... 在初步探索了 AI 函数的可能性之后,本次我们将目光投向两个更为核心的函数:AI_AGG 和 EMBED。我们将深入解析这两个函数的设计理念、实现原理及其在业务场景中的应用,展示 Apache Doris 如何通过原生的函数设计,将文本聚合与语义向量分析无缝集成到 SQL 中,为用户提供更强大、更易用的智能数据分析体验。AI_AGG:基于 AI 的文本聚合聚合是数据分析中最常见的操作,但如果...
- 网易云音乐基于 Apache Doris 替换了早期架构中 Kylin、Druid、Clickhouse、Elasticsearch、HBase 等引擎,统一了实时分析架构,并广泛应用于广告实时数仓、日志平台和会员报表分析等典型场景中,带来导入性能提升 3~30 倍,机器成本整体降低 55%、部分场景下高达 85%,每年节省数百万成本,综合效能提升 3~7 倍等显著收益。截止目前,已有超过 ... 网易云音乐基于 Apache Doris 替换了早期架构中 Kylin、Druid、Clickhouse、Elasticsearch、HBase 等引擎,统一了实时分析架构,并广泛应用于广告实时数仓、日志平台和会员报表分析等典型场景中,带来导入性能提升 3~30 倍,机器成本整体降低 55%、部分场景下高达 85%,每年节省数百万成本,综合效能提升 3~7 倍等显著收益。截止目前,已有超过 ...
- 引言:时序数据管理的挑战与机遇在工业4.0与物联网技术深度融合的今天,全球设备产生的时序数据量正以指数级增长。据IDC预测,到2025年物联网设备产生的数据将达79.4ZB,其中60%为时序数据。这类数据具有高频采集(毫秒级)、维度丰富(单设备数百监测点)、严格有序(时间戳为核心)等特性,传统关系型数据库在处理时面临写入吞吐不足、存储成本高企、查询效率低下等痛点。本文从大数据视角出发,结合国... 引言:时序数据管理的挑战与机遇在工业4.0与物联网技术深度融合的今天,全球设备产生的时序数据量正以指数级增长。据IDC预测,到2025年物联网设备产生的数据将达79.4ZB,其中60%为时序数据。这类数据具有高频采集(毫秒级)、维度丰富(单设备数百监测点)、严格有序(时间戳为核心)等特性,传统关系型数据库在处理时面临写入吞吐不足、存储成本高企、查询效率低下等痛点。本文从大数据视角出发,结合国...
- Apache Tomcat(简称Tomcat)是由Apache软件基金会开发的开源Web服务器和Servlet容器,实现了Java Servlet和JavaServer Pages(JSP)规范,为Java Web应用提供了"纯Java"的HTTP运行环境。Tomcat以其轻量、稳定、可扩展的特性,广泛应用于企业级Java应用部署。 Apache Tomcat(简称Tomcat)是由Apache软件基金会开发的开源Web服务器和Servlet容器,实现了Java Servlet和JavaServer Pages(JSP)规范,为Java Web应用提供了"纯Java"的HTTP运行环境。Tomcat以其轻量、稳定、可扩展的特性,广泛应用于企业级Java应用部署。
- 引言面对物联网设备产生的海量时间序列数据,传统数据库正面临前所未有的性能与架构挑战。在工业物联网、智慧城市、车联网等场景中,每秒产生数百万数据点已成为常态。据实测数据,传统关系型数据库在处理此类数据时,写入性能通常不超过1万点/秒,且存储成本居高不下。而专门设计的时序数据库如Apache IoTDB,单节点写入吞吐可达1000万点/秒以上,存储空间仅为传统方案的1/10。本文将深入解析时序... 引言面对物联网设备产生的海量时间序列数据,传统数据库正面临前所未有的性能与架构挑战。在工业物联网、智慧城市、车联网等场景中,每秒产生数百万数据点已成为常态。据实测数据,传统关系型数据库在处理此类数据时,写入性能通常不超过1万点/秒,且存储成本居高不下。而专门设计的时序数据库如Apache IoTDB,单节点写入吞吐可达1000万点/秒以上,存储空间仅为传统方案的1/10。本文将深入解析时序...
- 提到开源,很多人会立刻想到Linux——那个托起了全球互联网和超级计算机的隐形巨人。的确,Linux是开源史上最成功的项目之一。但如果你认为开源世界就等于Linux,那可能就错过了整片星空。今天,我们就来聊聊主流开源社区有哪些,它们是否都基于Linux,以及为什么在有了Linux之后,我们还需要一个如此庞大的开源生态系统。 一、 主流开源社区“群星闪耀”开源社区是开源项目协作、开发和治理的载... 提到开源,很多人会立刻想到Linux——那个托起了全球互联网和超级计算机的隐形巨人。的确,Linux是开源史上最成功的项目之一。但如果你认为开源世界就等于Linux,那可能就错过了整片星空。今天,我们就来聊聊主流开源社区有哪些,它们是否都基于Linux,以及为什么在有了Linux之后,我们还需要一个如此庞大的开源生态系统。 一、 主流开源社区“群星闪耀”开源社区是开源项目协作、开发和治理的载...
- 在数据洪流奔涌的今天,企业对实时决策的需求已从“锦上添花”变为“生死攸关”。传统批处理模式面对每秒百万级的数据洪流时,往往力不从心——延迟高、开发复杂、运维成本陡增。而Apache Flink作为新一代流处理引擎,凭借其低延迟、高吞吐的特性,正成为实时计算的首选。但真正让开发者如释重负的,是Flink SQL这一“化繁为简”的利器。它让熟悉SQL的分析师和工程师无需深入流处理底层,就能像操作... 在数据洪流奔涌的今天,企业对实时决策的需求已从“锦上添花”变为“生死攸关”。传统批处理模式面对每秒百万级的数据洪流时,往往力不从心——延迟高、开发复杂、运维成本陡增。而Apache Flink作为新一代流处理引擎,凭借其低延迟、高吞吐的特性,正成为实时计算的首选。但真正让开发者如释重负的,是Flink SQL这一“化繁为简”的利器。它让熟悉SQL的分析师和工程师无需深入流处理底层,就能像操作...
- Apache HTTP Server(简称Apache)和Apache Tomcat(简称Tomcat)虽然同属Apache软件基金会项目,但二者在设计目标、功能定位和技术架构上有显著差异。以下是两者的核心区别及适用场景的详细对比: 一、核心定位与功能差异维度Apache HTTP ServerApache Tomcat本质静态内容服务器 + 反向代理Java Web应用服务器(Servle... Apache HTTP Server(简称Apache)和Apache Tomcat(简称Tomcat)虽然同属Apache软件基金会项目,但二者在设计目标、功能定位和技术架构上有显著差异。以下是两者的核心区别及适用场景的详细对比: 一、核心定位与功能差异维度Apache HTTP ServerApache Tomcat本质静态内容服务器 + 反向代理Java Web应用服务器(Servle...
- Apache Lucene 是一个由 Apache 软件基金会维护的开源高性能、全功能信息检索库,专为文本搜索和索引设计,广泛应用于搜索引擎、内容管理系统和企业级应用中。以下从核心架构、功能特性、适用场景及优缺点四个方面进行详细介绍: 一、核心架构倒排索引(Inverted Index):Lucene 的核心数据结构,记录每个词项(Term)与包含该词项的文档(Document)之间的映射关... Apache Lucene 是一个由 Apache 软件基金会维护的开源高性能、全功能信息检索库,专为文本搜索和索引设计,广泛应用于搜索引擎、内容管理系统和企业级应用中。以下从核心架构、功能特性、适用场景及优缺点四个方面进行详细介绍: 一、核心架构倒排索引(Inverted Index):Lucene 的核心数据结构,记录每个词项(Term)与包含该词项的文档(Document)之间的映射关...
- Doris 与 ClickHouse 各有优势,但在运维效率、集群自动化能力、故障恢复机制以及开源治理模型方面,Doris 展现出了更成熟、更开放、更面向云原生架构的产品能力。对于希望构建可控、弹性、高可用分析平台的团队而言,Doris 提供了一个更具确定性和长期价值的选择。而 ClickHouse 仍是极具性能优势的分析引擎,但其闭源方向的转变可能需要用户在技术与商业之间做出更谨慎的权衡。 Doris 与 ClickHouse 各有优势,但在运维效率、集群自动化能力、故障恢复机制以及开源治理模型方面,Doris 展现出了更成熟、更开放、更面向云原生架构的产品能力。对于希望构建可控、弹性、高可用分析平台的团队而言,Doris 提供了一个更具确定性和长期价值的选择。而 ClickHouse 仍是极具性能优势的分析引擎,但其闭源方向的转变可能需要用户在技术与商业之间做出更谨慎的权衡。
- 本文展示了 Apache Doris 中,谓词过滤、LIMIT 数据裁剪、TopK 数据裁剪、JOIN 数据裁剪四种数据裁剪方式的实现策略。目前,Apache Doris 通过这四类高效的数据裁剪策略极大提升了处理数据的效率。 本文展示了 Apache Doris 中,谓词过滤、LIMIT 数据裁剪、TopK 数据裁剪、JOIN 数据裁剪四种数据裁剪方式的实现策略。目前,Apache Doris 通过这四类高效的数据裁剪策略极大提升了处理数据的效率。
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签