- 在人工智能的浪潮中,检索增强生成(RAG)技术以其卓越的能力,成为了处理知识密集型任务的关键。它让大型语言模型(LLM)能够“博闻强识”,从海量、私有的外部知识库中获取信息,从而生成更准确、更可靠的答案。如果把RAG系统比作一位超级学霸的思考过程,那么其中的 Document(文档)、Embedding(嵌入向量) 和 Retriever(检索器) 就是构成其核心学习与回忆机制的三大支柱。本... 在人工智能的浪潮中,检索增强生成(RAG)技术以其卓越的能力,成为了处理知识密集型任务的关键。它让大型语言模型(LLM)能够“博闻强识”,从海量、私有的外部知识库中获取信息,从而生成更准确、更可靠的答案。如果把RAG系统比作一位超级学霸的思考过程,那么其中的 Document(文档)、Embedding(嵌入向量) 和 Retriever(检索器) 就是构成其核心学习与回忆机制的三大支柱。本...
- 数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度 数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
- ABoVE: Tundra Plant Functional Type Continuous-Cover, North Slope, Alaska, 2010-2015简介该数据集提供了阿拉斯加北坡约125,000平方公里苔原植物功能类型(PFT)的连续田间覆盖预测数据,分辨率为30米。数据涵盖2010年7月1日至2015年8月31日。数据采用随机森林数据挖掘算法、基于Landsat卫星观... ABoVE: Tundra Plant Functional Type Continuous-Cover, North Slope, Alaska, 2010-2015简介该数据集提供了阿拉斯加北坡约125,000平方公里苔原植物功能类型(PFT)的连续田间覆盖预测数据,分辨率为30米。数据涵盖2010年7月1日至2015年8月31日。数据采用随机森林数据挖掘算法、基于Landsat卫星观...
- dolphinScheduler一、启动dolphinScheduler修改一个配置文件 (/opt/installs/dolphinscheduler2.0.6/conf/env/dolphinscheduler_env.sh)增加spark2相关配置, 为什么是SPARK_HOME2,因为我们使用的spark2.4版本,目前ds支持两种spark版本我修改ds2.0.6下的配置文件,然后... dolphinScheduler一、启动dolphinScheduler修改一个配置文件 (/opt/installs/dolphinscheduler2.0.6/conf/env/dolphinscheduler_env.sh)增加spark2相关配置, 为什么是SPARK_HOME2,因为我们使用的spark2.4版本,目前ds支持两种spark版本我修改ds2.0.6下的配置文件,然后...
- Flink 实时数仓在 ODS 到 DWD 层处理行为日志时,需对用户属性、页面信息、地域等公共维度做退维,避免后续重复关联,提升分析效率,核心技术如下: 采用 “MySQL CDC 同步 + HBase 存储 + Flink Lookup Join” 架构:业务库(如用户注册表)通过 MySQL CDC 监听 binlog,实时同步数据至 HBase 维表;行为日志流用 Flink Looku Flink 实时数仓在 ODS 到 DWD 层处理行为日志时,需对用户属性、页面信息、地域等公共维度做退维,避免后续重复关联,提升分析效率,核心技术如下: 采用 “MySQL CDC 同步 + HBase 存储 + Flink Lookup Join” 架构:业务库(如用户注册表)通过 MySQL CDC 监听 binlog,实时同步数据至 HBase 维表;行为日志流用 Flink Looku
- Flink的复杂事件处理CEP复杂事件处理(CEP)是一种基于流处理的技术,将系统数据看作不同类型的事件,通过分析事件之间的关系,建立不同的事件关系序列库,并利用过滤、关联、聚合等技术,最终由简单事件产生高级事件,并通过模式规则的方式对重要信息进行跟踪和分析,从实时数据中发掘有价值的信息。复杂事件处理主要应用于防范网络欺诈、设备故障检测、风险规避和智能营销等领域。Flink基于DataStr... Flink的复杂事件处理CEP复杂事件处理(CEP)是一种基于流处理的技术,将系统数据看作不同类型的事件,通过分析事件之间的关系,建立不同的事件关系序列库,并利用过滤、关联、聚合等技术,最终由简单事件产生高级事件,并通过模式规则的方式对重要信息进行跟踪和分析,从实时数据中发掘有价值的信息。复杂事件处理主要应用于防范网络欺诈、设备故障检测、风险规避和智能营销等领域。Flink基于DataStr...
- 看球还能更爽?数据分析教你解锁体育赛事新体验 看球还能更爽?数据分析教你解锁体育赛事新体验
- 在大数据浪潮席卷各行各业的今天,Hadoop作为开源分布式计算的基石,早已成为企业构建数据仓库的核心引擎。然而,随着集群规模膨胀和业务复杂度攀升,我亲历过太多团队陷入“数据沼泽”的困境——数据看似丰富,却因缺乏有效治理而难以转化为可靠资产。去年在某电商平台的用户行为分析项目中,我们曾因元数据混乱导致关键报表延迟上线,业务方质疑声不断。这让我深刻意识到:数据治理不是可选项,而是Hadoop生态... 在大数据浪潮席卷各行各业的今天,Hadoop作为开源分布式计算的基石,早已成为企业构建数据仓库的核心引擎。然而,随着集群规模膨胀和业务复杂度攀升,我亲历过太多团队陷入“数据沼泽”的困境——数据看似丰富,却因缺乏有效治理而难以转化为可靠资产。去年在某电商平台的用户行为分析项目中,我们曾因元数据混乱导致关键报表延迟上线,业务方质疑声不断。这让我深刻意识到:数据治理不是可选项,而是Hadoop生态...
- ABoVE: CO2 and CH4 Fluxes and Meteorology at Flux Tower Sites, Alaska, 2015-2017简介该数据集提供阿拉斯加州巴罗(三个站点)、阿特卡苏克(ATQ)和伊沃图克(IVO)五个涡旋协方差 (EC) 塔站的二氧化碳 (CO2) 和甲烷 (CH4) 通量及气象参数。这些站点构成了一条横跨阿拉斯加北坡 300 公里的南北横断... ABoVE: CO2 and CH4 Fluxes and Meteorology at Flux Tower Sites, Alaska, 2015-2017简介该数据集提供阿拉斯加州巴罗(三个站点)、阿特卡苏克(ATQ)和伊沃图克(IVO)五个涡旋协方差 (EC) 塔站的二氧化碳 (CO2) 和甲烷 (CH4) 通量及气象参数。这些站点构成了一条横跨阿拉斯加北坡 300 公里的南北横断...
- 大数据+游戏:原来玩家的快乐还能这样被“算”出来? 大数据+游戏:原来玩家的快乐还能这样被“算”出来?
- CARVE: Alaskan Fire Emissions Database (AKFED), 2001-2013简介该数据集提供了2001年至2013年阿拉斯加州北方森林火灾年碳排放量(千克/平方米)的估算值(分辨率为450米)。为了生成这些数据,我们利用中分辨率成像光谱仪(MODIS)的图像,结合阿拉斯加大型火灾数据库的周长数据,绘制了2001年至2013年的每日过火面积。碳消耗量则利... CARVE: Alaskan Fire Emissions Database (AKFED), 2001-2013简介该数据集提供了2001年至2013年阿拉斯加州北方森林火灾年碳排放量(千克/平方米)的估算值(分辨率为450米)。为了生成这些数据,我们利用中分辨率成像光谱仪(MODIS)的图像,结合阿拉斯加大型火灾数据库的周长数据,绘制了2001年至2013年的每日过火面积。碳消耗量则利...
- 在即将发布的华为云MRS 3.6.0-LTS版本中,湖仓一体高性能交互式分析引擎HetuEngine的性能预计提升明显。1TB TPCDS总时长优化1倍(1225s->629s)。 在即将发布的华为云MRS 3.6.0-LTS版本中,湖仓一体高性能交互式分析引擎HetuEngine的性能预计提升明显。1TB TPCDS总时长优化1倍(1225s->629s)。
- 数据是新药研发的“秘密武器”?聊聊背后的那些门道 数据是新药研发的“秘密武器”?聊聊背后的那些门道
- /Aqua Granule map product V005 (AIRXAMAP) at GES DISC简介大气红外探测器 (AIRS) 是安装在第二个地球观测系统 (EOS) 极地轨道平台 EOS Aqua 上的一台光栅光谱仪 (R = 1200)。AIRS 与先进微波探测装置 (AMSU) 和巴西湿度探测器 (HSB) 结合,构成了一个由可见光、红外和微波传感器组成的创新型大气探测组... /Aqua Granule map product V005 (AIRXAMAP) at GES DISC简介大气红外探测器 (AIRS) 是安装在第二个地球观测系统 (EOS) 极地轨道平台 EOS Aqua 上的一台光栅光谱仪 (R = 1200)。AIRS 与先进微波探测装置 (AMSU) 和巴西湿度探测器 (HSB) 结合,构成了一个由可见光、红外和微波传感器组成的创新型大气探测组...
- SAFARI 2000 Vegetation and Soils, 1-Deg (Wilson and Henderson-Sellers)简介该数据集包含威尔逊和亨德森-塞勒斯全球植被与土壤 1 度数据的南部非洲子集。该数据集提供 ASCII 网格和二进制图像文件格式。威尔逊、亨德森-塞勒斯全球植被与土壤数据集是一个用于大气环流模型(GCM)的土壤类型和土地覆盖数据档案。数据整理自自然植... SAFARI 2000 Vegetation and Soils, 1-Deg (Wilson and Henderson-Sellers)简介该数据集包含威尔逊和亨德森-塞勒斯全球植被与土壤 1 度数据的南部非洲子集。该数据集提供 ASCII 网格和二进制图像文件格式。威尔逊、亨德森-塞勒斯全球植被与土壤数据集是一个用于大气环流模型(GCM)的土壤类型和土地覆盖数据档案。数据整理自自然植...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签