- 该数据要素案例由智慧芽投递并参与金猿组委会×数据猿×上海大数据联盟共同推出的《2025中国大数据产业年度数据要素价值释放案例》榜单/奖项评选。 该数据要素案例由智慧芽投递并参与金猿组委会×数据猿×上海大数据联盟共同推出的《2025中国大数据产业年度数据要素价值释放案例》榜单/奖项评选。
- 别让大数据任务“互相等着死” ——聊聊任务依赖与 DAG 设计的江湖规矩 别让大数据任务“互相等着死” ——聊聊任务依赖与 DAG 设计的江湖规矩
- 数据智能从“辅助工具”迈向“决策主体”的层级进化之路。 数据智能从“辅助工具”迈向“决策主体”的层级进化之路。
- 指标的建设对于大模型应用来说的确有用,但是建设的过程需要企业花费大量精力去梳理,落地成本较高,这个问题 Aloudata 怎么解决的呢? 指标的建设对于大模型应用来说的确有用,但是建设的过程需要企业花费大量精力去梳理,落地成本较高,这个问题 Aloudata 怎么解决的呢?
- 一、引言:当维度超越样本——高维实验的时代挑战在数字化时代,实验设计正面临维度爆炸的严峻挑战。某头部电商平台在优化首页推荐时,每个用户可同时观测:200+行为特征:点击序列、停留时长、加购频次、分享路径、设备信息50+画像标签:年龄分桶、购买力、生命周期价值、兴趣偏好、社交影响力100+ contextual变量:时段、季节、促销类型、竞品动态、天气数据实时交互变量:滑动速度、页面滚动深度... 一、引言:当维度超越样本——高维实验的时代挑战在数字化时代,实验设计正面临维度爆炸的严峻挑战。某头部电商平台在优化首页推荐时,每个用户可同时观测:200+行为特征:点击序列、停留时长、加购频次、分享路径、设备信息50+画像标签:年龄分桶、购买力、生命周期价值、兴趣偏好、社交影响力100+ contextual变量:时段、季节、促销类型、竞品动态、天气数据实时交互变量:滑动速度、页面滚动深度...
- 在 Hive 的世界里,JOIN 就像是数据间的红线,把原本分散在各自表里的信息串联起来。无论是内连接、外连接,还是 Hive 特有的左半连接,都各有“武功招式”,适用于不同场景。 在 Hive 的世界里,JOIN 就像是数据间的红线,把原本分散在各自表里的信息串联起来。无论是内连接、外连接,还是 Hive 特有的左半连接,都各有“武功招式”,适用于不同场景。
- Hive 查询不仅能查,还能查得漂亮、高效。我们这次聚焦 HQL 中的高级技巧——从 ORDER BY 到 SORT BY、DISTRIBUTE BY 与 CLUSTER BY,带你理解排序在分布式环境中的执行逻辑;再深入讲解 UNION 与 CTE 等查询组织方式,帮你将复杂 SQL 拆解得更清晰。我还特意写了丰富示例与实战练习,适合正在提升 Hive 查询能力的你阅读、收藏和练习。 Hive 查询不仅能查,还能查得漂亮、高效。我们这次聚焦 HQL 中的高级技巧——从 ORDER BY 到 SORT BY、DISTRIBUTE BY 与 CLUSTER BY,带你理解排序在分布式环境中的执行逻辑;再深入讲解 UNION 与 CTE 等查询组织方式,帮你将复杂 SQL 拆解得更清晰。我还特意写了丰富示例与实战练习,适合正在提升 Hive 查询能力的你阅读、收藏和练习。
- 在 Hive 中,写好一条 INSERT,远不止“把数据塞进去”那么简单。本文将用清晰的语法讲解和实用案例,带你一步步掌握 LOAD DATA、INSERT ... SELECT、动态分区、CTAS 等核心用法。从数据导入、表间写入到多表分发、HDFS 导出,覆盖 Hive DML 的关键技能,让你的数据处理更高效、更得心应手。 在 Hive 中,写好一条 INSERT,远不止“把数据塞进去”那么简单。本文将用清晰的语法讲解和实用案例,带你一步步掌握 LOAD DATA、INSERT ... SELECT、动态分区、CTAS 等核心用法。从数据导入、表间写入到多表分发、HDFS 导出,覆盖 Hive DML 的关键技能,让你的数据处理更高效、更得心应手。
- NPP Tropical Forest: Darien, Panama, 1967-1968, R1简介该净初级生产力(NPP)数据集包含一个 ASCII 文件(.txt 格式)。数据文件包含巴拿马达连省拉拉河(雨季样地)和萨瓦纳河(旱季样地)过渡性湿润/干旱热带森林的地上和地下生物量、凋落物量、叶面积指数(LAI)、植被/土壤微量元素含量(磷、钾、钙、镁等)以及地上净初级生产力(ANPP... NPP Tropical Forest: Darien, Panama, 1967-1968, R1简介该净初级生产力(NPP)数据集包含一个 ASCII 文件(.txt 格式)。数据文件包含巴拿马达连省拉拉河(雨季样地)和萨瓦纳河(旱季样地)过渡性湿润/干旱热带森林的地上和地下生物量、凋落物量、叶面积指数(LAI)、植被/土壤微量元素含量(磷、钾、钙、镁等)以及地上净初级生产力(ANPP...
- NPP Grassland: Dickinson, USA, 1970, R1简介该数据集包含三个 ASCII 文件(.txt 格式)。其中两个文件包含北部混合草原的地上和地下生物量及生产力数据,一个文件对应未放牧处理,另一个文件对应重度放牧处理。研究地点(北纬 46.90 度,西经 102.82 度,海拔 784 米)位于北部大平原,靠近迪金森市,距北达科他州俾斯麦市以西约 160 公里... NPP Grassland: Dickinson, USA, 1970, R1简介该数据集包含三个 ASCII 文件(.txt 格式)。其中两个文件包含北部混合草原的地上和地下生物量及生产力数据,一个文件对应未放牧处理,另一个文件对应重度放牧处理。研究地点(北纬 46.90 度,西经 102.82 度,海拔 784 米)位于北部大平原,靠近迪金森市,距北达科他州俾斯麦市以西约 160 公里...
- Hive 中的表是数据仓库的核心容器,定义了数据的结构和存储方式。本文系统讲解了 Hive 中创建表的语法与关键参数,包括字段类型、分隔符设置、SerDe 使用等内容,特别通过结构化与复杂数据类型(如 ARRAY、MAP、STRUCT)的案例讲解,让读者理解如何让 Hive 正确“读懂”你的数据。配合常见示例与练习题,帮你打好 Hive 表设计的基础,轻松驾驭文本、JSON 等多格式数据。数据如何 Hive 中的表是数据仓库的核心容器,定义了数据的结构和存储方式。本文系统讲解了 Hive 中创建表的语法与关键参数,包括字段类型、分隔符设置、SerDe 使用等内容,特别通过结构化与复杂数据类型(如 ARRAY、MAP、STRUCT)的案例讲解,让读者理解如何让 Hive 正确“读懂”你的数据。配合常见示例与练习题,帮你打好 Hive 表设计的基础,轻松驾驭文本、JSON 等多格式数据。数据如何
- Hive 中的数据库(Schema)是构建数据仓库的基础单位。这次我们来了解 Hive 中创建、查看、切换、修改与删除数据库的 DDL 操作语法与用法,涵盖 COMMENT、LOCATION、DBPROPERTIES 等常用参数,辅以丰富示例与练习,助你扎实掌握 Hive 数据库管理核心能力。 Hive 中的数据库(Schema)是构建数据仓库的基础单位。这次我们来了解 Hive 中创建、查看、切换、修改与删除数据库的 DDL 操作语法与用法,涵盖 COMMENT、LOCATION、DBPROPERTIES 等常用参数,辅以丰富示例与练习,助你扎实掌握 Hive 数据库管理核心能力。
- 别让大数据“全表扫描”掏空你:数据分区策略与分区裁剪的实战心经 别让大数据“全表扫描”掏空你:数据分区策略与分区裁剪的实战心经
- 数据仓库不是数据库的升级,而是面向决策的大脑。本篇带你快速厘清数据库 vs 数仓、分层架构逻辑、ETL/ELT区别,轻松建立数据思维骨架。 数据仓库不是数据库的升级,而是面向决策的大脑。本篇带你快速厘清数据库 vs 数仓、分层架构逻辑、ETL/ELT区别,轻松建立数据思维骨架。
- 在数据民主化时代,选择一款“可信、灵活、高效、安全”的智能问数 Agent,不仅是技术升级,更是企业迈向智能决策的关键一步。 在数据民主化时代,选择一款“可信、灵活、高效、安全”的智能问数 Agent,不仅是技术升级,更是企业迈向智能决策的关键一步。
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签