- 神经正切核(NTK)视角下的无限宽网络训练动力学 引言在深度学习理论研究中,理解神经网络在训练过程中的行为一直是一个核心挑战。传统的神经网络分析往往依赖于启发式方法和经验观察,而缺乏严格的数学框架。近年来,神经正切核(Neural Tangent Kernel, NTK)理论的出现为我们提供了全新的视角,特别是在研究无限宽神经网络时,这一理论揭示了深度学习训练动力学的深刻数学本质。NTK理... 神经正切核(NTK)视角下的无限宽网络训练动力学 引言在深度学习理论研究中,理解神经网络在训练过程中的行为一直是一个核心挑战。传统的神经网络分析往往依赖于启发式方法和经验观察,而缺乏严格的数学框架。近年来,神经正切核(Neural Tangent Kernel, NTK)理论的出现为我们提供了全新的视角,特别是在研究无限宽神经网络时,这一理论揭示了深度学习训练动力学的深刻数学本质。NTK理...
- LBA-ECO ND-08 Biomass, Nutrients, and Decomposition in Eucalyptus and Primary Forests简介本数据集报告了 1999 年至 2001 年间在巴西帕拉州蒙特杜拉多市 Jari Celulose 公司采集的样本中,根、凋落物、叶片和枝条中氮(N)、磷(P)、镁(Mg)、钙(Ca)和钾(K)的浓度,细根和凋落物的生... LBA-ECO ND-08 Biomass, Nutrients, and Decomposition in Eucalyptus and Primary Forests简介本数据集报告了 1999 年至 2001 年间在巴西帕拉州蒙特杜拉多市 Jari Celulose 公司采集的样本中,根、凋落物、叶片和枝条中氮(N)、磷(P)、镁(Mg)、钙(Ca)和钾(K)的浓度,细根和凋落物的生...
- 持续学习中的突触重要性估计:费雪信息矩阵的近似误差持续学习是人工智能领域的一个重要研究方向,旨在使模型能够像人类一样持续学习多个任务而不会忘记之前学到的知识。在持续学习中,突触重要性估计是防止灾难性遗忘的关键技术之一。本文将深入探讨基于费雪信息矩阵的突触重要性估计方法,分析其近似误差,并提供详细的代码实例。 1. 持续学习与突触重要性估计 1.1 持续学习的挑战持续学习(Continual... 持续学习中的突触重要性估计:费雪信息矩阵的近似误差持续学习是人工智能领域的一个重要研究方向,旨在使模型能够像人类一样持续学习多个任务而不会忘记之前学到的知识。在持续学习中,突触重要性估计是防止灾难性遗忘的关键技术之一。本文将深入探讨基于费雪信息矩阵的突触重要性估计方法,分析其近似误差,并提供详细的代码实例。 1. 持续学习与突触重要性估计 1.1 持续学习的挑战持续学习(Continual...
- 一、引言1.1 智慧物流的重要性鸿蒙物流运输平台是现代供应链的核心基础设施,通过实时货物追踪、智能路线优化和高效司机调度三大核心能力,构建数字化、智能化、可视化的现代物流体系。在中国物流市场规模达15万亿元的背景下,鸿蒙系统凭借分布式能力和端云协同优势,为物流行业提供技术领先的智能化解决方案。1.2 技术价值与市场分析class LogisticsMarketAnalysis { /*... 一、引言1.1 智慧物流的重要性鸿蒙物流运输平台是现代供应链的核心基础设施,通过实时货物追踪、智能路线优化和高效司机调度三大核心能力,构建数字化、智能化、可视化的现代物流体系。在中国物流市场规模达15万亿元的背景下,鸿蒙系统凭借分布式能力和端云协同优势,为物流行业提供技术领先的智能化解决方案。1.2 技术价值与市场分析class LogisticsMarketAnalysis { /*...
- 新加坡国立大学研究发现,扩散语言模型(DLM)在有限数据下表现卓越,重复训练480次性能仍不饱和,数据潜力超自回归模型3倍,为破解AI“数据饥渴”难题提供新路径。 新加坡国立大学研究发现,扩散语言模型(DLM)在有限数据下表现卓越,重复训练480次性能仍不饱和,数据潜力超自回归模型3倍,为破解AI“数据饥渴”难题提供新路径。
- 对比学习下游任务性能的信息论下界研究 引言对比学习作为自监督学习的重要范式,在过去几年中取得了显著成功。其核心思想是通过学习数据样本之间的相似性和差异性,将语义相似的样本在嵌入空间中拉近,将不相似的样本推远。然而,一个关键的理论问题一直困扰着研究者:对比学习在下游任务上的性能是否存在理论下界?这个下界由什么因素决定?信息论为我们理解这个问题提供了有力的工具框架。通过分析对比学习过程中的信息... 对比学习下游任务性能的信息论下界研究 引言对比学习作为自监督学习的重要范式,在过去几年中取得了显著成功。其核心思想是通过学习数据样本之间的相似性和差异性,将语义相似的样本在嵌入空间中拉近,将不相似的样本推远。然而,一个关键的理论问题一直困扰着研究者:对比学习在下游任务上的性能是否存在理论下界?这个下界由什么因素决定?信息论为我们理解这个问题提供了有力的工具框架。通过分析对比学习过程中的信息...
- 在AI时代,专属“数字分身”正从科幻走向现实。依托Qwen2.5-14B大模型、LoRA微调技术及LLaMA-Factory Online平台,仅需四步即可打造会说话、懂风格、能办事的个性化AI助手,让每个人拥有自己的“贾维斯”。 在AI时代,专属“数字分身”正从科幻走向现实。依托Qwen2.5-14B大模型、LoRA微调技术及LLaMA-Factory Online平台,仅需四步即可打造会说话、懂风格、能办事的个性化AI助手,让每个人拥有自己的“贾维斯”。
- CANN训练营实战指南:从算子分析到核函数定义的完整开发流程训练营简介2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。 完成Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。 本次训练营依托CANN全面开源开放,推出四大定制化专题... CANN训练营实战指南:从算子分析到核函数定义的完整开发流程训练营简介2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。 完成Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。 本次训练营依托CANN全面开源开放,推出四大定制化专题...
- 昇腾AI开发者必看:CANN训练营四大专题课程详解与学习路径训练营简介与报名信息2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机、平板、开发板等大奖。报名链接: https://www.hiasce... 昇腾AI开发者必看:CANN训练营四大专题课程详解与学习路径训练营简介与报名信息2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机、平板、开发板等大奖。报名链接: https://www.hiasce...
- 2025昇腾CANN训练营第二季:0基础入门Ascend C算子开发全攻略报名链接: https://www.hiascend.com/developer/activities/cann20252#cann-camp-2502-intro 训练营简介:2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速... 2025昇腾CANN训练营第二季:0基础入门Ascend C算子开发全攻略报名链接: https://www.hiascend.com/developer/activities/cann20252#cann-camp-2502-intro 训练营简介:2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速...
- 联邦学习中的模型异构性:个性化聚合算法收敛界综述 1 引言联邦学习作为一种新兴的分布式机器学习范式,能够在保护数据隐私的前提下,利用分布在多个设备或机构的数据协同训练模型。其核心理念是数据不动模型动,即原始数据保留在本地,仅通过交换模型参数或梯度更新来实现协同训练。然而,联邦学习在实际部署中面临诸多挑战,其中模型异构性是一个关键问题。模型异构性指的是联邦学习中不同客户端由于数据分布、系统资... 联邦学习中的模型异构性:个性化聚合算法收敛界综述 1 引言联邦学习作为一种新兴的分布式机器学习范式,能够在保护数据隐私的前提下,利用分布在多个设备或机构的数据协同训练模型。其核心理念是数据不动模型动,即原始数据保留在本地,仅通过交换模型参数或梯度更新来实现协同训练。然而,联邦学习在实际部署中面临诸多挑战,其中模型异构性是一个关键问题。模型异构性指的是联邦学习中不同客户端由于数据分布、系统资...
- 大语言模型涌现能力的可解释性:临界现象还是度量假象? 引言:当"涌现"成为热词2022 年以来,随着 GPT-3.5/4、PaLM、Claude 等千亿级模型的发布,"Emergent Abilities(涌现能力)"一词几乎成了大模型营销的标配:模型规模突破某临界点后,突然就会做加减法、写代码、解逻辑题。学术圈却出现了两种针锋相对的声音:临界派(Criticality Hypothesi... 大语言模型涌现能力的可解释性:临界现象还是度量假象? 引言:当"涌现"成为热词2022 年以来,随着 GPT-3.5/4、PaLM、Claude 等千亿级模型的发布,"Emergent Abilities(涌现能力)"一词几乎成了大模型营销的标配:模型规模突破某临界点后,突然就会做加减法、写代码、解逻辑题。学术圈却出现了两种针锋相对的声音:临界派(Criticality Hypothesi...
- 当电竞遇上大数据:原来高手是“算”出来的 当电竞遇上大数据:原来高手是“算”出来的
- 别再靠“经验救火”了:用运维数据 + 机器学习,让系统自己告诉你问题在哪 别再靠“经验救火”了:用运维数据 + 机器学习,让系统自己告诉你问题在哪
- 从VAE到Diffusion:生成模型演进背后的概率图视角 引言生成模型是人工智能领域最令人兴奋的方向之一,其目标是从训练数据中学习潜在分布,并生成新的样本。从变分自编码器(VAE)到扩散模型(Diffusion Models),这一演进历程不仅带来了生成质量的飞跃,更体现了概率图模型思想的深化发展。本文将从概率图的视角,深入剖析这一演进路径的内在逻辑,并提供详细的代码实现。 概率图模型基... 从VAE到Diffusion:生成模型演进背后的概率图视角 引言生成模型是人工智能领域最令人兴奋的方向之一,其目标是从训练数据中学习潜在分布,并生成新的样本。从变分自编码器(VAE)到扩散模型(Diffusion Models),这一演进历程不仅带来了生成质量的飞跃,更体现了概率图模型思想的深化发展。本文将从概率图的视角,深入剖析这一演进路径的内在逻辑,并提供详细的代码实现。 概率图模型基...
上滑加载中
推荐直播
-
华为云码道 × 仓颉编程:工程化AI编码探索2026/05/27 周三 19:00-21:00
刘俊杰-华为云仓颉语言专家/李炎-华为云码道技术专家/王智鹏-OpenCangjie开源社区发起人
本场直播围绕华为云仓颉语言与华为云码道的深度结合,展示华为云智能编程从零基础到高效落地的完整生态能力。以华为云码道为引擎,仓颉语言为载体,带给大家日常提效、趣味创新到极速量产的开发体验。
回顾中
热门标签