- 梯度下降(Gradient Descent)是机器学习和深度学习中最常用的优化算法之一,其目标是通过迭代更新模型参数以最小化损失函数。反向传播(Backpropagation)为梯度计算提供了高效的实现方式,而随机梯度下降(Stochastic Gradient Descent, SGD)则通过随机采样显著提升了大规模数据集上的训练效率。本文将深入探讨梯度下降、反向传播和SGD的核心原理、技... 梯度下降(Gradient Descent)是机器学习和深度学习中最常用的优化算法之一,其目标是通过迭代更新模型参数以最小化损失函数。反向传播(Backpropagation)为梯度计算提供了高效的实现方式,而随机梯度下降(Stochastic Gradient Descent, SGD)则通过随机采样显著提升了大规模数据集上的训练效率。本文将深入探讨梯度下降、反向传播和SGD的核心原理、技...
- 随着人工智能系统在医疗、金融、司法等关键领域的深度渗透,模型决策的透明度成为其可信部署的核心前提。本文系统阐述可解释AI(Explainable AI, XAI)的技术内涵,重点解析局部可解释模型与全局解释性的差异,梳理主流解释性算法的原理与适用场景,并提出面向实际业务的XAI实施框架。研究表明,混合解释策略与交互式可视化工具的结合,是平衡模型性能与解释性需求的关键路径。关键词:可解释AI;... 随着人工智能系统在医疗、金融、司法等关键领域的深度渗透,模型决策的透明度成为其可信部署的核心前提。本文系统阐述可解释AI(Explainable AI, XAI)的技术内涵,重点解析局部可解释模型与全局解释性的差异,梳理主流解释性算法的原理与适用场景,并提出面向实际业务的XAI实施框架。研究表明,混合解释策略与交互式可视化工具的结合,是平衡模型性能与解释性需求的关键路径。关键词:可解释AI;...
- 本文系统梳理了深度学习领域中五大里程碑式网络架构——卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)、自注意力机制(Self-Attention)及Transformer的技术原理与工程实践。通过对比分析各架构在特征提取能力、计算效率、适用场景等方面的优劣势,结合计算机视觉、自然语言处理等领域的典型应用案例,提出面向实际业务的架构选型策略。研究结果表明,多模态融合与... 本文系统梳理了深度学习领域中五大里程碑式网络架构——卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)、自注意力机制(Self-Attention)及Transformer的技术原理与工程实践。通过对比分析各架构在特征提取能力、计算效率、适用场景等方面的优劣势,结合计算机视觉、自然语言处理等领域的典型应用案例,提出面向实际业务的架构选型策略。研究结果表明,多模态融合与...
- 深度学习领域中五大主流网络架构——卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)、自注意力机制(Self-Attention)及Transformer的技术原理、优势场景与局限性。通过对比分析其底层设计哲学、计算特性及典型应用案例,提出面向计算机视觉、自然语言处理等任务的模型选型策略。研究结果表明,混合架构设计与任务适配性优化是当前工业落地的关键方向。关键词:CN... 深度学习领域中五大主流网络架构——卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)、自注意力机制(Self-Attention)及Transformer的技术原理、优势场景与局限性。通过对比分析其底层设计哲学、计算特性及典型应用案例,提出面向计算机视觉、自然语言处理等任务的模型选型策略。研究结果表明,混合架构设计与任务适配性优化是当前工业落地的关键方向。关键词:CN...
- 面向能效和低延迟的语音控制智能家居:离线语音识别与物联网集成方案Huang P, Ullah I, Wei X, et al. Towards Energy-Efficient and Low-Latency Voice-Controlled Smart Homes: A Proposal for Offline Speech Recognition and IoT Integration... 面向能效和低延迟的语音控制智能家居:离线语音识别与物联网集成方案Huang P, Ullah I, Wei X, et al. Towards Energy-Efficient and Low-Latency Voice-Controlled Smart Homes: A Proposal for Offline Speech Recognition and IoT Integration...
- 智能家居环境中的AI决策解释:实现以人为中心的可解释性Shajalal M, Boden A, Stevens G, et al. Explaining AI Decisions: Towards Achieving Human-Centered Explainability in Smart Home Environments[C]//World Conference on Explai... 智能家居环境中的AI决策解释:实现以人为中心的可解释性Shajalal M, Boden A, Stevens G, et al. Explaining AI Decisions: Towards Achieving Human-Centered Explainability in Smart Home Environments[C]//World Conference on Explai...
- Sasha:使用大语言模型在智能家居中进行创造性目标导向推理King E, Yu H, Lee S, et al. Sasha: creative goal-oriented reasoning in smart homes with large language models[J]. Proceedings of the ACM on Interactive, Mobile, Weara... Sasha:使用大语言模型在智能家居中进行创造性目标导向推理King E, Yu H, Lee S, et al. Sasha: creative goal-oriented reasoning in smart homes with large language models[J]. Proceedings of the ACM on Interactive, Mobile, Weara...
- 边缘云系统的灵活可变速率图像特征压缩Hossain M A F, Duan Z, Huang Y, et al. Flexible variable-rate image feature compression for edge-cloud systems[C]//2023 IEEE International Conference on Multimedia and Expo Works... 边缘云系统的灵活可变速率图像特征压缩Hossain M A F, Duan Z, Huang Y, et al. Flexible variable-rate image feature compression for edge-cloud systems[C]//2023 IEEE International Conference on Multimedia and Expo Works...
- WorldSimBench: 迈向作为世界模拟器的视频生成模型Qin Y, Shi Z, Yu J, et al. Worldsimbench: Towards video generation models as world simulators[J]. arXiv preprint arXiv:2410.18072, 2024. 1. 引言与研究背景在采取行动之前,人类会基于目标和对当... WorldSimBench: 迈向作为世界模拟器的视频生成模型Qin Y, Shi Z, Yu J, et al. Worldsimbench: Towards video generation models as world simulators[J]. arXiv preprint arXiv:2410.18072, 2024. 1. 引言与研究背景在采取行动之前,人类会基于目标和对当...
- Stable Video Diffusion:将潜在视频扩散模型扩展到大规模数据集Blattmann A, Dockhorn T, Kulal S, et al. Stable video diffusion: Scaling latent video diffusion models to large datasets[J]. arXiv preprint arXiv:2311.1512... Stable Video Diffusion:将潜在视频扩散模型扩展到大规模数据集Blattmann A, Dockhorn T, Kulal S, et al. Stable video diffusion: Scaling latent video diffusion models to large datasets[J]. arXiv preprint arXiv:2311.1512...
- 该方法在继承 Transformer 模型强大建模能力的同时,结合古籍特有的稀疏结构与复杂布局特点,设计了多项创新机制。其核心目标是:在有限训练数据下,依旧能够实现对古籍逻辑结构(如段落、标题、注释)与物理结构(如文字块、插图、边框)的精准识别与定位。 该方法在继承 Transformer 模型强大建模能力的同时,结合古籍特有的稀疏结构与复杂布局特点,设计了多项创新机制。其核心目标是:在有限训练数据下,依旧能够实现对古籍逻辑结构(如段落、标题、注释)与物理结构(如文字块、插图、边框)的精准识别与定位。
- Phi-4 技术报告深度解读Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 引言:小模型的强大潜能微软研究院在2024年12月发布的 phi-4 是一个仅有140亿参数的语言模型,却在多个推理任务上展现出与千亿参数级别模型相媲美的性能。这个成... Phi-4 技术报告深度解读Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 引言:小模型的强大潜能微软研究院在2024年12月发布的 phi-4 是一个仅有140亿参数的语言模型,却在多个推理任务上展现出与千亿参数级别模型相媲美的性能。这个成...
- Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前... Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前...
- Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前... Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前...
- EdgeMark:嵌入式人工智能工具的自动化与基准测试系统Wang X, Jia W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies[J]. arXiv preprint arXiv:2501.03265, 2025. 1. 引言与背景人工智能技术的快速发展正在从根本上改变数... EdgeMark:嵌入式人工智能工具的自动化与基准测试系统Wang X, Jia W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies[J]. arXiv preprint arXiv:2501.03265, 2025. 1. 引言与背景人工智能技术的快速发展正在从根本上改变数...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签