- Seq2Seq 架构RNN 和 LSTM 处理序列数据。这些模型在三类任务中表现出色多对一(Many-to-One):将整个序列信息压缩成一个特征向量,用于文本分类、情感分析等任务。多对多(Many-to-Many, Aligned):为输入序列的每一个词元(Token)都生成一个对应的输出,如词性标注、命名实体识别等。一对多(One-to-Many):从一个固定的输入(如一张图片、一个类... Seq2Seq 架构RNN 和 LSTM 处理序列数据。这些模型在三类任务中表现出色多对一(Many-to-One):将整个序列信息压缩成一个特征向量,用于文本分类、情感分析等任务。多对多(Many-to-Many, Aligned):为输入序列的每一个词元(Token)都生成一个对应的输出,如词性标注、命名实体识别等。一对多(One-to-Many):从一个固定的输入(如一张图片、一个类...
- 从零实现一个 RNN RNN 公式简化为了与后续的代码实现保持一致,此处采用一个不含偏置项(bias)的简化版 RNN,核心计算公式如下:ht=tanh(Uxt+Wht−1)h_t = \tanh(U x_t + W h_{t-1})ht=tanh(Uxt+Wht−1)其中, hth_tht 是当前时刻的隐藏状态, xtx_txt 是当前输入, ht−1h_{t-1}ht−1... 从零实现一个 RNN RNN 公式简化为了与后续的代码实现保持一致,此处采用一个不含偏置项(bias)的简化版 RNN,核心计算公式如下:ht=tanh(Uxt+Wht−1)h_t = \tanh(U x_t + W h_{t-1})ht=tanh(Uxt+Wht−1)其中, hth_tht 是当前时刻的隐藏状态, xtx_txt 是当前输入, ht−1h_{t-1}ht−1...
- 概述Word2Vec 通常被认为是一种浅层神经网络模型(Shallow Neural Network)。其"浅层"体现在网络结构的简单性上,它移除了传统神经概率语言模型(NNLM)中计算昂贵的非线性隐藏层,直接将投影层与输出层相连。这种简洁的设计使得 Word2Vec 的计算非常高效,从而能够在大规模语料库上进行训练。 目标与手段分离理解Word2Vec的关键在于区分其最终目标与实现手段。... 概述Word2Vec 通常被认为是一种浅层神经网络模型(Shallow Neural Network)。其"浅层"体现在网络结构的简单性上,它移除了传统神经概率语言模型(NNLM)中计算昂贵的非线性隐藏层,直接将投影层与输出层相连。这种简洁的设计使得 Word2Vec 的计算非常高效,从而能够在大规模语料库上进行训练。 目标与手段分离理解Word2Vec的关键在于区分其最终目标与实现手段。...
- 反向传播算法是神经网络中用于训练的核心算法,它通过计算损失函数相对于网络参数的梯度来更新参数,从而最小化损失函数。这个过程涉及到了复杂的数学运算,但其基本思想是利用链式法则来高效地计算这些梯度。通过反向传播,神经网络能够从输出层向输入层逐层调整权重,以提高模型的预测准确性。 反向传播算法的基本原理反向传播算法的执行可以分为两个主要阶段:前向传播和反向传播。前向传播:在这个阶段,输入数据被送入... 反向传播算法是神经网络中用于训练的核心算法,它通过计算损失函数相对于网络参数的梯度来更新参数,从而最小化损失函数。这个过程涉及到了复杂的数学运算,但其基本思想是利用链式法则来高效地计算这些梯度。通过反向传播,神经网络能够从输出层向输入层逐层调整权重,以提高模型的预测准确性。 反向传播算法的基本原理反向传播算法的执行可以分为两个主要阶段:前向传播和反向传播。前向传播:在这个阶段,输入数据被送入...
- 卷积操作(Convolution)在数学、信号处理、图像处理以及深度学习领域都有广泛的应用。它是一种数学运算,用于将两个函数或信号合并成一个新的函数或信号,表示其中一个函数如何修改另一个函数。在不同领域,卷积操作的具体实现和应用可能有所不同,但基本的数学原理是相通的。 定义和数学表达在数学上,两个实数函数 f 和 g 的卷积定义为:(f * g)(t) = ∫f(τ)g(t - τ)dτ,其... 卷积操作(Convolution)在数学、信号处理、图像处理以及深度学习领域都有广泛的应用。它是一种数学运算,用于将两个函数或信号合并成一个新的函数或信号,表示其中一个函数如何修改另一个函数。在不同领域,卷积操作的具体实现和应用可能有所不同,但基本的数学原理是相通的。 定义和数学表达在数学上,两个实数函数 f 和 g 的卷积定义为:(f * g)(t) = ∫f(τ)g(t - τ)dτ,其...
- 卷积神经网络是一种深度学习模型,它在处理具有网格拓扑结构的数据,如图像(2D网格)和音频(1D网格)时,表现出色。CNN 通过模仿生物视觉系统的工作原理,能够从图像中自动学习和提取有用的特征,这一能力使其成为视觉识别任务中的首选模型。 CNN 的关键构件卷积层:这是 CNN 的核心,负责从输入图像中提取特征。每个卷积层包含若干卷积核,这些卷积核通过在输入数据上滑动并计算核与数据的点积,从而产... 卷积神经网络是一种深度学习模型,它在处理具有网格拓扑结构的数据,如图像(2D网格)和音频(1D网格)时,表现出色。CNN 通过模仿生物视觉系统的工作原理,能够从图像中自动学习和提取有用的特征,这一能力使其成为视觉识别任务中的首选模型。 CNN 的关键构件卷积层:这是 CNN 的核心,负责从输入图像中提取特征。每个卷积层包含若干卷积核,这些卷积核通过在输入数据上滑动并计算核与数据的点积,从而产...
- 在深度学习中,尤其是在卷积神经网络(CNN)的结构里,池化层(Pooling Layer)扮演着重要的角色。池化层通常跟在卷积层之后,其主要目的是减少卷积层输出的特征图(Feature Maps)的空间大小,同时保留最重要的信息。这一过程不仅有助于减少计算量,还能提高模型的泛化能力,减少过拟合的风险。 池化层的工作原理池化层通过对输入特征图的每个小区域进行下采样(subsampling)或池... 在深度学习中,尤其是在卷积神经网络(CNN)的结构里,池化层(Pooling Layer)扮演着重要的角色。池化层通常跟在卷积层之后,其主要目的是减少卷积层输出的特征图(Feature Maps)的空间大小,同时保留最重要的信息。这一过程不仅有助于减少计算量,还能提高模型的泛化能力,减少过拟合的风险。 池化层的工作原理池化层通过对输入特征图的每个小区域进行下采样(subsampling)或池...
- 全连接层是深度学习中常见的一种网络层,特别是在卷积神经网络(CNN)中。在这个层中,神经元与前一层中的每一个神经元都有连接,因此称为全连接。全连接层的主要作用是对前面卷积层或池化层提取到的特征进行整合,并最终输出一个固定大小的向量。这个向量通常用于分类或回归任务的最终决策。 全连接层的工作机制全连接层的工作原理基于线性变换和激活函数。具体来说,它将输入特征向量与权重矩阵相乘,再加上一个偏置项... 全连接层是深度学习中常见的一种网络层,特别是在卷积神经网络(CNN)中。在这个层中,神经元与前一层中的每一个神经元都有连接,因此称为全连接。全连接层的主要作用是对前面卷积层或池化层提取到的特征进行整合,并最终输出一个固定大小的向量。这个向量通常用于分类或回归任务的最终决策。 全连接层的工作机制全连接层的工作原理基于线性变换和激活函数。具体来说,它将输入特征向量与权重矩阵相乘,再加上一个偏置项...
- 在深入探讨卷积层如何提取图片中的特征之前,我们需要理解卷积神经网络(CNN)在图像处理中的核心作用。CNN 是一种专门为处理具有类似网格结构的数据设计的神经网络,例如图像数据,可以视为一个二维的像素网格。卷积层,作为 CNN 的基础构件,通过卷积操作来提取图片中的低级到高级特征,这些特征对于图像的分类、识别等任务至关重要。 卷积层的工作原理卷积层工作的基本单位是 卷积核 或 滤波器,它是一个... 在深入探讨卷积层如何提取图片中的特征之前,我们需要理解卷积神经网络(CNN)在图像处理中的核心作用。CNN 是一种专门为处理具有类似网格结构的数据设计的神经网络,例如图像数据,可以视为一个二维的像素网格。卷积层,作为 CNN 的基础构件,通过卷积操作来提取图片中的低级到高级特征,这些特征对于图像的分类、识别等任务至关重要。 卷积层的工作原理卷积层工作的基本单位是 卷积核 或 滤波器,它是一个...
- 大模型中的“自组织临界性”:智能涌现的统计物理机制 摘要随着大规模语言模型的参数量突破千亿级别,研究者们开始从复杂系统的视角审视智能涌现现象。本文探讨了大模型训练动态与“自组织临界性”理论之间的深刻联系,提出了智能涌现可能遵循类似沙堆崩塌的统计物理机制。我们将通过理论分析和代码实验,揭示大模型如何通过简单的梯度下降达到临界状态,从而产生突现能力。 一、自组织临界性:从沙堆模型到神经网络 1... 大模型中的“自组织临界性”:智能涌现的统计物理机制 摘要随着大规模语言模型的参数量突破千亿级别,研究者们开始从复杂系统的视角审视智能涌现现象。本文探讨了大模型训练动态与“自组织临界性”理论之间的深刻联系,提出了智能涌现可能遵循类似沙堆崩塌的统计物理机制。我们将通过理论分析和代码实验,揭示大模型如何通过简单的梯度下降达到临界状态,从而产生突现能力。 一、自组织临界性:从沙堆模型到神经网络 1...
- 当算力变成“新石油”:AI 芯片的战争、底层逻辑与未来爆点 当算力变成“新石油”:AI 芯片的战争、底层逻辑与未来爆点
- 一、引言:当观测不等于真实——测量误差的幽灵在因果推断的理想世界中,我们假设能够精确观测所有变量。然而,真实业务与科研场景充斥着测量误差:医疗场景:患者自我报告的"每日吸烟量"与实际生化指标存在30-50%偏差经济研究:企业申报的"研发投入"与真实支出因会计准则差异偏离20%用户行为:APP记录的"使用时长"因后台运行、统计口径问题虚高40%临床试验:血压测量因"白大褂效应"单次读数波动达... 一、引言:当观测不等于真实——测量误差的幽灵在因果推断的理想世界中,我们假设能够精确观测所有变量。然而,真实业务与科研场景充斥着测量误差:医疗场景:患者自我报告的"每日吸烟量"与实际生化指标存在30-50%偏差经济研究:企业申报的"研发投入"与真实支出因会计准则差异偏离20%用户行为:APP记录的"使用时长"因后台运行、统计口径问题虚高40%临床试验:血压测量因"白大褂效应"单次读数波动达...
- Ascend CANN 深度算子开发实践:以 Conv2D 为例解析架构原理与实战【华为根技术】卷积运算(Conv2D)是计算机视觉与深度学习模型中最具代表性、计算最密集的核心算子之一。从经典的 ResNet 到前沿的 Vision Transformer,卷积层始终是模型效率和性能的关键决定因素。在 GPU 上,你可以依赖 cuDNN;在 CPU 上,可以调用 OneDNN。但在昇腾(A... Ascend CANN 深度算子开发实践:以 Conv2D 为例解析架构原理与实战【华为根技术】卷积运算(Conv2D)是计算机视觉与深度学习模型中最具代表性、计算最密集的核心算子之一。从经典的 ResNet 到前沿的 Vision Transformer,卷积层始终是模型效率和性能的关键决定因素。在 GPU 上,你可以依赖 cuDNN;在 CPU 上,可以调用 OneDNN。但在昇腾(A...
- 神经符号混合架构:破解大模型“黑箱”的新思路 引言:大模型的“黑箱”困境当前的大型语言模型在感知和生成能力上取得了令人瞩目的成就,但它们的推理过程仍然是一个不透明的“黑箱”。这种黑箱特性带来了三大关键问题:可解释性缺失、逻辑推理薄弱和事实一致性差。神经符号混合架构(Neural-Symbolic AI)正在成为破解这一困境的突破性方向,它将神经网络的感知能力与符号系统的推理能力相结合,开辟... 神经符号混合架构:破解大模型“黑箱”的新思路 引言:大模型的“黑箱”困境当前的大型语言模型在感知和生成能力上取得了令人瞩目的成就,但它们的推理过程仍然是一个不透明的“黑箱”。这种黑箱特性带来了三大关键问题:可解释性缺失、逻辑推理薄弱和事实一致性差。神经符号混合架构(Neural-Symbolic AI)正在成为破解这一困境的突破性方向,它将神经网络的感知能力与符号系统的推理能力相结合,开辟...
- 神经辐射场(NeRF)的逆渲染:可识别性与非凸优化landscape 引言:NeRF与逆渲染的交叉领域神经辐射场(Neural Radiance Fields, NeRF)自2020年提出以来,已成为三维场景表示与视图合成的革命性技术。其核心思想是使用多层感知机(MLP)将三维坐标和观察方向映射为体积密度和颜色值。然而,逆渲染(Inverse Rendering)视角下的NeRF提出了更深... 神经辐射场(NeRF)的逆渲染:可识别性与非凸优化landscape 引言:NeRF与逆渲染的交叉领域神经辐射场(Neural Radiance Fields, NeRF)自2020年提出以来,已成为三维场景表示与视图合成的革命性技术。其核心思想是使用多层感知机(MLP)将三维坐标和观察方向映射为体积密度和颜色值。然而,逆渲染(Inverse Rendering)视角下的NeRF提出了更深...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签