神经网络_标签_开发者_华为云

博客(2.3k)
视频(0)
论坛(0)
云声(0)
代码示例(0)

Mixture of Experts架构的简要解析
Mixture of Experts架构的简要解析 MoE的起源与核心思想Mixture of Experts（MoE）架构的历史可以追溯到1991年，当时Robert Jacobs、Michael Jordan、Geoffrey Hinton等人在《Neural Computation》期刊上发表了开创性论文《Adaptive Mixtures of Local Experts》。这篇论...

DuHz
发表于2025-09-10 22:24:01
2213 0 0

2.2k 0 0

Mixture of Experts架构的简要解析 MoE的起源与核心思想Mixture of Experts（MoE）架构的历史可以追溯到1991年，当时Robert Jacobs、Michael Jordan、Geoffrey Hinton等人在《Neural Computation》期刊上发表了开创性论文《Adaptive Mixtures of Local Experts》。这篇论...
机器学习深度学习神经网络网络
Transformer架构的简要解析
Transformer架构的简要解析Transformer架构自2017年诞生以来，已经彻底革新了人工智能领域，从最初的机器翻译任务扩展到几乎所有的序列建模问题。这种架构通过纯注意力机制取代了传统的循环和卷积结构，实现了前所未有的并行化能力和长距离依赖建模能力。其核心创新在于自注意力机制能够让序列中的任意两个位置直接交互，打破了RNN的序列处理瓶颈。从GPT到BERT，从ChatGPT到C...

DuHz
发表于2025-09-10 22:02:20
2005 0 0

2.0k 0 0

Transformer架构的简要解析Transformer架构自2017年诞生以来，已经彻底革新了人工智能领域，从最初的机器翻译任务扩展到几乎所有的序列建模问题。这种架构通过纯注意力机制取代了传统的循环和卷积结构，实现了前所未有的并行化能力和长距离依赖建模能力。其核心创新在于自注意力机制能够让序列中的任意两个位置直接交互，打破了RNN的序列处理瓶颈。从GPT到BERT，从ChatGPT到C...
机器学习深度学习神经网络网络
大语言模型的核心算法——简要解析
大语言模型的核心算法——简要解析 Transformer架构的数学本质与演进自注意力机制的核心原理Transformer架构的灵魂在于自注意力机制，它允许模型在处理序列中的每个元素时，动态地关注序列中的所有其他位置。从数学角度看，自注意力的计算过程可以表达为：Attention(Q,K,V)=softmax(QKTdk)V\text{Attention}(Q,K,V) = \text{s...

DuHz
发表于2025-09-10 21:26:32
617 0 0

617 0 0

大语言模型的核心算法——简要解析 Transformer架构的数学本质与演进自注意力机制的核心原理Transformer架构的灵魂在于自注意力机制，它允许模型在处理序列中的每个元素时，动态地关注序列中的所有其他位置。从数学角度看，自注意力的计算过程可以表达为：Attention(Q,K,V)=softmax(QKTdk)V\text{Attention}(Q,K,V) = \text{s...
机器学习深度学习神经网络
ProxylessNAS：直接在目标任务和硬件上进行神经架构搜索——论文解读
ProxylessNAS：直接在目标任务和硬件上进行神经架构搜索Cai H, Zhu L, Han S. Proxylessnas: Direct neural architecture search on target task and hardware[J]. arXiv preprint arXiv:1812.00332, 2018. 第一章引言与研究背景神经架构搜索（NAS）在自...

DuHz
发表于2025-09-08 23:02:51
774 0 0

774 0 0

ProxylessNAS：直接在目标任务和硬件上进行神经架构搜索Cai H, Zhu L, Han S. Proxylessnas: Direct neural architecture search on target task and hardware[J]. arXiv preprint arXiv:1812.00332, 2018. 第一章引言与研究背景神经架构搜索（NAS）在自...
嵌入式机器学习深度学习神经网络边缘计算
Edge Impulse：面向微型机器学习的MLOps平台深度解析
Edge Impulse：面向微型机器学习的MLOps平台深度解析Hymel S, Banbury C, Situnayake D, et al. Edge impulse: An mlops platform for tiny machine learning[J]. arXiv preprint arXiv:2212.03332, 2022. 一、引言与研究背景Edge Impulse...

DuHz
发表于2025-09-08 22:01:43
7621 0 0

7.6k 0 0

Edge Impulse：面向微型机器学习的MLOps平台深度解析Hymel S, Banbury C, Situnayake D, et al. Edge impulse: An mlops platform for tiny machine learning[J]. arXiv preprint arXiv:2212.03332, 2022. 一、引言与研究背景Edge Impulse...
IoT 嵌入式机器学习神经网络边缘计算
MINUN: 微控制器上的精确机器学习推理——论文解读
MINUN: 微控制器上的精确机器学习推理Jaiswal S, Goli R K K, Kumar A, et al. MinUn: Accurate ML inference on microcontrollers[C]//Proceedings of the 24th ACM SIGPLAN/SIGBED International Conference on Languages, C...

DuHz
发表于2025-09-07 13:16:00
7625 0 1

7.6k 0 1

MINUN: 微控制器上的精确机器学习推理Jaiswal S, Goli R K K, Kumar A, et al. MinUn: Accurate ML inference on microcontrollers[C]//Proceedings of the 24th ACM SIGPLAN/SIGBED International Conference on Languages, C...
IoT 嵌入式机器学习神经网络边缘计算
μNAS：面向微控制器的约束神经架构搜索——论文解读
μNAS：面向微控制器的约束神经架构搜索Liberis E, Dudziak Ł, Lane N D. μnas: Constrained neural architecture search for microcontrollers[C]//Proceedings of the 1st Workshop on Machine Learning and Systems. 2021: 70-...

DuHz
发表于2025-09-07 02:23:29
7124 0 0

7.1k 0 0

μNAS：面向微控制器的约束神经架构搜索Liberis E, Dudziak Ł, Lane N D. μnas: Constrained neural architecture search for microcontrollers[C]//Proceedings of the 1st Workshop on Machine Learning and Systems. 2021: 70-...
IoT 嵌入式深度学习神经网络边缘计算
CMSIS-NN：ARM Cortex-M处理器的高效神经网络内核——论文解读
CMSIS-NN：ARM Cortex-M处理器的高效神经网络内核Lai L, Suda N, Chandra V. Cmsis-nn: Efficient neural network kernels for arm cortex-m cpus[J]. arXiv preprint arXiv:1801.06601, 2018. 引言与背景物联网设备正在快速增长，预计到2035年将在各个...

DuHz
发表于2025-09-07 02:20:26
6840 0 0

6.8k 0 0

CMSIS-NN：ARM Cortex-M处理器的高效神经网络内核Lai L, Suda N, Chandra V. Cmsis-nn: Efficient neural network kernels for arm cortex-m cpus[J]. arXiv preprint arXiv:1801.06601, 2018. 引言与背景物联网设备正在快速增长，预计到2035年将在各个...
IoT 嵌入式深度学习神经网络边缘计算
MCUNetV2：面向微型深度学习的内存高效分块推理方法——论文解读
MCUNetV2：面向微型深度学习的内存高效分块推理方法Ji Lin, Wei-Ming Chen, Han Cai, Chuang Gan, and Song Han. 2021. MCUNetV2: memory-efficient patch-based inference for tiny deep learning. In Proceedings of the 35th Inte...

DuHz
发表于2025-09-06 21:53:04
923 0 1

923 0 1

MCUNetV2：面向微型深度学习的内存高效分块推理方法Ji Lin, Wei-Ming Chen, Han Cai, Chuang Gan, and Song Han. 2021. MCUNetV2: memory-efficient patch-based inference for tiny deep learning. In Proceedings of the 35th Inte...
嵌入式机器学习深度学习神经网络边缘计算
TensorFlow Lite Micro：嵌入式TinyML系统上的机器学习推理框架深度解析——论文解读
TensorFlow Lite Micro：嵌入式TinyML系统上的机器学习推理框架深度解析David R, Duke J, Jain A, et al. Tensorflow lite micro: Embedded machine learning for tinyml systems[J]. Proceedings of machine learning and systems, ...

DuHz
发表于2025-09-06 21:46:27
998 0 1

998 0 1

TensorFlow Lite Micro：嵌入式TinyML系统上的机器学习推理框架深度解析David R, Duke J, Jain A, et al. Tensorflow lite micro: Embedded machine learning for tinyml systems[J]. Proceedings of machine learning and systems, ...
TensorFlow 嵌入式机器学习神经网络边缘计算
液体神经网络详解：原理与应用
一、液体神经网络是什么？为什么值得关注· 液体神经网络（Liquid Neural Networks, LNN）的核心思想是用连续时间的微分方程来描述神经元状态随输入而变的动态，并允许时间常数随输入自适应（“液体”）。这类模型最早以 Liquid Time-Constant (LTC) 形式提出；后续又发展出闭式解连续网络（Closed-form Continuous-time,...

yd_288058137
发表于2025-09-01 14:38:43
28902 2 0

28.9k 2 0

一、液体神经网络是什么？为什么值得关注· 液体神经网络（Liquid Neural Networks, LNN）的核心思想是用连续时间的微分方程来描述神经元状态随输入而变的动态，并允许时间常数随输入自适应（“液体”）。这类模型最早以 Liquid Time-Constant (LTC) 形式提出；后续又发展出闭式解连续网络（Closed-form Continuous-time,...
神经网络
CNN中的激活函数层
在卷积神经网络（CNN）中，激活函数层通过引入非线性变换，使模型能够学习复杂的数据模式（如图像中的边缘、纹理组合等）。没有激活函数，CNN将退化为线性模型，无法解决非线性问题。以下是CNN中常用的激活函数及其特性、应用场景和代码示例的详细解析： 1. 为什么需要激活函数？线性模型的局限性：若仅使用卷积层和全连接层（均为线性变换），堆叠多层网络仍等价于单层线性模型（如 y = W_n...W_...

林欣
发表于2025-08-29 17:01:47
1006 0 0

1.0k 0 0

在卷积神经网络（CNN）中，激活函数层通过引入非线性变换，使模型能够学习复杂的数据模式（如图像中的边缘、纹理组合等）。没有激活函数，CNN将退化为线性模型，无法解决非线性问题。以下是CNN中常用的激活函数及其特性、应用场景和代码示例的详细解析： 1. 为什么需要激活函数？线性模型的局限性：若仅使用卷积层和全连接层（均为线性变换），堆叠多层网络仍等价于单层线性模型（如 y = W_n...W_...
深度学习神经网络
CNN中的几个核心层
卷积神经网络（CNN）通常由多种类型的层组合而成，每层承担特定功能，共同完成特征提取和分类任务。以下是CNN中常见的核心层及其作用： 1. 卷积层（Convolutional Layer）功能：通过卷积核（Filter）提取输入数据的局部空间特征（如边缘、纹理、形状）。关键操作：卷积核在输入上滑动，计算局部区域的加权和（点积）。输出特征图（Feature Map），通道数由卷积核数量决定。超...

林欣
发表于2025-08-29 16:59:06
678 0 0

678 0 0

卷积神经网络（CNN）通常由多种类型的层组合而成，每层承担特定功能，共同完成特征提取和分类任务。以下是CNN中常见的核心层及其作用： 1. 卷积层（Convolutional Layer）功能：通过卷积核（Filter）提取输入数据的局部空间特征（如边缘、纹理、形状）。关键操作：卷积核在输入上滑动，计算局部区域的加权和（点积）。输出特征图（Feature Map），通道数由卷积核数量决定。超...
神经网络
CNN中的卷积层
卷积层（Convolutional Layer）是卷积神经网络（CNN）的核心组件，主要用于通过局部感受野和权重共享机制自动提取输入数据的空间特征（如图像中的边缘、纹理、形状等）。以下是卷积层的详细解析： 1. 基本操作卷积层通过**卷积核（Filter/Kernel）**在输入数据上滑动，计算局部区域的加权和（点积运算），生成特征图（Feature Map）。具体步骤如下：输入：形状为 (...

林欣
发表于2025-08-29 16:58:50
819 0 0

819 0 0

卷积层（Convolutional Layer）是卷积神经网络（CNN）的核心组件，主要用于通过局部感受野和权重共享机制自动提取输入数据的空间特征（如图像中的边缘、纹理、形状等）。以下是卷积层的详细解析： 1. 基本操作卷积层通过**卷积核（Filter/Kernel）**在输入数据上滑动，计算局部区域的加权和（点积运算），生成特征图（Feature Map）。具体步骤如下：输入：形状为 (...
神经网络
鸿蒙的NPU加速（神经网络计算）
1. 引言在人工智能技术深度融入智能终端的今天，神经网络计算（如图像识别、语音处理、自然语言理解）已成为设备智能化的核心驱动力。然而，传统的CPU或GPU在执行复杂的神经网络推理任务时，往往面临计算效率低、功耗高、实时性差等问题——例如，运行一个轻量级的图像分类模型可能需要数百毫秒的延迟，或消耗大量电量，严重影响用户体验。华为鸿蒙操作系统（HarmonyOS）针对这一挑战...

鱼弦
发表于2025-08-25 19:57:21
2488 0 0

2.4k 0 0

1. 引言在人工智能技术深度融入智能终端的今天，神经网络计算（如图像识别、语音处理、自然语言理解）已成为设备智能化的核心驱动力。然而，传统的CPU或GPU在执行复杂的神经网络推理任务时，往往面临计算效率低、功耗高、实时性差等问题——例如，运行一个轻量级的图像分类模型可能需要数百毫秒的延迟，或消耗大量电量，严重影响用户体验。华为鸿蒙操作系统（HarmonyOS）针对这一挑战...
神经网络

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript