- MicroNAS:面向MCU的零样本神经架构搜索Qiao Y, Xu H, Zhang Y, et al. Micronas: Zero-shot neural architecture search for mcus[C]//2024 Design, Automation & Test in Europe Conference & Exhibition (DATE). IEEE, 202... MicroNAS:面向MCU的零样本神经架构搜索Qiao Y, Xu H, Zhang Y, et al. Micronas: Zero-shot neural architecture search for mcus[C]//2024 Design, Automation & Test in Europe Conference & Exhibition (DATE). IEEE, 202...
- H4H:面向AR/VR应用的NPU-CIM异构系统混合卷积-Transformer架构搜索Yiwei Zhao, Jinhui Chen, Sai Qian Zhang, Syed Shakib Sarwar, Kleber Hugo Stangherlin, Jorge Tomas Gomez, Jae-Sun Seo, Barbara De Salvo, Chiao Liu, Phil... H4H:面向AR/VR应用的NPU-CIM异构系统混合卷积-Transformer架构搜索Yiwei Zhao, Jinhui Chen, Sai Qian Zhang, Syed Shakib Sarwar, Kleber Hugo Stangherlin, Jorge Tomas Gomez, Jae-Sun Seo, Barbara De Salvo, Chiao Liu, Phil...
- SmoothQuant: 大型语言模型的精确高效后训练量化Xiao G, Lin J, Seznec M, et al. Smoothquant: Accurate and efficient post-training quantization for large language models[C]//International conference on machine learni... SmoothQuant: 大型语言模型的精确高效后训练量化Xiao G, Lin J, Seznec M, et al. Smoothquant: Accurate and efficient post-training quantization for large language models[C]//International conference on machine learni...
- 用于最近邻搜索的乘积量化H. Jégou, M. Douze and C. Schmid, “Product Quantization for Nearest Neighbor Search,” in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 33, no. 1, pp. 117-128, Ja... 用于最近邻搜索的乘积量化H. Jégou, M. Douze and C. Schmid, “Product Quantization for Nearest Neighbor Search,” in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 33, no. 1, pp. 117-128, Ja...
- 改进的激光方法与更快的矩阵乘法Josh Alman and Virginia Vassilevska Williams. 2021. A refined laser method and faster matrix multiplication. In Proceedings of the Thirty-Second Annual ACM-SIAM Symposium on Discret... 改进的激光方法与更快的矩阵乘法Josh Alman and Virginia Vassilevska Williams. 2021. A refined laser method and faster matrix multiplication. In Proceedings of the Thirty-Second Annual ACM-SIAM Symposium on Discret...
- 使用分区截断奇异值分解滤波的近似卷积J. Atkins, A. Strauss and C. Zhang, “Approximate convolution using partitioned truncated singular value decomposition filtering,” 2013 IEEE International Conference on Acoustics,... 使用分区截断奇异值分解滤波的近似卷积J. Atkins, A. Strauss and C. Zhang, “Approximate convolution using partitioned truncated singular value decomposition filtering,” 2013 IEEE International Conference on Acoustics,...
- 无乘法器的多常数乘法Yevgen Voronenko and Markus Püschel. 2007. Multiplierless multiple constant multiplication. ACM Trans. Algorithms 3, 2 (May 2007), 11–es. 第一章 引言与问题定义在数字信号处理(DSP)和计算机算术领域,一个核心问题是如何高效地计算变量... 无乘法器的多常数乘法Yevgen Voronenko and Markus Püschel. 2007. Multiplierless multiple constant multiplication. ACM Trans. Algorithms 3, 2 (May 2007), 11–es. 第一章 引言与问题定义在数字信号处理(DSP)和计算机算术领域,一个核心问题是如何高效地计算变量...
- EdgeShard:通过协作边缘计算实现高效的大语言模型推理M. Zhang, X. Shen, J. Cao, Z. Cui and S. Jiang, “EdgeShard: Efficient LLM Inference via Collaborative Edge Computing,” in IEEE Internet of Things Journal, vol. 12, no... EdgeShard:通过协作边缘计算实现高效的大语言模型推理M. Zhang, X. Shen, J. Cao, Z. Cui and S. Jiang, “EdgeShard: Efficient LLM Inference via Collaborative Edge Computing,” in IEEE Internet of Things Journal, vol. 12, no...
- Agile-Quant:面向大语言模型边缘端更快推理的激活引导量化框架Shen X, Dong P, Lu L, et al. Agile-quant: Activation-guided quantization for faster inference of LLMs on the edge[C]//Proceedings of the AAAI Conference on Artif... Agile-Quant:面向大语言模型边缘端更快推理的激活引导量化框架Shen X, Dong P, Lu L, et al. Agile-quant: Activation-guided quantization for faster inference of LLMs on the edge[C]//Proceedings of the AAAI Conference on Artif...
- 在人工智能的发展过程中,AI Agent 已经逐渐从单一任务执行者演化为具备自主学习、协作和推理能力的智能体。在应对复杂决策场景(如智能制造、金融交易、灾害应急、智能交通)时,仅依赖单个 Agent 的计算与感知能力往往难以满足高效、鲁棒的决策需求。 在人工智能的发展过程中,AI Agent 已经逐渐从单一任务执行者演化为具备自主学习、协作和推理能力的智能体。在应对复杂决策场景(如智能制造、金融交易、灾害应急、智能交通)时,仅依赖单个 Agent 的计算与感知能力往往难以满足高效、鲁棒的决策需求。
- Mixture of Experts架构的简要解析 MoE的起源与核心思想Mixture of Experts(MoE)架构的历史可以追溯到1991年,当时Robert Jacobs、Michael Jordan、Geoffrey Hinton等人在《Neural Computation》期刊上发表了开创性论文《Adaptive Mixtures of Local Experts》。这篇论... Mixture of Experts架构的简要解析 MoE的起源与核心思想Mixture of Experts(MoE)架构的历史可以追溯到1991年,当时Robert Jacobs、Michael Jordan、Geoffrey Hinton等人在《Neural Computation》期刊上发表了开创性论文《Adaptive Mixtures of Local Experts》。这篇论...
- Transformer架构的简要解析Transformer架构自2017年诞生以来,已经彻底革新了人工智能领域,从最初的机器翻译任务扩展到几乎所有的序列建模问题。这种架构通过纯注意力机制取代了传统的循环和卷积结构,实现了前所未有的并行化能力和长距离依赖建模能力。其核心创新在于自注意力机制能够让序列中的任意两个位置直接交互,打破了RNN的序列处理瓶颈。从GPT到BERT,从ChatGPT到C... Transformer架构的简要解析Transformer架构自2017年诞生以来,已经彻底革新了人工智能领域,从最初的机器翻译任务扩展到几乎所有的序列建模问题。这种架构通过纯注意力机制取代了传统的循环和卷积结构,实现了前所未有的并行化能力和长距离依赖建模能力。其核心创新在于自注意力机制能够让序列中的任意两个位置直接交互,打破了RNN的序列处理瓶颈。从GPT到BERT,从ChatGPT到C...
- 大语言模型的核心算法——简要解析 Transformer架构的数学本质与演进 自注意力机制的核心原理Transformer架构的灵魂在于自注意力机制,它允许模型在处理序列中的每个元素时,动态地关注序列中的所有其他位置。从数学角度看,自注意力的计算过程可以表达为:Attention(Q,K,V)=softmax(QKTdk)V\text{Attention}(Q,K,V) = \text{s... 大语言模型的核心算法——简要解析 Transformer架构的数学本质与演进 自注意力机制的核心原理Transformer架构的灵魂在于自注意力机制,它允许模型在处理序列中的每个元素时,动态地关注序列中的所有其他位置。从数学角度看,自注意力的计算过程可以表达为:Attention(Q,K,V)=softmax(QKTdk)V\text{Attention}(Q,K,V) = \text{s...
- ProxylessNAS:直接在目标任务和硬件上进行神经架构搜索Cai H, Zhu L, Han S. Proxylessnas: Direct neural architecture search on target task and hardware[J]. arXiv preprint arXiv:1812.00332, 2018. 第一章 引言与研究背景神经架构搜索(NAS)在自... ProxylessNAS:直接在目标任务和硬件上进行神经架构搜索Cai H, Zhu L, Han S. Proxylessnas: Direct neural architecture search on target task and hardware[J]. arXiv preprint arXiv:1812.00332, 2018. 第一章 引言与研究背景神经架构搜索(NAS)在自...
- Edge Impulse:面向微型机器学习的MLOps平台深度解析Hymel S, Banbury C, Situnayake D, et al. Edge impulse: An mlops platform for tiny machine learning[J]. arXiv preprint arXiv:2212.03332, 2022. 一、引言与研究背景Edge Impulse... Edge Impulse:面向微型机器学习的MLOps平台深度解析Hymel S, Banbury C, Situnayake D, et al. Edge impulse: An mlops platform for tiny machine learning[J]. arXiv preprint arXiv:2212.03332, 2022. 一、引言与研究背景Edge Impulse...
上滑加载中
推荐直播
-
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中 -
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
热门标签