- BERT 量化实战分析 BERT 量化实战分析
- 运维日志里的“读心术”:深度学习能看出啥? 运维日志里的“读心术”:深度学习能看出啥?
- MicroNAS:面向MCU的零样本神经架构搜索Qiao Y, Xu H, Zhang Y, et al. Micronas: Zero-shot neural architecture search for mcus[C]//2024 Design, Automation & Test in Europe Conference & Exhibition (DATE). IEEE, 202... MicroNAS:面向MCU的零样本神经架构搜索Qiao Y, Xu H, Zhang Y, et al. Micronas: Zero-shot neural architecture search for mcus[C]//2024 Design, Automation & Test in Europe Conference & Exhibition (DATE). IEEE, 202...
- H4H:面向AR/VR应用的NPU-CIM异构系统混合卷积-Transformer架构搜索Yiwei Zhao, Jinhui Chen, Sai Qian Zhang, Syed Shakib Sarwar, Kleber Hugo Stangherlin, Jorge Tomas Gomez, Jae-Sun Seo, Barbara De Salvo, Chiao Liu, Phil... H4H:面向AR/VR应用的NPU-CIM异构系统混合卷积-Transformer架构搜索Yiwei Zhao, Jinhui Chen, Sai Qian Zhang, Syed Shakib Sarwar, Kleber Hugo Stangherlin, Jorge Tomas Gomez, Jae-Sun Seo, Barbara De Salvo, Chiao Liu, Phil...
- SmoothQuant: 大型语言模型的精确高效后训练量化Xiao G, Lin J, Seznec M, et al. Smoothquant: Accurate and efficient post-training quantization for large language models[C]//International conference on machine learni... SmoothQuant: 大型语言模型的精确高效后训练量化Xiao G, Lin J, Seznec M, et al. Smoothquant: Accurate and efficient post-training quantization for large language models[C]//International conference on machine learni...
- 嵌入式AI领域关键技术的理论基础 引言嵌入式AI的核心挑战在于如何在极其有限的计算和存储资源下实现高性能的智能推理。这需要我们从数学原理出发,理解模型压缩、优化和部署的本质。 第一部分:神经网络量化的完整理论体系 1.1 量化的信息论基础 1.1.1 从连续到离散:信息损失的数学刻画考虑一个连续随机变量X∈RX \in \mathbb{R}X∈R,其概率密度函数为p(x)p(x)p(x)。... 嵌入式AI领域关键技术的理论基础 引言嵌入式AI的核心挑战在于如何在极其有限的计算和存储资源下实现高性能的智能推理。这需要我们从数学原理出发,理解模型压缩、优化和部署的本质。 第一部分:神经网络量化的完整理论体系 1.1 量化的信息论基础 1.1.1 从连续到离散:信息损失的数学刻画考虑一个连续随机变量X∈RX \in \mathbb{R}X∈R,其概率密度函数为p(x)p(x)p(x)。...
- 改进的激光方法与更快的矩阵乘法Josh Alman and Virginia Vassilevska Williams. 2021. A refined laser method and faster matrix multiplication. In Proceedings of the Thirty-Second Annual ACM-SIAM Symposium on Discret... 改进的激光方法与更快的矩阵乘法Josh Alman and Virginia Vassilevska Williams. 2021. A refined laser method and faster matrix multiplication. In Proceedings of the Thirty-Second Annual ACM-SIAM Symposium on Discret...
- 使用分区截断奇异值分解滤波的近似卷积J. Atkins, A. Strauss and C. Zhang, “Approximate convolution using partitioned truncated singular value decomposition filtering,” 2013 IEEE International Conference on Acoustics,... 使用分区截断奇异值分解滤波的近似卷积J. Atkins, A. Strauss and C. Zhang, “Approximate convolution using partitioned truncated singular value decomposition filtering,” 2013 IEEE International Conference on Acoustics,...
- 无乘法器的多常数乘法Yevgen Voronenko and Markus Püschel. 2007. Multiplierless multiple constant multiplication. ACM Trans. Algorithms 3, 2 (May 2007), 11–es. 第一章 引言与问题定义在数字信号处理(DSP)和计算机算术领域,一个核心问题是如何高效地计算变量... 无乘法器的多常数乘法Yevgen Voronenko and Markus Püschel. 2007. Multiplierless multiple constant multiplication. ACM Trans. Algorithms 3, 2 (May 2007), 11–es. 第一章 引言与问题定义在数字信号处理(DSP)和计算机算术领域,一个核心问题是如何高效地计算变量...
- 1 简介编程免不得要处理各种异常,比如系统的,语言层面的,数据库的,业务逻辑的异常。本文从 语言设计哲学 和 SQL错误处理 两个方面来对比分析。 2、Golang 与 Python 在错误处理上的设计理念Go 的错误处理哲学显式 (Explicit) 优于隐式 (Implicit)Go 选择了非常“啰嗦”的 if err != nil 风格,这是出于语言设计哲学:程序员必须正视每一步可能... 1 简介编程免不得要处理各种异常,比如系统的,语言层面的,数据库的,业务逻辑的异常。本文从 语言设计哲学 和 SQL错误处理 两个方面来对比分析。 2、Golang 与 Python 在错误处理上的设计理念Go 的错误处理哲学显式 (Explicit) 优于隐式 (Implicit)Go 选择了非常“啰嗦”的 if err != nil 风格,这是出于语言设计哲学:程序员必须正视每一步可能...
- EdgeShard:通过协作边缘计算实现高效的大语言模型推理M. Zhang, X. Shen, J. Cao, Z. Cui and S. Jiang, “EdgeShard: Efficient LLM Inference via Collaborative Edge Computing,” in IEEE Internet of Things Journal, vol. 12, no... EdgeShard:通过协作边缘计算实现高效的大语言模型推理M. Zhang, X. Shen, J. Cao, Z. Cui and S. Jiang, “EdgeShard: Efficient LLM Inference via Collaborative Edge Computing,” in IEEE Internet of Things Journal, vol. 12, no...
- Agile-Quant:面向大语言模型边缘端更快推理的激活引导量化框架Shen X, Dong P, Lu L, et al. Agile-quant: Activation-guided quantization for faster inference of LLMs on the edge[C]//Proceedings of the AAAI Conference on Artif... Agile-Quant:面向大语言模型边缘端更快推理的激活引导量化框架Shen X, Dong P, Lu L, et al. Agile-quant: Activation-guided quantization for faster inference of LLMs on the edge[C]//Proceedings of the AAAI Conference on Artif...
- 1.1 深度学习介绍 深度学习与神经网络 1.2 神经网络基础 1.3 浅层神经网络 2.1 多分类与 TensorFlow 5、得出每次训练的准确率(通过真实值和预测值进行位置比较,每个样本都比较) 2.2 梯度下降算法改进 2.3.4 其它正则化方法 2.4 BN 与神经网络调优 3.1 图像数据与边缘检测 3.2 卷积神经网络(CNN)原理 3.3 经典分类网络结构 4. 1.1 深度学习介绍 深度学习与神经网络 1.2 神经网络基础 1.3 浅层神经网络 2.1 多分类与 TensorFlow 5、得出每次训练的准确率(通过真实值和预测值进行位置比较,每个样本都比较) 2.2 梯度下降算法改进 2.3.4 其它正则化方法 2.4 BN 与神经网络调优 3.1 图像数据与边缘检测 3.2 卷积神经网络(CNN)原理 3.3 经典分类网络结构 4.
- 推荐理由AI编译器是现在各大软硬件厂商争夺的核心要地,本文作者Chris Lattner是LLVM项目的主要发起人与作者之一,Clang编译器的作者,苹果公司编译器开发团队的首席架构师,苹果新编程语言Swift创造者,在这篇万字长文中,他详述了AI编译器发展史。阅读地址https://www.chaspark.com/#/hotspots/1138522768379686912文中列到的关键... 推荐理由AI编译器是现在各大软硬件厂商争夺的核心要地,本文作者Chris Lattner是LLVM项目的主要发起人与作者之一,Clang编译器的作者,苹果公司编译器开发团队的首席架构师,苹果新编程语言Swift创造者,在这篇万字长文中,他详述了AI编译器发展史。阅读地址https://www.chaspark.com/#/hotspots/1138522768379686912文中列到的关键...
- Mixture of Experts架构的简要解析 MoE的起源与核心思想Mixture of Experts(MoE)架构的历史可以追溯到1991年,当时Robert Jacobs、Michael Jordan、Geoffrey Hinton等人在《Neural Computation》期刊上发表了开创性论文《Adaptive Mixtures of Local Experts》。这篇论... Mixture of Experts架构的简要解析 MoE的起源与核心思想Mixture of Experts(MoE)架构的历史可以追溯到1991年,当时Robert Jacobs、Michael Jordan、Geoffrey Hinton等人在《Neural Computation》期刊上发表了开创性论文《Adaptive Mixtures of Local Experts》。这篇论...
上滑加载中
推荐直播
-
华为云码道-AI时代应用开发利器2026/03/18 周三 19:00-20:00
童得力,华为云开发者生态运营总监/姚圣伟,华为云HCDE开发者专家
本次直播由华为专家带你实战应用开发,看华为云码道(CodeArts)代码智能体如何在AI时代让你的创意应用快速落地。更有华为云HCDE开发者专家带你用码道玩转JiuwenClaw,让小艺成为你的AI助理。
回顾中 -
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中 -
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中
热门标签