- Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前... Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前...
- EdgeMark:嵌入式人工智能工具的自动化与基准测试系统Wang X, Jia W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies[J]. arXiv preprint arXiv:2501.03265, 2025. 1. 引言与背景人工智能技术的快速发展正在从根本上改变数... EdgeMark:嵌入式人工智能工具的自动化与基准测试系统Wang X, Jia W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies[J]. arXiv preprint arXiv:2501.03265, 2025. 1. 引言与背景人工智能技术的快速发展正在从根本上改变数...
- AI-ANNE: 将神经网络迁移到微控制器的深度探索Klinkhammer D. AI-ANNE:(A)(N) eural (N) et for (E) xploration: Transferring Deep Learning Models onto Microcontrollers and Embedded Systems[J]. arXiv preprint arXiv:2501.... AI-ANNE: 将神经网络迁移到微控制器的深度探索Klinkhammer D. AI-ANNE:(A)(N) eural (N) et for (E) xploration: Transferring Deep Learning Models onto Microcontrollers and Embedded Systems[J]. arXiv preprint arXiv:2501....
- NLP参数高效迁移学习:Adapter方法的深度解析Houlsby N, Giurgiu A, Jastrzebski S, et al. Parameter-efficient transfer learning for NLP[C]//International conference on machine learning. PMLR, 2019: 2790-2799. 第一章 引言与... NLP参数高效迁移学习:Adapter方法的深度解析Houlsby N, Giurgiu A, Jastrzebski S, et al. Parameter-efficient transfer learning for NLP[C]//International conference on machine learning. PMLR, 2019: 2790-2799. 第一章 引言与...
- MicroNAS:面向MCU的零样本神经架构搜索Qiao Y, Xu H, Zhang Y, et al. Micronas: Zero-shot neural architecture search for mcus[C]//2024 Design, Automation & Test in Europe Conference & Exhibition (DATE). IEEE, 202... MicroNAS:面向MCU的零样本神经架构搜索Qiao Y, Xu H, Zhang Y, et al. Micronas: Zero-shot neural architecture search for mcus[C]//2024 Design, Automation & Test in Europe Conference & Exhibition (DATE). IEEE, 202...
- H4H:面向AR/VR应用的NPU-CIM异构系统混合卷积-Transformer架构搜索Yiwei Zhao, Jinhui Chen, Sai Qian Zhang, Syed Shakib Sarwar, Kleber Hugo Stangherlin, Jorge Tomas Gomez, Jae-Sun Seo, Barbara De Salvo, Chiao Liu, Phil... H4H:面向AR/VR应用的NPU-CIM异构系统混合卷积-Transformer架构搜索Yiwei Zhao, Jinhui Chen, Sai Qian Zhang, Syed Shakib Sarwar, Kleber Hugo Stangherlin, Jorge Tomas Gomez, Jae-Sun Seo, Barbara De Salvo, Chiao Liu, Phil...
- SmoothQuant: 大型语言模型的精确高效后训练量化Xiao G, Lin J, Seznec M, et al. Smoothquant: Accurate and efficient post-training quantization for large language models[C]//International conference on machine learni... SmoothQuant: 大型语言模型的精确高效后训练量化Xiao G, Lin J, Seznec M, et al. Smoothquant: Accurate and efficient post-training quantization for large language models[C]//International conference on machine learni...
- 嵌入式AI领域关键技术的理论基础 引言嵌入式AI的核心挑战在于如何在极其有限的计算和存储资源下实现高性能的智能推理。这需要我们从数学原理出发,理解模型压缩、优化和部署的本质。 第一部分:神经网络量化的完整理论体系 1.1 量化的信息论基础 1.1.1 从连续到离散:信息损失的数学刻画考虑一个连续随机变量X∈RX \in \mathbb{R}X∈R,其概率密度函数为p(x)p(x)p(x)。... 嵌入式AI领域关键技术的理论基础 引言嵌入式AI的核心挑战在于如何在极其有限的计算和存储资源下实现高性能的智能推理。这需要我们从数学原理出发,理解模型压缩、优化和部署的本质。 第一部分:神经网络量化的完整理论体系 1.1 量化的信息论基础 1.1.1 从连续到离散:信息损失的数学刻画考虑一个连续随机变量X∈RX \in \mathbb{R}X∈R,其概率密度函数为p(x)p(x)p(x)。...
- Agile-Quant:面向大语言模型边缘端更快推理的激活引导量化框架Shen X, Dong P, Lu L, et al. Agile-quant: Activation-guided quantization for faster inference of LLMs on the edge[C]//Proceedings of the AAAI Conference on Artif... Agile-Quant:面向大语言模型边缘端更快推理的激活引导量化框架Shen X, Dong P, Lu L, et al. Agile-quant: Activation-guided quantization for faster inference of LLMs on the edge[C]//Proceedings of the AAAI Conference on Artif...
- ProxylessNAS:直接在目标任务和硬件上进行神经架构搜索Cai H, Zhu L, Han S. Proxylessnas: Direct neural architecture search on target task and hardware[J]. arXiv preprint arXiv:1812.00332, 2018. 第一章 引言与研究背景神经架构搜索(NAS)在自... ProxylessNAS:直接在目标任务和硬件上进行神经架构搜索Cai H, Zhu L, Han S. Proxylessnas: Direct neural architecture search on target task and hardware[J]. arXiv preprint arXiv:1812.00332, 2018. 第一章 引言与研究背景神经架构搜索(NAS)在自...
- Edge Impulse:面向微型机器学习的MLOps平台深度解析Hymel S, Banbury C, Situnayake D, et al. Edge impulse: An mlops platform for tiny machine learning[J]. arXiv preprint arXiv:2212.03332, 2022. 一、引言与研究背景Edge Impulse... Edge Impulse:面向微型机器学习的MLOps平台深度解析Hymel S, Banbury C, Situnayake D, et al. Edge impulse: An mlops platform for tiny machine learning[J]. arXiv preprint arXiv:2212.03332, 2022. 一、引言与研究背景Edge Impulse...
- MINUN: 微控制器上的精确机器学习推理Jaiswal S, Goli R K K, Kumar A, et al. MinUn: Accurate ML inference on microcontrollers[C]//Proceedings of the 24th ACM SIGPLAN/SIGBED International Conference on Languages, C... MINUN: 微控制器上的精确机器学习推理Jaiswal S, Goli R K K, Kumar A, et al. MinUn: Accurate ML inference on microcontrollers[C]//Proceedings of the 24th ACM SIGPLAN/SIGBED International Conference on Languages, C...
- μNAS:面向微控制器的约束神经架构搜索Liberis E, Dudziak Ł, Lane N D. μnas: Constrained neural architecture search for microcontrollers[C]//Proceedings of the 1st Workshop on Machine Learning and Systems. 2021: 70-... μNAS:面向微控制器的约束神经架构搜索Liberis E, Dudziak Ł, Lane N D. μnas: Constrained neural architecture search for microcontrollers[C]//Proceedings of the 1st Workshop on Machine Learning and Systems. 2021: 70-...
- CMSIS-NN:ARM Cortex-M处理器的高效神经网络内核Lai L, Suda N, Chandra V. Cmsis-nn: Efficient neural network kernels for arm cortex-m cpus[J]. arXiv preprint arXiv:1801.06601, 2018. 引言与背景物联网设备正在快速增长,预计到2035年将在各个... CMSIS-NN:ARM Cortex-M处理器的高效神经网络内核Lai L, Suda N, Chandra V. Cmsis-nn: Efficient neural network kernels for arm cortex-m cpus[J]. arXiv preprint arXiv:1801.06601, 2018. 引言与背景物联网设备正在快速增长,预计到2035年将在各个...
- MCUNetV2:面向微型深度学习的内存高效分块推理方法Ji Lin, Wei-Ming Chen, Han Cai, Chuang Gan, and Song Han. 2021. MCUNetV2: memory-efficient patch-based inference for tiny deep learning. In Proceedings of the 35th Inte... MCUNetV2:面向微型深度学习的内存高效分块推理方法Ji Lin, Wei-Ming Chen, Han Cai, Chuang Gan, and Song Han. 2021. MCUNetV2: memory-efficient patch-based inference for tiny deep learning. In Proceedings of the 35th Inte...
上滑加载中
推荐直播
-
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中 -
华为云码道全新升级,多会话并行与多智能体协作2026/05/08 周五 19:00-21:00
王一男-华为云码道产品专家;张嘉冉-华为云码道工程师;胡琦-华为云HCDE;程诗杰-华为云HCDG
华为云码道4月份版本全新升级,此次直播深度解读4月份产品特性,通过“特性解读+实操演示+实战案例+设计创新”的组合,全方位展现码道在多会话并行与多智能体协作方面的能力,赋能开发者提升效率
正在直播
热门标签