- SmoothQuant: 大型语言模型的精确高效后训练量化Xiao G, Lin J, Seznec M, et al. Smoothquant: Accurate and efficient post-training quantization for large language models[C]//International conference on machine learni... SmoothQuant: 大型语言模型的精确高效后训练量化Xiao G, Lin J, Seznec M, et al. Smoothquant: Accurate and efficient post-training quantization for large language models[C]//International conference on machine learni...
- 嵌入式AI领域关键技术的理论基础 引言嵌入式AI的核心挑战在于如何在极其有限的计算和存储资源下实现高性能的智能推理。这需要我们从数学原理出发,理解模型压缩、优化和部署的本质。 第一部分:神经网络量化的完整理论体系 1.1 量化的信息论基础 1.1.1 从连续到离散:信息损失的数学刻画考虑一个连续随机变量X∈RX \in \mathbb{R}X∈R,其概率密度函数为p(x)p(x)p(x)。... 嵌入式AI领域关键技术的理论基础 引言嵌入式AI的核心挑战在于如何在极其有限的计算和存储资源下实现高性能的智能推理。这需要我们从数学原理出发,理解模型压缩、优化和部署的本质。 第一部分:神经网络量化的完整理论体系 1.1 量化的信息论基础 1.1.1 从连续到离散:信息损失的数学刻画考虑一个连续随机变量X∈RX \in \mathbb{R}X∈R,其概率密度函数为p(x)p(x)p(x)。...
- 用于最近邻搜索的乘积量化H. Jégou, M. Douze and C. Schmid, “Product Quantization for Nearest Neighbor Search,” in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 33, no. 1, pp. 117-128, Ja... 用于最近邻搜索的乘积量化H. Jégou, M. Douze and C. Schmid, “Product Quantization for Nearest Neighbor Search,” in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 33, no. 1, pp. 117-128, Ja...
- 改进的激光方法与更快的矩阵乘法Josh Alman and Virginia Vassilevska Williams. 2021. A refined laser method and faster matrix multiplication. In Proceedings of the Thirty-Second Annual ACM-SIAM Symposium on Discret... 改进的激光方法与更快的矩阵乘法Josh Alman and Virginia Vassilevska Williams. 2021. A refined laser method and faster matrix multiplication. In Proceedings of the Thirty-Second Annual ACM-SIAM Symposium on Discret...
- 使用分区截断奇异值分解滤波的近似卷积J. Atkins, A. Strauss and C. Zhang, “Approximate convolution using partitioned truncated singular value decomposition filtering,” 2013 IEEE International Conference on Acoustics,... 使用分区截断奇异值分解滤波的近似卷积J. Atkins, A. Strauss and C. Zhang, “Approximate convolution using partitioned truncated singular value decomposition filtering,” 2013 IEEE International Conference on Acoustics,...
- 无乘法器的多常数乘法Yevgen Voronenko and Markus Püschel. 2007. Multiplierless multiple constant multiplication. ACM Trans. Algorithms 3, 2 (May 2007), 11–es. 第一章 引言与问题定义在数字信号处理(DSP)和计算机算术领域,一个核心问题是如何高效地计算变量... 无乘法器的多常数乘法Yevgen Voronenko and Markus Püschel. 2007. Multiplierless multiple constant multiplication. ACM Trans. Algorithms 3, 2 (May 2007), 11–es. 第一章 引言与问题定义在数字信号处理(DSP)和计算机算术领域,一个核心问题是如何高效地计算变量...
- 鸿蒙未来怎么走?技术演进路线的深度拆解 鸿蒙未来怎么走?技术演进路线的深度拆解
- EdgeShard:通过协作边缘计算实现高效的大语言模型推理M. Zhang, X. Shen, J. Cao, Z. Cui and S. Jiang, “EdgeShard: Efficient LLM Inference via Collaborative Edge Computing,” in IEEE Internet of Things Journal, vol. 12, no... EdgeShard:通过协作边缘计算实现高效的大语言模型推理M. Zhang, X. Shen, J. Cao, Z. Cui and S. Jiang, “EdgeShard: Efficient LLM Inference via Collaborative Edge Computing,” in IEEE Internet of Things Journal, vol. 12, no...
- 鸿蒙在加码:鸿蒙如何推动全球智能设备市场发展 鸿蒙在加码:鸿蒙如何推动全球智能设备市场发展
- 鸿蒙 + 开源:不是“借船出海”,而是“造船远航” 鸿蒙 + 开源:不是“借船出海”,而是“造船远航”
- 系统架构演变 随着互联网的发展,网站应用的规模不断扩大。需求的激增,带来的是技术上的压力。系统架构也因此不断的演进、升级、迭代。从单一应用,到垂直拆分,到分布式服务,到SOA,以及现在火热的微服务架构,还有在Google带领下来势汹涌的Service Mesh。我们到底是该乘坐微服务的船只驶向远方,还是偏安一隅得过且过?其实生活不止眼前的苟且,还有诗和远方。所以我们今天就回顾历史,看一看系统... 系统架构演变 随着互联网的发展,网站应用的规模不断扩大。需求的激增,带来的是技术上的压力。系统架构也因此不断的演进、升级、迭代。从单一应用,到垂直拆分,到分布式服务,到SOA,以及现在火热的微服务架构,还有在Google带领下来势汹涌的Service Mesh。我们到底是该乘坐微服务的船只驶向远方,还是偏安一隅得过且过?其实生活不止眼前的苟且,还有诗和远方。所以我们今天就回顾历史,看一看系统...
- 1. 引言在操作系统与智能终端技术高速迭代的今天,专利布局已成为企业构建技术护城河、争夺产业话语权的关键战略。鸿蒙系统(HarmonyOS)作为华为自主研发的面向全场景的分布式操作系统,自 2019 年正式发布以来,不仅通过“一次开发,多端部署”的创新架构打破了设备壁垒,更通过 系统性、前瞻性的专利布局 构筑了核心技术壁垒。据公开数据显示,截至 202X 年,华为围绕鸿蒙系统在全球范... 1. 引言在操作系统与智能终端技术高速迭代的今天,专利布局已成为企业构建技术护城河、争夺产业话语权的关键战略。鸿蒙系统(HarmonyOS)作为华为自主研发的面向全场景的分布式操作系统,自 2019 年正式发布以来,不仅通过“一次开发,多端部署”的创新架构打破了设备壁垒,更通过 系统性、前瞻性的专利布局 构筑了核心技术壁垒。据公开数据显示,截至 202X 年,华为围绕鸿蒙系统在全球范...
- 鸿蒙跨设备数据保护,真不是“加密”那么简单 鸿蒙跨设备数据保护,真不是“加密”那么简单
- 本文以某政务云平台Ceph集群扩容后的数据同步异常故障为案例,剖析云原生分布式存储的运维挑战。该故障因CRUSH算法"firstn"策略导致新节点OSD被边缘化、默认PG配置不均引发负载过高,叠加容器化部署中emptyDir日志IO瓶颈及DNS解析延迟,形成数据同步停滞的恶性循环。 本文以某政务云平台Ceph集群扩容后的数据同步异常故障为案例,剖析云原生分布式存储的运维挑战。该故障因CRUSH算法"firstn"策略导致新节点OSD被边缘化、默认PG配置不均引发负载过高,叠加容器化部署中emptyDir日志IO瓶颈及DNS解析延迟,形成数据同步停滞的恶性循环。
- 1. 引言在万物互联的智能时代,鸿蒙操作系统(HarmonyOS)凭借“一次开发,多端部署”“分布式软总线”“原子化服务”等核心技术,已成为智能终端生态的核心底座。随着鸿蒙设备(涵盖手机、平板、智能穿戴、智能家居等)的广泛普及,鸿蒙应用市场(如华为应用市场HarmonyOS专区)成为开发者触达用户的关键渠道。然而,为了保障用户体验、设备安全与生态健康,鸿蒙应用市场制定了严格的上架审核规则,开... 1. 引言在万物互联的智能时代,鸿蒙操作系统(HarmonyOS)凭借“一次开发,多端部署”“分布式软总线”“原子化服务”等核心技术,已成为智能终端生态的核心底座。随着鸿蒙设备(涵盖手机、平板、智能穿戴、智能家居等)的广泛普及,鸿蒙应用市场(如华为应用市场HarmonyOS专区)成为开发者触达用户的关键渠道。然而,为了保障用户体验、设备安全与生态健康,鸿蒙应用市场制定了严格的上架审核规则,开...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签