- Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前... Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前...
- Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前... Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前...
- EdgeMark:嵌入式人工智能工具的自动化与基准测试系统Wang X, Jia W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies[J]. arXiv preprint arXiv:2501.03265, 2025. 1. 引言与背景人工智能技术的快速发展正在从根本上改变数... EdgeMark:嵌入式人工智能工具的自动化与基准测试系统Wang X, Jia W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies[J]. arXiv preprint arXiv:2501.03265, 2025. 1. 引言与背景人工智能技术的快速发展正在从根本上改变数...
- AI-ANNE: 将神经网络迁移到微控制器的深度探索Klinkhammer D. AI-ANNE:(A)(N) eural (N) et for (E) xploration: Transferring Deep Learning Models onto Microcontrollers and Embedded Systems[J]. arXiv preprint arXiv:2501.... AI-ANNE: 将神经网络迁移到微控制器的深度探索Klinkhammer D. AI-ANNE:(A)(N) eural (N) et for (E) xploration: Transferring Deep Learning Models onto Microcontrollers and Embedded Systems[J]. arXiv preprint arXiv:2501....
- 边缘AI优化:数据、模型与系统策略的综合调研——论文阅读Wang X, Jia W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies[J]. arXiv preprint arXiv:2501.03265, 2025. 第一章 引言与研究背景 1.1 研究动机与挑战人工智能技术... 边缘AI优化:数据、模型与系统策略的综合调研——论文阅读Wang X, Jia W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies[J]. arXiv preprint arXiv:2501.03265, 2025. 第一章 引言与研究背景 1.1 研究动机与挑战人工智能技术...
- AIGC 生图技术作为一颗璀璨的明星,正逐渐改变着我们对于图像创作与生成的传统认知。从艺术设计到商业广告,从影视特效到游戏开发,AIGC 生图技术都展现出了其独特的魅力与巨大的潜力。 AIGC 生图技术作为一颗璀璨的明星,正逐渐改变着我们对于图像创作与生成的传统认知。从艺术设计到商业广告,从影视特效到游戏开发,AIGC 生图技术都展现出了其独特的魅力与巨大的潜力。
- I-ViT: 用于高效视觉Transformer推理的纯整数量化Li Z, Gu Q. I-vit: Integer-only quantization for efficient vision transformer inference[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision.... I-ViT: 用于高效视觉Transformer推理的纯整数量化Li Z, Gu Q. I-vit: Integer-only quantization for efficient vision transformer inference[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision....
- 钛丝驱动技术(NiTiDrivetech)的可靠性设计【前言】形状记忆合金(Shape memory alloy, SMA),也叫形态记忆合金、肌肉丝、镍钛记忆合金,它是由Ni(镍)- Ti(钛)材料组成,经过多道工序制成的丝,财哥简称钛丝,可以通过电路驱动钛丝发生运动。相比于传统的电机、电磁铁动力,钛丝是一种新型的动力元件。钛丝驱动技术(nitidrivetech)目前已经在航空航天、医疗... 钛丝驱动技术(NiTiDrivetech)的可靠性设计【前言】形状记忆合金(Shape memory alloy, SMA),也叫形态记忆合金、肌肉丝、镍钛记忆合金,它是由Ni(镍)- Ti(钛)材料组成,经过多道工序制成的丝,财哥简称钛丝,可以通过电路驱动钛丝发生运动。相比于传统的电机、电磁铁动力,钛丝是一种新型的动力元件。钛丝驱动技术(nitidrivetech)目前已经在航空航天、医疗...
- 短视频平台内容推荐算法优化:从协同过滤到多模态深度学习 引言:为什么推荐系统决定短视频平台的生死在抖音、快手、TikTok 等平台中,用户平均停留时长超过 60% 由推荐系统决定。一个优秀的推荐系统不仅要“猜你喜欢”,更要在冷启动、多样性、实时性、用户长期价值之间做出权衡。本文将深入探讨短视频推荐系统的核心算法演进,并给出一个基于多模态内容+用户行为序列的深度学习推荐模型的完整代码实现。 ... 短视频平台内容推荐算法优化:从协同过滤到多模态深度学习 引言:为什么推荐系统决定短视频平台的生死在抖音、快手、TikTok 等平台中,用户平均停留时长超过 60% 由推荐系统决定。一个优秀的推荐系统不仅要“猜你喜欢”,更要在冷启动、多样性、实时性、用户长期价值之间做出权衡。本文将深入探讨短视频推荐系统的核心算法演进,并给出一个基于多模态内容+用户行为序列的深度学习推荐模型的完整代码实现。 ...
- 1.1 深度学习介绍 深度学习与神经网络 1.2 神经网络基础 1.3 浅层神经网络 2.1 多分类与 TensorFlow 5、得出每次训练的准确率(通过真实值和预测值进行位置比较,每个样本都比较) 2.2 梯度下降算法改进 2.3.4 其它正则化方法 2.4 BN 与神经网络调优 3.1 图像数据与边缘检测 3.2 卷积神经网络(CNN)原理 3.3 经典分类网络结构 4. 1.1 深度学习介绍 深度学习与神经网络 1.2 神经网络基础 1.3 浅层神经网络 2.1 多分类与 TensorFlow 5、得出每次训练的准确率(通过真实值和预测值进行位置比较,每个样本都比较) 2.2 梯度下降算法改进 2.3.4 其它正则化方法 2.4 BN 与神经网络调优 3.1 图像数据与边缘检测 3.2 卷积神经网络(CNN)原理 3.3 经典分类网络结构 4.
- 1.深度学习概述包括深度学习与机器学习区别、深度学习应用场景、深度学习框架介绍、项目演示、开发环境搭建(pycharm安装)。2. TensorFlow基础涵盖TF数据流图、TensorFlow实现加法运算、图与TensorBoard(图结构、图相关操作、默认图、创建图、OP)、张量(张量概念、张量的阶、张量数学运算)、变量OP(创建变量)、增加其他功能(命名空间、模型保存与加 1.深度学习概述包括深度学习与机器学习区别、深度学习应用场景、深度学习框架介绍、项目演示、开发环境搭建(pycharm安装)。2. TensorFlow基础涵盖TF数据流图、TensorFlow实现加法运算、图与TensorBoard(图结构、图相关操作、默认图、创建图、OP)、张量(张量概念、张量的阶、张量数学运算)、变量OP(创建变量)、增加其他功能(命名空间、模型保存与加
- 模型量化技术简要详解 模型量化的本质与基础原理模型量化技术本质上是一种精度与效率的权衡艺术。想象一下,如果我们用数字来记录一个房间的温度,使用小数点后十位的精度(如23.1234567890°C)虽然非常精确,但在日常生活中,精确到小数点后一位(23.1°C)就足够了。模型量化的核心思想与此类似——将神经网络中的高精度浮点数(通常是32位浮点数,FP32)转换为低精度的整数表示(如8位整数... 模型量化技术简要详解 模型量化的本质与基础原理模型量化技术本质上是一种精度与效率的权衡艺术。想象一下,如果我们用数字来记录一个房间的温度,使用小数点后十位的精度(如23.1234567890°C)虽然非常精确,但在日常生活中,精确到小数点后一位(23.1°C)就足够了。模型量化的核心思想与此类似——将神经网络中的高精度浮点数(通常是32位浮点数,FP32)转换为低精度的整数表示(如8位整数...
- NLP参数高效迁移学习:Adapter方法的深度解析Houlsby N, Giurgiu A, Jastrzebski S, et al. Parameter-efficient transfer learning for NLP[C]//International conference on machine learning. PMLR, 2019: 2790-2799. 第一章 引言与... NLP参数高效迁移学习:Adapter方法的深度解析Houlsby N, Giurgiu A, Jastrzebski S, et al. Parameter-efficient transfer learning for NLP[C]//International conference on machine learning. PMLR, 2019: 2790-2799. 第一章 引言与...
- BERT 量化实战分析 BERT 量化实战分析
- 运维日志里的“读心术”:深度学习能看出啥? 运维日志里的“读心术”:深度学习能看出啥?
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签