- AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型 AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
- WorldSimBench: 迈向作为世界模拟器的视频生成模型Qin Y, Shi Z, Yu J, et al. Worldsimbench: Towards video generation models as world simulators[J]. arXiv preprint arXiv:2410.18072, 2024. 1. 引言与研究背景在采取行动之前,人类会基于目标和对当... WorldSimBench: 迈向作为世界模拟器的视频生成模型Qin Y, Shi Z, Yu J, et al. Worldsimbench: Towards video generation models as world simulators[J]. arXiv preprint arXiv:2410.18072, 2024. 1. 引言与研究背景在采取行动之前,人类会基于目标和对当...
- Stable Video Diffusion:将潜在视频扩散模型扩展到大规模数据集Blattmann A, Dockhorn T, Kulal S, et al. Stable video diffusion: Scaling latent video diffusion models to large datasets[J]. arXiv preprint arXiv:2311.1512... Stable Video Diffusion:将潜在视频扩散模型扩展到大规模数据集Blattmann A, Dockhorn T, Kulal S, et al. Stable video diffusion: Scaling latent video diffusion models to large datasets[J]. arXiv preprint arXiv:2311.1512...
- 机器会“看病”?深度学习正在颠覆医学成像! 机器会“看病”?深度学习正在颠覆医学成像!
- 从“解题”到“证明”——OpenAI 通用大模型如何摘取 IMO 2025 金牌 一、为什么是 IMO?——AI 推理的“登月考场”国际数学奥林匹克(IMO)被公认为创造性符号推理的巅峰:每题平均 100 分钟级深度思考,远超 GSM8K(0.1 min)、MATH(1 min)、AIME(10 min);闭卷、禁用计算器/Lean,必须输出多页自然语言证明;评分由人类专家主观判定,无明确... 从“解题”到“证明”——OpenAI 通用大模型如何摘取 IMO 2025 金牌 一、为什么是 IMO?——AI 推理的“登月考场”国际数学奥林匹克(IMO)被公认为创造性符号推理的巅峰:每题平均 100 分钟级深度思考,远超 GSM8K(0.1 min)、MATH(1 min)、AIME(10 min);闭卷、禁用计算器/Lean,必须输出多页自然语言证明;评分由人类专家主观判定,无明确...
- Phi-4 技术报告深度解读Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 引言:小模型的强大潜能微软研究院在2024年12月发布的 phi-4 是一个仅有140亿参数的语言模型,却在多个推理任务上展现出与千亿参数级别模型相媲美的性能。这个成... Phi-4 技术报告深度解读Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 引言:小模型的强大潜能微软研究院在2024年12月发布的 phi-4 是一个仅有140亿参数的语言模型,却在多个推理任务上展现出与千亿参数级别模型相媲美的性能。这个成...
- Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前... Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前...
- Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前... Phi-3 技术报告:手机本地运行的高能力语言模型Abdin M, Aneja J, Behl H, et al. Phi-4 technical report[J]. arXiv preprint arXiv:2412.08905, 2024. 1. 引言与背景人工智能在过去几年的惊人进步很大程度上归功于全球范围内对不断扩大模型和数据集规模的努力。大型语言模型(LLMs)的参数量从五年前...
- EdgeMark:嵌入式人工智能工具的自动化与基准测试系统Wang X, Jia W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies[J]. arXiv preprint arXiv:2501.03265, 2025. 1. 引言与背景人工智能技术的快速发展正在从根本上改变数... EdgeMark:嵌入式人工智能工具的自动化与基准测试系统Wang X, Jia W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies[J]. arXiv preprint arXiv:2501.03265, 2025. 1. 引言与背景人工智能技术的快速发展正在从根本上改变数...
- AI-ANNE: 将神经网络迁移到微控制器的深度探索Klinkhammer D. AI-ANNE:(A)(N) eural (N) et for (E) xploration: Transferring Deep Learning Models onto Microcontrollers and Embedded Systems[J]. arXiv preprint arXiv:2501.... AI-ANNE: 将神经网络迁移到微控制器的深度探索Klinkhammer D. AI-ANNE:(A)(N) eural (N) et for (E) xploration: Transferring Deep Learning Models onto Microcontrollers and Embedded Systems[J]. arXiv preprint arXiv:2501....
- 边缘AI优化:数据、模型与系统策略的综合调研——论文阅读Wang X, Jia W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies[J]. arXiv preprint arXiv:2501.03265, 2025. 第一章 引言与研究背景 1.1 研究动机与挑战人工智能技术... 边缘AI优化:数据、模型与系统策略的综合调研——论文阅读Wang X, Jia W. Optimizing edge AI: a comprehensive survey on data, model, and system strategies[J]. arXiv preprint arXiv:2501.03265, 2025. 第一章 引言与研究背景 1.1 研究动机与挑战人工智能技术...
- AIGC 生图技术作为一颗璀璨的明星,正逐渐改变着我们对于图像创作与生成的传统认知。从艺术设计到商业广告,从影视特效到游戏开发,AIGC 生图技术都展现出了其独特的魅力与巨大的潜力。 AIGC 生图技术作为一颗璀璨的明星,正逐渐改变着我们对于图像创作与生成的传统认知。从艺术设计到商业广告,从影视特效到游戏开发,AIGC 生图技术都展现出了其独特的魅力与巨大的潜力。
- I-ViT: 用于高效视觉Transformer推理的纯整数量化Li Z, Gu Q. I-vit: Integer-only quantization for efficient vision transformer inference[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision.... I-ViT: 用于高效视觉Transformer推理的纯整数量化Li Z, Gu Q. I-vit: Integer-only quantization for efficient vision transformer inference[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision....
- 钛丝驱动技术(NiTiDrivetech)的可靠性设计【前言】形状记忆合金(Shape memory alloy, SMA),也叫形态记忆合金、肌肉丝、镍钛记忆合金,它是由Ni(镍)- Ti(钛)材料组成,经过多道工序制成的丝,财哥简称钛丝,可以通过电路驱动钛丝发生运动。相比于传统的电机、电磁铁动力,钛丝是一种新型的动力元件。钛丝驱动技术(nitidrivetech)目前已经在航空航天、医疗... 钛丝驱动技术(NiTiDrivetech)的可靠性设计【前言】形状记忆合金(Shape memory alloy, SMA),也叫形态记忆合金、肌肉丝、镍钛记忆合金,它是由Ni(镍)- Ti(钛)材料组成,经过多道工序制成的丝,财哥简称钛丝,可以通过电路驱动钛丝发生运动。相比于传统的电机、电磁铁动力,钛丝是一种新型的动力元件。钛丝驱动技术(nitidrivetech)目前已经在航空航天、医疗...
- 短视频平台内容推荐算法优化:从协同过滤到多模态深度学习 引言:为什么推荐系统决定短视频平台的生死在抖音、快手、TikTok 等平台中,用户平均停留时长超过 60% 由推荐系统决定。一个优秀的推荐系统不仅要“猜你喜欢”,更要在冷启动、多样性、实时性、用户长期价值之间做出权衡。本文将深入探讨短视频推荐系统的核心算法演进,并给出一个基于多模态内容+用户行为序列的深度学习推荐模型的完整代码实现。 ... 短视频平台内容推荐算法优化:从协同过滤到多模态深度学习 引言:为什么推荐系统决定短视频平台的生死在抖音、快手、TikTok 等平台中,用户平均停留时长超过 60% 由推荐系统决定。一个优秀的推荐系统不仅要“猜你喜欢”,更要在冷启动、多样性、实时性、用户长期价值之间做出权衡。本文将深入探讨短视频推荐系统的核心算法演进,并给出一个基于多模态内容+用户行为序列的深度学习推荐模型的完整代码实现。 ...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签