- 随着模型越来越大,上下文越来越长,传统注意力机制的问题逐渐暴露出来。为了解决问题,业界提出了一系列结构的改进,在保持模型能力的同时显著提升了推理效率。 随着模型越来越大,上下文越来越长,传统注意力机制的问题逐渐暴露出来。为了解决问题,业界提出了一系列结构的改进,在保持模型能力的同时显著提升了推理效率。
- 回顾 GPT 系列的发展演化,对生成式大模型的祛魅,以及对深入理解大语言模型的技术路径与能力形成的机制具有重要意义。 回顾 GPT 系列的发展演化,对生成式大模型的祛魅,以及对深入理解大语言模型的技术路径与能力形成的机制具有重要意义。
- 本文将深度拆解 GenUI SDK 六大核心开发特性,帮助你全面了解这一革命式的 AI 应用开发工具。 本文将深度拆解 GenUI SDK 六大核心开发特性,帮助你全面了解这一革命式的 AI 应用开发工具。
- 基于Transformer预训练-BERT构建一个文本情感分类模型 基于Transformer预训练-BERT构建一个文本情感分类模型
- 基于传统序列模型(RNN,LSTM和GRU)构建文本情感分类模型 基于传统序列模型(RNN,LSTM和GRU)构建文本情感分类模型
- 基于神经网络构建一个文本情感分类模型 基于神经网络构建一个文本情感分类模型
- 纯手工打造Transformer代码 纯手工打造Transformer代码
- You shall know a word by the company it keeps. You shall know a word by the company it keeps.
- 研究NLP模型的发展历史,理解大模型基础架构的设计 研究NLP模型的发展历史,理解大模型基础架构的设计
- 研究NLP模型的发展历史,理解大模型基础架构的设计. 研究NLP模型的发展历史,理解大模型基础架构的设计.
- 在模型训练或预测过程中,模型会首先对输入文本进行分词,分词集合组成词表,再为每一个分词映射对应的唯一ID。接着,这些 ID 会被输入语言模型进行训练和预测。 在模型训练或预测过程中,模型会首先对输入文本进行分词,分词集合组成词表,再为每一个分词映射对应的唯一ID。接着,这些 ID 会被输入语言模型进行训练和预测。
- 人类认知的知识形式(语言文本,图像等)经过处理,embedding输入transformer模型,经过训练后,模型将同时理解并融合多种不同类型信息的能力. 人类认知的知识形式(语言文本,图像等)经过处理,embedding输入transformer模型,经过训练后,模型将同时理解并融合多种不同类型信息的能力.
- 今天年前最后一天班,马上下班了,让AI看看还有没有回老家的火车票。结果AI还真的自己打开浏览器,打开12306页面,自己搜索。神奇了。2026数字助理时代真的要来临了。后台真的自动打开浏览器去处理了。马斯克说,MacroHard数字擎天柱(Digital Optimus),它不是一个聊天机器人,它是一个能坐在你电脑前,替你握鼠标,替你敲键盘的数字员工。颠覆过去20年软件行的的底层逻辑,也就是... 今天年前最后一天班,马上下班了,让AI看看还有没有回老家的火车票。结果AI还真的自己打开浏览器,打开12306页面,自己搜索。神奇了。2026数字助理时代真的要来临了。后台真的自动打开浏览器去处理了。马斯克说,MacroHard数字擎天柱(Digital Optimus),它不是一个聊天机器人,它是一个能坐在你电脑前,替你握鼠标,替你敲键盘的数字员工。颠覆过去20年软件行的的底层逻辑,也就是...
- 既然llm有思考能力,如果把图数据库相关的信息和调用方式通过agentscope喂给llm,那么模型是不是就可以基于图数据库中的知识进行问答了? 既然llm有思考能力,如果把图数据库相关的信息和调用方式通过agentscope喂给llm,那么模型是不是就可以基于图数据库中的知识进行问答了?
- 在自然语言处理领域,模型微调是一种强大的技术,可以让预训练模型适应特定的任务和数据集。本文将详细介绍如何使用 昇腾LLM分布式训练框架MindSpeed-LLM 进行 ChatGLM3-6B 模型的微调迁移,并结合工具进行性能分析和数据解析。 一、迁移准备 参考文档主要参考 昇腾LLM分布式训练框架MindSpeed-LLM 中的使用方式和流程进行迁移。 二、迁移步骤首先需要在安装好相关组件... 在自然语言处理领域,模型微调是一种强大的技术,可以让预训练模型适应特定的任务和数据集。本文将详细介绍如何使用 昇腾LLM分布式训练框架MindSpeed-LLM 进行 ChatGLM3-6B 模型的微调迁移,并结合工具进行性能分析和数据解析。 一、迁移准备 参考文档主要参考 昇腾LLM分布式训练框架MindSpeed-LLM 中的使用方式和流程进行迁移。 二、迁移步骤首先需要在安装好相关组件...
上滑加载中
推荐直播
-
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中 -
华为云码道全新升级,多会话并行与多智能体协作2026/05/08 周五 19:00-21:00
王一男-华为云码道产品专家;张嘉冉-华为云码道工程师;胡琦-华为云HCDE;程诗杰-华为云HCDG
华为云码道4月份版本全新升级,此次直播深度解读4月份产品特性,通过“特性解读+实操演示+实战案例+设计创新”的组合,全方位展现码道在多会话并行与多智能体协作方面的能力,赋能开发者提升效率
正在直播
热门标签