- 近年来随着深度学习的发展,模型参数的数量飞速增长。为了训练这些参数,需要更大的数据集来避免过拟合。然而,对于大部分NLP任务来说,构建大规模的标注数据集非常困难(成本过高),特别是对于句法和语义相关的任务。相比之下,大规模的未标注语料库的构建则相对容易。为了利用这些数据,我们可以先从其中学习到一个好的表示,再将这些表示应用到其他任务中。最近的研究表明,基于大规模未标注语料库的预训练模型(Pretr 近年来随着深度学习的发展,模型参数的数量飞速增长。为了训练这些参数,需要更大的数据集来避免过拟合。然而,对于大部分NLP任务来说,构建大规模的标注数据集非常困难(成本过高),特别是对于句法和语义相关的任务。相比之下,大规模的未标注语料库的构建则相对容易。为了利用这些数据,我们可以先从其中学习到一个好的表示,再将这些表示应用到其他任务中。最近的研究表明,基于大规模未标注语料库的预训练模型(Pretr
- 对于标注样本充足的场景可以直接使用预训练模型微调实现文本多分类,对于尚无标注或者标注样本较少的任务场景我们推荐使用小样本学习,以取得比微调方法更好的效果。 下边通过新闻分类的例子展示如何使用小样本学习来进行文本分类。 对于标注样本充足的场景可以直接使用预训练模型微调实现文本多分类,对于尚无标注或者标注样本较少的任务场景我们推荐使用小样本学习,以取得比微调方法更好的效果。 下边通过新闻分类的例子展示如何使用小样本学习来进行文本分类。
- 本篇文章提出了叠加生成对抗网络(StackGAN)与条件增强,用于从文本合成现实图像,被2017年ICCV(International Conference on Computer Vision)会议录取。论文地址: https://arxiv.org/pdf/1612.03242.pdf代码地址: https://github.com/hanzhanggit/StackGAN本篇是精读这篇... 本篇文章提出了叠加生成对抗网络(StackGAN)与条件增强,用于从文本合成现实图像,被2017年ICCV(International Conference on Computer Vision)会议录取。论文地址: https://arxiv.org/pdf/1612.03242.pdf代码地址: https://github.com/hanzhanggit/StackGAN本篇是精读这篇...
- 11月10日上午,由工业和信息化部、浙江省人民政府主办的工业互联网论坛在浙江乌镇举行。论坛聚焦“数字化赋能产业链重构”,邀请业界专家、企业家、机构代表等齐聚一堂,就数字化背景下的技术赋能与产业创新开展交流分享。 11月10日上午,由工业和信息化部、浙江省人民政府主办的工业互联网论坛在浙江乌镇举行。论坛聚焦“数字化赋能产业链重构”,邀请业界专家、企业家、机构代表等齐聚一堂,就数字化背景下的技术赋能与产业创新开展交流分享。
- 推广TrustAI可信分析:通过提升数据质量来增强在ERNIE模型下性能 推广TrustAI可信分析:通过提升数据质量来增强在ERNIE模型下性能
- 人工智能(AI)技术在各行各业中得到普遍应用,然而对于AI开发者来说,在AI 应用开发工程中,都会面临着不小的麻烦。例如如何安装开发所需的复杂的环境,如何选择合适的算法,如何找寻训练算法所需的设备,如何快速的部署上线一个AI模型…… 11月14日 19:00-20:30 华为云AI开发高级工程师小童老师带你0代码快速训练AI模型,使用ModelArts平台的免费资源提升开发能力。 人工智能(AI)技术在各行各业中得到普遍应用,然而对于AI开发者来说,在AI 应用开发工程中,都会面临着不小的麻烦。例如如何安装开发所需的复杂的环境,如何选择合适的算法,如何找寻训练算法所需的设备,如何快速的部署上线一个AI模型…… 11月14日 19:00-20:30 华为云AI开发高级工程师小童老师带你0代码快速训练AI模型,使用ModelArts平台的免费资源提升开发能力。
- 11月7日,华为面向ICT产业的年度旗舰活动——华为全联接大会2022在深圳和线上举办。 11月7日,华为面向ICT产业的年度旗舰活动——华为全联接大会2022在深圳和线上举办。
- 快递单信息抽取【二】基于ERNIE1.0至ErnieGram + CRF预训练模型 快递单信息抽取【二】基于ERNIE1.0至ErnieGram + CRF预训练模型
- 基于Ernie-3.0 CAIL2019法研杯要素识别多标签分类任务 基于Ernie-3.0 CAIL2019法研杯要素识别多标签分类任务
- PaddleNLP通用信息抽取技术UIE【一】产业应用实例:信息抽取{实体关系抽取、中文分词、精准实体标。情感分析等}、文本纠错、问答系统、闲聊机器人、定制训练 PaddleNLP通用信息抽取技术UIE【一】产业应用实例:信息抽取{实体关系抽取、中文分词、精准实体标。情感分析等}、文本纠错、问答系统、闲聊机器人、定制训练
- Paddlenlp之UIE模型实战实体抽取任务【打车数据、快递单】 Paddlenlp之UIE模型实战实体抽取任务【打车数据、快递单】
- 本文提出了一种针对文字识别的半监督方法。区别于常见的半监督方法,本文的针对文字识别这类序列识别问题做出了特定的设计。具体来说,本文首先采用了teacher-student的网络结构,然后采用字符级别的一致性约束对teacher和student网络的预测进行对齐。此外,考虑到文字识别是step-by-step,每一个字符的预测都和之前时刻的预测结果相关。 本文提出了一种针对文字识别的半监督方法。区别于常见的半监督方法,本文的针对文字识别这类序列识别问题做出了特定的设计。具体来说,本文首先采用了teacher-student的网络结构,然后采用字符级别的一致性约束对teacher和student网络的预测进行对齐。此外,考虑到文字识别是step-by-step,每一个字符的预测都和之前时刻的预测结果相关。
- 本项目主要讲解了犯罪名预测任务、以及doccano标注指南(对于多分类多标签问题),和对性能指标的简单探讨,可以看到实际更多问题是关于多标签分类的。 本项目主要讲解了犯罪名预测任务、以及doccano标注指南(对于多分类多标签问题),和对性能指标的简单探讨,可以看到实际更多问题是关于多标签分类的。
- AiTrust下预训练和小样本学习在中文医疗信息处理挑战榜CBLUE表现 AiTrust下预训练和小样本学习在中文医疗信息处理挑战榜CBLUE表现
- 近年来,语义表示(language representation)技术的发展,使得 “预训练-微调” 作为解决NLP任务的一种新的范式开始出现。一个通用的表示能力强的模型被选择为语义表示模型,在预训练阶段,用大量的语料和特定的任务训练该模型,使其编码海量的语义知识;在微调阶段,该模型会被加上不同的简单输出层用以解决下游的 NLP 任务。早期较为著名的语义表示模型包括[ELMo] 近年来,语义表示(language representation)技术的发展,使得 “预训练-微调” 作为解决NLP任务的一种新的范式开始出现。一个通用的表示能力强的模型被选择为语义表示模型,在预训练阶段,用大量的语料和特定的任务训练该模型,使其编码海量的语义知识;在微调阶段,该模型会被加上不同的简单输出层用以解决下游的 NLP 任务。早期较为著名的语义表示模型包括[ELMo]
上滑加载中
推荐直播
-
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中 -
码道新技能,AI 新生产力——从自动视频生成到开源项目解析2026/04/08 周三 19:00-21:00
童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人
本次华为云码道 Skill 实战活动,聚焦两大 AI 开发场景:通过实战教学,带你打造 AI 编程自动生成视频 Skill,并实现对 GitHub 热门开源项目的智能知识抽取,手把手掌握 Skill 开发全流程,用 AI 提升研发效率与内容生产力。
回顾中 -
华为云码道:零代码股票智能决策平台全功能实战2026/04/18 周六 10:00-12:00
秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家
利用Tushare接口获取实时行情数据,采用Transformer算法进行时序预测与涨跌分析,并集成DeepSeek API提供智能解读。同时,项目深度结合华为云CodeArts(码道)的代码智能体能力,实现代码一键推送至云端代码仓库,建立起高效、可协作的团队开发新范式。开发者可快速上手,从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
热门标签