- 近年来随着深度学习的发展,模型参数的数量飞速增长。为了训练这些参数,需要更大的数据集来避免过拟合。然而,对于大部分NLP任务来说,构建大规模的标注数据集非常困难(成本过高),特别是对于句法和语义相关的任务。相比之下,大规模的未标注语料库的构建则相对容易。为了利用这些数据,我们可以先从其中学习到一个好的表示,再将这些表示应用到其他任务中。最近的研究表明,基于大规模未标注语料库的预训练模型(Pretr 近年来随着深度学习的发展,模型参数的数量飞速增长。为了训练这些参数,需要更大的数据集来避免过拟合。然而,对于大部分NLP任务来说,构建大规模的标注数据集非常困难(成本过高),特别是对于句法和语义相关的任务。相比之下,大规模的未标注语料库的构建则相对容易。为了利用这些数据,我们可以先从其中学习到一个好的表示,再将这些表示应用到其他任务中。最近的研究表明,基于大规模未标注语料库的预训练模型(Pretr
- 对于标注样本充足的场景可以直接使用预训练模型微调实现文本多分类,对于尚无标注或者标注样本较少的任务场景我们推荐使用小样本学习,以取得比微调方法更好的效果。 下边通过新闻分类的例子展示如何使用小样本学习来进行文本分类。 对于标注样本充足的场景可以直接使用预训练模型微调实现文本多分类,对于尚无标注或者标注样本较少的任务场景我们推荐使用小样本学习,以取得比微调方法更好的效果。 下边通过新闻分类的例子展示如何使用小样本学习来进行文本分类。
- 本篇文章提出了叠加生成对抗网络(StackGAN)与条件增强,用于从文本合成现实图像,被2017年ICCV(International Conference on Computer Vision)会议录取。论文地址: https://arxiv.org/pdf/1612.03242.pdf代码地址: https://github.com/hanzhanggit/StackGAN本篇是精读这篇... 本篇文章提出了叠加生成对抗网络(StackGAN)与条件增强,用于从文本合成现实图像,被2017年ICCV(International Conference on Computer Vision)会议录取。论文地址: https://arxiv.org/pdf/1612.03242.pdf代码地址: https://github.com/hanzhanggit/StackGAN本篇是精读这篇...
- 11月10日上午,由工业和信息化部、浙江省人民政府主办的工业互联网论坛在浙江乌镇举行。论坛聚焦“数字化赋能产业链重构”,邀请业界专家、企业家、机构代表等齐聚一堂,就数字化背景下的技术赋能与产业创新开展交流分享。 11月10日上午,由工业和信息化部、浙江省人民政府主办的工业互联网论坛在浙江乌镇举行。论坛聚焦“数字化赋能产业链重构”,邀请业界专家、企业家、机构代表等齐聚一堂,就数字化背景下的技术赋能与产业创新开展交流分享。
- 推广TrustAI可信分析:通过提升数据质量来增强在ERNIE模型下性能 推广TrustAI可信分析:通过提升数据质量来增强在ERNIE模型下性能
- 人工智能(AI)技术在各行各业中得到普遍应用,然而对于AI开发者来说,在AI 应用开发工程中,都会面临着不小的麻烦。例如如何安装开发所需的复杂的环境,如何选择合适的算法,如何找寻训练算法所需的设备,如何快速的部署上线一个AI模型…… 11月14日 19:00-20:30 华为云AI开发高级工程师小童老师带你0代码快速训练AI模型,使用ModelArts平台的免费资源提升开发能力。 人工智能(AI)技术在各行各业中得到普遍应用,然而对于AI开发者来说,在AI 应用开发工程中,都会面临着不小的麻烦。例如如何安装开发所需的复杂的环境,如何选择合适的算法,如何找寻训练算法所需的设备,如何快速的部署上线一个AI模型…… 11月14日 19:00-20:30 华为云AI开发高级工程师小童老师带你0代码快速训练AI模型,使用ModelArts平台的免费资源提升开发能力。
- 11月7日,华为面向ICT产业的年度旗舰活动——华为全联接大会2022在深圳和线上举办。 11月7日,华为面向ICT产业的年度旗舰活动——华为全联接大会2022在深圳和线上举办。
- 快递单信息抽取【二】基于ERNIE1.0至ErnieGram + CRF预训练模型 快递单信息抽取【二】基于ERNIE1.0至ErnieGram + CRF预训练模型
- 基于Ernie-3.0 CAIL2019法研杯要素识别多标签分类任务 基于Ernie-3.0 CAIL2019法研杯要素识别多标签分类任务
- PaddleNLP通用信息抽取技术UIE【一】产业应用实例:信息抽取{实体关系抽取、中文分词、精准实体标。情感分析等}、文本纠错、问答系统、闲聊机器人、定制训练 PaddleNLP通用信息抽取技术UIE【一】产业应用实例:信息抽取{实体关系抽取、中文分词、精准实体标。情感分析等}、文本纠错、问答系统、闲聊机器人、定制训练
- Paddlenlp之UIE模型实战实体抽取任务【打车数据、快递单】 Paddlenlp之UIE模型实战实体抽取任务【打车数据、快递单】
- 本文提出了一种针对文字识别的半监督方法。区别于常见的半监督方法,本文的针对文字识别这类序列识别问题做出了特定的设计。具体来说,本文首先采用了teacher-student的网络结构,然后采用字符级别的一致性约束对teacher和student网络的预测进行对齐。此外,考虑到文字识别是step-by-step,每一个字符的预测都和之前时刻的预测结果相关。 本文提出了一种针对文字识别的半监督方法。区别于常见的半监督方法,本文的针对文字识别这类序列识别问题做出了特定的设计。具体来说,本文首先采用了teacher-student的网络结构,然后采用字符级别的一致性约束对teacher和student网络的预测进行对齐。此外,考虑到文字识别是step-by-step,每一个字符的预测都和之前时刻的预测结果相关。
- 本项目主要讲解了犯罪名预测任务、以及doccano标注指南(对于多分类多标签问题),和对性能指标的简单探讨,可以看到实际更多问题是关于多标签分类的。 本项目主要讲解了犯罪名预测任务、以及doccano标注指南(对于多分类多标签问题),和对性能指标的简单探讨,可以看到实际更多问题是关于多标签分类的。
- AiTrust下预训练和小样本学习在中文医疗信息处理挑战榜CBLUE表现 AiTrust下预训练和小样本学习在中文医疗信息处理挑战榜CBLUE表现
- 近年来,语义表示(language representation)技术的发展,使得 “预训练-微调” 作为解决NLP任务的一种新的范式开始出现。一个通用的表示能力强的模型被选择为语义表示模型,在预训练阶段,用大量的语料和特定的任务训练该模型,使其编码海量的语义知识;在微调阶段,该模型会被加上不同的简单输出层用以解决下游的 NLP 任务。早期较为著名的语义表示模型包括[ELMo] 近年来,语义表示(language representation)技术的发展,使得 “预训练-微调” 作为解决NLP任务的一种新的范式开始出现。一个通用的表示能力强的模型被选择为语义表示模型,在预训练阶段,用大量的语料和特定的任务训练该模型,使其编码海量的语义知识;在微调阶段,该模型会被加上不同的简单输出层用以解决下游的 NLP 任务。早期较为著名的语义表示模型包括[ELMo]
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签