自然语言处理基础_标签_开发者

博客(500)
视频(0)
论坛(0)
云声(11)
代码示例(0)

《Llama 3：开源AI界的“羊驼”革命》
在技术革新的浪潮中，「开源」正成为一股不可小觑的力量！Meta，作为开源领域的佼佼者，其最新推出的Llama 3模型无疑再次证明了其在这一领域的领导地位。近日，Meta（原 Facebook）开源了他们公司的新一代大模型 Llama 3，虽然目前只放出了 8B 和 70B 两个版本，但是在评估结果上已经优于 Claude 3 Sonnet、Mistral Medium 和 GPT-3.5 等...

码上开花_Lancer
发表于2024-04-25 15:37:05
46198 1 0

46.1k 1 0

在技术革新的浪潮中，「开源」正成为一股不可小觑的力量！Meta，作为开源领域的佼佼者，其最新推出的Llama 3模型无疑再次证明了其在这一领域的领导地位。近日，Meta（原 Facebook）开源了他们公司的新一代大模型 Llama 3，虽然目前只放出了 8B 和 70B 两个版本，但是在评估结果上已经优于 Claude 3 Sonnet、Mistral Medium 和 GPT-3.5 等...
AI开发平台ModelArts Python 机器学习自然语言处理基础
爆圈Sora横空出世，AGI通用人工智能时代真的要来了吗？一键Run带你体验扩散模型的魅力！
Sora这几天的爆炸性新闻，让所有人工智能相关从业者及对应用感兴趣的人群都感到沸腾，震撼到央视也在进行相关的讨论，简直可以和2023年初ChatGPT讨论带来的热潮一般。所以它到底为什么这么火？一、什么是SORA?Sora 是OpenAI最新发布的文本生成视频模型，不仅可以生成长达一分钟的视频，且能完全遵照用户的 Prompt 并保持视觉质量。OpenAI 这个公司的格局非常大，他想要做...

码上开花_Lancer
发表于2024-03-06 17:51:21
8248 4 0

8.2k 4 0

Sora这几天的爆炸性新闻，让所有人工智能相关从业者及对应用感兴趣的人群都感到沸腾，震撼到央视也在进行相关的讨论，简直可以和2023年初ChatGPT讨论带来的热潮一般。所以它到底为什么这么火？一、什么是SORA?Sora 是OpenAI最新发布的文本生成视频模型，不仅可以生成长达一分钟的视频，且能完全遵照用户的 Prompt 并保持视觉质量。OpenAI 这个公司的格局非常大，他想要做...
AI开发平台ModelArts Python 机器学习自然语言处理基础
浅谈如何处理大语言模型训练数据之三开源数据集介绍
随着最近这些年来基于统计机器学习的自然语言处理的算法的发展，以及信息检索研究的需求，特别是近年来深度学习和预训练语言模型的研究以及国内国外许多大模型的开源，研究人员们构建了多种大规模开源数据集，涵盖了网页、图片、论文、百科等多个领域。在构建大语言模型时，数据的质量和多样性对于提高模型的性能至关重要‘同时，为了推动大模型的语言的研究和应用，学术界和工业界也开放了多个针对大语言模型的开源...

码上开花_Lancer
发表于2024-01-31 15:54:36
17427 0 1

17.4k 0 1

随着最近这些年来基于统计机器学习的自然语言处理的算法的发展，以及信息检索研究的需求，特别是近年来深度学习和预训练语言模型的研究以及国内国外许多大模型的开源，研究人员们构建了多种大规模开源数据集，涵盖了网页、图片、论文、百科等多个领域。在构建大语言模型时，数据的质量和多样性对于提高模型的性能至关重要‘同时，为了推动大模型的语言的研究和应用，学术界和工业界也开放了多个针对大语言模型的开源...
机器学习自然语言处理基础
浅谈如何处理大语言模型训练数据之一常见的数据处理方法
大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然，截止到2023 年9 月为止，还没有非常好的大模型的理论分析和解释，也缺乏对语言模型训练数据的严格说明和定义。但是，大多数研究人员都普遍认为训练数据是影响大语言模型效果以及样本泛化能力的关键因素之一。从此前的研究来看，预训练数据需要涵盖各种类型，包括网络数据、图书、论文、百科和社...

码上开花_Lancer
发表于2023-12-18 15:40:30
17258 1 4

17.2k 1 4

大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然，截止到2023 年9 月为止，还没有非常好的大模型的理论分析和解释，也缺乏对语言模型训练数据的严格说明和定义。但是，大多数研究人员都普遍认为训练数据是影响大语言模型效果以及样本泛化能力的关键因素之一。从此前的研究来看，预训练数据需要涵盖各种类型，包括网络数据、图书、论文、百科和社...
AI开发平台ModelArts 机器学习自然语言处理基础
大语言模型底层原理你都知道吗？大语言模型底层架构之二GPT实现
大语言模型底层架构之生成式预训练语言模型GPT 受到计算机视觉领域采用ImageNet对模型进行一次预训练，使得模型可以通过海量图像充分学习如何提取特征，然后再根据任务目标进行模型微调的范式影响，自然语言处理领域基于预训练语言模型的方法也逐渐成为主流。以ELMo为代表的动态词向量模型开启了语言模型预训练的大门，此后以GPT 和BERT为代表的基于Transformer 的大规模预训练语言模...

码上开花_Lancer
发表于2023-12-05 14:27:24
7361 0 0

7.3k 0 0

大语言模型底层架构之生成式预训练语言模型GPT 受到计算机视觉领域采用ImageNet对模型进行一次预训练，使得模型可以通过海量图像充分学习如何提取特征，然后再根据任务目标进行模型微调的范式影响，自然语言处理领域基于预训练语言模型的方法也逐渐成为主流。以ELMo为代表的动态词向量模型开启了语言模型预训练的大门，此后以GPT 和BERT为代表的基于Transformer 的大规模预训练语言模...
AI开发平台ModelArts Python 自然语言处理基础
大语言模型底层架构你了解多少？大语言模型底层架构之一Transfomer
语言模型目标是建模自然语言的概率分布，在自然语言处理研究中具有重要的作用，是自然语言处理基础任务之一。大量的研究从n 元语言模型（n-gram Language Models）、神经语言模型（Neural Language Models，NLM）以及预训练语言模型（Pre-trained Language Models，PLM）等不同角度开展了系列工作。这些研究在不同阶段都对自然语...

码上开花_Lancer
发表于2023-12-05 11:11:07
8189 0 2

8.1k 0 2

语言模型目标是建模自然语言的概率分布，在自然语言处理研究中具有重要的作用，是自然语言处理基础任务之一。大量的研究从n 元语言模型（n-gram Language Models）、神经语言模型（Neural Language Models，NLM）以及预训练语言模型（Pre-trained Language Models，PLM）等不同角度开展了系列工作。这些研究在不同阶段都对自然语...
AI开发平台ModelArts Python 机器学习自然语言处理基础
华为连续2年入选Gartner®企业低代码应用平台魔力象限
近日，全球咨询机构Gartner®发布《Magic Quadrant™ for Enterprise Low-Code Application Platforms》报告，华为入选该象限，作为中国唯一入选厂商，华为已连续两年入选Gartner®企业低代码应用平台魔力象限。

华为云PaaS服务小智
发表于2023-11-15 15:03:55
4473 0 0

4.4k 0 0

近日，全球咨询机构Gartner®发布《Magic Quadrant™ for Enterprise Low-Code Application Platforms》报告，华为入选该象限，作为中国唯一入选厂商，华为已连续两年入选Gartner®企业低代码应用平台魔力象限。
Astro轻应用 Astro Zero 自然语言处理基础
中国唯一！华为入选Gartner®企业低代码应用平台魔力象限
帮助企业在数字化转型道路上加速前进

华为云头条
发表于2023-11-14 15:46:20
4591 1 1

4.5k 1 1

帮助企业在数字化转型道路上加速前进
自然语言处理基础
华为云API自然语言处理的魅力—AI情感分析、文本分析
云服务、API、SDK，调试，查看，我都行阅读短文您可以学习到：人工智能AI自言语言的情感分析、文本分词、文本翻译

华为云PaaS服务小智
发表于2023-10-07 09:32:59
4493 0 1

4.4k 0 1

云服务、API、SDK，调试，查看，我都行阅读短文您可以学习到：人工智能AI自言语言的情感分析、文本分词、文本翻译
API IDE 自然语言处理基础
Huawei Cloud CodeArts Snap 智能编程助手PyCharm实验手册. 插件安装与使用指南
作为一款自主创新的AI代码辅助编程工具，华为云智能编程助手CodeArts Snap目标打造现代化开发新范式。通过将自然语言转化为规范可阅读、无开源漏洞的安全编程语言，提升开发者编程效率，助力企业快速响应市场需求。华为云CodeArts Snap现进入邀测阶段，可即刻下载体验！

华为云CodeArts Snap
发表于2023-04-27 17:41:02
15633 1 0

15.6k 1 0

作为一款自主创新的AI代码辅助编程工具，华为云智能编程助手CodeArts Snap目标打造现代化开发新范式。通过将自然语言转化为规范可阅读、无开源漏洞的安全编程语言，提升开发者编程效率，助力企业快速响应市场需求。华为云CodeArts Snap现进入邀测阶段，可即刻下载体验！
定制自然语言处理开发者自然语言处理基础语言理解语言生成
NLP专栏简介：数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性能调优、模型压缩算
NLP专栏简介：数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性能调优、模型压缩算法等

汀丶
发表于2023-04-07 21:18:56
3099 0 0

3.0k 0 0

NLP专栏简介：数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性能调优、模型压缩算法等
应用性能调优自然语言处理基础
自然语言处理实战——命名实体识别（二）
8.创建模型，开始训练耗时约15分钟model_fn = model_fn_builder( bert_config=bert_config, num_labels=len(label_list) + 1, init_checkpoint=init_checkpoint, learning_rate=learning_rate, ...

HWCloudAI
发表于2022-12-19 11:48:01
59453 0 0

59.4k 0 0

8.创建模型，开始训练耗时约15分钟model_fn = model_fn_builder( bert_config=bert_config, num_labels=len(label_list) + 1, init_checkpoint=init_checkpoint, learning_rate=learning_rate, ...
人工智能 AI开发平台ModelArts 自然语言处理基础
自然语言处理实战——命名实体识别（一）
自然语言处理实战——命名实体识别BERT模型(Bidirectional Encoder Representations from Transformers)是2018年10月谷歌推出的，它在机器阅读理解顶级水平测试SQuAD1.1中表现出惊人的成绩：全部两个衡量指标上全面超越人类，并且还在11种不同NLP测试中创出最佳成绩，包括将GLUE基准推至80.4％（绝对改进率7.6％），Mult...

HWCloudAI
发表于2022-12-19 11:47:03
4025 0 0

4.0k 0 0

自然语言处理实战——命名实体识别BERT模型(Bidirectional Encoder Representations from Transformers)是2018年10月谷歌推出的，它在机器阅读理解顶级水平测试SQuAD1.1中表现出惊人的成绩：全部两个衡量指标上全面超越人类，并且还在11种不同NLP测试中创出最佳成绩，包括将GLUE基准推至80.4％（绝对改进率7.6％），Mult...
人工智能 AI开发平台ModelArts 自然语言处理基础
自然语言处理介绍
自然语言处理介绍注意事项本案例推荐使用AI引擎：TensorFlow-1.13.1本案例最低硬件规格要求：2 vCPU + 4 GiB切换硬件规格方法：如需切换硬件规格，您可以在本页面右边的工作区进行切换运行代码方法：点击本页面顶部菜单栏的三角形运行按钮或按Ctrl+Enter键运行每个方块中的代码JupyterLab的详细用法：请参考《ModelAtrs JupyterLab使用指导...

HWCloudAI
发表于2022-12-19 11:43:01
8242 0 0

8.2k 0 0

自然语言处理介绍注意事项本案例推荐使用AI引擎：TensorFlow-1.13.1本案例最低硬件规格要求：2 vCPU + 4 GiB切换硬件规格方法：如需切换硬件规格，您可以在本页面右边的工作区进行切换运行代码方法：点击本页面顶部菜单栏的三角形运行按钮或按Ctrl+Enter键运行每个方块中的代码JupyterLab的详细用法：请参考《ModelAtrs JupyterLab使用指导...
人工智能 AI开发平台ModelArts 自然语言处理基础
PaddleNLPUIE--小样本快速提升性能（含doccona标注
需求跨领域跨任务：领域之间知识迁移难度高，如通用领域知识很难迁移到垂类领域，垂类领域之间的知识很难相互迁移；存在实体、关系、事件等不同的信息抽取任务需求。 - 定制化程度高：针对实体、关系、事件等不同的信息抽取任务，需要开发不同的模型，开发成本和机器资源消耗都很大。 - 训练数据无或很少：部分领域数据稀缺，难以获取，且领域专业性使得数据标注门槛高。

汀丶
发表于2022-11-02 10:29:05
3019 0 0

3.0k 0 0

需求跨领域跨任务：领域之间知识迁移难度高，如通用领域知识很难迁移到垂类领域，垂类领域之间的知识很难相互迁移；存在实体、关系、事件等不同的信息抽取任务需求。 - 定制化程度高：针对实体、关系、事件等不同的信息抽取任务，需要开发不同的模型，开发成本和机器资源消耗都很大。 - 训练数据无或很少：部分领域数据稀缺，难以获取，且领域专业性使得数据标注门槛高。
人工智能机器学习知识图谱自然语言处理基础

上滑加载中

推荐直播

0.5

基于开源鸿蒙+海思星闪开发板：嵌入式系统开发实战（Day1）
2025/03/29 周六 09:00-18:00

华为开发者布道师

本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用，涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容，旨在帮助学员全面掌握相关技术并进行实际操作
回顾中
华为云软件开发生产线（CodeArts）1月&2月新特性解读
2025/03/18 周二 19:00-20:00

阿星华为云高级产品经理

不知道产品的最新特性？没法和产品团队建立直接的沟通？本期直播产品经理将为您解读华为云软件开发生产线1月&2月发布的新特性，并在直播过程中为您答疑解惑。
回顾中
基于能力图谱的openGauss项目闯关
2025/03/20 周四 19:00-20:30

华为开发者布道师

想成为顶级数据库开发者吗？本次直播将从银行业务系统的数据库设计出发，带你逐步掌握openGauss的建库表、数据封装、密态技术、性能调优及AI应用。通过实战案例，全面展示openGauss的强大功能，助你提升技能，为未来的职业发展打下坚实基础。立即报名，开启你的数据库进阶之旅！
回顾中
基于开源鸿蒙+海思星闪开发板：嵌入式系统开发实战（Day1）
2025/03/29 周六 09:00-18:00

华为开发者布道师

本次为期两天的课程将深入讲解OpenHarmony操作系统及其与星闪技术的结合应用，涵盖WS63E星闪开发板的详细介绍、“OpenHarmony+星闪”的创新实践、实验环境搭建以及编写首个“Hello World”程序等内容，旨在帮助学员全面掌握相关技术并进行实际操作
回顾中
华为云软件开发生产线（CodeArts）1月&2月新特性解读
2025/03/18 周二 19:00-20:00

阿星华为云高级产品经理

不知道产品的最新特性？没法和产品团队建立直接的沟通？本期直播产品经理将为您解读华为云软件开发生产线1月&2月发布的新特性，并在直播过程中为您答疑解惑。
回顾中

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript

开发者空间

了解空间

工作台

开发工具

实战案例

空间活动

空间论坛

开发平台

软件开发生产线 CodeArts

AI平台ModelArts

数据治理中心 DataArts Studio

数字内容生产线 MetaStudio

精选服务

云数据库 GaussDB

云数据库 RDS for MySQL

MapReduce服务 MRS

数据仓库服务 DWS

分布式缓存服务Redis版

分布式消息服务 DMS

华为云实时音视频 SparkRTC

媒体处理 MPC

主机迁移服务 SMS

对象存储迁移服务 OMS

云消息服务 KooMessage

云手机服务 KooPhone

企业搜索服务 KooSearch

云地图服务 KooMap

更多开放能力

开发工具

API生态

CodeArts API

API Explorer

Terraform Explorer

KooCLI

API 中心

SDK 中心

开发服务

Codelabs

DevStar

低代码平台Astro

CodeArts IDE

Huawei Cloud Toolkit

Classroom

开发资源

开源镜像站

开源资源

开发语言

开发实践

入门精选

分发资源

企业应用中心

企业通用专区

教育专区

华为应用专区

政务云专区

硬件云服务商城

医疗健康专区

跳蚤市场

华为云开发者日

直播专区

开发者精品活动

DTSE Tech Talk

加入HCDE

加入HCDG

加入HCSD

加入HCWD

鲁班会

沃土云创计划·企业

沃土云创计划·高校

沃土云创计划·个人

沃土云创计划·开源共创

博客

论坛

专题

开发者榜单

学习路径

在线课程

动手实验

考试认证

培训服务