机器学习_标签_开发者_华为云

博客(8.0k)
视频(11)
论坛(0)
云声(0)
代码示例(0)

5月8日19:00锁定CANN训练营直播间，大神讲解Ascend C算子开发流程
扫码报名CANN训练营24年第一季，限时领取免费学习资源，完成认证考核赢华为手机、开发板等重磅大奖！

哈小主
发表于2024-05-06 15:46:42
249904 0 0

249.9k 0 0

扫码报名CANN训练营24年第一季，限时领取免费学习资源，完成认证考核赢华为手机、开发板等重磅大奖！
机器学习视频直播
大模型LLM之分布式训练
随着语言模型参数量和所需训练数据量的急速增长，单个机器上有限的资源已无法满足大语言模型训练的要求。需要设计分布式训练（Distributed Training）系统来解决海量的计算和内存资源要求问题。在分布式训练系统环境下需要将一个模型训练任务拆分成多个子任务，并将子任务分发给多个计算设备，从而解决资源瓶颈。但是如何才能利用包括数万计算加速芯片的集群，训练模型参数量千亿甚至是万亿的大...

码上开花_Lancer
发表于2024-05-06 15:02:03
13629 0 1

13.6k 0 1

随着语言模型参数量和所需训练数据量的急速增长，单个机器上有限的资源已无法满足大语言模型训练的要求。需要设计分布式训练（Distributed Training）系统来解决海量的计算和内存资源要求问题。在分布式训练系统环境下需要将一个模型训练任务拆分成多个子任务，并将子任务分发给多个计算设备，从而解决资源瓶颈。但是如何才能利用包括数万计算加速芯片的集群，训练模型参数量千亿甚至是万亿的大...
分布式机器学习
《Llama 3：开源AI界的“羊驼”革命》
在技术革新的浪潮中，「开源」正成为一股不可小觑的力量！Meta，作为开源领域的佼佼者，其最新推出的Llama 3模型无疑再次证明了其在这一领域的领导地位。近日，Meta（原 Facebook）开源了他们公司的新一代大模型 Llama 3，虽然目前只放出了 8B 和 70B 两个版本，但是在评估结果上已经优于 Claude 3 Sonnet、Mistral Medium 和 GPT-3.5 等...

码上开花_Lancer
发表于2024-04-25 15:37:05
48972 1 0

48.9k 1 0

在技术革新的浪潮中，「开源」正成为一股不可小觑的力量！Meta，作为开源领域的佼佼者，其最新推出的Llama 3模型无疑再次证明了其在这一领域的领导地位。近日，Meta（原 Facebook）开源了他们公司的新一代大模型 Llama 3，虽然目前只放出了 8B 和 70B 两个版本，但是在评估结果上已经优于 Claude 3 Sonnet、Mistral Medium 和 GPT-3.5 等...
AI开发平台ModelArts Python 机器学习自然语言处理基础
华为云亮相KubeCon EU 2024，以持续开源创新开启智能时代
3月21日，在巴黎举办的云原生顶级峰会KubeCon EU 2024上，华为云首席架构师顾炯炯在“Cloud Native x AI：以持续开源创新开启智能时代”的主题演讲中指出，云原生和AI技术的融合，是推动产业深刻变革的关键所在。华为云将持续进行开源创新，与开发者共启智能时代。▲华为云首席架构师顾炯炯发表演讲▶AI对于云原生范式提出关键挑战在过去的几年里，云原生彻底改变了传统的IT系统...

华为云头条
发表于2024-03-25 16:56:08
7158 0 0

7.1k 0 0

3月21日，在巴黎举办的云原生顶级峰会KubeCon EU 2024上，华为云首席架构师顾炯炯在“Cloud Native x AI：以持续开源创新开启智能时代”的主题演讲中指出，云原生和AI技术的融合，是推动产业深刻变革的关键所在。华为云将持续进行开源创新，与开发者共启智能时代。▲华为云首席架构师顾炯炯发表演讲▶AI对于云原生范式提出关键挑战在过去的几年里，云原生彻底改变了传统的IT系统...
机器学习
华为云&深圳市气象局，人工智能区域预报模型“智霁”1.0发布！
今天世界气象日“气候行动最前线”主题活动上华为云&深圳市气象局发布首个人工智能区域预报模型“智霁”1.0模型现已正式上线华为云联合深圳气象局率先开展人工智能区域预报模型联创研发。“智霁”区域模型以华为云盘古气象大模型为基础，融合区域高质量气象数据集，可快速得到未来5天深圳及周边地区空间分辨率为3公里，包含气温、降雨、风速等气象要素的预报。在历时半年的深度联创过程中，华为云投入大量AI算力支撑...

华为云头条
发表于2024-03-23 15:50:51
5134 0 0

5.1k 0 0

今天世界气象日“气候行动最前线”主题活动上华为云&深圳市气象局发布首个人工智能区域预报模型“智霁”1.0模型现已正式上线华为云联合深圳气象局率先开展人工智能区域预报模型联创研发。“智霁”区域模型以华为云盘古气象大模型为基础，融合区域高质量气象数据集，可快速得到未来5天深圳及周边地区空间分辨率为3公里，包含气温、降雨、风速等气象要素的预报。在历时半年的深度联创过程中，华为云投入大量AI算力支撑...
机器学习
爆圈Sora横空出世，AGI通用人工智能时代真的要来了吗？一键Run带你体验扩散模型的魅力！
Sora这几天的爆炸性新闻，让所有人工智能相关从业者及对应用感兴趣的人群都感到沸腾，震撼到央视也在进行相关的讨论，简直可以和2023年初ChatGPT讨论带来的热潮一般。所以它到底为什么这么火？一、什么是SORA?Sora 是OpenAI最新发布的文本生成视频模型，不仅可以生成长达一分钟的视频，且能完全遵照用户的 Prompt 并保持视觉质量。OpenAI 这个公司的格局非常大，他想要做...

码上开花_Lancer
发表于2024-03-06 17:51:21
11307 4 0

11.3k 4 0

Sora这几天的爆炸性新闻，让所有人工智能相关从业者及对应用感兴趣的人群都感到沸腾，震撼到央视也在进行相关的讨论，简直可以和2023年初ChatGPT讨论带来的热潮一般。所以它到底为什么这么火？一、什么是SORA?Sora 是OpenAI最新发布的文本生成视频模型，不仅可以生成长达一分钟的视频，且能完全遵照用户的 Prompt 并保持视觉质量。OpenAI 这个公司的格局非常大，他想要做...
AI开发平台ModelArts Python 机器学习自然语言处理基础
为了今天这句“万事顺遂”，我们升级了盘古数字人大模型
除夕是中国人一年中最热闹喜庆的节日可有些人却被困在寂静里根据第二次全国残疾人抽样调查结果，我国现有2780万听障人士。因为听觉的缺失，他们日常生活面临许多问题，更难以在像今天这样重要的日子里，亲口说出新春的祝愿。我们可以做些什么帮助他们打破跟世界对话的屏障呢？历时数月，华为云的工程师们升级了盘古数字人大模型，只为帮助一个女孩在这个除夕，对世界说一句，“愿你在新的一年里，万事顺遂，身体健康”。...

华为云头条
发表于2024-02-09 10:19:05
7207 1 1

7.2k 1 1

除夕是中国人一年中最热闹喜庆的节日可有些人却被困在寂静里根据第二次全国残疾人抽样调查结果，我国现有2780万听障人士。因为听觉的缺失，他们日常生活面临许多问题，更难以在像今天这样重要的日子里，亲口说出新春的祝愿。我们可以做些什么帮助他们打破跟世界对话的屏障呢？历时数月，华为云的工程师们升级了盘古数字人大模型，只为帮助一个女孩在这个除夕，对世界说一句，“愿你在新的一年里，万事顺遂，身体健康”。...
机器学习
浅谈如何处理大语言模型训练数据之三开源数据集介绍
随着最近这些年来基于统计机器学习的自然语言处理的算法的发展，以及信息检索研究的需求，特别是近年来深度学习和预训练语言模型的研究以及国内国外许多大模型的开源，研究人员们构建了多种大规模开源数据集，涵盖了网页、图片、论文、百科等多个领域。在构建大语言模型时，数据的质量和多样性对于提高模型的性能至关重要‘同时，为了推动大模型的语言的研究和应用，学术界和工业界也开放了多个针对大语言模型的开源...

码上开花_Lancer
发表于2024-01-31 15:54:36
21354 0 1

21.3k 0 1

随着最近这些年来基于统计机器学习的自然语言处理的算法的发展，以及信息检索研究的需求，特别是近年来深度学习和预训练语言模型的研究以及国内国外许多大模型的开源，研究人员们构建了多种大规模开源数据集，涵盖了网页、图片、论文、百科等多个领域。在构建大语言模型时，数据的质量和多样性对于提高模型的性能至关重要‘同时，为了推动大模型的语言的研究和应用，学术界和工业界也开放了多个针对大语言模型的开源...
机器学习自然语言处理基础
ICDM'23 BICE论文解读
华为云数据库创新Lab在论文《Efficient Cardinality and Cost Estimation with Bidirectional Compressor-based Ensemble Learning》中提出了基于集成学习的基数和代价估计模型。本文发表在ICDM'23上， ICDM会议是由电气与电子工程师协会组织的、数据挖掘领域的顶级国际学术会议。

数据库创新实验室
发表于2024-01-17 17:39:51
267593 0 0

267.5k 0 0

华为云数据库创新Lab在论文《Efficient Cardinality and Cost Estimation with Bidirectional Compressor-based Ensemble Learning》中提出了基于集成学习的基数和代价估计模型。本文发表在ICDM'23上， ICDM会议是由电气与电子工程师协会组织的、数据挖掘领域的顶级国际学术会议。
数据库数据挖掘机器学习
浅谈如何处理大语言模型训练数据之一常见的数据处理方法
大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然，截止到2023 年9 月为止，还没有非常好的大模型的理论分析和解释，也缺乏对语言模型训练数据的严格说明和定义。但是，大多数研究人员都普遍认为训练数据是影响大语言模型效果以及样本泛化能力的关键因素之一。从此前的研究来看，预训练数据需要涵盖各种类型，包括网络数据、图书、论文、百科和社...

码上开花_Lancer
发表于2023-12-18 15:40:30
23676 1 4

23.6k 1 4

大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然，截止到2023 年9 月为止，还没有非常好的大模型的理论分析和解释，也缺乏对语言模型训练数据的严格说明和定义。但是，大多数研究人员都普遍认为训练数据是影响大语言模型效果以及样本泛化能力的关键因素之一。从此前的研究来看，预训练数据需要涵盖各种类型，包括网络数据、图书、论文、百科和社...
AI开发平台ModelArts 机器学习自然语言处理基础
大模型那么火，教你一键Modelarts玩转开源LlaMA(羊驼)大模型
近日，开发者群体正热议一款基于开源模型更换张量（Tensor）名字的话题。研究者认为零一万物近期发布的Yi-34B 模型基本上采用了 LLaMA 的架构，只是重命名了两个张量。LlaMA(羊驼)这个大模型再次冲上热搜！LLaMA（Large Language Model Meta AI），由 Meta AI 发布的一个开放且高效的大型基础语言模型，共有 7B、13B、33B、65B（650 ...

码上开花_Lancer
发表于2023-12-13 17:57:52
15016 0 1

15.0k 0 1

近日，开发者群体正热议一款基于开源模型更换张量（Tensor）名字的话题。研究者认为零一万物近期发布的Yi-34B 模型基本上采用了 LLaMA 的架构，只是重命名了两个张量。LlaMA(羊驼)这个大模型再次冲上热搜！LLaMA（Large Language Model Meta AI），由 Meta AI 发布的一个开放且高效的大型基础语言模型，共有 7B、13B、33B、65B（650 ...
AI开发平台ModelArts 机器学习
大语言模型底层架构你了解多少？大语言模型底层架构之一Transfomer
语言模型目标是建模自然语言的概率分布，在自然语言处理研究中具有重要的作用，是自然语言处理基础任务之一。大量的研究从n 元语言模型（n-gram Language Models）、神经语言模型（Neural Language Models，NLM）以及预训练语言模型（Pre-trained Language Models，PLM）等不同角度开展了系列工作。这些研究在不同阶段都对自然语...

码上开花_Lancer
发表于2023-12-05 11:11:07
11622 0 2

11.6k 0 2

语言模型目标是建模自然语言的概率分布，在自然语言处理研究中具有重要的作用，是自然语言处理基础任务之一。大量的研究从n 元语言模型（n-gram Language Models）、神经语言模型（Neural Language Models，NLM）以及预训练语言模型（Pre-trained Language Models，PLM）等不同角度开展了系列工作。这些研究在不同阶段都对自然语...
AI开发平台ModelArts Python 机器学习自然语言处理基础
【AIOps】一种全新的日志异常检测评估框架：LightAD，相关成果已被软工顶会ICSE 2024录用
深度学习（DL）虽然在日志异常检测中得到了不少应用，但在实际轻量级运维模型选择中，必须仔细考虑异常检测方法与计算成本的关系。具体来说，尽管深度学习方法在日志异常检测方面取得了出色的性能，但它们通常需要更长的时间来进行日志预处理、模型训练和模型推断，从而阻碍了它们在需要快速部署日志异常检测服务的在线分布式云系统中的采用。本文对现有的基于经典机器学习和深度学习方法的日志异常检测方法进行了实证研究...

华为云软件工具链
发表于2023-12-01 14:56:25
8607 0 0

8.6k 0 0

深度学习（DL）虽然在日志异常检测中得到了不少应用，但在实际轻量级运维模型选择中，必须仔细考虑异常检测方法与计算成本的关系。具体来说，尽管深度学习方法在日志异常检测方面取得了出色的性能，但它们通常需要更长的时间来进行日志预处理、模型训练和模型推断，从而阻碍了它们在需要快速部署日志异常检测服务的在线分布式云系统中的采用。本文对现有的基于经典机器学习和深度学习方法的日志异常检测方法进行了实证研究...
机器学习深度学习
从HumanEval到CoderEval: 你的代码生成模型真的work吗？
本文主要介绍了一个名为CoderEval的代码生成大模型评估基准，并对三个代码生成模型（CodeGen、PanGu-Coder和ChatGPT）在该基准上的表现进行了评估和比较。研究人员从真实的开源项目中的选取了代码生成任务来构建CoderEval，并根据对外部依赖的程度为标准将这些任务分为6个等级、根据生成的目标分为3类生成任务，以更多维地评估不同大模型在不同上下文场景中的生成效果。实验结...

华为云软件分析Lab
发表于2023-11-17 14:48:21
9692 0 0

9.6k 0 0

本文主要介绍了一个名为CoderEval的代码生成大模型评估基准，并对三个代码生成模型（CodeGen、PanGu-Coder和ChatGPT）在该基准上的表现进行了评估和比较。研究人员从真实的开源项目中的选取了代码生成任务来构建CoderEval，并根据对外部依赖的程度为标准将这些任务分为6个等级、根据生成的目标分为3类生成任务，以更多维地评估不同大模型在不同上下文场景中的生成效果。实验结...
机器学习
昇腾CANN 7.0 黑科技：DVPP硬件加速训练数据预处理，友好解决Host CPU预处理瓶颈
随着人工智能的快速发展，越来越多的应用场景需要使用机器学习和深度学习模型。AI网络模型的训练一般分成两个关键部分，一个是训练数据预处理，一个是模型训练，如何提升两者的处理性能成为提升模型训练性能的关键。一般情况下，数据加载预处理由host CPU处理，而模型训练计算是在NPU或GPU上处理的，两者一般并行执行，因此训练一次迭代的时间通常是两个处理时间的最大值。

昇腾CANN
发表于2023-11-08 22:32:41
12747 0 0

12.7k 0 0

随着人工智能的快速发展，越来越多的应用场景需要使用机器学习和深度学习模型。AI网络模型的训练一般分成两个关键部分，一个是训练数据预处理，一个是模型训练，如何提升两者的处理性能成为提升模型训练性能的关键。一般情况下，数据加载预处理由host CPU处理，而模型训练计算是在NPU或GPU上处理的，两者一般并行执行，因此训练一次迭代的时间通常是两个处理时间的最大值。
昇腾机器学习

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript