机器学习_标签_开发者_华为云

博客(7.9k)
视频(11)
论坛(0)
云声(0)
代码示例(0)

别只会写脚本了！看看机器学习是怎么帮运维“摸鱼”的
别只会写脚本了！看看机器学习是怎么帮运维“摸鱼”的

Echo_Wish
发表于2025-07-01 21:43:00
743 0 0

743 0 0

别只会写脚本了！看看机器学习是怎么帮运维“摸鱼”的
机器学习运维
浅谈 Transformer 模型的输入嵌入环节
如下图所示，笔者最近学习 Transformer 模型的架构，学习到了输入嵌入这一章节。本文是笔者的学习笔记。输入嵌入的定义输入嵌入（Input Embedding）是将离散的符号（如单词、字符）转换为连续的向量表示的一种方法。神经网络在处理输入数据时，无法直接处理离散符号，因此需要将这些符号映射到一个高维的实数向量空间中。这样，输入嵌入使得网络能够捕捉到符号之间的语义关系，并使模型的训练...

汪子熙
发表于2025-07-01 20:26:06
1438 0 0

1.4k 0 0

如下图所示，笔者最近学习 Transformer 模型的架构，学习到了输入嵌入这一章节。本文是笔者的学习笔记。输入嵌入的定义输入嵌入（Input Embedding）是将离散的符号（如单词、字符）转换为连续的向量表示的一种方法。神经网络在处理输入数据时，无法直接处理离散符号，因此需要将这些符号映射到一个高维的实数向量空间中。这样，输入嵌入使得网络能够捕捉到符号之间的语义关系，并使模型的训练...
机器学习
什么是 Transformer 模型输入层使用的词元化方法
笔者最近在学习 Transformer 模型的实现细节。在下面这本书的输入嵌入章节，提到了词元化方法的概念。词元化方法简介词元化（Tokenization）是自然语言处理中的一个核心步骤，涉及将文本数据转换为模型可以理解的基本单元。这个步骤的重要性毋庸置疑，因为文本数据本质上是字符串，无法直接输入到机器学习模型中，尤其是神经网络模型中。通过词元化，文本数据可以被分解为更小的单位（如词、子词...

汪子熙
发表于2025-07-01 20:25:31
1143 0 0

1.1k 0 0

笔者最近在学习 Transformer 模型的实现细节。在下面这本书的输入嵌入章节，提到了词元化方法的概念。词元化方法简介词元化（Tokenization）是自然语言处理中的一个核心步骤，涉及将文本数据转换为模型可以理解的基本单元。这个步骤的重要性毋庸置疑，因为文本数据本质上是字符串，无法直接输入到机器学习模型中，尤其是神经网络模型中。通过词元化，文本数据可以被分解为更小的单位（如词、子词...
Python 机器学习
ABoVE/ASCENDS：2017 年二氧化碳探测器大气后向散射系数剖面图
ABoVE/ASCENDS: Atmospheric Backscattering Coefficient Profiles from CO2 Sounder, 2017简介该数据集提供了 2017 年 7 月 20 日至 2017 年 8 月 8 日在美国阿拉斯加、加拿大育空地区和西北地区开展的“夜间、白天和季节二氧化碳排放主动感知” (ASCENDS) 部署期间收集的大气后向散射系数剖...

此星光明
发表于2025-07-01 15:12:35
1133 0 0

1.1k 0 0

ABoVE/ASCENDS: Atmospheric Backscattering Coefficient Profiles from CO2 Sounder, 2017简介该数据集提供了 2017 年 7 月 20 日至 2017 年 8 月 8 日在美国阿拉斯加、加拿大育空地区和西北地区开展的“夜间、白天和季节二氧化碳排放主动感知” (ASCENDS) 部署期间收集的大气后向散射系数剖...
Python 大数据数据挖掘机器学习遥感
大模型参数量选型指南：从业务需求到技术落地的全流程决策框架
大模型参数量选型指南：从业务需求到技术落地的全流程决策框架

阿依纳伐
发表于2025-07-01 12:59:26
28464 0 0

28.4k 0 0

大模型参数量选型指南：从业务需求到技术落地的全流程决策框架
昇腾机器学习
大模型参数全景解析：从 7B 到 7180B 的技术内涵与华为云实践
在大模型领域，我们常常会看到诸如 7B、32B、671B 这样的表述，这里的 “B” 是 “billion” 的缩写，意为 “十亿” ，用于量化大模型所包含的参数数量。参数是模型在训练过程中学习和调整的数值，参数规模在一定程度上影响着模型的性能、理解能力与生成能力。通常，参数越多，模型能够学习到的知识和模式就越丰富，理论上在处理复杂任务时表现也会更出色。接下来，为你详细梳理当前主流大模型的参数规模

阿依纳伐
发表于2025-07-01 12:56:23
10242 0 0

10.2k 0 0

在大模型领域，我们常常会看到诸如 7B、32B、671B 这样的表述，这里的 “B” 是 “billion” 的缩写，意为 “十亿” ，用于量化大模型所包含的参数数量。参数是模型在训练过程中学习和调整的数值，参数规模在一定程度上影响着模型的性能、理解能力与生成能力。通常，参数越多，模型能够学习到的知识和模式就越丰富，理论上在处理复杂任务时表现也会更出色。接下来，为你详细梳理当前主流大模型的参数规模
机器学习自然语言处理基础
LBA 之前的 ABLE-2A 和 ABLE-2B 探险数据
Pre-LBA ABLE-2A and ABLE-2B Expedition Data简介ABLE 2A 和 2B（大气边界层实验）数据包括对亚马逊盆地与其大气边界层之间各种气溶胶和气体交换速率的估算，以及这些气溶胶和气体在边界层和自由对流层之间移动的过程。数据以全球对流层实验 (GTE) 格式的 gzip 压缩 ASCII 文本文件呈现。ABLE-2 项目由两次考察组成：第一次在亚马逊...

此星光明
发表于2025-06-30 23:39:01
1204 0 0

1.2k 0 0

Pre-LBA ABLE-2A and ABLE-2B Expedition Data简介ABLE 2A 和 2B（大气边界层实验）数据包括对亚马逊盆地与其大气边界层之间各种气溶胶和气体交换速率的估算，以及这些气溶胶和气体在边界层和自由对流层之间移动的过程。数据以全球对流层实验 (GTE) 格式的 gzip 压缩 ASCII 文本文件呈现。ABLE-2 项目由两次考察组成：第一次在亚马逊...
Python 大数据数据挖掘机器学习遥感
大模型时代 PPT 创作的黄金组合
在 AI 重塑办公范式的今天，大模型与 PPT 工具的组合已不仅是效率工具，更是创意生产力的倍增器。通过内容生成的深度化、设计美学的智能化、协作流程的云端化，它们正在重新定义 PPT 的价值 —— 从信息载体升级为认知工具。选择时需紧扣内容专业性、设计适配性、协作便捷性三大核心指标，而非盲目追求「最新」工具。在 2025 年的 AI 办公竞赛中，善用工具者终将胜出。

阿依纳伐
发表于2025-06-30 15:12:59
2567 0 0

2.5k 0 0

在 AI 重塑办公范式的今天，大模型与 PPT 工具的组合已不仅是效率工具，更是创意生产力的倍增器。通过内容生成的深度化、设计美学的智能化、协作流程的云端化，它们正在重新定义 PPT 的价值 —— 从信息载体升级为认知工具。选择时需紧扣内容专业性、设计适配性、协作便捷性三大核心指标，而非盲目追求「最新」工具。在 2025 年的 AI 办公竞赛中，善用工具者终将胜出。
机器学习
deepseek R1 和 V3的区别
DeepSeek-R1 和 DeepSeek-V3 是 DeepSeek 系列中两款不同定位的模型，主要区别体现在架构设计、训练目标、性能侧重、应用场景以及技术细节上。以下是两者的详细对比： 1. 模型定位与发布背景DeepSeek-V3定位：通用型大语言模型（LLM），主打多任务处理能力，覆盖文本生成、理解、逻辑推理等基础场景。发布时间：较早版本（如2023年），作为基础模型为后续优化提供...

福州司马懿
发表于2025-06-30 11:36:51
17783 0 0

17.7k 0 0

DeepSeek-R1 和 DeepSeek-V3 是 DeepSeek 系列中两款不同定位的模型，主要区别体现在架构设计、训练目标、性能侧重、应用场景以及技术细节上。以下是两者的详细对比： 1. 模型定位与发布背景DeepSeek-V3定位：通用型大语言模型（LLM），主打多任务处理能力，覆盖文本生成、理解、逻辑推理等基础场景。发布时间：较早版本（如2023年），作为基础模型为后续优化提供...
机器学习
基于昇腾一体机 + 全开源组件的企业级方案可行性分析与实施路径
基于昇腾一体机 + 全开源组件的企业级方案在技术上具备可行性，但需供应商构建 "昇腾硬件优化 + 开源组件定制 + 合规安全治理" 的三位一体能力。建议优先选择华为云开源生态中已适配的组件（如 MindSpore-LLM、TinyMS），并通过昇腾社区获取官方优化补丁，在成本可控的前提下实现企业级应用落地。

阿依纳伐
发表于2025-06-30 11:19:32
9143 0 0

9.1k 0 0

基于昇腾一体机 + 全开源组件的企业级方案在技术上具备可行性，但需供应商构建 "昇腾硬件优化 + 开源组件定制 + 合规安全治理" 的三位一体能力。建议优先选择华为云开源生态中已适配的组件（如 MindSpore-LLM、TinyMS），并通过昇腾社区获取官方优化补丁，在成本可控的前提下实现企业级应用落地。
昇腾机器学习
AMSR/ADEOS-II L2A 全球带状空间重采样亮度温度 V001
AMSR/ADEOS-II L2A Global Swath Spatially-Resampled Brightness Temperatures V001简介AMSR Level-2A 产品 (AA_L2A) 包含 6.9 GHz、10.65 GHz、18.7 GHz、23.8 GHz、36.5 GHz、89.0 GHz、50.3 GHz 和 52.8 GHz 的亮度温度。除 50.3...

此星光明
发表于2025-06-29 23:17:44
1092 0 0

1.0k 0 0

AMSR/ADEOS-II L2A Global Swath Spatially-Resampled Brightness Temperatures V001简介AMSR Level-2A 产品 (AA_L2A) 包含 6.9 GHz、10.65 GHz、18.7 GHz、23.8 GHz、36.5 GHz、89.0 GHz、50.3 GHz 和 52.8 GHz 的亮度温度。除 50.3...
Python 大数据数据挖掘机器学习遥感
全球网格相对剥夺指数（GRDI），版本 1
Global Gridded Relative Deprivation Index (GRDI), Version 1简介全球网格化相对剥夺指数 (GRDI) 第 1 版数据集描述了每 30 弧秒（约 1 公里）像素内多维剥夺和贫困的相对水平，其中 100 代表最高剥夺水平，0 代表最低剥夺水平。GRDI 基于社会人口统计和卫星数据输入构建，这些数据经过空间协调、索引和加权，分为六个主要组...

此星光明
发表于2025-06-28 11:35:41
1254 0 0

1.2k 0 0

Global Gridded Relative Deprivation Index (GRDI), Version 1简介全球网格化相对剥夺指数 (GRDI) 第 1 版数据集描述了每 30 弧秒（约 1 公里）像素内多维剥夺和贫困的相对水平，其中 100 代表最高剥夺水平，0 代表最低剥夺水平。GRDI 基于社会人口统计和卫星数据输入构建，这些数据经过空间协调、索引和加权，分为六个主要组...
Python 大数据数据挖掘机器学习遥感
Pytroch实现bert网络文本分类
Pytroch实现bert网络文本分类本实验主要是用来指导用户如何使用pytorch来搭建经典的Bert网络，并在此基础上使用昇腾Npu硬件对Bert网络实现文本分类训练的代码实战过程。实验介绍目录如下：Bert网络的主要创新点介绍Bert及网络搭建过程介绍input embeddings层Self-AttentionMutiHeadAttentionEncoder-Transformer...

yd_284014651
发表于2025-06-28 10:26:51
1647 0 0

1.6k 0 0

Pytroch实现bert网络文本分类本实验主要是用来指导用户如何使用pytorch来搭建经典的Bert网络，并在此基础上使用昇腾Npu硬件对Bert网络实现文本分类训练的代码实战过程。实验介绍目录如下：Bert网络的主要创新点介绍Bert及网络搭建过程介绍input embeddings层Self-AttentionMutiHeadAttentionEncoder-Transformer...
机器学习网络
卫星拍下的地球真相：用机器学习预测气候未来
卫星拍下的地球真相：用机器学习预测气候未来

Echo_Wish
发表于2025-06-27 15:39:09
708 0 0

708 0 0

卫星拍下的地球真相：用机器学习预测气候未来
机器学习
水安全指标模型 - 全球陆地数据同化系统（WSIM-GLDAS）月度网格，版本 1
Water Security Indicator Model - Global Land Data Assimilation System (WSIM-GLDAS) Monthly Grids, Version 1简介水安全指标模型 - 全球陆地数据同化系统 (WSIM-GLDAS) 月度格网版本 1 数据集识别并描述了 1948 年 1 月至 2014 年 12 月期间每月的淡水盈亏情...

此星光明
发表于2025-06-27 12:45:24
1121 0 0

1.1k 0 0

Water Security Indicator Model - Global Land Data Assimilation System (WSIM-GLDAS) Monthly Grids, Version 1简介水安全指标模型 - 全球陆地数据同化系统 (WSIM-GLDAS) 月度格网版本 1 数据集识别并描述了 1948 年 1 月至 2014 年 12 月期间每月的淡水盈亏情...
Python 大数据数据挖掘机器学习遥感

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript