- 别只会写脚本了!看看机器学习是怎么帮运维“摸鱼”的 别只会写脚本了!看看机器学习是怎么帮运维“摸鱼”的
- 如下图所示,笔者最近学习 Transformer 模型的架构,学习到了输入嵌入这一章节。本文是笔者的学习笔记。 输入嵌入的定义输入嵌入(Input Embedding)是将离散的符号(如单词、字符)转换为连续的向量表示的一种方法。神经网络在处理输入数据时,无法直接处理离散符号,因此需要将这些符号映射到一个高维的实数向量空间中。这样,输入嵌入使得网络能够捕捉到符号之间的语义关系,并使模型的训练... 如下图所示,笔者最近学习 Transformer 模型的架构,学习到了输入嵌入这一章节。本文是笔者的学习笔记。 输入嵌入的定义输入嵌入(Input Embedding)是将离散的符号(如单词、字符)转换为连续的向量表示的一种方法。神经网络在处理输入数据时,无法直接处理离散符号,因此需要将这些符号映射到一个高维的实数向量空间中。这样,输入嵌入使得网络能够捕捉到符号之间的语义关系,并使模型的训练...
- 笔者最近在学习 Transformer 模型的实现细节。在下面这本书的输入嵌入章节,提到了词元化方法的概念。 词元化方法简介词元化(Tokenization)是自然语言处理中的一个核心步骤,涉及将文本数据转换为模型可以理解的基本单元。这个步骤的重要性毋庸置疑,因为文本数据本质上是字符串,无法直接输入到机器学习模型中,尤其是神经网络模型中。通过词元化,文本数据可以被分解为更小的单位(如词、子词... 笔者最近在学习 Transformer 模型的实现细节。在下面这本书的输入嵌入章节,提到了词元化方法的概念。 词元化方法简介词元化(Tokenization)是自然语言处理中的一个核心步骤,涉及将文本数据转换为模型可以理解的基本单元。这个步骤的重要性毋庸置疑,因为文本数据本质上是字符串,无法直接输入到机器学习模型中,尤其是神经网络模型中。通过词元化,文本数据可以被分解为更小的单位(如词、子词...
- ABoVE/ASCENDS: Atmospheric Backscattering Coefficient Profiles from CO2 Sounder, 2017简介该数据集提供了 2017 年 7 月 20 日至 2017 年 8 月 8 日在美国阿拉斯加、加拿大育空地区和西北地区开展的“夜间、白天和季节二氧化碳排放主动感知” (ASCENDS) 部署期间收集的大气后向散射系数剖... ABoVE/ASCENDS: Atmospheric Backscattering Coefficient Profiles from CO2 Sounder, 2017简介该数据集提供了 2017 年 7 月 20 日至 2017 年 8 月 8 日在美国阿拉斯加、加拿大育空地区和西北地区开展的“夜间、白天和季节二氧化碳排放主动感知” (ASCENDS) 部署期间收集的大气后向散射系数剖...
- 大模型参数量选型指南:从业务需求到技术落地的全流程决策框架 大模型参数量选型指南:从业务需求到技术落地的全流程决策框架
- 在大模型领域,我们常常会看到诸如 7B、32B、671B 这样的表述,这里的 “B” 是 “billion” 的缩写,意为 “十亿” ,用于量化大模型所包含的参数数量。参数是模型在训练过程中学习和调整的数值,参数规模在一定程度上影响着模型的性能、理解能力与生成能力。通常,参数越多,模型能够学习到的知识和模式就越丰富,理论上在处理复杂任务时表现也会更出色。接下来,为你详细梳理当前主流大模型的参数规模 在大模型领域,我们常常会看到诸如 7B、32B、671B 这样的表述,这里的 “B” 是 “billion” 的缩写,意为 “十亿” ,用于量化大模型所包含的参数数量。参数是模型在训练过程中学习和调整的数值,参数规模在一定程度上影响着模型的性能、理解能力与生成能力。通常,参数越多,模型能够学习到的知识和模式就越丰富,理论上在处理复杂任务时表现也会更出色。接下来,为你详细梳理当前主流大模型的参数规模
- Pre-LBA ABLE-2A and ABLE-2B Expedition Data简介ABLE 2A 和 2B(大气边界层实验)数据包括对亚马逊盆地与其大气边界层之间各种气溶胶和气体交换速率的估算,以及这些气溶胶和气体在边界层和自由对流层之间移动的过程。数据以全球对流层实验 (GTE) 格式的 gzip 压缩 ASCII 文本文件呈现。ABLE-2 项目由两次考察组成:第一次在亚马逊... Pre-LBA ABLE-2A and ABLE-2B Expedition Data简介ABLE 2A 和 2B(大气边界层实验)数据包括对亚马逊盆地与其大气边界层之间各种气溶胶和气体交换速率的估算,以及这些气溶胶和气体在边界层和自由对流层之间移动的过程。数据以全球对流层实验 (GTE) 格式的 gzip 压缩 ASCII 文本文件呈现。ABLE-2 项目由两次考察组成:第一次在亚马逊...
- 在 AI 重塑办公范式的今天,大模型与 PPT 工具的组合已不仅是效率工具,更是创意生产力的倍增器。通过内容生成的深度化、设计美学的智能化、协作流程的云端化,它们正在重新定义 PPT 的价值 —— 从信息载体升级为认知工具。选择时需紧扣内容专业性、设计适配性、协作便捷性三大核心指标,而非盲目追求「最新」工具。在 2025 年的 AI 办公竞赛中,善用工具者终将胜出。 在 AI 重塑办公范式的今天,大模型与 PPT 工具的组合已不仅是效率工具,更是创意生产力的倍增器。通过内容生成的深度化、设计美学的智能化、协作流程的云端化,它们正在重新定义 PPT 的价值 —— 从信息载体升级为认知工具。选择时需紧扣内容专业性、设计适配性、协作便捷性三大核心指标,而非盲目追求「最新」工具。在 2025 年的 AI 办公竞赛中,善用工具者终将胜出。
- DeepSeek-R1 和 DeepSeek-V3 是 DeepSeek 系列中两款不同定位的模型,主要区别体现在架构设计、训练目标、性能侧重、应用场景以及技术细节上。以下是两者的详细对比: 1. 模型定位与发布背景DeepSeek-V3定位:通用型大语言模型(LLM),主打多任务处理能力,覆盖文本生成、理解、逻辑推理等基础场景。发布时间:较早版本(如2023年),作为基础模型为后续优化提供... DeepSeek-R1 和 DeepSeek-V3 是 DeepSeek 系列中两款不同定位的模型,主要区别体现在架构设计、训练目标、性能侧重、应用场景以及技术细节上。以下是两者的详细对比: 1. 模型定位与发布背景DeepSeek-V3定位:通用型大语言模型(LLM),主打多任务处理能力,覆盖文本生成、理解、逻辑推理等基础场景。发布时间:较早版本(如2023年),作为基础模型为后续优化提供...
- 基于昇腾一体机 + 全开源组件的企业级方案在技术上具备可行性,但需供应商构建 "昇腾硬件优化 + 开源组件定制 + 合规安全治理" 的三位一体能力。建议优先选择华为云开源生态中已适配的组件(如 MindSpore-LLM、TinyMS),并通过昇腾社区获取官方优化补丁,在成本可控的前提下实现企业级应用落地。 基于昇腾一体机 + 全开源组件的企业级方案在技术上具备可行性,但需供应商构建 "昇腾硬件优化 + 开源组件定制 + 合规安全治理" 的三位一体能力。建议优先选择华为云开源生态中已适配的组件(如 MindSpore-LLM、TinyMS),并通过昇腾社区获取官方优化补丁,在成本可控的前提下实现企业级应用落地。
- AMSR/ADEOS-II L2A Global Swath Spatially-Resampled Brightness Temperatures V001简介AMSR Level-2A 产品 (AA_L2A) 包含 6.9 GHz、10.65 GHz、18.7 GHz、23.8 GHz、36.5 GHz、89.0 GHz、50.3 GHz 和 52.8 GHz 的亮度温度。除 50.3... AMSR/ADEOS-II L2A Global Swath Spatially-Resampled Brightness Temperatures V001简介AMSR Level-2A 产品 (AA_L2A) 包含 6.9 GHz、10.65 GHz、18.7 GHz、23.8 GHz、36.5 GHz、89.0 GHz、50.3 GHz 和 52.8 GHz 的亮度温度。除 50.3...
- Global Gridded Relative Deprivation Index (GRDI), Version 1简介全球网格化相对剥夺指数 (GRDI) 第 1 版数据集描述了每 30 弧秒(约 1 公里)像素内多维剥夺和贫困的相对水平,其中 100 代表最高剥夺水平,0 代表最低剥夺水平。GRDI 基于社会人口统计和卫星数据输入构建,这些数据经过空间协调、索引和加权,分为六个主要组... Global Gridded Relative Deprivation Index (GRDI), Version 1简介全球网格化相对剥夺指数 (GRDI) 第 1 版数据集描述了每 30 弧秒(约 1 公里)像素内多维剥夺和贫困的相对水平,其中 100 代表最高剥夺水平,0 代表最低剥夺水平。GRDI 基于社会人口统计和卫星数据输入构建,这些数据经过空间协调、索引和加权,分为六个主要组...
- Pytroch实现bert网络文本分类本实验主要是用来指导用户如何使用pytorch来搭建经典的Bert网络,并在此基础上使用昇腾Npu硬件对Bert网络实现文本分类训练的代码实战过程。实验介绍目录如下:Bert网络的主要创新点介绍Bert及网络搭建过程介绍input embeddings层Self-AttentionMutiHeadAttentionEncoder-Transformer... Pytroch实现bert网络文本分类本实验主要是用来指导用户如何使用pytorch来搭建经典的Bert网络,并在此基础上使用昇腾Npu硬件对Bert网络实现文本分类训练的代码实战过程。实验介绍目录如下:Bert网络的主要创新点介绍Bert及网络搭建过程介绍input embeddings层Self-AttentionMutiHeadAttentionEncoder-Transformer...
- 卫星拍下的地球真相:用机器学习预测气候未来 卫星拍下的地球真相:用机器学习预测气候未来
- Water Security Indicator Model - Global Land Data Assimilation System (WSIM-GLDAS) Monthly Grids, Version 1简介水安全指标模型 - 全球陆地数据同化系统 (WSIM-GLDAS) 月度格网版本 1 数据集识别并描述了 1948 年 1 月至 2014 年 12 月期间每月的淡水盈亏情... Water Security Indicator Model - Global Land Data Assimilation System (WSIM-GLDAS) Monthly Grids, Version 1简介水安全指标模型 - 全球陆地数据同化系统 (WSIM-GLDAS) 月度格网版本 1 数据集识别并描述了 1948 年 1 月至 2014 年 12 月期间每月的淡水盈亏情...
上滑加载中
推荐直播
-
华为云码道 × 仓颉编程:工程化AI编码探索2026/05/27 周三 19:00-21:00
刘俊杰-华为云仓颉语言专家/李炎-华为云码道技术专家/王智鹏-OpenCangjie开源社区发起人
本场直播围绕华为云仓颉语言与华为云码道的深度结合,展示华为云智能编程从零基础到高效落地的完整生态能力。以华为云码道为引擎,仓颉语言为载体,带给大家日常提效、趣味创新到极速量产的开发体验。
回顾中
热门标签