华为云Flexus云服务_标签_开发者

博客(74)
视频(0)
论坛(128)
云声(419)
代码示例(0)

[技术干货] AI模型训练中过拟合和欠拟合的区别是什么？

一个简单的例子假设我们要根据“学习时间”预测“考试成绩”。数据点中包含一些噪声（比如某天学生生病了，学得久但考得差）。欠拟合模型：可能只用一条直线来拟合。它无法捕捉“学习时间增加到一定程度后，成绩提升变慢”的趋势，导致预测不准确。恰到好处的模型：一条平滑的曲线，能够很好地反映成绩随学习时间增长的整体趋势，并且对噪声点不敏感。过拟合模型：一条剧烈波动的曲线，为了完美通过每一个数据点（包括那个因生病导致的噪声点），它记住了所有训练样本的细节。当一个新的学生数据进来时，如果他的学习时间稍微偏离原有数据点，预测就可能谬以千里。如何监测和避免？划分数据集：将数据分为训练集（用于训练模型）、验证集（用于调整超参数、选择模型）和测试集（用于最终评估模型性能）。监控误差：在训练过程中，同时监控模型在训练集和验证集上的误差（或性能指标如准确率）。如果两者都高，很可能欠拟合。如果训练误差很低，但验证误差很高，并且差距很大，就是过拟合的典型信号。使用正则化：正则化技术（如 L2 正则化）通过在损失函数中增加一个“惩罚项”，来限制模型的复杂度，从而有效防止过拟合。早停（Early Stopping）：在训练过程中，当验证集上的误差不再下降反而开始上升时，就立即停止训练。这是一种简单有效的防止过拟合的方法。总之，欠拟合和过拟合是模型能力与数据复杂性不匹配的表现。成功的模型训练就是在偏差（Bias，欠拟合的根源）和方差（Variance，过拟合的根源）之间找到最佳平衡，从而获得最强的泛化能力。

湘山Hsiong 发表于2025-08-29 17:00:36 2025-08-29 17:00:36 最后回复一只牛博 2025-09-04 09:05:14
23 2

华为云Flexus云服务
[技术干货] 关于大模型中token的理解

一、核心定义：Token 是什么？Token 是大模型处理和生成文本的基本单位。它并不是一个严格的“单词”或“汉字”，而是子词（Subword）片段。模型看到的不是我们人类理解的句子，而是一串由 Token 组成的序列。这个过程分为两步：分词（Tokenization）: 将输入文本拆分成一个个 Token。编码（Encoding）: 将每个 Token 转换成一个唯一的数字（ID），因为模型只能处理数字。二、Token 的具体形式Token 的划分方式因模型和分词器（Tokenizer）而异，但通常包括以下几种情况：完整的常见单词：例如，"the", "apple", "is" 这类高频词通常会成为一个独立的 Token。单词的一部分（子词）：前缀/词根：例如，"##ing", "##ed", "##s"（## 通常表示这个 Token 是另一个 Token 的后缀，需要连接起来）。长单词拆分：例如，"unbelievable" 可能会被拆分成 "un", "##believe", "##able" 三个 Token。单个字符：尤其是对于中文、日文等语言，一个汉字通常就是一个独立的 Token。例如，“你好”会被分成 ["你", "好"] 两个 Token。标点符号和空格：例如，".", "?", "\n"（换行符）也都会被当作独立的 Token。举个例子：句子："Don't hesitate to ask questions."一个可能的分词结果是：["Don", "'", "t", " hesitate", " to", " ask", " questions", "."]这里，"hesitate" 是一个完整 Token，而 "Don't" 被拆成了三个 Token (Don, ', t)。三、为什么使用 Token（而不是单词或字符）？这种子词（Subword）分词策略是深思熟虑后的最佳平衡点，解决了另外两种方法的核心缺陷：基于单词（Word-based）的问题：词汇表爆炸（Vocabulary Explosion）：语言中的单词组合是无限的，新词、俚语、专业术语会不断出现。模型需要一个巨大的词汇表，导致效率低下。未知词（OOV, Out-of-Vocabulary）问题：遇到词汇表里没有的单词，模型就无法处理（通常表示为 [UNK]），严重影响性能。基于字符（Character-based）的问题：序列过长：一个句子会被拆分成几百个字符，模型需要处理极长的序列，计算量和记忆负担非常重。语义学习困难：单个字符（如英文字母）本身几乎没有含义，模型需要从更长的序列中艰难地学习语义组合。基于子词（Subword）Token 的优势（折中方案）：高效的词汇表：通过共享词根（如 ##ing, ##ed），可以用一个较小的词汇表覆盖几乎所有的单词。几乎消除未知词：即使是一个从未见过的长单词，如 "antidisestablishmentarianism"，也可以被拆成已知的子词 Token（如 "anti", "##dis", "##establish", "##ment", "##arian", "##ism"），模型能根据这些部分推测其大致含义。平衡序列长度和语义：序列长度介于单词和字符之间，即保证了效率，又能让每个 Token 携带一定的语义信息。四、Token 的重要性和影响计算和计费的依据：模型的处理能力通常以其能处理的最大上下文 Token 数量来衡量，比如 4k, 8k, 32k, 128k, 200k 等。这决定了模型一次能“记住”和参考多长的文本。API 调用费用通常是按 Token 数量计费的（输入 + 输出）。无论是提示（Prompt）还是生成的回复，都按 Token 数量算钱。影响生成质量和效率：分词方式会影响模型对词义的理解。一个好的分词器能提升模型性能。生成长文本在本质上是一个“逐个生成 Token”的循环过程，Token 数量直接决定了生成所需的时间。中英文 Token 数量的差异：英文：平均下来，1个 Token ≈ 0.75个单词。100个英文单词大约对应 ~133 个 Token。中文：由于汉字密集，1个汉字通常就是 1~2 个 Token（常见字是1个，生僻字可能被拆成多个字节级别的 Token）。因此，同样内容的中文文本，其 Token 数量通常会比英文多。这也是为什么用中文和模型对话有时感觉“更费钱”的原因。

湘山Hsiong 发表于2025-08-29 16:26:16 2025-08-29 16:26:16 最后回复一只牛博 2025-09-04 09:05:08
673 3

华为云Flexus云服务
[问题求助] vscode连接modelarts服务器问题

我在华为modelarts平台上，通过Notebook租用了8卡910B服务器，并用VScode远程连接。租用的过程中我发现：刚开始几天可以通过VScode成功连接服务器，但是过了一段时间就显示无法与服务器建立连接了。该现象过个半天一天有时就可以莫名其妙的解决。想请教一下，要怎么解决这个问题？如何保持服务器长期能够通过VScode建立连接？

yd_281557169 发表于2025-08-22 15:45:57 2025-08-22 15:45:57 最后回复黄生 2025-08-26 16:26:09
118 3

华为云Flexus云服务帮助中心
累计完成了一个案例一：开发者空间 - 云开发环境使用指导

在实践过程中我的环境变量老是出错

雪雨漫漫 发表于2025-08-13 19:30:19 2025-08-13 19:30:19 最后回复雪雨漫漫 0
21 0

裸金属服务器 BMS 华为云Flexus云服务
[热门活动] 华为云主机使用DeepSeek和Dify打造AI智能体

免费领取云主机点击免费领取链接, 登录华为云账号，免费领取云主机。如果没有华为账号的话，先点击注册；有账号的话直接登录。根据提示，填写手机号和密码，完成注册。然后找到配置云主机根据下面的提示选择配置，然后点击安装。这样云主机就领取并安装好了。启动云主机接下来，我们进入云主机安装宝塔面板，快速建站。首先点击打开云主机，选择进入桌面打开云主机，会进入初始化界面，等待几分钟然后就看到云主机的桌面了安装配置宝塔面板和 DeepSeek我们在之前的文章华为云主机安装宝塔面板并使用DeepSeek助力网站运维(./华为云主机安装宝塔面板并使用DeepSeek助力网站运维.md)中已经介绍了如何安装宝塔面板和 DeepSeek，这里就不再赘述。安装 DifyDify 是一个开源的生成式 AI 应用开发平台，旨在简化和加速 AI 应用的创建和部署。打开宝塔的 Docker 菜单，搜索 Dify，找到第一个，点击安装。这里按默认的选项即可，点击确定开发安装。等待安装配置在配置页面，设置域名等基本信息，点击确定填写应用名称配置端口点击提交，面板进行初始化，等到几分钟后，即可访问访问 Dify

DCmini 发表于2025-07-31 15:10:44 2025-07-31 15:10:44 最后回复 DCmini 2025-07-31 15:10:44
34 0

专属主机 DeH 华为云Flexus云服务全栈专属服务 FCS
[问题求助] 远程连接断开flexus锁屏

请问大家，如何解决在RDP远程连接断开后，flexus自动锁屏的问题，挂在后台的代码无法正常运行

yd_259029540 发表于2025-06-25 10:56:54 2025-06-25 10:56:54 最后回复小强鼓掌 2025-06-30 10:15:30
83 4

华为云Flexus云服务 Python
[大赛资讯] 可以跨学校赛区组队吗

2025华为软件精英挑战赛可以跨赛区组队吗

yd_269914478 发表于2025-03-17 17:39:22 2025-03-17 17:39:22 最后回复林欣 2025-03-18 10:26:21
197 1

专属主机 DeH 裸金属服务器 BMS 函数工作流 FunctionGraph 华为云Flexus云服务 FPGA加速云服务器 FACS
[问题求助] 要提交的应该是什么

您好我已经按照文档要求部署好了，但是要提交的东西不是很明确，我最后输入指令，生成的不是文档中的程序，我最后要提交的应该是什么东西。

yd_259871013 发表于2025-03-11 14:33:10 2025-03-11 14:33:10 最后回复多米诺的古牌 2025-03-30 19:03:48
59 3

华为云Flexus云服务
[问题求助] 怎么启动Flexus L实例应用镜像

这个咋回事有知道的吗

yd_285415679 发表于2025-02-10 13:32:15 2025-02-10 13:32:15 最后回复云聪明 2025-02-27 11:46:38
118 5

华为云Flexus云服务
[交流分享] 在云计算平台上，如何高效管理API接口以提高服务质量？

在云计算平台上，如何高效管理API接口以提高服务质量？

yd_235043738 发表于2024-12-12 14:27:20 2024-12-12 14:27:20 最后回复 yd_235043738 2024-12-12 14:27:20
28 0

ROMA资产中心 ROMAExchange 裸金属服务器 BMS 函数工作流 FunctionGraph 华为云Flexus云服务弹性文件服务 SFS
[互动交流] 在云计算平台上，如何高效管理API接口以提高服务质量？

在云计算平台上，如何高效管理API接口以提高服务质量？

yd_235043738 发表于2024-12-12 11:10:46 2024-12-12 11:10:46 最后回复 wzsのcloud 2025-03-24 17:30:54
57 2

函数工作流 FunctionGraph 华为云Flexus云服务 FPGA加速云服务器 FACS 云手机 CPH GPU加速云服务器 GACS
[问题求助] 迁移失败

Windows 2016 迁移失败安装的是py3 agent

yd_255700601 发表于2024-12-05 13:42:43 2024-12-05 13:42:43 最后回复来杯咖啡 2024-12-06 09:28:02
68 1

华为云Flexus云服务
[问题求助] cc-gateway连接cti失败，输出日志看不懂

根据产品文档AICC 23.200.0在cc-gateway与cti的连接上输出的日志出现类似乱码的情况，在用AgentDemo链接时会长时间的卡主，并不能话务员工号登录。但是监控台的提示是正常的！

yd_223215640 发表于2024-12-04 12:03:28 2024-12-04 12:03:28 最后回复 AICC支撑人员1 2024-12-04 14:06:01
50 1

专属主机 DeH 裸金属服务器 BMS 函数工作流 FunctionGraph 华为云Flexus云服务 FPGA加速云服务器 FACS
[问题求助] CC-gateway 安装所需证书证书问题？

版本：AICC 23.200.0 跟教程需要安装生成指定的证书，但是教程中却好像没有对应的生成方法！采取此阶段生成的tomcatKeyStore文件，放入后依旧无法启动！./startup.sh之后依旧无法启动

yd_223215640 发表于2024-12-03 10:47:45 2024-12-03 10:47:45 最后回复 AICC支撑人员1 2024-12-03 14:16:17
91 1

专属主机 DeH 裸金属服务器 BMS 函数工作流 FunctionGraph 华为云Flexus云服务
[热门活动] 话题交流

大家认为云计算的热度在未来会不断增加吗？以及华为的云数据库体验如何？欢迎大佬们在下面评论区评论！

Xxy_1008 发表于2024-11-29 16:46:58 2024-11-29 16:46:58 最后回复柠檬🍋 2024-11-29 16:51:10
36 1

华为云Flexus云服务云数据库 GaussDB

上滑加载中

推荐直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript