- 华为CANN算子开发全解析:从基础概念到高性能数据排布在深度学习领域,算子(Operator,简称OP)是模型计算的基本单元。每一个算子承载了特定的数学运算逻辑,例如卷积(Convolution)、池化(Pooling)、归一化(Softmax)、激活函数(ReLU)等。华为CANN(Compute Architecture for Neural Networks)框架提供了强大的算子支持... 华为CANN算子开发全解析:从基础概念到高性能数据排布在深度学习领域,算子(Operator,简称OP)是模型计算的基本单元。每一个算子承载了特定的数学运算逻辑,例如卷积(Convolution)、池化(Pooling)、归一化(Softmax)、激活函数(ReLU)等。华为CANN(Compute Architecture for Neural Networks)框架提供了强大的算子支持...
- 1.背景与问题在AI大模型训练过程中,性能优化是永恒的主题。如何快速、高效地实现算子级优化,进一步提升整网训练效率,成为很多开发者与企业的核心诉求。昇腾CANN开放了算子源码,并提供了Ascend C编程能力,使用户能够根据自身业务需求开发高性能算子。本实践聚焦于两个紧密相关的损失函数:交叉熵损失(CrossEntropyLoss)和ZLoss。在客户的某大模型训练场景中,使用Mind St... 1.背景与问题在AI大模型训练过程中,性能优化是永恒的主题。如何快速、高效地实现算子级优化,进一步提升整网训练效率,成为很多开发者与企业的核心诉求。昇腾CANN开放了算子源码,并提供了Ascend C编程能力,使用户能够根据自身业务需求开发高性能算子。本实践聚焦于两个紧密相关的损失函数:交叉熵损失(CrossEntropyLoss)和ZLoss。在客户的某大模型训练场景中,使用Mind St...
- 近几年,人工智能(AI)已经从科幻电影里的“高冷技术”逐渐走进了我们的日常生活。我们用手机App识别人脸、用智能音箱听音乐、用自动驾驶技术出行。这些其实只是AI应用的冰山一角。事实上,AI正悄然改变着科学研究的方式,推动着整个社会的进步。在蛋白质结构预测、药物发现、气候模型和材料科学等前沿领域,AI已经展现出前所未有的力量。今天,我想和大家分享AI在这些科学领域的故事,让更多人了解、学习并应... 近几年,人工智能(AI)已经从科幻电影里的“高冷技术”逐渐走进了我们的日常生活。我们用手机App识别人脸、用智能音箱听音乐、用自动驾驶技术出行。这些其实只是AI应用的冰山一角。事实上,AI正悄然改变着科学研究的方式,推动着整个社会的进步。在蛋白质结构预测、药物发现、气候模型和材料科学等前沿领域,AI已经展现出前所未有的力量。今天,我想和大家分享AI在这些科学领域的故事,让更多人了解、学习并应...
- 一、神经元的"心跳":激活函数在人工神经网络的世界里,每个节点都是一个虚拟神经元。就像人类大脑中神经元传递信号需要突触连接,机器学习中的神经元也需要某种"触发机制"。这就是激活函数的核心作用——它决定着信息是否继续向前传递。想象一下教室里的举手发言场景。如果把输入数据看作学生提出的问题,激活函数就是老师的判断标准。当问题的"强度"超过某个阈值(比如"这个问题值得讨论"),老师才会允许学生站... 一、神经元的"心跳":激活函数在人工神经网络的世界里,每个节点都是一个虚拟神经元。就像人类大脑中神经元传递信号需要突触连接,机器学习中的神经元也需要某种"触发机制"。这就是激活函数的核心作用——它决定着信息是否继续向前传递。想象一下教室里的举手发言场景。如果把输入数据看作学生提出的问题,激活函数就是老师的判断标准。当问题的"强度"超过某个阈值(比如"这个问题值得讨论"),老师才会允许学生站...
- 我第一次接触AI的时候,总觉得它像一台黑箱机器:塞进数据,按下按钮,就吐出结果。后来才明白,AI并不是一上台就完美的,它更像一个需要练习的学生,靠三样关键“把手”一步步长进:激活函数、损失函数、正则化技术。理解这三者,就能轻松地理解AI在“做什么”、怎样“做得更好”,以及为何要“做得更稳”。 激活函数:给模型一个“非线性”的世界如果说输入和权重相乘是在做“配比”,激活函数就是给结果“换气”... 我第一次接触AI的时候,总觉得它像一台黑箱机器:塞进数据,按下按钮,就吐出结果。后来才明白,AI并不是一上台就完美的,它更像一个需要练习的学生,靠三样关键“把手”一步步长进:激活函数、损失函数、正则化技术。理解这三者,就能轻松地理解AI在“做什么”、怎样“做得更好”,以及为何要“做得更稳”。 激活函数:给模型一个“非线性”的世界如果说输入和权重相乘是在做“配比”,激活函数就是给结果“换气”...
- 基于 CANN Kernel 直调工程的 Ascend C 算子开发实战:从 Add 到多核流水的深度实践(训练营深度实践篇)在昇腾生态中,CANN 提供了一整套从算子开发到部署的高效工具链,而 Ascend C 则是其中面向 AI Core 进行 Kernel 编程的核心能力。对于很多初次接触 CANN 的开发者而言,“算子如何真正落到 AI Core 上运行?”、“如何实现多核并行与流... 基于 CANN Kernel 直调工程的 Ascend C 算子开发实战:从 Add 到多核流水的深度实践(训练营深度实践篇)在昇腾生态中,CANN 提供了一整套从算子开发到部署的高效工具链,而 Ascend C 则是其中面向 AI Core 进行 Kernel 编程的核心能力。对于很多初次接触 CANN 的开发者而言,“算子如何真正落到 AI Core 上运行?”、“如何实现多核并行与流...
- 你是否曾好奇,为什么AI能在围棋上战胜世界冠军?为什么手机相册能精准识别出你和家人的面孔?为什么短视频平台总能“猜”到你喜欢看什么?这些看似“魔法”的背后,都离不开一个核心技术——深度学习。它并非遥不可及的科幻概念,而是由一系列精妙的数学原理和工程实践构成的强大工具。今天,我们就来拆解这个“黑箱”,从神经网络的结构到反向传播的算法,一窥其究竟。 神经网络:模拟大脑的数学模型想象一下,你正在学... 你是否曾好奇,为什么AI能在围棋上战胜世界冠军?为什么手机相册能精准识别出你和家人的面孔?为什么短视频平台总能“猜”到你喜欢看什么?这些看似“魔法”的背后,都离不开一个核心技术——深度学习。它并非遥不可及的科幻概念,而是由一系列精妙的数学原理和工程实践构成的强大工具。今天,我们就来拆解这个“黑箱”,从神经网络的结构到反向传播的算法,一窥其究竟。 神经网络:模拟大脑的数学模型想象一下,你正在学...
- 神经压缩的率失真-感知权衡理论新进展在信息论与深度学习的交叉领域,一场关于压缩本质的革命正在悄然发生。自1948年香农提出率失真理论以来,我们一直相信在给定比特率下,压缩的保真度存在一个不可逾越的理论极限。然而,传统的率失真理论忽略了一个关键维度——人类感知。直到Blau与Michaeli在2019年提出的率失真-感知权衡理论,才真正将感知质量纳入压缩的数学框架中,揭示了在保持高感知质量的... 神经压缩的率失真-感知权衡理论新进展在信息论与深度学习的交叉领域,一场关于压缩本质的革命正在悄然发生。自1948年香农提出率失真理论以来,我们一直相信在给定比特率下,压缩的保真度存在一个不可逾越的理论极限。然而,传统的率失真理论忽略了一个关键维度——人类感知。直到Blau与Michaeli在2019年提出的率失真-感知权衡理论,才真正将感知质量纳入压缩的数学框架中,揭示了在保持高感知质量的...
- 零知识证明与深度学习:打造可验证的AI推理新时代在医疗、金融和自动驾驶等关键领域,人工智能系统正日益成为决策的核心。然而,这些“黑箱”模型如何让人信任?当AI告诉你不应该批准贷款或患有癌症时,你如何知道这个决策是基于正确的推理,而不是被恶意篡改或包含了偏见?传统方法要求完全透明公开模型参数和输入数据,但这在保护知识产权和用户隐私方面面临巨大挑战。零知识证明(Zero-Knowledge P... 零知识证明与深度学习:打造可验证的AI推理新时代在医疗、金融和自动驾驶等关键领域,人工智能系统正日益成为决策的核心。然而,这些“黑箱”模型如何让人信任?当AI告诉你不应该批准贷款或患有癌症时,你如何知道这个决策是基于正确的推理,而不是被恶意篡改或包含了偏见?传统方法要求完全透明公开模型参数和输入数据,但这在保护知识产权和用户隐私方面面临巨大挑战。零知识证明(Zero-Knowledge P...
- 别再给我推明星八卦了!——大数据视角下,个性化新闻推荐的“人间真实”优化指南 别再给我推明星八卦了!——大数据视角下,个性化新闻推荐的“人间真实”优化指南
- 本文介绍了字节跳动火山引擎最新发布的豆包编程模型Doubao-Seed-Code。该模型兼容Anthropic API,具备256K长上下文处理能力,在SWEBench榜单取得领先成绩,同时定价策略显著低于市场水平,为企业及开发者提供了高性价比的AI编程解决方案。 本文介绍了字节跳动火山引擎最新发布的豆包编程模型Doubao-Seed-Code。该模型兼容Anthropic API,具备256K长上下文处理能力,在SWEBench榜单取得领先成绩,同时定价策略显著低于市场水平,为企业及开发者提供了高性价比的AI编程解决方案。
- 本文整理了21个Transformer高频面试题,从测试开发视角解析其核心原理。通过理解多头注意力、位置编码等关键机制,帮助测试人员建立对大模型的可测试性认知,为设计AI系统验证方案打下基础。 本文整理了21个Transformer高频面试题,从测试开发视角解析其核心原理。通过理解多头注意力、位置编码等关键机制,帮助测试人员建立对大模型的可测试性认知,为设计AI系统验证方案打下基础。
- 本文介绍了字节跳动火山引擎最新发布的豆包编程模型Doubao-Seed-Code。该模型兼容Anthropic API,具备256K长上下文处理能力,在SWEBench榜单取得领先成绩,同时定价策略显著低于市场水平,为企业及开发者提供了高性价比的AI编程解决方案。 本文介绍了字节跳动火山引擎最新发布的豆包编程模型Doubao-Seed-Code。该模型兼容Anthropic API,具备256K长上下文处理能力,在SWEBench榜单取得领先成绩,同时定价策略显著低于市场水平,为企业及开发者提供了高性价比的AI编程解决方案。
- 本文整理了21个Transformer高频面试题,从测试开发视角解析其核心原理。通过理解多头注意力、位置编码等关键机制,帮助测试人员建立对大模型的可测试性认知,为设计AI系统验证方案打下基础。 本文整理了21个Transformer高频面试题,从测试开发视角解析其核心原理。通过理解多头注意力、位置编码等关键机制,帮助测试人员建立对大模型的可测试性认知,为设计AI系统验证方案打下基础。
- CANN训练营实战指南:从算子分析到核函数定义的完整开发流程训练营简介2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。 完成Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。 本次训练营依托CANN全面开源开放,推出四大定制化专题... CANN训练营实战指南:从算子分析到核函数定义的完整开发流程训练营简介2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。 完成Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。 本次训练营依托CANN全面开源开放,推出四大定制化专题...
上滑加载中
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签