- 标注不规范,大模型全白练:聊聊训练大模型背后的规模化数据治理与标注流水线 标注不规范,大模型全白练:聊聊训练大模型背后的规模化数据治理与标注流水线
- 💎【行业认证·权威头衔】✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者🏆【荣誉殿堂】🎖 连续三年蝉联"华为云十佳博主"(2022-2024)🎖 双冠加冕CSDN"年度博客之星TOP... 💎【行业认证·权威头衔】✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者🏆【荣誉殿堂】🎖 连续三年蝉联"华为云十佳博主"(2022-2024)🎖 双冠加冕CSDN"年度博客之星TOP...
- 2024年马上就要结束了,据《华尔街日报》最新报道指出,OpenAI 正在开发的下一代大型语言模型 GPT-5 的研发进度落后于原计划,且目前取得的成果尚未达到与其巨额成本相匹配的水平。有评论家认为,OpenAI 的 GPT5 模型,快触碰到 scale Law 的天花板了。在人工智能领域中,大语言模型的快速发展离不开 scale law 的理论支持。所谓的 scale law ,是指当模型... 2024年马上就要结束了,据《华尔街日报》最新报道指出,OpenAI 正在开发的下一代大型语言模型 GPT-5 的研发进度落后于原计划,且目前取得的成果尚未达到与其巨额成本相匹配的水平。有评论家认为,OpenAI 的 GPT5 模型,快触碰到 scale Law 的天花板了。在人工智能领域中,大语言模型的快速发展离不开 scale law 的理论支持。所谓的 scale law ,是指当模型...
- National Science Foundation (NSF)-Blue Water Zone (BWZ) measurements简介2004 年至 2006 年,在南极洲和德雷克斯海峡附近的蓝水区 (BWZ) 进行了 NSF 资助的测量。摘要代码!pip install leafmap!pip install pandas!pip install folium!pip insta... National Science Foundation (NSF)-Blue Water Zone (BWZ) measurements简介2004 年至 2006 年,在南极洲和德雷克斯海峡附近的蓝水区 (BWZ) 进行了 NSF 资助的测量。摘要代码!pip install leafmap!pip install pandas!pip install folium!pip insta...
- 人工智能(Artificial Intelligence, AI) 是计算机科学的一个分支,致力于让机器模仿人类智能,能够像人一样思考、学习、判断和解决问题。根据智能程度的不同,AI可以分为强人工智能(AGI) 和 弱人工智能(ANI)。前者指能完成任何智力任务的系统,而后者则专注于特定任务,如图像识别或语音合成。实例:自动化测试中的视觉验证:利用AI进行UI元素的自动识别与验证。日志异常模... 人工智能(Artificial Intelligence, AI) 是计算机科学的一个分支,致力于让机器模仿人类智能,能够像人一样思考、学习、判断和解决问题。根据智能程度的不同,AI可以分为强人工智能(AGI) 和 弱人工智能(ANI)。前者指能完成任何智力任务的系统,而后者则专注于特定任务,如图像识别或语音合成。实例:自动化测试中的视觉验证:利用AI进行UI元素的自动识别与验证。日志异常模...
- 近期EDA技术圈最热的争论,莫过于“MCP该淘汰,Skill才是王者”。有人说这是普通开发者的片面体感,有人坚持这是行业迭代的必然趋势。作为深耕EDA二次开发与工具生态十余年的技术从业者,我不想站在“非此即彼”的对立面,而是要撕开表象——MCP的“没落”不是技术失效,而是时代不再需要它的笨重;Skill的“崛起”不是偶然幸运,而是它天生适配EDA开发的核心需求。当EDA工具从“碎片化拼接”走... 近期EDA技术圈最热的争论,莫过于“MCP该淘汰,Skill才是王者”。有人说这是普通开发者的片面体感,有人坚持这是行业迭代的必然趋势。作为深耕EDA二次开发与工具生态十余年的技术从业者,我不想站在“非此即彼”的对立面,而是要撕开表象——MCP的“没落”不是技术失效,而是时代不再需要它的笨重;Skill的“崛起”不是偶然幸运,而是它天生适配EDA开发的核心需求。当EDA工具从“碎片化拼接”走...
- AI 训练慢,不一定是模型的锅:我在 openEuler 上榨干算力的那些实战技巧 AI 训练慢,不一定是模型的锅:我在 openEuler 上榨干算力的那些实战技巧
- 模型复现翻车的第一现场:不是代码,而是你没管好训练数据 模型复现翻车的第一现场:不是代码,而是你没管好训练数据
- 推荐系统为啥都长一个样?聊聊「离线训练 + 在线召回 + 排序」这套大数据架构 推荐系统为啥都长一个样?聊聊「离线训练 + 在线召回 + 排序」这套大数据架构
- NSCAT Level 3 Daily Gridded Ocean Surface Wind Vector Browse Images (JPL)简介本数据集提供美国宇航局散射计(NSCAT)3 级每日网格化海洋风矢量的浏览图像,升轨和降轨的风矢量空间分辨率均为 0.5 度;相邻轨道重叠处的风矢量取平均值。这是最新版本,代表了校准、验证和科学数据处理的最终阶段,该阶段于 1998 年 11... NSCAT Level 3 Daily Gridded Ocean Surface Wind Vector Browse Images (JPL)简介本数据集提供美国宇航局散射计(NSCAT)3 级每日网格化海洋风矢量的浏览图像,升轨和降轨的风矢量空间分辨率均为 0.5 度;相邻轨道重叠处的风矢量取平均值。这是最新版本,代表了校准、验证和科学数据处理的最终阶段,该阶段于 1998 年 11...
- NSCAT Level 2 Ocean Wind Vector Geophysical Data Record简介美国国家航空航天局散射计(NSCAT)二级海洋风矢量数据以 50 公里风矢量网格(WVC)幅宽呈现,包含每日上升和下降轨道的数据。风矢量的精度在 2 米/秒(矢量速度)和 20 度(矢量方向)以内。受降雨污染区域的风矢量数据无效;数据中不包含降雨标记和降水信息。数据中会标记缺失、... NSCAT Level 2 Ocean Wind Vector Geophysical Data Record简介美国国家航空航天局散射计(NSCAT)二级海洋风矢量数据以 50 公里风矢量网格(WVC)幅宽呈现,包含每日上升和下降轨道的数据。风矢量的精度在 2 米/秒(矢量速度)和 20 度(矢量方向)以内。受降雨污染区域的风矢量数据无效;数据中不包含降雨标记和降水信息。数据中会标记缺失、...
- 模型量化实战 什么是量化量化,听起来是一个复杂的数学概念,但实际非常简单,就是用较少的信息来表示数据,在尽量不损失模型性能的前提下,降低资源开销。深度学习模型(无论是 CV 还是 NLP 领域)普遍表现出显著的参数冗余性。早在 1989 年,Yann LeCun 等人就在论文《Optimal Brain Damage》 中指出神经网络中存在大量参数可以被删除而不影响准确率;而后续著名的“彩... 模型量化实战 什么是量化量化,听起来是一个复杂的数学概念,但实际非常简单,就是用较少的信息来表示数据,在尽量不损失模型性能的前提下,降低资源开销。深度学习模型(无论是 CV 还是 NLP 领域)普遍表现出显著的参数冗余性。早在 1989 年,Yann LeCun 等人就在论文《Optimal Brain Damage》 中指出神经网络中存在大量参数可以被删除而不影响准确率;而后续著名的“彩...
- 本文聚焦程序化内容生成中可控性与随机性的量化平衡核心问题,跳出表层参数调优思维,从技术实操与底层逻辑出发,系统阐释了可控性维度拆解、指标赋值、阈值锚定的量化方法,以及随机性有效域划定、熵值梯度分级、非核心维度释能的界定逻辑。通过双体系耦合映射、平衡系数动态校准、场景化调优的三维路径实现二者动态适配,再经双指标闭环验证、增量式迭代、数据驱动优化完成体系落地与进化。 本文聚焦程序化内容生成中可控性与随机性的量化平衡核心问题,跳出表层参数调优思维,从技术实操与底层逻辑出发,系统阐释了可控性维度拆解、指标赋值、阈值锚定的量化方法,以及随机性有效域划定、熵值梯度分级、非核心维度释能的界定逻辑。通过双体系耦合映射、平衡系数动态校准、场景化调优的三维路径实现二者动态适配,再经双指标闭环验证、增量式迭代、数据驱动优化完成体系落地与进化。
- 量子机器学习:AI 的下一个维度,真不是玄学 量子机器学习:AI 的下一个维度,真不是玄学
- MLflow / Feast 实战手记:MLOps 不是装工具,是治内伤 MLflow / Feast 实战手记:MLOps 不是装工具,是治内伤
上滑加载中
推荐直播
-
华为云码道 × 仓颉编程:工程化AI编码探索2026/05/27 周三 19:00-21:00
刘俊杰-华为云仓颉语言专家/李炎-华为云码道技术专家/王智鹏-OpenCangjie开源社区发起人
本场直播围绕华为云仓颉语言与华为云码道的深度结合,展示华为云智能编程从零基础到高效落地的完整生态能力。以华为云码道为引擎,仓颉语言为载体,带给大家日常提效、趣味创新到极速量产的开发体验。
回顾中
热门标签