- 这两年,大模型、智能体、MCP、RAG 几乎刷屏。但有个问题更关键:我们是在“用 AI”,还是在“测 AI”?很多人理解的 AI,是生成测试用例、自动造数据、自动写脚本。 那叫用 AI 做测试。今天讨论的是另一件事:当产品本身是 AI 系统时,测试逻辑会发生什么变化?当系统从“确定性程序”变成“概率模型”, 测试方法就必须跟着改变。以前我们测试的是规则系统。 现在我们测试的是概率系统。目录传... 这两年,大模型、智能体、MCP、RAG 几乎刷屏。但有个问题更关键:我们是在“用 AI”,还是在“测 AI”?很多人理解的 AI,是生成测试用例、自动造数据、自动写脚本。 那叫用 AI 做测试。今天讨论的是另一件事:当产品本身是 AI 系统时,测试逻辑会发生什么变化?当系统从“确定性程序”变成“概率模型”, 测试方法就必须跟着改变。以前我们测试的是规则系统。 现在我们测试的是概率系统。目录传...
- 前言:那些年我们“造”过的数据“小王,明天演示环境要上线,数据库里需要100个带订单的真实用户,还有30天连续登录的数据,今晚搞定一下。”这种需求,干过开发的应该都不陌生。刚入行那会儿,我最怕听到“造点数据”——打开Navicat,对着Excel一行行复制粘贴,姓名全是“测试1、测试2”,手机号全是13888888888变个尾号,地址永远“北京市朝阳区”。结果第二天演示,老板一点开用户详情:... 前言:那些年我们“造”过的数据“小王,明天演示环境要上线,数据库里需要100个带订单的真实用户,还有30天连续登录的数据,今晚搞定一下。”这种需求,干过开发的应该都不陌生。刚入行那会儿,我最怕听到“造点数据”——打开Navicat,对着Excel一行行复制粘贴,姓名全是“测试1、测试2”,手机号全是13888888888变个尾号,地址永远“北京市朝阳区”。结果第二天演示,老板一点开用户详情:...
- 最近模型圈出现一条重要消息。OpenAI 宣布,不再推荐使用 SWE-bench Verified 作为代码能力评估基准。这一基准曾被视为衡量大模型“真实工程修复能力”的重要指标,如今被官方主动弃用。与此同时,新的 SWE-bench Pro 被建议作为替代方案。目录发生了什么?问题一:测试设计缺陷问题二:训练数据污染为什么要转向 SWE-bench Pro?对软件测试从业者的影响这次变化意... 最近模型圈出现一条重要消息。OpenAI 宣布,不再推荐使用 SWE-bench Verified 作为代码能力评估基准。这一基准曾被视为衡量大模型“真实工程修复能力”的重要指标,如今被官方主动弃用。与此同时,新的 SWE-bench Pro 被建议作为替代方案。目录发生了什么?问题一:测试设计缺陷问题二:训练数据污染为什么要转向 SWE-bench Pro?对软件测试从业者的影响这次变化意...
- 上周三下午,我正在写代码,突然收到一堆消息。群里炸了:OpenAI又挂了。有人发截图,ChatGPT页面一片空白;有人说API返回5xx;还有人幸灾乐祸:“让你们天天吹AI,关键时候掉链子。”我刷着消息,突然想起上个月我们自己的AI服务也出过类似的事。那天也是周三,也是下午,也是突然就崩了。当时我正在开会,运维的电话打过来:“服务挂了,用户全连不上,怎么办?”怎么办?我能怎么办,我又不能现场... 上周三下午,我正在写代码,突然收到一堆消息。群里炸了:OpenAI又挂了。有人发截图,ChatGPT页面一片空白;有人说API返回5xx;还有人幸灾乐祸:“让你们天天吹AI,关键时候掉链子。”我刷着消息,突然想起上个月我们自己的AI服务也出过类似的事。那天也是周三,也是下午,也是突然就崩了。当时我正在开会,运维的电话打过来:“服务挂了,用户全连不上,怎么办?”怎么办?我能怎么办,我又不能现场...
- 上个月,我们团队负责的大模型对话功能终于要上线了。上线前夜,产品经理跑过来问我:“测完了吗?能上吗?”我盯着屏幕上密密麻麻的测试报告,沉默了五秒。然后说:“你等我再想想。”不是没测,是测了太多,反而不知道该怎么判断“能不能上”。传统功能测试,标准很清晰:功能实现了,用例跑通了,bug修复了,就能上。但大模型不一样——它没有“正确”答案,只有“合理”答案;没有固定的输入输出,只有概率分布;没有... 上个月,我们团队负责的大模型对话功能终于要上线了。上线前夜,产品经理跑过来问我:“测完了吗?能上吗?”我盯着屏幕上密密麻麻的测试报告,沉默了五秒。然后说:“你等我再想想。”不是没测,是测了太多,反而不知道该怎么判断“能不能上”。传统功能测试,标准很清晰:功能实现了,用例跑通了,bug修复了,就能上。但大模型不一样——它没有“正确”答案,只有“合理”答案;没有固定的输入输出,只有概率分布;没有...
- 上个月团队聚餐,几个刚入职的年轻人问我:强哥,你现在还自己写代码吗?我愣了一下,说写啊,不写代码怎么测?他们笑,说以为我现在只负责画架构图、写文档。我放下筷子,认真想了想这个问题。入行十一年,从最早的功能测试,到自动化测试,再到测试开发,工具在变,语言在变,平台在变,但有一件事没变:我在用工具,而不是造工具。自动化测试火的时候,我学会了Selenium;容器化火的时候,我学会了Docker;... 上个月团队聚餐,几个刚入职的年轻人问我:强哥,你现在还自己写代码吗?我愣了一下,说写啊,不写代码怎么测?他们笑,说以为我现在只负责画架构图、写文档。我放下筷子,认真想了想这个问题。入行十一年,从最早的功能测试,到自动化测试,再到测试开发,工具在变,语言在变,平台在变,但有一件事没变:我在用工具,而不是造工具。自动化测试火的时候,我学会了Selenium;容器化火的时候,我学会了Docker;...
- 市面上从不缺少能跑通 Demo 的 AI 测试脚本,缺的是能在企业级复杂场景下真正“抗住事”的测试智能体。今天我们不谈概念,直接动手:基于 LangChain 从零构建一个具备测试设计、自主执行、结果分析能力的生产级 Agent。它将证明,AI 自动化测试的价值,不在于“看起来智能”,而在于能为你省下多少真实工时。 市面上从不缺少能跑通 Demo 的 AI 测试脚本,缺的是能在企业级复杂场景下真正“抗住事”的测试智能体。今天我们不谈概念,直接动手:基于 LangChain 从零构建一个具备测试设计、自主执行、结果分析能力的生产级 Agent。它将证明,AI 自动化测试的价值,不在于“看起来智能”,而在于能为你省下多少真实工时。
- DeepSeek 近日被曝大规模招揽多语言搜索与长期运行智能体方向工程人才。这并非简单扩编,而是一次明确的战略转向:从“训练模型”走向“构建系统”。当竞争从模型参数迁移至搜索入口与 Agent 工作流,考验的不再只是算力,而是系统级工程与质量保障能力。 DeepSeek 近日被曝大规模招揽多语言搜索与长期运行智能体方向工程人才。这并非简单扩编,而是一次明确的战略转向:从“训练模型”走向“构建系统”。当竞争从模型参数迁移至搜索入口与 Agent 工作流,考验的不再只是算力,而是系统级工程与质量保障能力。
- 还在忍受因一次断言失败就导致整个测试用例中断,无法看到后续校验结果的低效吗?Pytest 9.0+ 原生的 subtests 功能正是为此而生。它允许你在一个用例内创建多个独立的“子测试”进行校验,即使某一点失败,其余测试仍会继续执行并汇总报告。告别繁琐的参数化或脚本重构,解锁更高效、更清晰的批量断言新方式。 还在忍受因一次断言失败就导致整个测试用例中断,无法看到后续校验结果的低效吗?Pytest 9.0+ 原生的 subtests 功能正是为此而生。它允许你在一个用例内创建多个独立的“子测试”进行校验,即使某一点失败,其余测试仍会继续执行并汇总报告。告别繁琐的参数化或脚本重构,解锁更高效、更清晰的批量断言新方式。
- 想让你的AI助手不再只会聊天,而是能稳定、精准地完成周报撰写、合同审查等复杂任务吗?Agent Skills就是将零散提示词升级为可复用、可管理的工程能力的关键。本文将为你拆解Skill的抽象模型、三层加载结构及模块化设计,手把手教你构建专属的高频独家能力,让AI从“聪明的助手”进化为“可靠的专业执行者”。 想让你的AI助手不再只会聊天,而是能稳定、精准地完成周报撰写、合同审查等复杂任务吗?Agent Skills就是将零散提示词升级为可复用、可管理的工程能力的关键。本文将为你拆解Skill的抽象模型、三层加载结构及模块化设计,手把手教你构建专属的高频独家能力,让AI从“聪明的助手”进化为“可靠的专业执行者”。
- 太多新人把 Playwright 当“黑盒”用:脚本能跑就行,一问原理就懵。其实面试官不关心你用了多新潮的工具,而是你是否真正理解它、能否用它稳定解决问题。这篇整理自一线实战和大厂真题,专为测试/测开同学准备,帮你把“会用”变成“懂用”。 太多新人把 Playwright 当“黑盒”用:脚本能跑就行,一问原理就懵。其实面试官不关心你用了多新潮的工具,而是你是否真正理解它、能否用它稳定解决问题。这篇整理自一线实战和大厂真题,专为测试/测开同学准备,帮你把“会用”变成“懂用”。
- 引言:当UI测试遇上计算机视觉传统的UI自动化测试依赖于DOM结构或控件ID,一旦界面元素发生变化,测试脚本就容易失效。而基于计算机视觉的测试方法让AI像人一样“看到”界面,通过识别屏幕上的视觉元素进行操作和验证。这种方法特别适合跨平台应用、游戏或动态变化的界面。今天,我们就动手搭建一个实用的视觉UI自动化测试框架。一、环境准备与工具选型1.1 核心工具栈# 安装必要库pip install... 引言:当UI测试遇上计算机视觉传统的UI自动化测试依赖于DOM结构或控件ID,一旦界面元素发生变化,测试脚本就容易失效。而基于计算机视觉的测试方法让AI像人一样“看到”界面,通过识别屏幕上的视觉元素进行操作和验证。这种方法特别适合跨平台应用、游戏或动态变化的界面。今天,我们就动手搭建一个实用的视觉UI自动化测试框架。一、环境准备与工具选型1.1 核心工具栈# 安装必要库pip install...
- 在快速迭代的软件开发周期中,测试用例的设计与编写常常成为瓶颈。传统手动编写测试用例的方式不仅耗时耗力,而且难以全面覆盖各种边界场景。近年来,随着人工智能技术的成熟,AI已成为测试工程师的得力助手。本文将分享五种经过实践验证的AI编写测试用例方法,帮助您提升测试效率与覆盖率。方法一:基于需求描述的自动生成核心思路将自然语言描述的需求或用户故事,通过AI转化为结构化测试用例。操作步骤需求结构化整... 在快速迭代的软件开发周期中,测试用例的设计与编写常常成为瓶颈。传统手动编写测试用例的方式不仅耗时耗力,而且难以全面覆盖各种边界场景。近年来,随着人工智能技术的成熟,AI已成为测试工程师的得力助手。本文将分享五种经过实践验证的AI编写测试用例方法,帮助您提升测试效率与覆盖率。方法一:基于需求描述的自动生成核心思路将自然语言描述的需求或用户故事,通过AI转化为结构化测试用例。操作步骤需求结构化整...
- 在自动化测试的实践中,我们经常会遇到重复性的任务和特定的业务需求,而Playwright的原生功能并不总能完全满足这些需求。这时候,开发自定义插件和工具就显得尤为重要。本文将带你深入探索如何为Playwright创建功能强大的扩展。为什么要开发自定义插件?在我多年的测试自动化经验中,我发现团队经常会遇到这些情况:重复代码片段在不同测试文件中频繁出现特定业务逻辑需要封装成可重用组件第三方服务集... 在自动化测试的实践中,我们经常会遇到重复性的任务和特定的业务需求,而Playwright的原生功能并不总能完全满足这些需求。这时候,开发自定义插件和工具就显得尤为重要。本文将带你深入探索如何为Playwright创建功能强大的扩展。为什么要开发自定义插件?在我多年的测试自动化经验中,我发现团队经常会遇到这些情况:重复代码片段在不同测试文件中频繁出现特定业务逻辑需要封装成可重用组件第三方服务集...
- 最近不少同学在关注手机与智能终端大厂的春招动态:“vivo今年春招启动了吗?”“哪些岗位还有机会?”目前,vivo 2026届春季校园招聘已全面启动,本次招聘面向全球高校2026届毕业生,涵盖研发、测试、产品、设计等多个方向。作为全球智能手机市场的头部企业,vivo正在持续加大技术创新投入,尤其在影像、AI、系统底层等领域的深度布局,为技术人才提供了丰富的成长空间。下面我们将从公司背景、招聘... 最近不少同学在关注手机与智能终端大厂的春招动态:“vivo今年春招启动了吗?”“哪些岗位还有机会?”目前,vivo 2026届春季校园招聘已全面启动,本次招聘面向全球高校2026届毕业生,涵盖研发、测试、产品、设计等多个方向。作为全球智能手机市场的头部企业,vivo正在持续加大技术创新投入,尤其在影像、AI、系统底层等领域的深度布局,为技术人才提供了丰富的成长空间。下面我们将从公司背景、招聘...
上滑加载中
推荐直播
-
华为云码道-玩转OpenClaw,在线养虾2026/03/11 周三 19:00-21:00
刘昱,华为云高级工程师/谈心,华为云技术专家/李海仑,上海圭卓智能科技有限公司CEO
OpenClaw 火爆开发者圈,华为云码道最新推出 Skill ——开发者只需输入一句口令,即可部署一个功能完整的「小龙虾」智能体。直播带你玩转华为云码道,玩转OpenClaw
回顾中 -
华为云码道-AI时代应用开发利器2026/03/18 周三 19:00-20:00
童得力,华为云开发者生态运营总监/姚圣伟,华为云HCDE开发者专家
本次直播由华为专家带你实战应用开发,看华为云码道(CodeArts)代码智能体如何在AI时代让你的创意应用快速落地。更有华为云HCDE开发者专家带你用码道玩转JiuwenClaw,让小艺成为你的AI助理。
回顾中 -
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中
热门标签