AI原生实践:测试用例创作探索

测试用例作为质量保障的核心,影响着研发-测试-发布-上线的全过程,如单元测试用例、手工测试用例、接口自动化用例、UI 自动化用例等,但用例撰写的高成本尤其是自动化用例,导致了用例的可持续积累、更新和迭代受到非常大制约。长久以来,我们在用例创作技术上一直未有过很大的突破,协助 QA 做好最基本的工作。

直到2023年,生成式 AI 的到来,为用例智能创作带来了可能,借由 AI 技术,尤其是生成式 AI,一切就变得不一样了。

我们可以通过 AI 更好地理解需求,理解 UI 页面,理解接口访问的含义,智能化的生成测试用例,辅助研发测试提效的同时借由数据飞轮不断巩固沉淀测试经验。

为此,百度移动生态质量效能部启动了 QAMate 用例智能创作项目,从基于需求生成脑图用例,基于真机操作的 UI 自动化用例录制回放,基于流量或代码生成接口自动化用例三个场景深耕,通过 AI 技术实现测试用例的智能创作,进而辅助研发测试提效,为业务质量保驾护航。

image.png

基于需求生成脑图用例:输入需求,一键生成测试用例,2个月生成并被采纳用例达2.6w 条

移动生态事业群组大部分业务都通过思维导图(脑图)来编辑测试用例,但是不同经验水平同学编写的测试用例参差不齐。业务和测试经验越丰富的 QA 同学可以写出更好的测试用例,反之则有可能会出现遗漏或者冗余,带来质量问题或者降低测试效率,但遇到研发人员流动则会加剧这个问题。但好在,生成式 AI 的快速发展,使得其已经具备了处理这一复杂任务的能力,其不仅能有效持久化业务及测试经验,辅助 QA 快速编写完备的测试用例,还可以通过标准化的生成输出,使得用例更易于理解及传承。

QAMate 项目组基于文心大模型,通过构建针对测试用例智能生成的标准化开放共建的 Prompt 层,基于成熟的脑图用例产品构建同测试人员直接闭环的数据飞轮,及测试&业务经验外挂知识库,实现了基于需求生成脑图用例的能力。

  • Prompt 层开源共建:采用开放 Prompt 层同各业务同学协同共建的模式,使得分业务可以规范输入输出、规则明确、针对特定场景优化 Prompt,从而最大程度激发大模型效果

  • 数据飞轮构建:完成了「用例生成 -> 生成用例采纳/删除;人工修正/添加用例 -> 业务个性化模型训练」数据飞轮的构建,经业务线评估,启用个性化模型的生成效果会优于92%通用模型的输出效果

  • 建构外挂知识库:持久化测试经验&业务知识,进一步增强了生成效果

image.png

当前 QAMate 已经支持了基于需求文本、表格及整份需求文档生成测试用例,并支持用户构建专属 Prompt、业务经验知识库来定向提升生成效果。

APP UI 用例录制回放:点点手机,搞定 UI 自动化用例,累计支撑1.5w 条 UI 用例编写,平均稳定性90%+

众所周知,移动端 APP 的 UI 测试耗时耗力,尤其是集成回归阶段,需要把 UI 测试用例做一遍遍地回归,甚至还需要在多种不同机型上重复这个过程。为了解决这个噩梦,过去数年,不管是业界还是百度内部,都尝试了各种方案,其中最有代表性、影响最广的便是 Appium 自动化测试框架,但是落到实处,Appium 也只是解决了 UI 用例能不能自动化跑起来的问题,基于它构建的各类方案远没有真正达成为业务提效的最终目标

如下图所示,为文心一言输出的,用 Appium 来编写百度 APP 首页搜索框 UI 自动化用例要做的事情,包括不限于:

  • 安装和配置 Appium 环境、连接设备到 Appium 服务器等

  • 启动 XPath 元素定位功能,查找搜索框的 XPath(类似 com.baidu.Baidu:id/search_button 这类不易理解的代号)

  • 接着编写一大段 Python 脚本等等

image.png

image.png

其实不难看出,UI 自动化用例的撰写成本很高,而且不仅撰写成本高,稳定性也是影响提效的一大难题。据此前构建的 Fast UI 自动化平台数据统计,UI 用例执行的稳定性仅70%不到,其核心问题在于 XPath 控件定位容易随 APP 版本不同、机型不同而变得不同,导致用例执行不稳定。而 APP 业务迭代频繁,也让 UI 用例维护、撰写和执行成本直线上升。

QAMate 项目组以 AI 原生为第一视角,直接抛弃了业界惯用的 XPath 的控件定位技术,基于 YOLOv5对象模型构建底层图标&组件模型、整合 OCR 能力、多控件布局算法及多真机云控技术,实现了 APP UI 用例录制回放能力,让用户只需要点点手机就能完成 UI 自动化用例的编写,直接将单 UI 自动化用例步骤编写的成本由40s/步骤降低至了 5s/步骤,用例整体执行的平均稳定性达到了 90%。

以视觉 AI 技术为基底,使得我们可以以人的视角自动化操控 APP,从而无视 APP 跨版本、跨机型兼容等问题,使得用例编写成本直线下降同时用例执行稳定性直线上升。

  • 80%以上的自动化测试场景,都是非常简单直接的单控件检测和点击操作。建设以视觉建模、识别能力为核心的通用控件定位算法解决。

image.png
视觉元素建模

image.png
视觉特征匹配寻址

  • 对于剩余的20%场景,往往存在大量复杂的多控件协同检测和复杂操作方式。建设综合使用视觉、dom 处理能力的多控件协同控件定位算法进行解决。

image.png
基于多种元素重组页面结构建模

image.png
多控件 布局&特征 协同寻址

进一步,通过用例产品闭环用户反馈、自动化执行结果,基于控件准召等指标实现底层视觉模型的自动迭代升级,形成数据飞轮,进而得以持续支撑快速迭代的 APP 业务。

image.png

最后,通过将录制回放能力集成于同一工具,使得编写及执行环境高度一致,再基于此构建稳定可靠的云真机控制系统,保障自动化用例高效稳定执行。

image.png

基于流量生成接口自动化用例:接口有流量,就有用例,用例生成占比达 76%

服务端接口自动化测试是服务端质量保障非常重要的一个手段,但是服务端接口众多,用例编辑和维护的成本非常的高,虽然自动化手段对于质量保障行之有效,但是也带来了很大的人力成本。

依托生成式 AI,QAMate 实现了基于线上流量的接口自动化用例生成能力,让服务端 QA 同学不用再花费大量人力去补充接口自动化回归用例,只要有线上流量进来,自动生成接口自动化用例。

image.png

▎关键实践

基于多种引流方式构建流量接入->分析->用例生成的端到端全流程自动化解决方案,用例编写维护成本节省70%

  • 低成本:eBPF 实时引流方式,用户仅需知道 BNS 就可以配置生成任务,一键完成总引流到生成case的工作,无需任何开发工作

  • 多渠道:提供 eBPF 流量实时录制、XSTP GoReplay 引流、用户流量文件上传等流量接入方式,覆盖不同业务形态的模块

  • 能力强:突破长连接、SSE、chunked 等接口引流能力,支持点到点、inbound 录制模式,提供单接口录制上限等接口录制丰富度相关配置

提供配置化的流量采样和用例生成策略能力,生成用例的覆盖率超过人维护用例

  • 流量采样策略:提供精简采样、优先采样、普通采样、高覆盖采样4种标准采样模式

  • case 生成策略:提供枚举值遍历、边界值异常、必填项异常、枚举值异常、字段类型异常等多种异常策略

  • 相对原人工维护 case,自动生成的 case 函数覆盖率从14.8%->46.7%,行覆盖率从9.9%->34.7%。单 API 行覆盖率从66%->74.3%

基于文心大模型和业务外挂知识库实现个性化的测试诉求识别和用例转化能力,生成的用例直接满足业务诉求,无需再人工调整

  • 简单的 LUI 支持复杂的用例修改能力:通过 LUI 和 LLM 技术识别用户对于流量用例请求参数、响应断言以及特定场景的复杂修改诉求,保证用例在其他环境的可运行性和问题拦截能力

  • 业务知识库:构建业务知识库存储不同业务的 case 特征,在生成过程中通过检索业务知识,转化为生成诉求的方式,实现生成出满足业务诉求的用例

image.png
LUI 使用案例

基于接口/代码生成接口用例:

有了接口文档/代码,就能生成用例

以上基于流量的用例生成只能解决回归测试用例编写和维护的问题,在全新功能的场景下需要寻找其他的解决方案。我们针对这一场景实现了基于代码分析和接口文档变更筛选&生成待测试用例的方案,在研发自测、服务端新功能迭代测试等阶段应用,辅助 RD 和 QA 高效完成新功能自测和测试,提升用例规范性、和测试质量。

image.png

▎关键实践

  • 接口文档生成:基于调用链、大模型、业务变更代码影响的接口分析能力,支持直接从变更代码挖掘出影响的接口文档,使得没有标准化、平台化的接口文档管理能力的业务也可接入

image.png

  • 业务知识库:通过离线的历史 case 分析和手动录入的方式构件字段字典信息、断言和参数特征等业务知识,解决新接口难以生成正确参数值的问题

  • 端到端方案:生成推荐过程融入业务 RD 和 QA 的日常工作流程中,业务无需调整或增加流程,在原有工作流程中就能直接使用到生成好的用例结果

image.png

总结

回顾既有的工作,我们认为,一个 AI 原生的产品,一定要找到自己的数据飞轮,通过数据让自己的能力不断迭代升级,而不是纯靠人工迭代;一定要抛弃方向上的惯性思维,用 AI 手段从人的视角上找解法;此外,还需要想方设法打磨好产品体验,降低用户使用成本,这样才有机会让能力落地,让用户用起来,从而让飞轮转起来。

展望测试用例智能创作方向,能用 AI 技术重构的,远远不止于测试用例的智能生成。测试用例落到研发测试环节,存在一个自有的生命周期:测试用例新引入阶段(新功能或者回归用例的撰写/生成)->执行阶段(新功能/回归用例的签章执行)-> 入库阶段(用例正式入到回归用例集合)-> 回归用例集合(通过筛选进入到当次正式的回归用例集合)->消亡阶段(随着项目的下线或者更改,用例从回归用例集合中删除),这样形成了用例的生命周期。

AI 技术不仅能重塑用例撰写过程,我们相信,未来 AI 还能辅助用例的执行、转化、更新和消亡等过程,进而为研发测试保质提效。

image.png

(本文由百度移动生态质量效能部分享)

——————END——————

推荐阅读

基于afx透明视频的视觉增强前端方案

百度一站式数据自助分析平台(TDA)建设

浅析如何加速商业业务实时化

登录系统演进、便捷登录设计与实现

一文带你完整了解Go语言IO基础库

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3032240.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

振弦采集仪在岩土工程监测中的数据处理与结果展示

振弦采集仪在岩土工程监测中的数据处理与结果展示 河北稳控科技振弦采集仪是岩土工程监测中常用的一种设备,用于采集地下土体振动信号,通过对数据的处理与结果的展示,可以有效地评估土体的动力特性和工程的稳定性。 振弦采集仪通过安装在土体…

(44)5.11第五章树和二叉树(树的基本概念)

1.树的基本概念 2.基本术语 2.1结点之间的关系 2.2结点,树的属性描述 2.3数和森林 2.4有序树和无序树 小结 3.树的性质 3.1树的常考性质 小结

又一位互联网大佬转行当网红,能写进简历么?

最近半个月,有两个中年男人仿佛住进了热搜。 一个是刚刚辟谣自己“卡里没有冰冷的 40 亿”的雷军,另一个则是在今年年初就高呼“如果有可能,企业家都要去当网红”的 360 创始人周鸿祎。 他也确实做到了。 先是作为当年 3Q 大战的当事人&…

手机格式化后数据还能恢复吗?恢复指南来了!

“手机被人捡走了,找回来后发现被格式化了,照片和聊天记录所有数据都没有了。手机格式化后数据还能恢复吗?难过到无法自拔,有没有类似情况但是恢复了数据的朋友回答一下?” 手机格式化是指将存储设备上的所有数据批量…

数据中心运维智能化管理 效果多炸裂?

从人工走向智能,一切的变化来源于数据中心规模化、系统复杂性和设备多样性的挑战,将平台运维的重要性推到了高点。 #01 为何要智能化? — 企业IT建设不断深入和完善,业务对系统稳定性和连续性的依赖,智能化将是更好…

Substrate 入门课第 14 期圆满结束,岗位内推直达知名 Web3 项目!

Substrate,一个完全免费且开源的框架,利用 Rust 语言的强大功能和安全性,为全球开发者提供了一个高效和灵活的开发环境。借助其模块化的设计,即使是新手开发者也能在短短 15 分钟内搭建起定制化的区块链。自 2020 年以来&#xff…

AIGC|将GPTBots与10000+主流软件连接,实现应用场景全覆盖

一、自动化工作流的无限可能,由AI带来 当前市场上存在许多自动化工作流工具,这些工具在很大程度上提升了人们的工作效率,为企业节省了大量时间和人力成本。然而,这些工具并非万能,它们在实际应用中仍存在一定的局限性…

课程设计 大学生竞赛系统

课程设计 大学生竞赛系统 wx:help-assignment 学生用户: wx:help-assignment 首页:推荐一些竞赛,热门活动等; 广场:用户可以通过广场来发表动态,同时也可以查看别人发布的动态,并且可以 关注…

2D-3D 转换中,为什么世界坐标要扩充成四维, 图像坐标要扩充成三维?

总结 在计算机视觉和图形学中,将世界坐标扩充成四维,以及图像坐标扩充成三维,是为了便于运用齐次坐标(homogeneous coordinates)进行坐标变换。这样的做法简化了投影变换的数学表示和计算,特别是在三维场景…

软件从立项申报到验收交付全资料整理(项目经理)

软件文档交付清单是指在软件开发项目完成后,开发团队需要准备的一份详细清单,用于确保交付的软件产品符合客户需求并达到预期的质量标准。以下是软件文档交付清单中可能包含的一些关键要素 项目启动阶段: 项目计划书/立项报告:描…

来看一段有趣的代码

最近实现发票连续打印时,直接copy其他项目代码来用,主要是对文件的处理,这部分可以不涉及数据库操作,这种功能也很方便写单元测试。在写单元测试图片转PDF功能时,发现了一段有趣的代码: protected void sc…

瑞芯微 rk3588 Linux系统备份还原 StepbyStep

1.系统备份 1.1 将瑞芯微平台嵌入式系统的root ssh 权限开通 step1:sudo vi /etc/ssh/sshd_config step2: 找到PermitRootLogin,把开关打开: PermitRootLogin yes step3:重启ssh服务 sudo systemctl restart sshd 1.2.使用瑞芯微的打包脚本把嵌入式系统系统打包 这…

操作系统实战(二)(linux+C语言)

实验内容 通过Linux 系统中管道通信机制,加深对于进程通信概念的理解,观察和体验并发进程间的通信和协作的效果 ,练习利用无名管道进行进程通信的编程和调试技术。 管道pipe是进程间通信最基本的一种机制,两个进程可以通过管道一个在管道一…

代码审计平台sonarqube的安装及使用

docker搭建代码审计平台sonarqube 一、代码审计关注的质量指标二、静态分析技术分类三、使用sonarqube的目的四、sonarqube流程五、docker快速搭建sonarqube六、sonarqube scanner的安装和使用七、sonarqube对maven项目进行分析八、sonarqube分析报告解析九、代码扫描规则定制十…

激光雷达赋能盲人导航:精准安全与实施挑战并存

在当今科技的推动下,一款名为“蝙蝠避障”专门为盲人设计的辅助应用正逐渐成为他们独立出行的重要工具,特别是那些融入了激光雷达技术的应用,为盲人导航提供了前所未有的支持。然而,任何技术都有其两面性,接下来我们将…

Fcos源码训练编译问题

训练fcos代码时出现问题 ImportError: cannot import name ‘_C’ 原因是没有对代码进行编译 运行python setup.py develop --no-deps进行代码编译 编译过程中出现报错: fcos_core/csrc/cuda/ROIAlign_cuda.cu:5:10: fatal error: THC/THC.h: No such file or dire…

【Hugging Face】编写 shell 脚本在 huggingface 镜像站快速下载模型文件

前言 我们使用 Git LFS 和 wget 结合的方法,小文件使用 Git 下载,大文件使用 wget 下载 Git 下载的优缺点: 优点:相当简单 缺点:不支持断点续传 直接 wegt 下载比较稳定,但是欠缺优雅 我们可以将这两…

python + word文本框中文字识别并替换【真替换,不只是识别】

1. 简单描述 在一些转换场景下,文本框不会被转换,需要先识别成文字内容。 【识别的文字段落可能会和实际看到的效果有些差异,后续还需校对,如下图】。 不足:除了上面说的那个情况(上图说的问题&#xff0…

pytest + yaml 框架 - 录制接口转 yaml 用例实现

pytest yaml 框架基本不用写 python 代码,只需写yaml 文件用例就能实现接口自动化。 现在引入接口录制功能,连 yaml 文件也不用写了,点点点就能生成 yaml 用例文件了。 录制功能在v1.3.4版本上实现 pip instal pytest-yaml-yoyo 环境准备 …

LLM 可以从简单数据中学习吗?

在 10 月份的一次周会结束后,我提到 SFT 训练后的 Loss 曲线呈现阶梯状,至于为什么,并没有人有合理的解释,加上当时的重心是提升次日留存率,Loss 曲线呈现阶梯状与次日留存率的关系还太远,即使有问题&#…