2025年,测试人还在用Selenium吗?“团队自动化测试效率低?大厂面试总问Selenium源码?新项目到底该选Playwright还是Selenium?” 一组数据看真相: 2025年,Playwright用户量同比暴涨200%,但Sele...
一、大模型基本概念1.1 定义与核心特征 大模型是指通过海量数据和巨大参数量(通常10亿以上)训练而成的深度学习模型,具有以下特征: 规模效应:参数量达百亿至万亿级通用能力:无需特定训练即可完成多种任务涌现特性:规模突破阈值后出现意外能...
一、凌晨3点的警报:工程师的噩梦从何而来?“连续三周,每天凌晨3:15准时崩溃!”某电商平台测试负责人发现,AI生成的支付系统测试脚本总在深夜罢工,导致次日紧急修复耗时超8小时。而这种现象绝非个例——腾讯安全团队2025年数据显示,68%的AI脚本故...
一、什么是AI Agent?AI Agent(人工智能代理)是基于大语言模型(LLMs)的智能系统,能够通过工具调用、自主决策和持续学习完成特定任务。在软件测试开发中,它被设计为测试领域的智能协作者,例如: 自动化测试:理解测试需求,生成并维护...
一、大模型定义狭义定义 特指ChatGPT等大语言模型(LLM),通过千亿级参数训练,具备文本生成、逻辑推理等通用能力。 广义定义 涵盖CV/语音等领域的通用模型范式,演进路径:专用小模型 → 预训练+微调 → 大模型+人类对齐 核心价值 ...
2025年4月13日,人形机器人半程马拉松赛在北京经济技术开发区(北京经开区)与北京亦庄半程马拉松赛同期举行。本次赛事共有20支队伍参赛,包括全球范围内的机器人企业、科研院所、机器人俱乐部、高校等创新主体的人形机器人。最终,天工队以36分54秒率先冲...
在电商系统的测试中,你是否经常遇到这些问题? ✅ 场景遗漏:测试用例覆盖不全,上线后才发现关键路径未测试 ✅ 重复劳动:不同模块的测试用例存在大量冗余 ✅ 维护困难:业务规则变更后,需要手动更新数十个关联用例 ✅ 效率低下:人...
一、企业引入AI测试工具的三大初衷1. 降本增效的必然选择某银行信用卡系统接入AI后: 识别速度提升:单笔交易风险检测从3秒→80毫秒人力节省:反欺诈团队从20人缩减至8人 数据: 指标 人工检测 AI检测 提升率...
探索性测试是一种强调测试人员自主性、学习性和实时设计执行的测试方法。测试人员通过动态探索软件功能,同时设计测试用例、执行测试并即时分析结果,依赖经验、直觉和创造力发现潜在缺陷。 什么时候进行探索性测试? 早期开发阶段 需求不明确或文档不全时...
月之暗面公司推出Kimi-VL,一个高效的开源Mixture-of-Experts(MOE)视觉语言模型(VLM),它提供了先进的多模态推理、长语境理解和强大的代理能力—同时仅在其语言解码器(Kimi-VL-A3B)中激活2.8B个参数。 Kimi...
“手工测试”在软件测试领域始终具有不可替代的价值,尤其是在移动应用(App)测试中。尽管自动化测试(如AppAgentX等工具)能提升效率,但手工测试的灵活性和人类直觉仍是发现复杂问题的关键。 手工测试的价值:为什么机器取代不了人手工测试就像老匠人...
“未来我会被AI取代吗?”这个问题,问出了很多人的好奇和担忧。在今年闭幕的全国两会上,从会场到驻地,代表委员们也议论风生。 我向DeepSeek求证——“你被问最多的关于人工智能的问题是什么?”“AI会取代人类的工作吗?”位列榜首。 “听说AI能...
Dify 和 FastGPT 都是基于大语言模型的 开源开发平台,旨在帮助开发者快速构建和部署 AI 应用,但它们的设计目标、功能特性和适用场景有所不同。 核心定位对比 维度 Dify FastGPT 核心目标 企...
2025年4月14日,中国信息通信研究院(以下简称“中国信通院”)在南京举办的“人工智能赋能新型工业化深度行”活动中宣布,正式启动“可信AI智能体测试床”建设工作。 该项目联合华为、百度、金蝶软件、联通数科、中国移动研究院、VIVO、吉利汽车、华晨...
RAG的基本流程,也就是检索增强生成。看起来简单,但实际优化起来可能有很多细节需要注意。提升RAG效果需要像拼积木一样,把每个环节拆开针对性优化。下面分享一些实战中验证过的策略: 数据预处理是基本功,但多数人没做透 文档切割别一刀切:根据内容类型...