基于大模型的Agent进行测试评估的3种方案 - 莫尔索

大家好啊，好久不见，我们都知道当前基于大模型构建的 Agent 能力极不稳定，而今年我司产品又在规划接入 Agent 能力，所以在引入之前，需要先设计一套测试框架，来看看各种场景下容错率是否能达到目标阈值，所以我调研了几种测试方案，本篇来总结下，大家有需求可以加我进群进一步讨论。

morsoli / blog-comment