morsoli / blog-comment

博客评论
0 stars 0 forks source link

基于大模型的Agent进行测试评估的3种方案 - 莫尔索 #108

Open morsoli opened 7 months ago

morsoli commented 7 months ago

https://liduos.com/llm-base-agent-evaluation.html

大家好啊,好久不见,我们都知道当前基于大模型构建的 Agent 能力极不稳定,而今年我司产品又在规划接入 Agent 能力,所以在引入之前,需要先设计一套测试框架,来看看各种场景下容错率是否能达到目标阈值,所以我调研了几种测试方案,本篇来总结下,大家有需求可以加我进群进一步讨论。