THUDM / AgentBench

A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)
https://llmbench.ai
Apache License 2.0
2.23k stars 159 forks source link

[Assistance] OS task retrun infos #173

Open xiaxiaxiatengxi opened 4 days ago

xiaxiaxiatengxi commented 4 days ago

Describe the bug 我看我们的OS环境目前是以用docker的方式把环境进行打包,之后利用Python的Docker.py和os环境交互。 想问一下,我们的OS环境,有相关的操作说明吗? 就类似RL的环境 每一步都有哪些可执行操作、环境会有的反馈以及每一次的reward,我想单独把OS交互的代码拿出来,之后适配到我们自己的任务里……