abacaj / code-eval

Run evaluation on LLMs using human-eval benchmark
MIT License
359 stars 34 forks source link