Add llama scorer script

causalNLP / cladder

We develop benchmarks and analysis tools to evaluate the causal reasoning abilities of LLMs.

MIT License

89 stars 15 forks source link

Closed feradauto closed 5 months ago

feradauto commented 5 months ago

Add a separate script to get Llama scores