qcri LLMeBench issues - Githubissues

qcri / LLMeBench

Benchmarking Large Language Models

76 stars 15 forks source link

issues

Newest

Newest Most commented Recently updated Oldest Least commented Least recently updated

add asset GPT4-o TR

#362 AridHasan closed 6 days ago
0
add asset GPT4-o NE

#361 AridHasan closed 6 days ago
0
add asset GPT4-o HI

#360 AridHasan closed 6 days ago
0
add asset GPT4-o EN-QA

#359 AridHasan closed 6 days ago
0
add asset GPT4-o EN-BD

#358 AridHasan closed 6 days ago
0
add asset GPT4-o BN-IN

#357 AridHasan closed 6 days ago
0
add asset GPT4-o BN-BD

#356 AridHasan closed 6 days ago
0
add asset GPT4-o ASM

#355 AridHasan closed 1 week ago
0
update post-processing GPT4-o AR

#354 AridHasan closed 1 week ago
0
add mistral asset TR

#353 AridHasan closed 1 week ago
0
add mistral asset NE

#352 AridHasan closed 1 week ago
0
add mistral asset HI

#351 AridHasan closed 1 week ago
0
add mistral asset EN-QA

#350 AridHasan closed 1 week ago
0
add mistral asset EN-BD

#349 AridHasan closed 1 week ago
0
add mistral asset BN-IN

#348 AridHasan closed 1 week ago
0
add mistral asset BN-BD

#347 AridHasan closed 1 week ago
0
fix assistant prompt

#346 AridHasan closed 1 week ago
0
add mistral asset MNQA ASM

#345 AridHasan closed 1 week ago
0
update mistral prompt MNQA AR

#344 AridHasan closed 1 week ago
0
update prompt MNQA AR

#343 AridHasan closed 1 week ago
0
update prompt MNQA TR

#342 AridHasan closed 1 week ago
0
update prompt MNQA ASM

#341 AridHasan closed 1 week ago
0
update prompt MNQA EN-QA

#340 AridHasan closed 1 week ago
0
update prompt MNQA NE

#339 AridHasan closed 1 week ago
0
update prompt MNQA HI

#338 AridHasan closed 1 week ago
0
update prompt MNQA EN-BD

#337 AridHasan closed 1 week ago
0
update prompt MNQA BN-IN

#336 AridHasan closed 1 week ago
0
updating prompt for MultiNativQA BN-BD

#335 AridHasan closed 1 week ago
0
updating prompt for MultiNativQA BN-BD

#334 AridHasan closed 1 week ago
0
updating prompt for arabic MultiNativQA

#333 AridHasan closed 1 week ago
0
Release v1.0.1

#332 fdalvi closed 1 month ago
0
Pin numpy version to < 2 since dependencies have code incompatible wi…

#331 fdalvi closed 1 month ago
0
Bump version to v1.0.0

#330 fdalvi closed 1 month ago
0
Add a new `assets` subcommand to manage assets.

#329 fdalvi closed 1 month ago
1
added test for AzureModel

#328 firojalam closed 1 month ago
0
Add Python 3.11 as supported version

#327 firojalam closed 1 month ago
0
Feat/anthropic

#326 firojalam closed 1 month ago
1
VLLMLlama3 deployment

#325 firojalam closed 1 month ago
0
updated information about current models and assets

#324 firojalam closed 1 month ago
0
anthropic model (Sonet tested) and a asset file added

#323 firojalam closed 1 month ago
0
update of the PR: https://github.com/qcri/LLMeBench/pull/321

#322 firojalam closed 1 month ago
0
VLLM/FastChat updates

#321 fdalvi closed 1 month ago
1
openai api refactoring update

#320 firojalam closed 2 months ago
0
asset MultiNativQA-Llama3 for Turkish

#319 AridHasan closed 2 months ago
0
asset MultiNativQA-Llama3 for Nepali

#318 AridHasan closed 2 months ago
0
asset MultiNativQA-Llama3 for Hindi

#317 AridHasan closed 2 months ago
0
Subjectivity/thati ar dataset -- assets llama3

#316 firojalam closed 1 month ago
0
asset MultiNativQA-Llama3 for English Qatar

#315 AridHasan closed 2 months ago
0
asset MultiNativQA-Llama3 for English BD

#314 AridHasan closed 2 months ago
0
asset MultiNativQA-Llama3 for Assamese

#313 AridHasan closed 2 months ago
0