kata-ai / wikiner

3 stars 2 forks source link

Pertanyaan mengenai dataset clean 1.2k #4

Open KerenzaDoxolodeo opened 4 years ago

KerenzaDoxolodeo commented 4 years ago

Saya memerika data di google drive dan menurut ekspolrasi saya, 1k_gold.conll.final memiliki hampir 1.2k entri dan dev.conll memiliki hampir 1k entri. Saya ingin mengkonfirmasi bahwa apakah ini memang seperti ini datasetnya? Saya mengira bahwa dev.conll harusnya hanya 200 entri.

farizikhwantri commented 3 years ago

Hi @KerenzaDoxolodeo , untuk dev.conll itu tidak digunakan dalam training scenario https://github.com/kata-ai/wikiner/blob/master/config/cl-transfer/conll-all-idtransfer_clean1k.json clean data