Closed albertvillanova closed 2 years ago
Thanks @KhalidAlt !
Link: https://huggingface.co/datasets/bigscience-catalogue-data/brad_2
Note that we are interested in the unbalanced subset, that contains the whole dataset.
DONE: https://huggingface.co/datasets/bigscience-catalogue-lm-data/lm_ar_brad_2
Sample:
{
'text': 'صراع الجذور والانتماء، عقلة ساق الخيزان توائم نفسها وتنمو ايا كانت التربة. فكك الكاتب المجتمع الفلبيني والكويتي،غاص عميقا عميقا في تعقيداتهما معا،، رواية ممتعة.',
'meta': "{'id': '1682581870'}"
}
Source: Masader Project