IndoNLP / nusa-crowd

A collaborative project to collect datasets in Indonesian languages.
Apache License 2.0
261 stars 61 forks source link

Create dataset loader for Code-mixed Sentiment JV-ID #290

Closed SamuelCahyawijaya closed 1 year ago

SamuelCahyawijaya commented 1 year ago

NusaCatalogue: https://indonlp.github.io/nusa-catalogue/card.html?code_mixed_jv_id

Dataset code_mixed_jv_id
Description Dataset terdiri dari 3.963 kalimat code-mixing dalam bahasa Indonesia dan bahasa Jawa yang dikumpulkan dari twitter. Label dataset terdiri dari 3 kelas sentimen, yaitu: positif, negatif, dan netral. Label sentimen dikumpulkan dengan melakukan anotasi manual untuk setiap tweet.
License CC-BY 3.0
fozziethebeat commented 1 year ago

I can take this on

fozziethebeat commented 1 year ago

self-assign