covid19-detection / data_collection

Here we can collect, clean, and preprocess data for COVID detection project
5 stars 3 forks source link

segment for coswara dataset + re-organize repo by dataset #2

Closed anhtu293 closed 3 years ago

anhtu293 commented 3 years ago

Segment 1 audio nhiều tiếng ho/âm thanh (utterance) thành nhiều audio nhỏ, mỗi audio chỉ có 1 tiếng ho duy nhất

Output 1 file csv tổng hợp các metadata + annotation (audio quality) cho từng đoạn audio nhỏ đã segment

EDA : bao gồm các notebook cho phần khai phá dữ liệu. Ở trong có các sub-dir theo từng dataset vì mình có nhiều dataset nên làm vậy để tránh nhầm lẫn

Preprocess: bao gồm code cho phần preprocess data. Hiện tại em gộp cả phần feature extraction (chuyển audio thành spectrogram ??) của bạn Đạt vào đây. Em cũng chia thành các sub directory theo từng dataset để tránh nhầm lẫn. Có thêm 1 README để chia sẻ command run code.