Closed bugor40 closed 3 weeks ago
Предобработал датасет и привел его к требуемому формату. Предобработка включала в себя следующие шаги:
На выходе получился датасет с количеством строк: 63 686 строк. Датасет загрузил на S3 (team-22/data/raw/toxric/TOXRIC_dataset.csv)
Что хотим?
Привести источник к общему формату, по которому сможем объединить все данные вместе.
Формат
Какие данные?
Предобработка
Предварительно с данными нужно поработать, как именно:
Собранные данные нужно выложить на S3 (появится позже)