поискать, какие виды предобработки применяются для рентген-изображений
часто в статьях помимо набора данных пишут еще и про предобрабатку. Поэтому можно посмотреть, что пишут в статьях, использующих выбранные датасеты (TBX11K Simplified - TB X-rays with bounding boxes; NIH Chest X-rays и VinBigData Chest X-ray Abnormalities Detection)
думаю, понадобится приводить изображения к единому разрешению (растяжение\сжатие)
приведение к одному диапазону значений (от 0 до 255 или от 0 до 1)
возможно, какая-то нормализация по типу "вычесть среднее, поделить на дисперсию"
разобраться с библиотекой OpenCV для Python
написать функции на языке Python (на каждую предобработку своя функция)
Upd (25.10.24):
Проведены эксперименты и получены первые результаты по обработке набора данных.
Необходимо опробовать методы для изображений в градациях серого и выложить ноутбук с кодом.
Заняться предобработкой данных, для этого: