Open chatterboy opened 5 years ago
환자 : 105명 Data
각 환자별 : CT 25~27장 / X-Ray 2~3장 (환부가 다른 부위로 두 곳인 경우에는 2배)
CT와 X-Ray :
서로가 고유한 정보를 포함하지는 않음.
기본적으로 CT를 사용하면 X-Ray에서 볼 수 있는 것은 보두 볼 수 있음(더 자세함).
하지만 CT는 입체적으로 볼 수 있으며, X-Ray는 단편적으로 볼 수 있는 차이점 있음
이 차이점 때문에 X-Ray에서는 한 장만으로도 뒷편의 골절까지 확인이 가능하지만
CT는 다각도에서 관찰해야 정확한 진단 가능한 것이 장점이자 단점
(이 점 때문에 CT를 어떻게 입력해야 할지 고민해봐야 할 것 같음)
라벨링 : 105명 중 90%이상(환자 수 기준)은 라벨링 됨 클래스 개수 전체 106개 중 26개 사용 되었고, 사용된 사항은 다음과 같음
라벨링 | 횟수 42B2 | 37 42A1 | 21 41A2 | 1 12A1 | 2 43A3 | 3 32C3 | 1 42C2 | 4 42A3 | 7 42B3 | 13 42A2 | 8 32A3 | 7 32B2 | 3 43B1 | 1 43A2 | 3 43A1 | 1 42C3 | 2 4F2B | 38 12B3 | 1 4F2A | 20 4FB2 | 1 4F3B | 9 4F1A | 5 31B1 | 1 4F1B | 10 4F3A | 7 4F2 | 1 총합 | 207
라벨링의 문제점 :
2-1. 같은 환자인데 라벨링이 두 번 되어있는 경우 있음 (이름, 환자번호 같음 / 나이와, 골절번호가 다름)
2-2. 어떤 환자는 데이터 디렉토리가 두 개가 있으나, 똑같은 사진임(라벨링도 각자 되어있음, 서로 다른 진단으로)
환부가 두 곳인 경우 어느 환부가 어느 골절인지 확인 할 수 없음(추가적인 표시가 없음) -메뉴얼을 보고 임의로 분류하는 것이 가능하나 정확하게 할 수 있을지 모르겠음. -이 환자의 경우 환부가 두 곳이라, Lt, Rt로 분류되어 표기되어 있긴 하지만 사진상으로 일일이 체크해야 확인 가능
이경국 환자의 경우 관절 내에 문제가 있는 것 같은데 데이터가 190장 가량의 MRI, 3장의 엑스레이가 있음 (따로 분류하던지 빼아될 것으로 보임)
정정.
TODO
모델 아키텍쳐
먼저, 환자에 대한 CT 영상은 각도에 따라 여러 장이 존재함. 예를 들어, 환자에 대한 24장의 CT 영상은 15도를 간격으로 회전시킨 영상을 나타냄. 위의 특징을 고려해서 아래 그림과 같은 첫 번째와 두 번째 모델을 고려함. CT 영상의 수가 사용할 모델의 수보다 많은 경우에는 각 모델의 기준각에 가장 가까운 영상들을 해당 모델의 학습 데이터 또는 테스트 데이터로 사용. 예를 들어, 기준각이 0도인 모델은 -45, -30, -15, 0, 15, 30에 대한 영상을 사용. 이 부분은 하나의 영상을 앙상블로 추론하는 경우와 비교 가능함. 첫 번째에서 각 모델의 특징을 각 모델에 대한 예측으로만 쓰는 반면에 두 번째는 그러한 특징들을 결합하여 하나의 통합된 모델로써 예측을 하는 것을 고려함. 세 번째는 CT 영상과 X-ray 영상을 동시에 사용해서 하나의 모델을 학습 및 추론하는 방법임.
클래스 불균형
현재 사용하려는 데이터에는 클래스 불균형이 있고 많게는 20배 정도 차이가 발생. 중요한 점은 적은 경우에는 단 한 장이고, 많아야 20장 정도 되기 때문에 학습을 어떻게 시킬지에 대한 문제도 고려해야함.
DONE
데이터 조사