데이터셋 및 전처리
MedPix 데이터셋: 다양한 방사선 이미지 양식(modalities)을 포함하는 공개 데이터셋을 사용하여 모델을 학습시켰습니다. 데이터 정제: 특수 문자 제거, 공백 조정 등을 수행했으며, 정보가 너무 적은 샘플을 배제하기 위해 20자 미만의 짧은 캡션은 제외했습니다. 이미지 설정: 모든 이미지는 224×224 픽셀 크기로 조정되었으며, CLIP 모델의 표준 RGB 채널 평균 및 표준 편차를 사용하여 정규화되었습니다. 데이터 분할: 전체 데이터를 학습용 85%(20,292개), 검증용 15%(3,515개)로 나누어 사용했습니다.
성능 검증

훈련셋 (Training Set: MedPix 85%)
내부 검증셋 (Internal Validation Set: MedPix 15%)
외부 성능 평가 (External Evaluation: ROCO Dataset)
일반화 성능(Generalization)의 증명력 약화: 이 논문의 핵심 목표는 ‘Universal(보편적인)’ 모델을 만드는 것입니다. 검증 데이터는 학습 중에 모델을 수정(하이퍼파라미터 변경 등)하는 데 참고되므로, 모델이 은연중에 그 데이터의 특성에 맞춰지게 됩니다. 하지만 ROCO를 아예 건드리지 않고 마지막에만 짠! 하고 보여주면, “우리 모델은 한 번도 본 적 없는 낯선 병원 데이터(ROCO)에서도 아주 잘 작동한다”는 것을 완벽하게 증명할 수 있습니다.
손실 함수와 성능 검증
성능 검증 용도 :
Radiology Objects in COntext (ROCO) 데이터셋은 다양한 방사선 이미지를 포함하고 있어 의료 도메인의 일반화 능력을 평가, 즉 범용적 의료파운 데이션 모델로서 가치를 확인하는데 적합하다. CLIP의 정렬 능력 자체를 평가하기 위함