일반적인 카운터팩츄얼 최적화 목표 개념

  • 타깃 출력 만족: 모델 예측 f ( x ′ ) f(x ′ )가 원하는 타깃 클래스/속성(예: “질병 제거”, “성별 변경”)을 갖도록 함
  • 근접성(proximity) 최대화: x x와 x ′ x ′ 사이의 거리(예: L1/L2, latent 거리)를 최소화해, 변화가 “최소 수정(minimal change)”이 되도록 함
  • 즉, 카운터팩츄얼의 “최적화 목표(optimization objective)”는, 원래 입력과 분류기/생성 모델의 출력을 거의 유지하면서도 원하는 레이블/속성으로 결과를 바꾸도록 입력을 최소 수정하는 것을 의미