Questions about Causal Inference Overview

euphoria0-0 commented 2 months ago

토론 주제 또는 질문

인과 추론과 예측 모델링 비교가 옳은가?
식별 가능성에 대한 수많은 가정들을 테스트해야 하는데, 실무에서 만족될 수 있는가?

상세 내용

인과 추론과 예측 모델링 비교가 옳은가?
- 저의 생각: 인과 추론과 통계적 추론, 통계적 추론과 예측 모델링 끼리의 비교가 더 옳아보여서 질문 드렸습니다. 대략적으로 (통계적, 인과) 추론은 데이터를 기반으로 어떤 변수에의 영향을 알아내고 싶은 것, 예측 모델링은 unknown 데이터의 outcome을 데이터를 기반으로 예측하고자 하는 것이고, 통계적 추론과 인과 추론은 인과적 질문(인과관계, 실험 등을 내포하는)에 답할 수 있냐 없냐가 차이 아닐까 생각했습니다.
식별 가능성에 대한 수많은 가정들을 테스트해야 하는데, 실무에서 만족될 수 있는가?
- Causal Discovery 에서는 엄청 엄격한 가정들을 하기 때문에 보통은 real-world 태스크/데이터셋들이 이 가정들을 만족하지 못하는 경우가 많은데, Causal Inference에서 실무/연구 경험이 있으신 분들은 보통 이 가정들이 잘 만족한가요? 그렇지 않다면 보통 어떤 가정이 가장 강한 가정인가요? (e.g. exchaneability)

참고 자료 또는 링크 토론이나 질문과 관련된 참고 자료나 유용한 링크가 있다면 여기에 추가해주세요.

토론까지는 아니지만.. 나름 첫 이슈로서만 의의를 가져봅시당...ㅎ

eun-kyoung113 commented 2 months ago

(1번 issue)

저는 통계적 추론 / 인과 추론 / 예측 모델링 세 part로 구분하기 보다는, "추론"과 "예측" 자체를 비교하는 것이 더 합리적이라고 생각하고 있습니다. (저의 주관적인 생각입니다!) 물론 그 안에서 세부적으로 방법론을 나눌 수 있겠지만 가장 큰 그림을 보면 "추론"과 "예측"으로 나눌 수 있으니까요.

(2번 issue)

제가 경험이 그리 많지는 않지만, Causal Inference를 real world data에 적용할 때 가정 충족 여부 검사를 엄격하게 수행하진 않았습니다. 데이터가 생성된 mechanism을 알기도 어려울 뿐더러, 변수 간 실제 관계를 알 수 없으니까요..!(simulation data가 아닌 이상)
건너 듣기로는, 대부분 민감도 분석을 통해 어느 정도 가정이 충족하는지 판단한다고 들었습니다.
그리고, 제가 생각했을 때 강하다고 생각하는 가정은 "Ignorability"(Exchangeability) assumption인 것 같습니다.

좋은 이슈 제시해주셔서 감사합니다:)

jsshin2022 commented 2 months ago

@euphoria0-0, @eun-kyoung113, @fenzhantw 좋은 스터디 내용과 의견 주셔서 감사드립니다! 일단 1번 부분에 대한 제 의견 먼저 전달드리고 2번은 이후에 코멘트 남기겠습니다.

인과추론과 예측 모델링의 비교는 옳은가? 일단 서로 다른점이 명확해서 옳고 그름의 문제는 아니라고 생각합니다. 먼저, 인과추론과 예측 머신러닝의 주요한 차이점은 "결과" 범위에 따른 차이라고 볼 수 있을 것 같아요. 요약하면 다음과 같습니다.
- 인과추론 : 잠재적 결과 (Factual / Counterfactual)를 모두 고려한 추론
- 머신러닝 : 관찰된(사실적) 결과만으로 추론 - Supervised Learning

따라서, 모델 추론 방식에서의 차이가 있으므로 맞다/틀리다 보다는 문제의 상황에 맞게 잘 적절하게 사용하는 것이 중요하지 않을까요? 아시는 것처럼, 인과추론은 머신러닝처럼 문제 해결을 위한 도구 중 하나일 뿐이며 주어진 상황에서 효율적으로 문제를 풀어야 할지가 더 중요할 것으로 보입니다.

(부연설명) 잠재적 결과 프레임워크 관점에서 보면, 인과추론은 결측값에 해당하는 부분을 잘 에측하는 것이니 인과추론은 인과적 질문에 대답/변수의 영향력 파악을 포함하는 것 뿐만 아니라 추론하는 모든 과정을 포함한다고 생각합니다. 또한, 4.4절에서 인과추론을 Potential outcome modeling 관점에서 설명을 하고 있으니 이 부분 참고 부탁드립니다.

6장에서 학습하게 될 이질적 처치효과(HTE)와 7장 메타러너를 보시면 인과추론은 단순히 변수의 영향력만을 다루는 것이 아님을 확인하실 수 있을 거예요 (7.2절).

eun-kyoung113 commented 2 months ago

Potential outcome framework 하에서 인과 추론은 결측치에 해당하는 부분을 잘 "예측"한다는 관점이 저에게 새롭게 들리네요..! 좋은 의견 감사합니다. (6장과 7장은 제가 발표하기로 한 부분인데..한 번 열심히 읽어보도록 하겠습니다.)

CausalInferenceLab / causal-inference-practice

Questions about Causal Inference Overview #1