- Science

ena
- 공개여부
- 작성일
- 2014.2.13
대학 때도, 그 후에도 통계학 공부는 제대로 하지 않은 죄로,
또 쉽게 통계 분석을 부탁할 수 있는 사람들이 옆에 많이 있었던 덕으로,
지금도 여전히 논문을 쓸 때 통계 분석은 스스로 하지 못합니다.
(나온 값의 의미도 대충은 알기에 논문을 쓸 수는 있는 정도죠.)
그런데, 이러저런 책들을 읽다보면 현재 통계학에서 가장 많이 쓰이는 p value의 한계를 지적하는 경우를 종종 접합니다.
또, 일반적으로 p value가 0.5 이하이면 유의(significant)하다고 해석하는데,
그게 너무 완화된 기준이라는 얘기도 듣습니다.
그래도 전통, 혹은 관습이라는 것은 완고해서 여전히 그 값을 씁니다.
오늘 날짜의 Nature지를 보면, 그에 관한 글이 실렸습니다.
(http://www.nature.com/news/scientific-method-statistical-errors-1.14700)
미처 다 읽지는 못했지만,
앞에서 언급한, 이른바 '황금률(gold standard)'로 여겨져온 p value가 많은 과학자들이 여겨왔던 것처럼 통계적으로 그다지 믿을만하지 않다는 내용입니다.
1920년대에 영국의 통계학자인 Ronald Fisher가 처음으로 p value를 도입했는데, 그 때부터도 그 p value는 지금과 같은 의미를 갖지는 않았다네요.
다른 어떤 것을 적용해야하는지는 잘 모르겠지만(아마도 더 엄격하게 통계학을 적용해야 한다는 얘기가 나오겠죠?), 지금 시점에서 얘기할 수 있는 것은 일반적인 통계가 한계를 가지고 있다는 것을 깨닫는 것이라 할 수 있을 것 같습니다.
연구에 있어서 세 가지 질문을 하게 된다는데,
"What is the evidence?" (증거는 있는지)
"What should I believe?" (믿어야만 하는지)
"What should I do?" (뭘 해야만 하는지)
그런데, 어떤 방법도 이 세 질문 모두에 답할 수는 없답니다.
이제 논의가 시작되어야 할 시점이라네요.
다시 통계 공부를 시작한다해도 따라가기가 쉽지 않겠네요.
- 좋아요
- 6
- 댓글
- 0
- 작성일
- 2023.04.26
댓글 0
댓글이 없습니다.
첫 번째 댓글을 남겨보세요.