의학통계
-
탐색적 자료분석 2. 결측치 확인 및 처리 (SPSS)SPSS 2019. 8. 5. 12:43
결측치 확인도 통계분석에서 중요한 부분의 하나이지만, 쉽게 넘어가는 부분이다. 특히 의학 계열 논문에서는 그 정도가 더 심한데, 그 이유 중 하나가 상당수의 의학 계열 논문에서 outlier나 결측치 대체 같은 통계기법 사용을 인정하지 않기 때문이다. 다른 분야에서 일반적으로 사용되는 기법을 인정하지 않는다고 보수적이라고 생각할 수도 있겠지만, 아무래도 연구 대상이 사람인만큼... 정규분포하지 않는 자료가 많기도 하고, 약간 특이하더라도 누군가의 생명을 outlier 취급 하기에는 무리가 따르는 점도 있다. 하여간 여러 이유로 결측치 확인 및 이상값 처리가 일상적이지 않기는 하지만 그렇다고 그냥 무시하고 넘어갈 수도 없느것이 현실이다. 그 이유를 함께 확인해보자. 우선 본 내용으로 들어가기 전에 선형회귀..
-
탐색적 자료분석 1. 정규성 검정 (SPSS)SPSS 2019. 8. 2. 06:31
논문 자료 분석할 때 초보자들이 하기 쉬운 가장 흔한 실수중의 하나가 탐색적 자료분석 (Explanatory Data Analysis)에 들이는 시간을 아까워 한다는 점이다. 언뜻 보기에는 화면 전체에 복잡한 숫자와 p-value들이 난무하는 다변수 분석이 뭔가 하는 것 같고 멋있어 보이겠지만, 대부분의 결과는 그 이전에 이미 결정되어 있는 경우가 많다. 1. 정규성 검정이란? 정규분포 자료는 위의 그림과 같이 종모양이며 평균을 중심으로 양쪽으로 예쁘게 분포되어 있는 자료를 말한다. 정규분포가 중요한 이유는, 우리가 다루는 대부분의 통계적 분석법은 자료(특히 결과변수)가 정규분포를 만족한다고 가정하고 진행하는 것이기 때문이다. 2. 중심극한정리 (Central Limit Theorem) 확률론과 통계학에..
-
탐색적 자료분석 1. 정규성 검정 (R)R 2019. 8. 2. 04:30
논문 자료 분석할 때 초보자들이 하기 쉬운 가장 흔한 실수중의 하나가 탐색적 자료분석 (Explanatory Data Analysis)에 들이는 시간을 아까워 한다는 점이다. 언뜻 보기에는 화면 전체에 복잡한 숫자와 p-value들이 난무하는 다변수 분석이 뭔가 하는 것 같고 멋있어 보이겠지만, 대부분의 결과는 그 이전에 이미 결정되어 있는 경우가 많다. 1. 정규성 검정이란? 정규분포 자료는 위의 그림과 같이 종모양이며 평균을 중심으로 양쪽으로 예쁘게 분포되어 있는 자료를 말한다. 정규분포가 중요한 이유는, 우리가 다루는 대부분의 통계적 분석법은 자료(특히 결과변수)가 정규분포를 만족한다고 가정하고 진행하는 것이기 때문이다. 2. 중심극한정리 (Central Limit Theorem) 확률론과 통계학에..