검색 상세

비대칭 결측 자료에서의 효과적인 대체 방법

An Efficient Imputation Method for Skewed Missing Data

초록/요약

Missing data structure includes unobserved values and these missing data are represented by various mechanisms. If analysis is conducted with ignoring the missingness, then the result of analysis is biased and the loss of information occurs when the missing rate is high. To solve these problem, we have to fill the missing values with proper estimate and it is called imputation method. Several imputation methods have been proposed according to the types of missing mechanisms. In this thesis, we show the performance and the efficiency of imputation methods under the distribution assumption. In specially, when there exists a skewed longitudinal data structure, we try to suggest most efficient imputation method using simulation. And also, we apply methods to real data which have the missing values.

more

초록/요약

결측 데이터는 관측되지 않는 값을 포함하며 이러한 결측은 다양한 메커니즘으로 표현된다. 결측을 무시하고 분석을 진행하면 분석의 결과가 편향되며 결측률이 높은 경우에는 정보의 손실이 발생한다. 이러한 문제를 해결하기 위해 적절한 값으로 결측값을 추정하는 것이 필요하다. 이러한 방법을 대체 방법이라고 하며 다양한 대체 방법들이 결측 메커니즘에 따라 제안되어 왔다. 본 서에서는 분포를 가정했을 때 대체 방법들의 성능과 효율성을 보이고자 한다. 특히, 치우쳐진 종단 자료 구조에서 가장 효율적인 대체 방법을 제안하기 위해 시뮬레이션을 이용한다. 또한 결측이 존재하는 실제 자료에 방법들을 적용한다.

more

목차

1 Introduction 1
2 Methodology 2
2.1 Missing Mechanism 2
2.2 Imputation methods 3
2.2.1 Compelete Case Analysis (CCA) 4
2.2.2 Mean Substitution (MS) 4
2.2.3 Last Observation Carried Forward (LOCF) 5
2.2.4 Hot Deck (HOT) 5
2.2.5 K-Nearest Neighbors (KNN) 6
2.2.6 Regression Imputation 7
2.2.7 Expectation Maximization (EM) 8
2.2.8 Multiple Imputation (MI) 9
2.3 Comparison Criteria 10
2.3.1 Mean Square Error (MSE) 10
2.3.2 Proportionate Variance (PV) 11
3 Simulation 11
3.1 Skewed Longitudinal Data Modeling 11
3.2 Result and Evaluation 16
4 Application 18
4.1 Data Stucture 18
4.2 Result 19
5 Conclusion 22
A Appendices 23

more