Imputasi Berganda Menggunakan Metode Regresi Dan Metode Predictive Mean Matching Untuk Menangani Missing Data

Basuki, Rakhmat (2009) Imputasi Berganda Menggunakan Metode Regresi Dan Metode Predictive Mean Matching Untuk Menangani Missing Data. Masters thesis, Insititut Teknologi Sepuluh Nopember.

[thumbnail of 1308201029-Master_Thesis.pdf] Text
1308201029-Master_Thesis.pdf

Download (10MB)

Abstract

Salah satu pemasalahan yang sering dihadapi dalam survei adalah data yang hilang (missing data) . Hal in disebabkan oleh beberapa hal diantaranya adalah non respon, kelalaian saat melakukan perekaman data atau bahkan oleh hal lain yang tidak diketahui sebabnya. Jika missing data dibiarkan begitu saja maka inferensi statistik dengan menggunakan metode standar untuk data yang lengkap tidak dapat dilakukan, terlebih lagi jika jumlahnya banyak. Imputasi, yaitu mengisi missing data del!gan sebuah nilai tertentu, merupakan salah satu solusi dalam menangani kasus ini . Dengan melakukan imputasi maka data yang lengkap akan bisa diperoleh sehingga analisa standar umuk data lengkap bisa dilakukan. Imputasi tungga l, yaitu mengisi setiap missing data dengan sebuah nilai tertentu temyata tidak merefleksikan adanya ketidakpastian pada prediksi dari missing data tersebut dan dalam kasus tertentu menghasilkan estimasi varian dari parameter bias menuju nol. Oleh karena itu, imputasi berganda lebih tepat diterapkan karena mampu merefleksikan adanya ketidakpastian pada prediksi dari mising data tersebut. Metode regresi dan predictive mean matching me1upakan dua metode yang bisa digunakan pada imputasi berganda. Pada penelitian ini kedua metode tersebut diuji melalui simulasi dan diterapkan pada data survei industri BPS kemudian hasilnya diperbandingkan. Pada data yang berdistribusi normal multivariat, kinerja ke:dua metode adalah sama baik. Namun, pada data yang tidak berdistribusi normal multivariat metode pr e di ctive mean matching menunjukkan i<.inerja yang lebih baik dibandingkan metode imputasi regresi .
=======================================================================================================================================
Missing data is one of a common problem in survey. Its caused by many things as non response, errors and omissions when data recorded or by unknown reasons. When missing data are left blank, .::omplete data statistics that would have been used in the absence of mising data can no longer be calculated and data analysts can no longer use standard complete data methods to draw inferences; especially when the number of missing is large. Imputation, its that impute the missing value with a real value is one of solution in this case. With imputation, the complete data will be derived so that standard analy~is for a complete data is applicable. Single imputation, its that fill every missing data with a single value does not reflect the uncertainty about the predictions of the unknown missing values, and the resulting estimated variances of the parameter estimates will be biased toward zero. Instead of filling in a single value for each missing value, multiple imputation replaces each missing value with a set of plausible values that represent the uncertainty about the right value to impute. Therefore, multiple imputation is more appropriate. Regression method and predictive mean matching method are two methods which can used in multiple imputation. In this research, both of the methods are tested by simulation learning. Practical learning is applied to industrial survey data of BPS and then the output are compared. In multivariate normal condition, both of the method are work properly. When the normality assumption is violated, the predictive mean matching method yield imputed values that are more plausible and more appropriate than the regression method.

Item Type: Thesis (Masters)
Additional Information: RTSt 519.536 Bas i, 2009
Uncontrolled Keywords: lmputasi, Missing data , Metode Regresi, Predict ive Me an Matching
Subjects: Q Science > QA Mathematics > QA278.2 Regression Analysis. Logistic regression
Divisions: Faculty of Mathematics and Science > Statistics > 49101-(S2) Master Thesis
Depositing User: Mr. Marsudiyana -
Date Deposited: 10 Jan 2024 07:11
Last Modified: 01 Feb 2024 01:42
URI: http://repository.its.ac.id/id/eprint/105439

Actions (login required)

View Item View Item