Noviyanti, Reny Ari (2025) Model Persamaan Simultan Data Panel Untuk Small Area Estimation Studi Kasus: Estimasi Pengeluaran Per Kapita dan Rata-rata Lama Sekolah Level Kecamatan di Kabupaten Langkat. Doctoral thesis, Institut Teknologi Sepuluh Nopember.
![]() |
Text
06211960010008 - Dissertation.pdf Restricted to Repository staff only until 1 April 2027. Download (4MB) | Request a copy |
Abstract
Survei umumnya dirancang untuk area luas, sehingga ukuran sampel untuk area yang lebih kecil memiliki jumlah terbatas. Estimasi berbasis data survei untuk area yang lebih kecil dapat dilakukan melalui metode Small Area Estimation (SAE). Model Fay-Herriot mengakomodir pengaruh acak area. Model Rao-Yu memodifikasi dengan menambahkan komponen pengaruh acak area-waktu yang mengikuti proses autoregresif orde pertama ke dalam model Fay-Herriot, sehingga bisa digunakan untuk analisis data panel. Adanya korelasi antar beberapa variabel respon dengan variabel penyerta pada data panel, kemudian berkembang model Multivariat Rao-Yu. Untuk variabel respon yang saling berkorelasi dan mempunyai hubungan saling mempengaruhi, maka penelitian ini mengembangkan model Simultaneous Equation Rao-Yu (SERY) yang merupakan modifikasi dari model Rao-Yu dengan menggunakan persamaan simultan. Model SERY memungkinkan variabel endogen berfungsi sebagai variabel explanatori dalam pemodelan data hasil survei berkala. Estimasi parameter dalam model SERY menggunakan metode Three-Stage Least Squares-Restricted Maximum Likelihood (3SLS-REML) untuk mendapatkan estimator Empirical Best Linear Unbiased Prediction (EBLUP) dan Mean Squared Error (MSE). Kajian simulasi dengan beberapa skenario jumlah area dan waktu dilakukan untuk mengukur kebaikan model. Model SERY menghasilkan estimasi parameter yang unbiased dan rata-rata nilai bias hasil estimasi cenderung menurun seiring dengan meningkatnya jumlah area dan waktu. Model SERY selanjutnya diaplikasikan untuk mengestimasi tingkat kesejahteraan yang diukur dengan pengeluaran per kapita dan variabel pendidikan yang diukur dengan rata-rata lama sekolah (RLS) untuk level kecamatan di Kabupaten Langkat berdasarkan data Survei Sosial Ekonomi Nasional (Susenas) tahun 2018-2021. Enam variabel penyerta yang digunakan adalah jumlah penduduk, luas panen produksi tanaman pangan, luas tanam tanaman perkebunan, jumlah industri, rasio tenaga kesehatan, dan rasio fasilitas pendidikan. Hasil estimasi parameter menunjukkan variabel yang mempunyai pengaruh signifikan terhadap estimasi pengeluaran per kapita adalah RLS, jumlah penduduk, luas panen produksi tanaman pangan, luas tanam tanaman perkebunan, jumlah industri, dan rasio tenaga kesehatan. Variabel yang mempunyai pengaruh signifikan terhadap estimasi RLS adalah pengeluaran per kapita, luas panen produksi tanaman pangan, jumlah industri, dan rasio fasilitas pendidikan. Analisis ini juga menunjukkan bahwa rata-rata lama sekolah memiliki autokorelasi yang lebih kuat dibandingkan dengan pengeluaran per kapita. Di sisi lain komponen pengaruh acak area-waktu memiliki varian yang lebih tinggi dibandingkan pengaruh acak area. Estimasi parameter yang diperoleh berdasarkan model SERY menunjukkan rata-rata nilai RMSE lebih kecil dibandingkan dengan estimasi langsung.
====================================================================================================================================
Surveys are designed for large areas so the sample size for smaller areas is limited. Survey data-based estimates for smaller areas with insufficient sample sizes can be done using Small Area Estimation (SAE). The Fay-Herriot model has been able to capture the diversity between areas. Moreover Rao-Yu model has been developed by adding a random area and time-varying effects component that follows a first-order autoregressive process to the Fay-Herriot model, so it can be used for panel data analysis. By considering correlation between variables of interests from panel data, the Multivariate Rao-Yu model was developed. For correlated response variables and have causal relationship, this research develops a Simultaneous Equation Rao-Yu (SERY) model, a modification of the Rao-Yu model using simultaneous equations. The SERY model allows endogenous variables to be functioned as explanatory variables in modeling periodic survey data. Parameter estimation in the SERY model uses the Three-Stage Least Squares-Restricted Maximum Likelihood (3SLS-REML) method. This method was used to derive Empirical Best Linear Unbiased Prediction (EBLUP) and Mean Square Error (MSE) estimator. A simulation study with several scenarios for the number of areas and time was carried out to measure the goodness of the model and to evaluate the performance of the proposed model. The SERY model produces unbiased parameter estimates and the average bias value of the estimated results tends to decrease as the number of areas and time increases. The SERY model was applied to estimate the level of welfare measured by per capita expenditure and the education quality measured by mean years of schooling for sub-district level in Langkat Regency using 2018-2021 Susenas data. Six auxiliary variables have been used are total population, paddy field harvest area, plantation area, number of industries, the ratio of total number of medical personnel, and the ratio of total number of education facilities. The parameter estimation results shows that the mean years of schooling, total population, paddy field harvest area, plantation area, number of industries, and the ratio of total number of medical personnel have a significant effects on per capita expenditure estimates. Per capita expenditure, paddy field harvest area, number of industries, and the ratio of total number of education facilities have a significant effect on the mean years of schooling estimates. The analysis also shows that the mean years of schooling seems to have strong autocorrelation than the expenditure per capita. Both equations indicates that the random effect of area-time has higher variance than the area random effect. The results indicate that the RMSE of the EBLUP for parameter estimation of SERY were lower compare to the direct estimation across all areas and time.
Item Type: | Thesis (Doctoral) |
---|---|
Uncontrolled Keywords: | Panel data, SAE, SERY, simultaneous equation, 3SLS-REML |
Subjects: | Q Science > QA Mathematics > QA275 Theory of errors. Least squares. Including statistical inference. Error analysis (Mathematics) |
Divisions: | Faculty of Science and Data Analytics (SCIENTICS) > Statistics > 49001-(S3) PhD Thesis |
Depositing User: | Reny Ari Noviyanti |
Date Deposited: | 12 Feb 2025 02:30 |
Last Modified: | 12 Feb 2025 02:30 |
URI: | http://repository.its.ac.id/id/eprint/118668 |
Actions (login required)
![]() |
View Item |