Estimator Campuran Spline Truncated, Kernel, dan Deret Fourier pada Regresi Semiparametrik (Studi Kasus: Indeks Pembangunan Manusia di Jawa Timur)

Dewi, Ardiana Fatma (2021) Estimator Campuran Spline Truncated, Kernel, dan Deret Fourier pada Regresi Semiparametrik (Studi Kasus: Indeks Pembangunan Manusia di Jawa Timur). Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 06211950015006-Master_Thesis.pdf]
Preview
Text
06211950015006-Master_Thesis.pdf - Accepted Version

Download (3MB) | Preview

Abstract

Pada analisis regresi terdapat beberapa pendekatan diantaranya adalah parametrik, nonparametrik, dan semiparametrik. Pendekatan parametrik digunakan bila kurva regresi diketahui bentuk polanya seperti linier, kuadrat, kubik dan sebagainya. Pendekatan nonparametrik digunakan jika bentuk kurva regresi tidak diketahui dan tidak mengikuti suatu pola tertentu. Sedangkan semiparametrik digunakan jika bentuk kurva regresi diketahui sebagian. Terdapat beberapa estimator pada pendekatan nonparametrik yang sering digunakan para peneliti sebelumnya diantaranya yaitu menggunakan Spline, Kernel, dan Deret Fourier. Penelitian sebelumnya masih terbatas pada penggunaan satu estimator dan dua estimator saja, sehingga pada penelitian ini akan dilakukan pengembangan teoritis dengan campuran tiga estimator. Pada data berpasangan diasumsikan mengikuti regresi semiparametrik campuran, dimana terdapat kurva regresi yang didekati dengan parametrik linier, Spline Truncated, Kernel, dan Deret Fourier. Penelitian ini bertujuan untuk mengestimasi regresi semiparametrik campuran Spline Truncated, Kernel, dan Deret Fourier dengan menggunakan OLS. Model campuran tersebut bergantung pada pemilihan titik knot (k) pada Spline Truncated, bandwidth (α) pada Kernel, dan panjang osilasi (w) pada Deret Fourier. Dari beberapa pasangan kombinasi titik knot, bandwidth, dan panjang osilasi akan menghasilkan nilai GCV yang digunakan sebagai pemilihan model terbaik. Selanjutnya akan didapatkan model terbaik yang memiliki nilai GCV terkecil. Model dengan estimator campuran memiliki nilai GCV yang terkecil, hal tersebut dikarenakan memiliki error yang relatif kecil dibandingkan dengan estimator tunggal. Hal tersebut dibuktikan pada aplikasi model regresi semiparametrik campuran Spline Truncated, Kernel, dan Deret Fourier pada faktor-faktor yang mempengaruhi Indeks Pembangunan Manusia (IPM) di Provinsi Jawa Timur tahun 2019. Model terbaik yang didapatkan yaitu dengan tiga titik knot serta satu osilasi dengan bandwidth yang digunakan sebesar 0,0071 dan GCV yang dihasilkan sebesar 0,4367 dengan nilai R2=98,40%. Telah di buktikan bahwa model campuran dengan tiga estimator lebih baik dibandingkan dengan estimator tunggal.
===================================================================================================================================
In regression analysis there are several approaches including parametric, nonparametric, and semiparametric. The parametric approach is used when the regression curve is known for its pattern shape such as linear, quadratic, cubic and so on. The nonparametric approach is used if the shape of the regression curve is unknown and does not follow a certain pattern. While semiparametric is used if the shape of the regression curve is partially known. There are several estimators on nonparametric approaches that are often used by previous researchers, including using Spline Truncated, Kernel, and Fourier Series. Previous research is still limited to the use of one estimator and two estimators, so that in this study a theoretical development will be carried out with a mixture of three estimators. In paired data, it is assumed to follow mixed semiparametric regression, where there is a regression curve that is approximated by linear parametric, Spline Truncated, Kernel, and Fourier Series. This study aims to estimate the mixed semiparametric regression of Spline Truncated, Kernel, and Fourier Series using OLS. The mixed model depends on the selection of knot points (k) on the Truncated Spline, bandwidth (α) on the Kernel, and the oscillation length (w) on the Fourier Series. From several pairs of knots, bandwidth, and oscillation length combinations, the GCV value will be used as the best model selection. Furthermore, the best model will be obtained which has the smallest GCV value. The model with the mixed estimator has the smallest GCV value, this is because it has a relatively small error compared to a single estimator. This is evidenced in the application of the mixed semiparametric regression model Spline Truncated, Kernel, and Fourier Series on the factors that affect the Human Development Index (HDI) in East Java Province in 2019. The best model obtained is with three knot points and one oscillation with bandwidth used is 0.0071 and the resulting GCV is 0.4367 with a value of R2 = 98.40%. It has been proven that a mixed model with three estimators is better than a single estimator.

Item Type: Thesis (Masters)
Additional Information: RTSt 519.536 Dew e-1 2021
Uncontrolled Keywords: Deret Fourier, Kernel, Regresi Semiparametrik, Spline Truncated Fourier Series, Kernel, Semiparametric Regression, Spline Truncated
Subjects: H Social Sciences > HA Statistics > HA29 Theory and method of social science statistics
H Social Sciences > HA Statistics > HA31.3 Regression. Correlation
Q Science > QA Mathematics > QA278.2 Regression Analysis. Logistic regression
Divisions: Faculty of Science and Data Analytics (SCIENTICS) > Statistics > 49101-(S2) Master Thesis
Depositing User: Ardiana Fatma Dewi
Date Deposited: 09 Sep 2021 07:56
Last Modified: 17 Apr 2024 02:22
URI: http://repository.its.ac.id/id/eprint/91921

Actions (login required)

View Item View Item