Regresi Nonparametrik Spline Truncated Data Longitudinal Menggunakan Metode Cross Validation (CV), Generalized Cross Validation (GCV), dan Unbiased Risk (UBR) (Studi Kasus: Tingkat Pengangguran Terbuka di Jawa Tengah Tahun 2012 – 2021)

Pramudita, Ditia Tahta (2022) Regresi Nonparametrik Spline Truncated Data Longitudinal Menggunakan Metode Cross Validation (CV), Generalized Cross Validation (GCV), dan Unbiased Risk (UBR) (Studi Kasus: Tingkat Pengangguran Terbuka di Jawa Tengah Tahun 2012 – 2021). Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 6003201018-Master_Thesis.pdf] Text
6003201018-Master_Thesis.pdf
Restricted to Repository staff only

Download (3MB) | Request a copy

Abstract

Pemodelan regresi nonparametrik banyak dilakukan dewasa ini karena tidak memerlukan asumsi yang harus dipenuhi. Pemodelan regresi spline truncated adalah salah satu regresi dengan pendekatan nonparametrik, pemodelan spline truncated dapat memodelkan data dengan perubahan pola perilaku pada interval yang berbeda. Dalam regresi spline truncated, terdapat titik knot yang akan mencari sendiri estimasi data dengan menyesuaikan pola data bergerak. Pemilihan titik knot yang optimal memiliki beberapa metode seperti Cross Validation (CV), Generalized Cross Validation (GCV), dan Unbiased Risk (UBR). Perbandingan fungsi antar metode pemilihan titik knot optimal sudah banyak diteliti namun terbatas pada data cross section. Kelemahan data cross section adalah hanya bisa memodelkan pada satu subjek saja dan tidak bisa memberikan gambaran dari waktu ke waktu. Oleh karena itu, penggunaan data longitudinal banyak dilakukan untuk mengatasi kelemahan tersebut. Pada implementasinya, dilakukan pada data tingkat pengangguran terbuka (TPT) dengan faktor-faktor yang mempengaruhinya yaitu Nilai PDRB, Upah Minimum, Indeks Pembangunan Manusia, Tingkat Partisipasi Angkatan Kerja, dan Jumlah Penduduk. Hasil dari penelitian ini adalah rumusan metode CV, GCV dan UBR yang dilakukan pada data longitudinal. Dalam penerapannya pada data TPT Tahun 2012 – 2021 di Provinsi Jawa Tengah, didapatkan hasil bahwa model terbaik dengan melihat titik knot yang paling minimun dan nilai koefisien determinasinya terdapat pada model CV dengan dua titik knot dengan nilai 2 R sebesar 96% dan titik knot minimum yaitu 2.301 × 10−5.
====================================================================================================================================
Nonparametric regression modeling is widely used nowadays because it does not require assumptions to be fulfilled. Truncated spline regression modeling is a regression with a nonparametric approach, truncated spline modeling can model data with changes in behavior patterns at different intervals. In truncated spline regression, there are knot points that will find their own estimated data by adjusting the pattern of moving data. The optimal knot point selection has several methods such as Cross Validation (CV), Generalized Cross Validation (GCV), and Unbiased Risk (UBR). Comparison between those methods for selecting the optimal knot point has been widely studied but is limited to cross section data. The weakness of cross section data is that it can only model on one subject and cannot provide time series pattern. Therefore, longitudinal data is mostly used to overcome these weaknesses. In its implementation, it is carried out on the data on the unemployment rate (TPT) with the factors that influence it, namely the GRDP Value, Minimum Wage, Human Development Index, Labor Force Participation Rate, and Total Population. The result of this research is the formulation of the CV, GCV and UBR methods which are carried out on longitudinal data. In its application to the 2012-2021 TPT data in the province of Central Java, the results show that the best model by looking at the minimum knot points and the coefficient of determination is found in the CV model with two knot points with a value of 96% and a minimum knot point of 2.301×10−5.

Item Type: Thesis (Masters)
Additional Information: RTSt 519.536 Pra p-1 2022
Uncontrolled Keywords: Data Longitudinal, Jawa Tengah, Regresi Spline Truncated, Tingkat Pengangguran Terbuka, Titik Knot Optimal, Central Java, Knot Point Optimum, Longitudinal Data, Truncated Spline Regression, Unemployment Rat
Subjects: Q Science > QA Mathematics > QA278.2 Regression Analysis. Logistic regression
Divisions: Faculty of Science and Data Analytics (SCIENTICS) > Statistics > 49101-(S2) Master Thesis
Depositing User: Mr. Marsudiyana -
Date Deposited: 29 Apr 2026 08:50
Last Modified: 29 Apr 2026 08:50
URI: http://repository.its.ac.id/id/eprint/132939

Actions (login required)

View Item View Item