Estimator Regresi Nonparametrik Spline Truncated Multivariabel Untuk Data Kategori

Suriaslan, Afiqah Saffa (2025) Estimator Regresi Nonparametrik Spline Truncated Multivariabel Untuk Data Kategori. Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 6003231017-Master_Thesis.pdf] Text
6003231017-Master_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 April 2027.

Download (2MB) | Request a copy

Abstract

Pemodelan statistik merupakan analisis data yang bertujuan untuk memahami hubungan antara variabel dalam sebuah dataset. Salah satu metode yang sering digunakan dalam pemodelan statistik adalah analisis regresi nonparametrik. Penggunaan estimator nonparametrik, seperti Spline Truncated, memiliki keunggulan dalam menangani pola data yang berubah-ubah pada sub sub interval tertentu. Penelitian mengenai Spline Truncated telah banyak dikembangkan oleh para penelitian dengan data respon kuantitatif, namun terdapat kasus dimana responnya bersifat kategori. Akibatnya model regresi nonparametrik Spline Truncated belum mampi mengakomodasi kasus dimana varibel responnya kategori (biner). Oleh karena itu, diperlukan suatu metode yang mampu mengakomodasi hubungan variabel respon dan variabel prediktor yang memiliki pola berubah-ubah pada sub sub interval tertentu dimana responnya berupa data kategori. Penelitian ini bertujuan mendapatkan estimator regresi nonparametrik Spline Truncated untuk data kategori. Selanjutnya, penelitian ini juga akan mempertimbangkan pemilihan titik knot optimal yang akan memastikan bahwa model regresi nonparametrik yang dihasilkan memiliki performa yang baik. Selanjutnya, penelitian ini juga akan membuat algoritma program untuk pemodelan regresi nonparametrik Spline Truncated untuk data kategori. Selain itu, metode penelitian ini akan diimplementasikan terhadap data indeks kedalaman kemiskinan di Indonesia tahun 2023. Variabel respon data indeks kedalaman kemiskinan di Indonesia akan dibagi atas 2 kategori, yaitu 1 untuk indeks kedalaman kemiskinan tinggi dan 0 1 untuk indeks kedalaman kemiskinan rendah. Pada tahapan akhir, model regresi nonparametrik Spline Truncated akan dibandingkan dengan model regresi logisik biner sebagai evaluasi performa. Hasil yang diperoleh adalah bahwa model regresi nonparametrik Spline Truncated untuk data kategori lebih unggul dengan nilai deviance yaitu 26,767.
==================================================================================================================================
Statistical modeling is a data analysis that aims to understand the relationship between variables in a dataset. One method that is often used in statistical modeling is nonparametric regression analysis. The use of nonparametric estimators, such as Truncated Spline, has the advantage of handling changing data patterns at certain sub-intervals. Research on Truncated Spline has been developed by many researchers with quantitative response data, but there are cases where the response is categorical. As a result, the Spline Truncated nonparametric regression model has not been able to accommodate cases where the response variable is categorical (binary). Therefore, a method is needed that is able to accommodate the relationship between response variables and predictor variables that have changing patterns at certain sub-intervals where the response is categorical data. This study aims to obtain a Spline Truncated nonparametric regression estimator for categorical data. Furthermore, this study will also consider the selection of optimal knot points that will ensure that the resulting nonparametric regression model has good performance. Furthermore, this research will also create a program algorithm for Spline Truncated nonparametric regression modeling for categorical data. In addition, this research method will be implemented on the data of poverty depth index in Indonesia in 2023. The response variable of poverty depth index data in Indonesia will be divided into 2 categories, namely 1 for high poverty depth index and 0 1 for low poverty depth index. In the final stage, the Spline Truncated nonparametric regression model will be compared with the binary logistic regression model as a performance evaluation. The result obtained is that the Spline Truncated nonparametric regression model for categorical data is superior with a deviance value of 26,767.

Item Type: Thesis (Masters)
Uncontrolled Keywords: Poverty, Categorical Data, Nonparametrik, Spline Truncated, Kemiskinan, Data Kategori
Subjects: H Social Sciences > HA Statistics
H Social Sciences > HA Statistics > HA31.3 Regression. Correlation. Logistic regression analysis.
Divisions: Faculty of Science and Data Analytics (SCIENTICS) > Statistics > 49101-(S2) Master Thesis
Depositing User: Afiqah Saffa Suriaslan
Date Deposited: 26 Jan 2025 10:08
Last Modified: 26 Jan 2025 10:08
URI: http://repository.its.ac.id/id/eprint/116915

Actions (login required)

View Item View Item