Pemodelan Regresi Kuantil Tersensor (Studi Kasus Pengeluaran Rumah Tangga Untuk Konsumsi Rokok)

Cintiani, - (2017) Pemodelan Regresi Kuantil Tersensor (Studi Kasus Pengeluaran Rumah Tangga Untuk Konsumsi Rokok). Masters thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 1315201006-Master-Theses.pdf]
Preview
Text
1315201006-Master-Theses.pdf - Published Version

Download (2MB) | Preview

Abstract

Data tersensor adalah data yang memuat nilai nol pada sebagian observasinya sedangkan sebagian nilai lainnya memiliki nilai tertentu yang bervariasi. Dalam analisis regresi seringkali terjadi pelanggaran normalitas pada saat data mengandung pencilan yang menyebab kan bentuk sebaran data tidak lagi simetrik. Akibatnya untuk metode kuadrat terkecil kurang tepat untuk melakukan analisis data yang tidak simetris, maka berkembanglah metode regresi median. Metode regresi median dilakukan dengan pendekatan Least Absolute Deviation (LAD) yang dikembangkan dengan mengganti rata-rata (mean) pada OLS menjadi median. Regresi kuantil tersensor digunakan pada kondisi terdapat data tersensor dan data yang memilki sebaran data yang tidak simetrik. Estimator model regresi kuantil tersensor bisa diperoleh menggunakan solusi minimasi metode pemrograman linear dengan penggunaan tiga tahap algoritma. Tahapan dalam algoritma ini adalah dengan cara pemisahan dari probabilitas tersensor dan melakukan dua kali estimasi menggunakan regresi kuantil. Hasil dari estimasi pertama adalah mendapatkan sub sampel yang sesuai, sedangkan hasil dari estimasi yang kedua adalah mendapatkan estimasi yang efisien.
Dari hasil analisis yang digunakan pada data pengeluaran rumah tangga untuk konsumsi rokok diperoleh informasi bahwa pengeluaran rumah tangga untuk konsumsi rokok bervariasi antar kuantil, hal ini menunjukkan bahwa penggunaan model regresi kuantil tersensor sudah tepat digunakan dalam pemodelan data tersebut. Variabel yang memiliki pengaruh yang besar pada tingginya pengeluaran konsumsi rokok baik di wilayah gabungan (perkotaan dan pedesaan) adalah pendapatan, tingkat pendidikan kepala rumah tangga, jumlah anggota rumah tangga, rata-rata pengeluaran per kapita, dan jenis kelamin kepala rumah tangga. Sedangkan variabel yang memberikan efek yang semakin kecil seiring kenaikan pengeluaran konsumsi rokok adalah umur, sektor pekerjaan, dan wilayah tempat tinggal. Selain itu dari hasil simulasi diketahui bahwa regresi kuantil tersensor memiliki nilai RMSE yang cenderung lebih kecil dibandingkan dengan regresi kuantil.

=================================================================

Censored data is data that contains zero values in some observations while some other value has a specific value that varies. In regression analysis is often a violation of normality when the data contains outliers that caused a form of data distribution is no longer symmetric. As a result of the least squares method is less appropriate to perform data analysis that is not symmetrical, then developed median regression method. Median regression methods to do with the pproach Least Absolute Deviation (LAD) that developed by replacing the average (mean) in the OLS into the median. Censored quantile regression is used on the condition the data are censored and have symmetric distribution. Estimator censored quantile regression model can be obtained minimization solution using linear programming methods with the use of a three-stage algorithm. Stages in the algorithm is by means of separation of probability censored and did two times estimated using quantile regression. Results from the first estimate is getting a sub-sample is appropriate, while the results from the second estimate is obtained estimates that efficient.
From the results of data analysis used in household expenditure on cigarettes consumption was obtained that household expenditure on cigarettes consumption varies between quintile, this suggests that the use of censored quantile regression is appropriate used in model. Variables that had a great influence on the high cigarette consumption expenditure both in the urban and rural are income, education level of the head of household, number of household members, average expenditure per capita, and gender of household head. While the variables that give effect gets smaller as the increase in cigarette consumption expenditures are age, employment sector, and region of residence. In addition, from the simulation result that the censored quantile regression has RMSE values that tend to be smaller than the quantile regression.

Item Type: Thesis (Masters)
Uncontrolled Keywords: Konsumsi rokok; Regresi kuantil tersensor; Tiga tahap algoritma; Censored Quantil Regression; Cigarettes Expenditure; Least Absolute Deviation; Three-stage algorithm
Subjects: Q Science > QA Mathematics > QA278.2 Regression Analysis. Logistic regression
Divisions: Faculty of Mathematics and Science > Statistics > 49101-(S2) Master Thesis
Depositing User: - CINTIANI
Date Deposited: 09 Mar 2017 03:04
Last Modified: 06 Mar 2019 06:42
URI: http://repository.its.ac.id/id/eprint/3114

Actions (login required)

View Item View Item