Fahrudin, Tora (2019) Deteksi Dini Kegagalan Akademik Menggunakan Data Akademik Dan Media Sosial. Doctoral thesis, Institut Teknologi Sepuluh Nopember.
Text
05111560010002-Disertation.pdf - Accepted Version Restricted to Repository staff only until 1 October 2023. Download (7MB) | Request a copy |
Abstract
Sistem informasi akademik sebuah perguruan tinggi umumnya sudah memiliki fasilitas bagi dosen wali untuk secara aktif memantau proses perkembangan akademik anak walinya. Tetapi pada kasus dosen wali ataupun orang tua yang tidak aktif memonitor mahasiswanya, mahasiswa yang mempunyai permasalahan akademik berpeluang untuk drop out. Oleh karena itu, pada penelitian ini dibangun model deteksi dini mahasiswa yang memiliki kecenderungan tidak berhasil menyelesaikan beban matakuliah pada tingkat 1 dalam waktu normal.
Deteksi dini dilakukan dengan menggali pola data mahasiswa bermasalah menggunakan tiga sumber data yaitu: demografis, akademik dan media sosial. Dari tiga sumber data tersebut, terdapat 3 permasalahan utama yang dapat dijadikan kontribusi utama dari penelitian ini. Pertama, bagaimana menghasilkan model deteksi dini kegagalan akademik. Kedua, bagaimana menghasilkan perbaikan algoritma untuk menangani kondisi imbalance pada data mahasiswa baik pada data akademik yang didominasi atribut kuantitatif serta data demografis yang didominasi atribut kualitatif. Ketiga, bagaimana menghasilkan perbaikan metoda BOW (Bag Of Word) multilabel permasalahan mahasiswa dari data media sosial berbahasa indonesia dengan penambahan model semantik.
Deteksi dini yang diusulkan terdiri dari dua model utama. Pertama, pemodelan deteksi awal dengan menggunakan data demografis dan data waktu aktivasi akun. Kedua, pemodelan deteksi periodik dengan menggunakan data akademik, media sosial dan pertemanan yang terbagi menjadi deteksi bulanan, deteksi tengah semester dan deteksi akhir semester. Pemodelan kedua ini disebut periodik dikarenakan model deteksi tersebut dirancang dalam periode bulanan yang diulang dari bulan pertama s/d bulan kelima perkuliahan setiap semester dari semester 1 s/d semester 4 (batas akhir evaluasi tingkat 1).
Beberapa skenario telah dilakukan untuk mendapatkan model terbaik dalam bentuk Recall, Precision dan F-Measure kelas minor (kelas positif (+)). Hasil penelitian menunjukkan bahwa akurasi maksimum pada model demografis dicapai oleh metoda usulan dengan nilai 92.34% untuk Recall dan 40.57% untuk F-Measure. Akurasi maksimum pada model periodik bervariasi dari 91-99.65% untuk Recall, 60.42-92.23% untuk F-Measure. Metoda usulan Randshuff memberikan perbaikan akurasi sebesar 15.42% untuk Recall dibanding metoda SMOTE dan variannya. AWH-SMOTE memberikan performansi terbaik pada bulan September dengan nilai Recall 95.4%. Ina-BWR mampu memberikan perbaikan akurasi terhadap metoda BoW yang asli sebesar 20.86%, 48.36%, 35.80% dan 42.22% parameter Accuracy, Precision, Recall and F-Measure secara berturut turut pada example based evaluation. Dari hasil tersebut, dapat disimpulkan bahwa usulan perbaikan algoritma SMOTE dan Ina-BWR dalam menangani permasalahan kondisi imbalance pada data mahasiswa serta menangani kelemahan metoda BOW pada multilabel keluhan tepat digunakan dalam proses deteksi dini kegagalan akademik mahasiswa.
================================================================================================
Academic information system of a University generally has facilities for advisor to monitor academic condition of their students. But in case where advisors or parents do not monitor them actively causing students to have probability to fail. Therefore, in this research, we build early detection of academic failure for students who failed to pass the first year evaluation.
We propose early detection model using data mining techniques on three student data sources i.e. demographics, academic, and social media. We define three main problems for our contribution. First, how to build early detection of academic failure model. Second, how to improve algorithm to handle imbalance problems in student data for both qualitative (demographics) and quantitative (academic). Third, how to improve BOW (Bag Of Word) method for multilabel student problems from social media in Indonesian language by using semantic model.
We divide our early detection models into two kinds. First, early detection model is built by using demographics data and account activation period. Second, periodic detection is built by using academic, social media and friendship data. Periodic detection model divide into three models i.e monthly detection, mid semester detection and semester detection. This second model is known as periodic detection because this model is repeated monthly for each semester from first semester until fourth semester (the end of first year evaluation).
Scenarios have been conducted to get the best model based on Recall, Precision and F-Measure of minority class parameter (positive class (+)). The experiment results demonstrated maximum accuracy on early detection model is obtained by our proposed method at 92.34% for Recall and 40.57% for F-Measure. The maximum accuracy on periodic detection model varies from 91-99.65% for Recall and 60.42-92.23% for F-Measure. Our proposed method (Randshuff) gives improvement accuracy up to 15.42% compared to SMOTE and its variants. AWH-SMOTE gives best performance on September with 95.4% Recall value. Ina-BWR can improve accuracy of Bag of Word method up to 20.86%, 48.36%, 35.8% and 42.22% for Accuracy, Precision, Recall, and F-Measure respectively on example based evaluation. Based on these results, it can be concluded that the proposed methods for both a new SMOTE for handling imbalance problems on students data and Ina-BWR for handling weakness of BOW Method in student multi-label problems are appropriate to be used in early detection of academic failures.
Item Type: | Thesis (Doctoral) |
---|---|
Additional Information: | RTIf 005.74 Fah d-1 2019 |
Uncontrolled Keywords: | deteksi dini, kegagalan akademik, pemodelan deteksi awal, pemodelan deteksi periodik, multilabel, media sosial |
Subjects: | H Social Sciences > HD Industries. Land use. Labor > HD30.213 Management information systems. Dashboards. Enterprise resource planning. Q Science > Q Science (General) > Q337.5 Pattern recognition systems Q Science > QA Mathematics > QA76.9.D343 Data mining. Querying (Computer science) |
Divisions: | Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55001-(S3) PhD Thesis (Comp Science) |
Depositing User: | Tora Fahrudin |
Date Deposited: | 21 Sep 2021 06:46 |
Last Modified: | 21 Sep 2021 06:46 |
URI: | http://repository.its.ac.id/id/eprint/60396 |
Actions (login required)
View Item |