Pratama, Achmad Sofyan (2022) Klasifikasi Berita Kesehatan Dari Situs Mainstream untuk Pembangunan Peta Kabar Berdasarkan Tingkat Keparahan Menggunakan Metode Random Forest. Other thesis, Institut Teknologi Sepuluh Nopember.
![]() |
Text
05111840000061-Undergraduate_Thesis.pdf Restricted to Repository staff only Download (2MB) | Request a copy |
Abstract
Indonesia adalah sebuah negara yang memiliki banyak pulau dan daerah terpencil. Fasilitas yang dijadikan penunjang kesehatan belum terbagi rata di beberapa daerah yang sulit untuk dijangkau. Penyuluhan atau penanggulangan penyakit dibutuhkan oleh pemerintah dan dinas kesehatan, sebelum terjadinya penyakit menyabar semakin luas atau memperbaiki pola sehat kepada penduduk daerah. Dikhawatrkan penambahan kasus dapat meningkatkan data kematian pada daerah tertentu. Terkait dengan proses scraping kesehatan ini, diharap dapat membantu mendapatkan informasi dari situs mainstream untuk pembangunan peta kabar yang menampilkan informasi Kesehatan yang ada di Indonesia. Proses scraping digunakan untuk pencarian 4W (What,Where,When, dan Who). Metode Query Expansion digunakan sebagai pencarian What Kesehatan (Penyakit). Kemudian Metode Named Entity Recognition digunakan untuk mencari Where, When, dan Who. Setelah itu dilakukan deteksi tingkat keparahan dengan metode POS tagging. Ada 3 jenis keparahan yaitu rendah, sedang, dan parah. Setelah didapatkan deteksi tingkat keparahan, dilanjutkan dengan menggunakan klasifikasi Random Forest untuk memprediksi tingkat keparahan. Akurasi dari klasifikasi keparahan menggunakan Random Forest didapatkan akurasi sebesar 99.5%. Hasil akhir Tugas akhir ini berupa dataset yang berisi informasi 4W dan tingkat keparahan kesehatan, yang nantinya dataset tersebut digunakan untuk pembuatan informasi petakabar kesehatan.
=================================================================================================================================
Indonesia is a country that has many islands and remote areas. Facilities that are used as health support are not evenly distributed in some areas that are difficult to reach. Counseling or disease management needed by the government and the health department before the occurrence of a widespread disease or improving healthy patterns to residents. It is feared that the addition of cases could increase the mortality data in certain areas. Related to this health scraping process, it is hoped that it can help obtain information from mainstream sites for the construction of news maps that display information on health in Indonesia. The scraping process is used to search 4W (What, Where, When, and Who). Query Expansion method is used as a search for What is Health (Illness). Named Entity Recognition Method is used to find Where, When, and Who. After that, the severity level was detected using the POS Tagging. There are 3 types of severity, namely low, moderate, and severe. After obtaining the severity level, it is continued by using Random Forest to predict the severity level. The accuracy of the severity classification using Random Forest is 99.5% accuracy. The result of this final project is a collection of data containing information on 4W and the severity of health, the next data set is used to produce information on health news reports.
Item Type: | Thesis (Other) |
---|---|
Uncontrolled Keywords: | Kesehatan, NER, Scraping, Pos Tagging, Query Expension, Random Forest. |
Subjects: | T Technology > T Technology (General) > T58.5 Information technology. IT--Auditing |
Divisions: | Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis |
Depositing User: | Mr. Marsudiyana - |
Date Deposited: | 13 Oct 2025 02:54 |
Last Modified: | 13 Oct 2025 02:54 |
URI: | http://repository.its.ac.id/id/eprint/128564 |
Actions (login required)
![]() |
View Item |