Prediksi Popularitas Foto pada Media Sosial Flickr via Analisis Regresi

Thalib, Muhammad Rizqi Fiqih (2024) Prediksi Popularitas Foto pada Media Sosial Flickr via Analisis Regresi. Other thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 05111940000219-Undergraduate_Thesis.pdf] Text
05111940000219-Undergraduate_Thesis.pdf - Accepted Version
Restricted to Repository staff only until 1 July 2026.

Download (3MB) | Request a copy

Abstract

Seiring dengan pesatnya perkembangan bidang digital seperti sosial media dengan menggunakan teknologi, pengguna dapat melakukan sebuah postingan dengan mengunggah hal yang mereka inginkan. Postingan dapat berupa foto, video, juga teks, dan dapat disaksikan oleh pengguna lainnya dalam jumlah besar di sosial media. Hal ini menyebabkan adanya faktor pengaruh popularitas terhadap postingan yang diunggah oleh pengguna. Prediksi popularitas merupakan hal yang bermanfaat bagi para pemangku kepentingan ataupun pihak organisasi tertentu untuk membuat rencana ke depannya dengan mudah, berdasarkan pengamatan data pada sebuah unggahan dan mengevaluasi seberapa banyak audiensi yang mengagumi produk atau layanan mereka. Oleh karena itu, penelitian ini dilakukan dengan tujuan memprediksi nilai tingkat popularitas sebuah postingan pada media sosial Flickr dengan menggunakan sebuah dataset (data perspektif) yang terdiri dari 11771 baris dan 14 kolom. Penelitian ini melakukan prediksi dengan menggunakan beberapa model machine learning dengan pendekatan metode regresi untuk menentukan nilai tingkat popularitas. Machine learning berbasis regresi yang digunakan pada penelitian ini adalah Catboost, Support Vector Regression (SVR), Random Forest, dan Artificial Neural Network (ANN) Multi-layer Perceptron (MLP). Dari hasil nilai prediksi tersebut dilakukan pengukuran uji kinerja dengan menggunakan evaluasi metrik Mean Square Error (MSE), Root Mean Square Error (RMSE), Mean Absolute Error (MAE), Spearman Rho, dan R-Squared. Pada penelitian ini didapatkan hasil terbaik yaitu penggunaan model machine learning Catboost terhadap skenario data yang dilakukan pengubahan fitur kategorikal menjadi numerikal (biner) tanpa adanya reduksi dimensionalitas. Berdasarkan evaluasi metrik, didapatkan hasil MSE 1,85; RMSE 1,36; MAE 0,87; R-squared sebesar 0,66; dan Spearman Rho 0,82. Pada hasil eksplorasi fitur menggunakan feature importance didapatkan fitur jumlah tag merupakan fitur yang paling berpengaruh pada sebagian besar model prediksi
=====================================================================================================================================
Along with the rapid development of digital fields such as social media using technology, users can post by uploading what they want. Posts can be in the form of photos, videos, as well as text, and can be viewed by large numbers of other users on social media. This causes a factor that influences the popularity of posts uploaded by users. Popularity predictions are useful for stakeholders or certain organizations to make future plans easily, based on observing data on an upload and evaluating how many audiences admire their product or service. Therefore, this research was carried out with the aim of predicting the popularity level of a post on Flickr social media using a dataset (perspective data) consisting of 11771 rows and 14 columns. This research makes predictions using several machine learning models with a regression method approach to determine the popularity level value. The regression-based machine learning used in this research is Catboost, Support Vector Regression (SVR), Random Forest, and Artificial Neural Network (ANN) Multi-layer Perceptron (MLP). From the results of the predicted values, performance tests were measured using the evaluation metrics Mean Square Error (MSE), Root Mean Square Error (RMSE), Mean Absolute Error (MAE), Spearman Rho, and R-Squared. In this research, the best results were obtained, namely the use of the Catboost machine learning model for data scenarios in which categorical features were converted to numerical (binary) without any dimensionality reduction. Based on metric evaluation, the MSE results were 1.85; RMSE 1.36; MAE 0.87; R-squared of 0.66; and Spearman Rho 0.82. From the results of feature exploration using feature importance, it was found that the number of tags feature was the most influential feature in most prediction models

Item Type: Thesis (Other)
Uncontrolled Keywords: Fitur, Flickr, Popularitas, Prediksi, Regresi; Feature, Flickr, Popularity, Prediction, Regression.
Subjects: H Social Sciences > HA Statistics > HA31.3 Regression. Correlation
T Technology > T Technology (General) > T57.5 Data Processing
Divisions: Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55201-(S1) Undergraduate Thesis
Depositing User: Muhammad Rizqi Fiqih Thalib
Date Deposited: 02 Feb 2024 06:40
Last Modified: 02 Feb 2024 06:40
URI: http://repository.its.ac.id/id/eprint/105959

Actions (login required)

View Item View Item