Membangun Model Prediksi Yang Robust: Penanganan Feature Leakage dalam Analisis Dampak Media Sosial Terhadap Prestasi

Muhammad Riansyahputra

Sari


Pengembangan dan evaluasi sebuah model Data Mining yang andal dilakukan untuk memprediksi dampak penggunaan media sosial terhadap prestasi akademik siswa. Proses analisisnya diawali dengan identifikasi dan penanganan masalah feature leakage, di mana fitur-fitur dengan hubungan deterministik (Addicted_Score dan Mental_Health_Score) dihilangkan demi membangun model yang realistis dan dapat digeneralisasi. Tiga algoritma klasifikasi, yaitu Random Forest, Decision Tree, dan k-NN, kemudian dievaluasi kinerjanya menggunakan metode Cross Validation 10-folds untuk memastikan keandalan hasil. Setelah dilakukan penyesuaian, model Random Forest menunjukkan kinerja terbaik dengan akurasi 99,86% dan F1-Score 99,85%. Hasil ini membuktikan bahwa pola prediktif yang kuat masih dapat ditemukan dari variabel perilaku yang tersisa, seperti durasi penggunaan dan jam tidur. Sebuah model prediktif yang andal pada akhirnya berhasil dibangun, sekaligus menyoroti pentingnya analisis data yang kritis untuk aplikasi dunia nyata.

Kata Kunci Data Mining, Pencapaian Akademik, Random Forest, Cross Validation, Kebocoran Fitur.

Teks Lengkap:

PDF

Referensi


S. Abdulsalim et al., “Evaluation of Social Media Addiction and Its Relationship with Anxiety and Academic Performance Among Medical and Non-Medical Students: A Cross-Sectional Study from Saudi Arabia,” Healthc., vol. 13, no. 3, 2025, doi: 10.3390/healthcare13030295.

A. Mufidah, U. Rohman, and S. Ismail, “Pengaruh Intensitas Penggunaan Media Sosial Terhadap Kesehatan Mental Mahasiswa UIN Sunan Gunung Djati Bandung,” J. Psikol. Insight, vol. 9, no. 1, pp. 45–56, 2025.

I. H. Utami, N. A. Shifa, and N. Rukiah, “Durasi Penggunaan Media Sosial dengan Kualitas Tidur dan Kestabilan Emosi pada Mahasiswa Keperawatan Tahun 2023,” Vitalitas Medis J. Kesehat. dan Kedokt., vol. 1, no. 2, pp. 81–94, 2024, [Online]. Available: https://journal.lpkd.or.id/index.php/ViMed/article/view/140

S. Alturki, N. Alturki, and H. Stuckenschmidt, “Using Educational Data Mining To Predict Students’ Academic Performance For Applying Early Interventions,” J. Inf. Technol. Educ. Innov. Pract., vol. 20, pp. 121–137, 2021, doi: 10.28945/4835.

S. R. Cholil, T. Handayani, R. Prathivi, and T. Ardianita, “Implementasi Algoritma Klasifikasi K-Nearest Neighbor (KNN) Untuk Klasifikasi Seleksi Penerima Beasiswa,” IJCIT (Indonesian J. Comput. Inf. Technol., vol. 6, no. 2, pp. 118–127, 2021, doi: 10.31294/ijcit.v6i2.10438.

R. A. Mrg and M. S. Hasibuan, “Best Student Classification using Ensemble Random Forest Method,” Sistemasi, vol. 13, no. 3, p. 1188, 2024, doi: 10.32520/stmsi.v13i3.4101.

A. Ramadhan, B. Susetyo, and Indahwati, “Penerapan Metode Klasifikasi Random Forest Dalam Mengidentifikasi Faktor Penting Penilaian Mutu Pendidikan,” J. Pendidik. dan Kebud., vol. 4, no. 2, pp. 169–182, 2019, doi: 10.24832/jpnk.v4i2.1327.

M. Adnan et al., “Predicting at-Risk Students at Different Percentages of Course Length for Early Intervention Using Machine Learning Models,” IEEE Access, vol. 9, pp. 7519–7539, 2021, doi: 10.1109/ACCESS.2021.3049446.

C. Chaka, “Educational data mining, student academic performance prediction, prediction methods, algorithms and tools: an overview of reviews,” J. E-Learning Knowl. Soc., vol. 18, no. 2, pp. 58–69, 2022, doi: 10.20368/1971-8829/1135578.

S. Sperandei, “Understanding logistic regression analysis,” Biochem. Medica, vol. 24, no. 1, pp. 12–18, 2014, doi: 10.11613/BM.2014.003.

R. Dong, D. Yuan, X. Wei, J. Cai, Z. Ai, and S. Zhou, “Exploring the relationship between social media dependence and internet addiction among college students from a bibliometric perspective,” Front. Psychol., vol. 16, no. March, pp. 1–20, 2025, doi: 10.3389/fpsyg.2025.1463671.

T. Margareth, “Hubungan penggunaan media sosial dengan kualitas tidur pada remaja di smk negeri 2 binjai tahun 2023,” J. Keperawatan Sisthana, vol. 8, no. 2, pp. 47–60, 2023, doi: 10.55606/sisthana.v8i2.562.

D. Olivia, “Penerapan Algoritma K-Nearest Neighbor (KNN) Untuk Ketepatan Waktu Lulus Mahasiswa,” pp. i–57, 2024.

J. O. Esieboma, “University Students ’ Mental Health in the Age of Social Media : A Sociological Perspective,” vol. 8, no. 5, pp. 73–82, 2024, doi: 10.56201/ijmepr.v8.no5.2024.pg73.82.

Y. Tampil, H. Komaliq, and Y. Langi, “Analisis Regresi Logistik Untuk Menentukan Faktor-Faktor Yang Mempengaruhi Indeks Prestasi Kumulatif (IPK) Mahasiswa FMIPA Universitas Sam Ratulangi Manado,” d’CARTESIAN, vol. 6, no. 2, p. 56, 2017, doi: 10.35799/dc.6.2.2017.17023.

E. Yildirim Demirdöğen et al., “Social media addiction, escapism and coping strategies are associated with the problematic internet use of adolescents in Türkiye: a multi-center study,” Front. Psychiatry, vol. 15, no. February, pp. 1–10, 2024, doi: 10.3389/fpsyt.2024.1355759.

N. Nurmalitasari and E. Purwanto, “Prediksi Performa Mahasiswa Menggunakan Model Regresi Logistik,” J. Deriv. J. Mat. dan Pendidik. Mat., vol. 9, no. 2, pp. 145–152, 2022, doi: 10.31316/jderivat.v9i2.2639.


Refbacks

  • Saat ini tidak ada refbacks.



EJECTS: Jurnal Computer, Technology, and Informations System

Gedung Fakultas Ilmu Komputer, Universitas Darwan Ali, JL. Batu Berlian, No. 10, Sampit, Kabupaten Kotawaringin Timur, Provinsi Kalimantan Tengah, 74322

Creative Commons Licence
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

View My Stats