Prediksi Gaji Pemain Bola Berdasarkan Statistiknya Menggunakan Algoritma Machine Learning Random Forest

Irkham Ramadhani

Sari


Penelitian ini bertujuan untuk memprediksi gaji pemain sepak bola berdasarkan statistik kemampuan dan rekam jejak mereka, guna mengatasi disparitas gaji yang signifikan di industri ini. Pendekatan data mining digunakan dengan algoritma Random Forest Regresi sebagai metode utama, dipilih karena kemampuannya dalam menangani kompleksitas data dan ketahanannya terhadap outlier besar. Dataset sekunder dari Kaggle yang mencakup 17.954 baris dan 51 kolom data pemain sepak bola diproses melalui tahapan penanganan nilai kosong, seleksi fitur, dan penentuan label (wage_euro). Untuk mengatasi masalah outlier ekstrem dan distribusi data gaji yang miring, transformasi logaritmik diterapkan pada variabel target (wage_euro). Model dilatih menggunakan 70% data training dan dievaluasi dengan 30% data testing menggunakan perangkat lunak RapidMiner. Hasil evaluasi model ML didapatkan performa yang lebih baik setelah penerapan transformasi logaritmik. Model mencapai Relative Error (MAPE) sebesar 6.94% +/- 5.45%, mengindikasikan bahwa prediksi gaji rata-rata meleset kurang dari 7% dari nilai aktual. Selain itu, Root Mean Squared Error (RMSE) 0.310 dan Absolute Error (MAE) 0.246 +/- 0.189  (dalam skala logaritmik) menunjukkan akurasi dan konsistensi yang tinggi. Performa superior ini dicapai karena Random Forest efektif menangani kompleksitas data, sementara transformasi logaritmik menstabilkan skala gaji. Model yang dikembangkan mampu memberikan estimasi gaji yang realistis dan andal, sejalan dengan tujuan penelitian untuk mendukung alokasi biaya yang efisien dan menghindari prediksi gaji yang terlalu rendah untuk sebagian besar pemain.

Kata kunci— Prediksi Gaji, Pemain Sepak Bola, Random Forest Regresi, Transformasi Logaritmik, Data Mining, RapidMiner.

Teks Lengkap:

PDF

Referensi


Y. M. Sawitri, “5 Pemain Top Ini Gajinya Terlalu Rendah! Bayangkan Bayaran Scott McTominay Kalah Jauh dibanding Phil Jones,” bola.com. Accessed: Jul. 28, 2025. [Online]. Available: https://www.bola.com/dunia/read/4635125/5-pemain-top-ini-gajinya-terlalu-rendah-bayangkan-bayaran-scott-mctominay-kalah-jauh-dibanding-phil-jones

O. Maliki, H. Hadi, and I. F. Royana, “Analisis Kondisi Fisik Pemain Sepakbola Klub PERSEPU UPGRIS Tahun 2016,” Jendela Olahraga, vol. 2, no. 2, pp. 1–8, 2017.

D. Wardhani et al., Pengantar Data Mining, vol. 6, no. 3. 2023.

H. Tantyoko, D. K. Sari, and A. R. Wijaya, “Prediksi Potensial Gempa Bumi Indonesia Menggunakan Metode Random Forest Dan Feature Selection,” IDEALIS Indones. J. Inf. Syst., vol. 6, no. 2, pp. 83–89, 2023, doi: 10.36080/idealis.v6i2.3036.

F. Indra Kusuma Budiyanto, I. Hermadi, and M. K. D. Hardhienata, “Prediksi Performa Akademik Mahasiswa untuk Kelulusan Predikat Cum Laude dengan Pendekatan Machine Learning,” J. Ilmu Komput. dan Agri-Informatika, vol. 11, no. 1, pp. 39–49, 2024, doi: 10.29244/jika.11.1.39-49.

H. P. K. Negara, E. Santoso, and H. Nurwasito, “Sistem Pendukung Keputusan Menentukan Transfer Pemain Sepak Bola Menggunakan Metode AHP ( Analytical Hierarchy Process ),” J. Pengemb. Teknol. Inf. dan Ilmu Komput. Univ. Brawijaya, vol. 2, no. 7, pp. 2670–2678, 2018.

C. E. Murwaningtyas et al., “Analisis Pengaruh Media Sosial terhadap Produktivitas Akademik Mahasiswa menggunakan Metode Decision Tree dan Random Forest,” J. Inform. dan Rekayasa Perangkat Lunak, vol. 6, no. 2, pp. 499–509, 2024.

E. Fitri, “Analisis Perbandingan Metode Regresi Linier, Random Forest Regression dan Gradient Boosted Trees Regression Method untuk Prediksi Harga Rumah,” J. Appl. Comput. Sci. Technol., vol. 4, no. 1, pp. 58–64, 2023, doi: 10.52158/jacost.v4i1.491.

H. Rizqifaluthi and M. A. Yaqin, “Process Mining Akademik Sekolah menggunakan RapidMiner,” Matics, vol. 10, no. 2, p. 47, 2019, doi: 10.18860/mat.v10i2.5158.

T. Purwa, “Perbandingan Metode Regresi Logistik dan Random Forest untuk Klasifikasi Data Imbalanced (Studi Kasus: Klasifikasi Rumah Tangga Miskin di Kabupaten Karangasem, Bali Tahun 2017),” J. Mat. Stat. dan Komputasi, vol. 16, no. 1, p. 58, 2019, doi: 10.20956/jmsk.v16i1.6494.

Trivusi, “Perbedaan MAE, MSE, RMSE, dan MAPE pada Data Science,” trivusi.web.id. Accessed: Jul. 28, 2025. [Online]. Available: https://www.trivusi.web.id/2023/03/perbedaan-mae-mse-rmse-dan-mape.html

K. Benoit, “Linear Regression Models with Logarithmic Transformations,” London Sch. Econ., pp. 1–8, 2011, [Online]. Available: http://www.kenbenoit.net/courses/ME104/logmodels2.pdf


Refbacks

  • Saat ini tidak ada refbacks.



EJECTS: Jurnal Computer, Technology, and Informations System

Gedung Fakultas Ilmu Komputer, Universitas Darwan Ali, JL. Batu Berlian, No. 10, Sampit, Kabupaten Kotawaringin Timur, Provinsi Kalimantan Tengah, 74322

Creative Commons Licence
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

View My Stats