Jurnal Teknologi Informasi dan Pendidikan
ISSN 2086-4981

KLASIFIKASI DATA KARAKTERISTIK MAHASISWA MENGGUNAKAN ALGORITMA C4.5 DAN CART (STUDI KASUS EDUCATIONAL DATA MINING)

Indri Rahmayuni
INTISARI

Dalam beberapa tahun terakhir, penggunaan data mining di dunia pendidikan yang dikenal sebagai educational data mining (EDM) semakin berkembang. Namun sebagian besar penggunaan itu dilakukan pada data yang berasal dari pendidikan berbasis web, komputer, dan e-learning. Padahal sebagian besar institusi pendidikan, terutama di negara-negara berkembang masih menggunakan sistem kelas tradisional. Data yang didapat dari kelas tradisional ini belum dieksploitasi dengan baik untuk memberikan dukungan dan bimbingan bagi siswa demi meningkatkan kualitas pendidikan.

Program studi Teknik Komputer merupakan salah satu program studi favorit di Politeknik Negeri Padang. Tahun pertama perkuliahan terutama semester pertama merupakan masa yang krusial bagi mahasiswa baru prodi Teknik Komputer. Persentase ketidaklulusan maupun lulus percobaan pada semester pertama lebih tinggi dari semester-semester berikutnya. Proses pendidikan di program studi Teknik Komputer didukung oleh dua jenis data, yaitu data karakteristik mahasiswa dan data hasil studi (nilai) mahasiswa tiap semesternya. Penggunaan data mining terhadap data karakteristik diharapkan dapat memberikan prediksi awal prestasi akademik mahasiswa pada semester pertama.

Pada penelitian ini, data mining diterapkan menggunakan model proses CRISP-DM yang menyediakan proses standar penggunaan data mining pada berbagai bidang. Metode pohon keputusan (algoritma C4.5 dan CART) digunakan dalam klasifikasi karena hasil metode ini mudah dipahami dan diinterpretasikan. Jenis sekolah, pilihan, jenis kelamin, rata-rata nilai STTB, dan UAN merupakan prediktor utama prestasi akademik mahasiswa.

Kata Kunci :
educational data mining, klasifikasi, CART, C4.5


ABSTRACT

In recent years, the use of data mining in education, known as an educational data mining (EDM) is growing. But most use of it is done on data derived from web-based, computer, and e-learning education. Meanwhile most educational institutions, especially in developing countries still use the traditional class system. Data obtained from the traditional classroom has not been exploited well to give support and guidance for students in order to improve the quality of education.

Computer Engineering study program is one of the favorite at the Padang State Polytechnic. The first year class, especially the first semester is a crucial period for Computer Engineering’s new students. The percentage of failure and conditional pass in the first semester was higher than the next semester. The process of education in Computer Engineering is supported by two types of data, namely the student characteristics data and student grades data. The use of data mining to the data characteristics are expected to provide early prediction of academic achievement of students in the first semester.

In this research, data mining is applied using CRISP-DM process model that provides a standard process of implementation of data mining in various fields. Decision tree method (C4.5 and CART algorithms) is used in the classification because it is easily understood and interpreted. Type of school, choice, and gender is a major predictor of student academic achievement.


Keyword :
educational data mining, classification, CART, C4.5

Download file : 9-Vol7No1Mar2014-IndriRahmayuni.pdf