Pengembangan Model Klasifikasi Teks Berbasis CNN untuk Deteksi Wuku Kurantil

Dika Aurelya Aleandra Taroreh

Abstract


Penelitian ini bertujuan mengembangkan model klasifikasi teks berbasis Convolutional Neural Network (CNN) untuk mendeteksi keterkaitan kalimat dalam bahasa Jawa dengan Wuku Kurantil, bagian dari sistem kalender tradisional Pawukon yang terekam dalam naskah Primbon. Permasalahan utama yang diangkat adalah minimnya pemahaman generasi muda terhadap sistem penanggalan tradisional akibat keterbatasan akses dan format digitalisasi konten budaya lokal. Penelitian menggunakan pendekatan CDIO (Conceive, Design, Implement, Operate) untuk membangun sistem klasifikasi otomatis. Data diperoleh dari situs sastra.org, kemudian diproses melalui tahapan pembersihan data, normalisasi, dan penghapusan stopwords, diikuti vektorisasi menggunakan Word2Vec. Arsitektur CNN dirancang dengan parameter optimal dan dilatih menggunakan train-test split (80:20). Hasil evaluasi model menunjukkan akurasi sebesar 80%, dengan precision dan recall yang tinggi pada kelas mayoritas (bukan Wuku Kurantil), namun nihil pada kelas minoritas (Wuku Kurantil), mengindikasikan adanya ketimpangan kinerja akibat distribusi data yang tidak seimbang. Untuk mengatasi hal tersebut, direkomendasikan penerapan oversampling, class weighting, atau penggunaan algoritma yang lebih adaptif seperti Random Forest atau ensemble models. Meskipun demikian, model yang dikembangkan telah mampu menunjukkan potensi dalam digitalisasi budaya berbasis teks Jawa. Studi ini memberikan kontribusi terhadap pelestarian warisan budaya lokal melalui pemanfaatan teknologi NLP, serta membuka peluang pengembangan lebih lanjut di bidang digital humanities dan linguistik komputasional.

Keywords


NLP, CNN, Klasifikasi Teks, Wuku

Full Text:

PDF

References


Aisah, I. S., Irawan, B., & Suprapti, T. (2023). ALGORITMA SUPPORT VECTOR MACHINE (SVM) UNTUK ANALISIS SENTIMEN ULASAN APLIKASI AL QUR’AN DIGITAL. In Jurnal Mahasiswa Teknik Informatika (Vol. 7, Issue 6).

Buda, M., Maki, A., & Mazurowski, M. A. (2018). A systematic study of the class imbalance problem in convolutional neural networks. Neural Networks, 106, 249–259. https://doi.org/10.1016/j.neunet.2018.07.011

Dharma, E. M., Lumban Gaol, F., Leslie, H., Warnars, H. S., & Soewito, B. (2022). THE ACCURACY COMPARISON AMONG WORD2VEC, GLOVE, AND FASTTEXT TOWARDS CONVOLUTION NEURAL NETWORK (CNN) TEXT CLASSIFICATION. Journal of Theoretical and Applied Information Technology, 31(2). www.jatit.org

Fan, C., Chen, M., Wang, X., Wang, J., & Huang, B. (2021). A Review on Data Preprocessing Techniques Toward Efficient and Reliable Knowledge Discovery From Building Operational Data. In Frontiers in Energy Research (Vol. 9). Frontiers Media S.A. https://doi.org/10.3389/fenrg.2021.652801

Gori, T., Sunyoto, A., & Al Fatta, H. (2024). Preprocessing Data dan Klasifikasi untuk Prediksi Kinerja Akademik Siswa. Jurnal Teknologi Informasi Dan Ilmu Komputer, 11(1), 215–224. https://doi.org/10.25126/jtiik.20241118074

Intan Af, D., Febbi Handayani, S., Wijayatun Pratiwi, R., Teknik Informatika, J., Harapan Bersama, P., Mataram No, J., & Lor, P. (2021). Pengaruh Parameter Word2Vec terhadap Performa Deep Learning pada Klasifikasi Sentimen. 6(3).

Islam Riau, U., Kaharuddin Nasution, J., Marpoyan, P., Marpoyan Damai, K., & Pekanbaru, K. (2022). Standarisasi Kualitas Riset di Sekolah Dasar Zaka Hadikusuma Ramadan. Journal on Education, 05(02), 1932–1939.

Kurniadi, B. W., Prasetyo, H., Ahmad, G. L., Aditya Wibisono, B., & Sandya Prasvita, D. (2021). Analisis Perbandingan Algoritma SVM dan CNN untuk Klasifikasi Buah. In Seminar Nasional Mahasiswa Ilmu Komputer dan Aplikasinya (SENAMIKA) Jakarta-Indonesia.

Martantoh, E., & Yanih, N. (2022). Implementasi Metode Naïve Bayes Untuk Klasifikasi Karakteristik Kepribadiaan Siswa Di Sekolah MTS Darussa’adah Menggunakan PHP MySQL Implementation of Naive Bayes Method for Classification of Student’s Personality Characteristics at MTS Darussa’adah School Using PHP Mysql. In JTSI (Vol. 3, Issue 2).

Muludi, K., Naufal Humam, M., Shofiana, D. A., Syarif, A., Komputer, J. I., & Lampung, U. (2023). Perbandingan Kinerja CNN dan Naïve Bayes pada Analisis Sentimen Performa Manchester United di Twitter. In Journal Information Engineering and Educational Technology (Vol. 07).

Nurhopipah, A., & Hasanah, U. (2020). Dataset Splitting Techniques Comparison For Face Classification on CCTV Images. IJCCS (Indonesian Journal of Computing and Cybernetics Systems), 14(4), 341. https://doi.org/10.22146/ijccs.58092

Sidhartani, S., Sugihartono, R. A., & Suyanto, S. (2023). Ekspresi Budaya Jawa pada Figur Dewa dalam Ilustrasi Pawukon. Jurnal Desain, 11(1), 171. https://doi.org/10.30998/jd.v11i1.17376

Sumarna, A. D., & Riadi, S. (n.d.). Simposium Nasional Akuntansi Vokasi (SNAV) XII 14-17 Mei Tahun 2024 Politeknik Negeri Jember Project Based Learning CDIO: Sebuah Metode Integrated Learning Untuk Program Studi Akuntansi.

Wesley, R., & Gunawan, R. (2024). LITERATUR REVIEW: METODE DEEP LEARNING UNTUK ANALISIS TEKS. In Jurnal Mahasiswa Teknik Informatika (Vol. 8, Issue 5).

Widhiyasana, Y., Semiawan, T., Gibran, I., Mudzakir, A., & Noor, M. R. (2021). Penerapan Convolutional Long Short-Term Memory untuk Klasifikasi Teks Berita Bahasa Indonesia (Convolutional Long Short-Term Memory Implementation for Indonesian News Classification). In Jurnal Nasional Teknik Elektro dan Teknologi Informasi | (Vol. 10, Issue 4).




DOI: http://dx.doi.org/10.17977/um034v35i1p20-29

Refbacks

  • There are currently no refbacks.


Copyright (c) 2025 TEKNO: Jurnal Teknologi Elektro dan Kejuruan

Gedung B11, Lantai 2
Departemen Teknik Elektro dan Informatika, Fakultas Teknik
Universitas Negeri Malang
Jln. Semarang No.5 Malang, Jawa Timur

Creative Commons License TEKNO : Jurnal Teknologi Elektro dan Kejuruan licensed under a Creative Commons Attribution-ShareAlike 4.0 International License

View Tekno Stats