Identifikasi Bahasa Artikel Publikasi Ilmiah Menggunakan Jaringan Syaraf Tiruan Berbasis Unigram
Abstract
Bahasa merupakan alat komunikasi untuk bisa saling berhubungan satu sama lain. Dengan bahasa manusia dapat membuat sebuah karya, salah satunya dalam bentuk tulisan. Tulisan yang dibuat berupa penelitian yang dimuat dalam bahasa publikasi. Bahasa publikasi dibedakan menjadi dua macam diantaranya adalah bahasa publikasi nasional dan internasional. Publikasi nasional yaitu publikasi yang dibuat oleh penulis berdasarkan asal negara pembuat. Publikasi internasional adalah publikasi yang dibuat penulis dengan menggunakan bahasa yang banyak diakui oleh banyak negara. Dan ditulis dengan menggunakan bahasa resmi perserikatan bangsa-bangsa yaitu Arab, Inggris, Perancis, Rusia, Spanyol, dan Tiongkok. Oleh karena itu pentingnya sebuah dokumen untuk mengklasifikasikan kedalam bahasa publikasi nasional atau internasional.Untuk itu diperlukan sebuah sistem yang dapat membedakan bahasa. Salah satunya dengan membuat sebuah sistem Identifikasi bahasa publikasi jaringan syaraf tiruan berbasis unigram. sistem tersebut mampu membedakan bahasa penulisan. Bahasa penulisan akan di ekstract dengan menggunakan unigram, kemudian diterapkan metode jaringan syaraf tiruan untuk mengambil sebuah keputusan. Jaringan syaraf tiruan merupakan salah satu metode kecerdasan buatan. Prosesnya terdiri dari preprocessing, training dan testing dan evaluasi hasil. Sehingga hasilnya, sistem akan mampu mengenali bahasa penulisan tersebut. Dokumen berbahasa indonesia akan mengahasilkan angka diatas sama dengan 0.5 dan dokumen berbahasa inggris menghasilkan angka dibawah 0.5. Hasil evaluasi precision bahasa indonesia 98.4% dan bahasa inggris 98%. Untuk recall bahasa indonesia 98% dan bahasa inggris 98.4%. Â
Full Text:
PDFReferences
A. Sukma, B. P. Santoso, D. Ramadhan, N. M. A. K. Wiraswari, and T. R. Sari, “Klasifikasi Dokumen Bahasa Jawa Menggunakan Metode N-Gram,†pp. 1–8, 2006.
A. Hamzah, “Deteksi Bahasa Untuk Dokumen Teks Berbahasa Indonesia,†Semin. Nas. Inform., vol. 1, no. 1, Jul. 2015.
T. W. et al. Esa Prakasa, Edi Kurniawan, Purnomo Husnul Khotimah, “Klasifikasi Bahasa Dokumen Dengan Menggunakan Jaringan Saraf Tiruan,†Pros. Konf. Nas. Teknol. Inf. Komun. untuk Indones., pp. 477–481, 2006.
S. Kusumaningtyas and R. A. Asmara, “Identifikasi Kematangan Buah Tomat Berdasarkan Warna Menggunakan Metode Jaringan Syaraf Tiruan (Jst),†J. Inform. Polinema, vol. 2, no. 2, pp. 72–75, 2016.
Suyanto, Artificial Intelligence, Revisi ked. yogyakarta: Informatika Bandung, 2014.
S. et al. Nadya Permadi, “Stemming Words Dengan N-Gram Dan Lexeme Based Untuk Teks Berbahasa Korea,†e-Proceeding Eng., vol. 2, 2015.
Amburika, “Vector Space Model,†Pros. SNST ke-7 Tahun 2016, pp. 10–27, 2016.
F. Amin, “Sistem Temu Kembali Informasi dengan Metode Vector Space Model,†J. Sist. Inf. Bisnis, vol. 2, no. 2, pp. 78–83, 2016.
DOI: http://dx.doi.org/10.30659/ei.4.1.11-20
Refbacks
- There are currently no refbacks.