Analisis Perbandingan Algoritma Naive Bayes Classifier dan Support Vector Machine untuk Klasifikasi Berita Hoax pada Berita Online Indonesia

Masyarakat mampu mengkonsumsi tiap informasi yang tersebar di internet dengan cepat dan terkadang informasi yang beredar tidak selalu memberikan kebenaran yang sesuai dengan kenyataannya (hoax). Demi mendapatkan keuntungan dan mencapai tujuan pribadi, hoax seringkali sengaja dibuat dan dibagikan. In...

Full description

Saved in:
Bibliographic Details
Main Authors: Ramadhan Rakhmat Sani, Yunita Ayu Pratiwi, Sri Winarno, Erika Devi Udayanti, Farrikh Alzami
Format: Article
Language:English
Published: Universitas Diponegoro 2022-11-01
Series:Jurnal Masyarakat Informatika
Subjects:
Online Access:https://ejournal.undip.ac.id/index.php/jmasif/article/view/47983
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Masyarakat mampu mengkonsumsi tiap informasi yang tersebar di internet dengan cepat dan terkadang informasi yang beredar tidak selalu memberikan kebenaran yang sesuai dengan kenyataannya (hoax). Demi mendapatkan keuntungan dan mencapai tujuan pribadi, hoax seringkali sengaja dibuat dan dibagikan. Informasi yang didapatkan dari hoax tentunya dapat mempengaruhi masyarakat karena menimbulkan keraguan dan kebingungan terhadap informasi yang diterima Oleh karena itu, penelitian ini membahas tentang bagaimana mengklasifikasikan berita hoax berbahasa Indonesia mengenai isu kesehatan menggunakan TF-IDF serta algoritma Naïve Bayes Classifier dan Support Vector Machine dengan 4 model yang berbeda sehingga mampu memprediksi sebuah berita hoax atau valid. Pada penelitian ini dataset yang dikumpulkan sebanyak 287 diantaranya 200 valid dan 87 hoax. Hasil evaluasi model penelitian ini dengan menggunakan 4 model berbeda pada masing-masing algoritma, diperoleh nilai classification report terbesar untuk algoritma NBC pada model Complement Naïve Bayes dengan hasil precision 95.4%, recall 95.4%, f1-score 95.4% dan accuracy 93.1%. Sedangkan nilai classification report terbesar untuk algoritma SVM pada kernel Sigmoid dengan hasil precision 95.6%, recall 100%, f1-score 97.7% dan accuracy 96.5%. Sehingga dapat disimpulkan bahwa hasil performa rata-rata dari algoritma SVM memiliki kinerja yang lebih baik jika dibandingkan dengan algoritma NBC dalam melakukan klasifikasi berita hoax mengenai isu kesehatan.
ISSN:2086-4930
2777-0648