Implementasi Term Frequency - Inverse Document Frequency dan Cosine Similarity untuk Analisis Kemiripan Deskripsi Produk Halal
DOI:
https://doi.org/10.36982/jseci.v3i01.5421Keywords:
Cosine Similarity, ekstraksi fitur, produk halal, produk haram, TF-IDFAbstract
Di era digital saat ini, kejelasan informasi produk telah menjadi aspek penting untuk mendukung keputusan konsumen dalam proses pembelian. Penelitian ini difokuskan pada implementasi ekstraksi fitur dari deskripsi produk menggunakan metode TF-IDF (Term Frequency - Inverse Document Frequency) dan Cosine Similarity untuk memprediksi deskripsi produk yang membingungkan. Metodologi penelitian ini meliputi beberapa tahap preprocessing, yang meliputi tokenizing, stopword removal, filtering, penghapusan data null dan data NaN, serta ekstraksi fitur teks menggunakan metode TF-IDF dan Cosine Similarity. Hasil evaluasi menunjukkan bahwa sistem berhasil mengenali produk halal dengan nilai precision sebesar 96%, recall sebesar 98%, dan F1-score sebesar 97%, yang mengindikasikan bahwa adanya keseimbangan yang baik antara precision dan recall. Untuk produk haram mencapai precision sebesar 98%, recall sebesar 95%, dan F1-score sebesar 97%. Secara keseluruhan, sistem berhasil mendapatkan nilai akurasi sebesar 97%. Hasil evaluasi menunjukkan bahwa model lebih baik dalam mengenali produk halal, dengan hasil recall sebesar 98%, sementara hasil recall produk haram sebesar 95%. Hal ini mengindikasikan bahwa metode yang digunakan sangat efektif dalam memprediksi kejelasan deskripsi produk. Kesimpulan dari penelitian ini menegaskan bahwa kombinasi TF-IDF dan Cosine Similarity efektif dalam mengidentifikasi ambiguitas deskripsi produk, sehingga dapat meningkatkan transparansi informasi bagi konsumen.
