PERBANDINGAN FITUR STATISTIK DAN LINGUISTIK PADA ALGORITMA K-NEAREST NEIGHBORS (KNN) & NEURAL NETWORK DALAM PENGKLASIFIKASIAN SMS SPAM

Rizal, Muhammad Raihan Rizal (2024) PERBANDINGAN FITUR STATISTIK DAN LINGUISTIK PADA ALGORITMA K-NEAREST NEIGHBORS (KNN) & NEURAL NETWORK DALAM PENGKLASIFIKASIAN SMS SPAM. Sarjana thesis, Universitan Khairun.

[thumbnail of COVER.pdf] Text
COVER.pdf - Published Version

Download (152kB)
[thumbnail of ABSTRAK.pdf] Text
ABSTRAK.pdf - Published Version

Download (186kB)
[thumbnail of BAB I.pdf] Text
BAB I.pdf - Published Version

Download (162kB)
[thumbnail of DAFTAR PUSTAKA.pdf] Text
DAFTAR PUSTAKA.pdf - Published Version

Download (159kB)
[thumbnail of SKRIPSI_MUHAMMAD RAIHAN RIZAL_07352011006.pdf] Text
SKRIPSI_MUHAMMAD RAIHAN RIZAL_07352011006.pdf - Published Version

Download (8MB)

Abstract

SMS masih banyak digunakan, namun keberadaan SMS spam telah menjadi masalah serius. Menurut Laporan Truecaller Insights tahun 2020, Indonesia mencatatkan jumlah pesan spam tertinggi di Asia, dengan kontribusi besar dari sektor layanan keuangan. Penelitian ini bertujuan untuk membandingkan pengaruh fitur statistik dan linguistik dalam klasifikasi SMS spam, dengan menggunakan algoritma K-Nearest Neighbors (KNN) dan Neural Network (NN). Metodologi yang diterapkan meliputi tahapan identifikasi masalah, perencanaan, pemodelan, evaluasi model, implementasi model, dan pengujian. Dalam penelitian ini, data diproses dengan menggunakan fitur statistik (TF-IDF) dan fitur linguistik sebelum diterapkan pada model KNN dan NN. Kinerja model dievaluasi berdasarkan metrik precision, precision, F1-score, dan akurasi. Hasil penelitian menunjukkan bahwa model NN yang menggunakan fitur statistik memiliki performa dengan akurasi mencapai 98%, KNN dengan fitur statistik 95%, NN dengan fitur linguistik 85% dan KNN dengan fitur linguistik 82%. Secara keseluruhan, NN fitur statistik menunjukkan performa yang lebih baik dibandingkan KNN di semua jenis fitur yang diuji. Dari hasil evaluasi ini, dapat disimpulkan bahwa fitur statistik lebih efektif dibandingkan fitur linguistik dan metode NN lebih unggul dibandingkan dengan metode KNN. Kata Kunci: SMS spam, K-Nearest Neighbors, Neural Network, fitur statistik, fitur linguistik, klasifikasi

Item Type: Thesis (Sarjana)
Subjects: T Technology > TS Informatics Engineering
Divisions: Fakultas > Teknik Informatika
Fakultas > Teknik Informatika
Fakultas > Teknik Informatika
Depositing User: Rini 1
Date Deposited: 06 Nov 2025 06:06
Last Modified: 06 Nov 2025 06:06
URI: http://digilib.unkhair.ac.id/id/eprint/6449

Actions (login required)

View Item View Item