PERBANDINGAN NORMALISASI KATA SLANG BAHASA INDONESIA MENGGUNAKAN MODEL FASTTEXT & WORD2VEC DENGAN PENDEKATAN NATURAL LANGUAGE PROCESSING

M.Jen, Rifqah Nur Surayya M.Jen (2024) PERBANDINGAN NORMALISASI KATA SLANG BAHASA INDONESIA MENGGUNAKAN MODEL FASTTEXT & WORD2VEC DENGAN PENDEKATAN NATURAL LANGUAGE PROCESSING. Sarjana thesis, Universitas Khairun.

[thumbnail of 01. SAMPUL DEPAN BERISI JUDUL.pdf] Text
01. SAMPUL DEPAN BERISI JUDUL.pdf - Published Version

Download (113kB)
[thumbnail of 04. ABSTRAK DALAM BAHASA INDONESIA DAN BAHASA INGGRIS.pdf] Text
04. ABSTRAK DALAM BAHASA INDONESIA DAN BAHASA INGGRIS.pdf - Published Version

Download (121kB)
[thumbnail of 06. BAB YANG TERPISAH (BAB I).pdf] Text
06. BAB YANG TERPISAH (BAB I).pdf - Published Version

Download (117kB)
[thumbnail of 07. DAFTAR PUSTAKA.pdf] Text
07. DAFTAR PUSTAKA.pdf - Updated Version

Download (114kB)
[thumbnail of SKRIPSI_RIFQAH NUR SURAYYA M.JEN_07352011097.pdf] Text
SKRIPSI_RIFQAH NUR SURAYYA M.JEN_07352011097.pdf - Published Version

Download (8MB)

Abstract

Penggunaan kata-kata gaul sering kali digunakan sebagai sarana komunikasi di media sosial seperti Twitter, namun menjadi masalah bagi kalangan tertentu karena sulit dimengerti jika diucapkan di luar konteks. Hal ini dapat menyebabkan komunikasi menjadi kurang efektif, terutama bagi yang tidak terbiasa dengan slang tersebut. Oleh karena itu, pendekatan normalisasi kata diperlukan untuk menerjemahkan kata ke dalam bahasa formal agar lebih dipahami masyarakat. Natural Language Processing (NLP) adalah teknik komputasi yang menganalisis dan merepresentasikan teks atau bahasa lisan untuk mencapai pemrosesan mirip manusia. Penelitian ini fokus pada teknik ekstraksi fitur seperti FastText dan Word2Vec untuk memetakan kata ke vektor numerik. Hasil pengujian kata slang menunjukkan FastText memiliki kemiripan tertinggi 0.9934859978 dan terendah 0.8928895496, sementara Word2Vec memiliki kemiripan tertinggi 0.9977979123 dan terendah 0.0975351095. Waktu yang dibutuhkan FastText untuk training adalah 0.432 detik dan untuk normalisasi 0.016 detik, sedangkan Word2Vec memerlukan 0.027 detik untuk training dan 0.006 detik untuk normalisasi. Kata kunci: Kata Slang, Natural Language Processing, Word2Vec, FastText

Item Type: Thesis (Sarjana)
Subjects: T Technology > TS Informatics Engineering
Divisions: Fakultas > Teknik Informatika
Fakultas > Teknik Informatika
Fakultas > Teknik Informatika
Depositing User: Rini 1
Date Deposited: 06 Nov 2025 06:07
Last Modified: 06 Nov 2025 06:07
URI: http://digilib.unkhair.ac.id/id/eprint/6456

Actions (login required)

View Item View Item