e-Libs >> TRUNOJOYO Library

Perpustakaan sebagai jantung pendidikan tinggi di Indonesia, harus mampu memberi kontribusi yang berarti bagi pelaksanaan proses belajar mengajar di perguruan tinggi.

TRUNOJOYO » Tugas Akhir & Skripsi » Informatika
di-posting oleh 160411100049 pada 2023-02-17 02:02:09 • 390 klik

DETEKSI CYBERBULLYING PADA DATA TWEET MENGGUNAKAN METODE RANDOM FOREST DAN SELEKSI FITUR INFORMATION GAIN
CYBERBULLYING DETECTION ON TWEET DATA USING RANDOM FOREST METHOD AND INFORMATION GAIN FEATURE SELECTION

disusun oleh RACHMAD MASBADI HATULLAH NURNARYO

Subyek:	Cyberbullying Random Forest Tweet Information Gain
Kata Kunci:	Cyberbullying Random Forest Tweet Information Gain

[ Anotasi Abstrak ]

Indonesia merupakan salah satu negara dengan pengguna media sosialrnterbanyak. Hal tersebut dapat memicu munculnya cyberbullying. Cyberbullying adalahrntindakan berulang yang melecehkan, mempermalukan, mengancam, atau mengganggurnorang lain melalui komputer, ponsel, dan perangkat elektronik lainnya, termasuk situsrnweb jejaring sosial online. Twitter merupakan salah satu media sosial yang seringrndigunakan untuk melakukan cyberbullying. Penelitian ini mendeteksi cyberbullyingrnyang berasal dari tweet berbahasa Indonesia dengan menggunakan metode RandomrnForest sebagai pengklasifikasi. Seleksi fitur Information Gain juga digunakan untukrnmenyeleksi fitur yang berupa atribut. Random Forest adalah salah satu teknik ensemblernlearning yang cara kerjanya berdasarkan metode Decision Tree, yang menggunakanrnaturan untuk membagi data dalam mode biner. Information Gain adalah salah saturnmetode seleksi fitur berbasis filter yang cara kerjanya melakukan perangkinganrnberdasarkan atribut. Deteksi cyberbullying pada penilitan ini tersusun atas tahapan:rnpreprocessing, pembobotan kata, seleksi fitur dan yang terakhir klasifikasi. Datasetrnyang digunakan pada tahapan klasifikasi merupakan dataset yang berupa matrixrndimana kata hasil pembobotan kata sebagai kolom dan telah diurutkan berdasarkanrnhasil perhitungan nilai entropi. Pengurutan dimulai dari nilai entropi yang tertinggirnhingga ke rendah. Kemudian K – Fold Cross Validation yang menggunakan foldrnsebanyak 10 digunakan sebagai metode evaluasi. Accuracy tiap fold dihitung lalu diratarn– rata. Setelah perhitungan K – Fold Cross Validation pertama atribut dikurangi saturnlalu dilakukan lagi perhitungan K – Fold Cross Validation kedua. Hal tersebutrndilakukan hingga jumlah atribut tersisa satu. Hasil akhir untuk skenario pengujianrnditentukan dengan memilih rata – rata Accuracy tertinggi dari perhitunganrnpengurangan atribut. Dari hasil pengujian, didapatkan nilai Accuracy tertinggi sebesarrn72.1% dengan atribut berjumlah 1295 dari 2277 atribut. Hal ini berarti, pemilihan fiturrnyang baik dapat meningkatkan performa dari metode machine learning.

Deskripsi Lain

Indonesia is one of the countries with the most social media users. This can triggerrnthe emergence of cyberbullying. Cyberbullying is the repeated act of harassing, humiliating,rnthreatening harassing another person via computers, cell phones and other electronicrndevices, including online social networking websites. Twitter is one of the social media that isrnoften used for cyberbullying. This study detects cyberbullying originating from Indonesianlanguage tweets using the Random Forest method a classifier. Feature selection InformationrnGain is also used to features in the form of attributes. Random Forest is an ensemblernlearning technique that works based on the Decision Tree method, which uses rules to dividerndata in binary mode. Information Gain is a filter-based feature selection method that performsrnranking based on attributes. Cyberbullying detection in this research is composed of stages:rnpreprocessing, word weighting, feature selection and finally classification. The dataset used atrnthe classification stage is a dataset in the form of a matrix where words are weighted asrncolumns and have been sorted based on the entropy value calculation results. Sorting startsrnfrom the highest entropy value to the lowest. Then K – Fold Cross Validation which uses 10rnfolds is used an evaluation method. Accuracy for each fold is calculated and then averaged.rnAfter the first K-Fold Cross Validation calculation, the attribute is reduced by one, then thernsecond K-Fold Cross Validation calculation is performed. This is done until the number ofrnattributes remains one. The final result for the test scenario is determined by selecting thernhighest average accuracy from the attribute reduction calculation. From the test results, thernhighest accuracy value was 72.1% with 1295 attributes out of 2277 attributes. This means,rngood feature selection can improve the performance of machine learning methods.

Kontributor	: MULA’AB, S.SI., M.KOM; IKA OKTAVIA SUZANTI, S.KOM., M.CS.
Tanggal tercipta	: 2022-12-13
Jenis(Tipe)	: Text
Bentuk(Format)	: pdf
Bahasa	: Indonesia
Pengenal(Identifier)	: TRUNOJOYO-Tugas Akhir-26877
No Koleksi	: 160411100049

Ketentuan (Rights) :
2022

Download File Penyerta (khusus anggota terdaftar)

File PDF

1. TRUNOJOYO-Tugas Akhir-26877-160411100049_Abstract.pdf - 277 KB
File PDF

2. TRUNOJOYO-Tugas Akhir-26877-160411100049_Cover.pdf - 719 KB
File PDF

3. TRUNOJOYO-Tugas Akhir-26877-160411100049_Chapter1.pdf - 308 KB
File PDF

4. TRUNOJOYO-Tugas Akhir-26877-160411100049_Chapter2.pdf - 579 KB
File PDF

5. TRUNOJOYO-Tugas Akhir-26877-160411100049_Chapter3.pdf - 858 KB
File PDF

6. TRUNOJOYO-Tugas Akhir-26877-160411100049_Chapter4.pdf - 669 KB
File PDF

7. TRUNOJOYO-Tugas Akhir-26877-160411100049_Conclusion.pdf - 89 KB
File PDF

8. TRUNOJOYO-Tugas Akhir-26877-160411100049_References.pdf - 210 KB

Dokumen sejenis...

Tidak ada !

Dokumen yang bertautan...

Kembali ke Daftar