Anda belum Log-in!
Silahkan Log in
Selamat Datang di Portal Digital Content Publisher
Sabtu , 13 September 2025
Perpustakaan sebagai jantung pendidikan tinggi di Indonesia, harus mampu memberi kontribusi yang berarti bagi pelaksanaan proses belajar mengajar di perguruan tinggi.
di-posting oleh 160411100049 pada 2023-02-17 02:02:09 • 332 klik
DETEKSI CYBERBULLYING PADA DATA TWEET MENGGUNAKAN METODE RANDOM FOREST DAN SELEKSI FITUR INFORMATION GAIN
CYBERBULLYING DETECTION ON TWEET DATA USING RANDOM FOREST METHOD AND INFORMATION GAIN FEATURE SELECTION
disusun oleh RACHMAD MASBADI HATULLAH NURNARYO
Subyek: | Cyberbullying Random Forest Tweet Information Gain |
Kata Kunci: | Cyberbullying Random Forest Tweet Information Gain |
[ Anotasi Abstrak ]
Indonesia merupakan salah satu negara dengan pengguna media sosialrnterbanyak. Hal tersebut dapat memicu munculnya cyberbullying. Cyberbullying adalahrntindakan berulang yang melecehkan, mempermalukan, mengancam, atau mengganggurnorang lain melalui komputer, ponsel, dan perangkat elektronik lainnya, termasuk situsrnweb jejaring sosial online. Twitter merupakan salah satu media sosial yang seringrndigunakan untuk melakukan cyberbullying. Penelitian ini mendeteksi cyberbullyingrnyang berasal dari tweet berbahasa Indonesia dengan menggunakan metode RandomrnForest sebagai pengklasifikasi. Seleksi fitur Information Gain juga digunakan untukrnmenyeleksi fitur yang berupa atribut. Random Forest adalah salah satu teknik ensemblernlearning yang cara kerjanya berdasarkan metode Decision Tree, yang menggunakanrnaturan untuk membagi data dalam mode biner. Information Gain adalah salah saturnmetode seleksi fitur berbasis filter yang cara kerjanya melakukan perangkinganrnberdasarkan atribut. Deteksi cyberbullying pada penilitan ini tersusun atas tahapan:rnpreprocessing, pembobotan kata, seleksi fitur dan yang terakhir klasifikasi. Datasetrnyang digunakan pada tahapan klasifikasi merupakan dataset yang berupa matrixrndimana kata hasil pembobotan kata sebagai kolom dan telah diurutkan berdasarkanrnhasil perhitungan nilai entropi. Pengurutan dimulai dari nilai entropi yang tertinggirnhingga ke rendah. Kemudian K – Fold Cross Validation yang menggunakan foldrnsebanyak 10 digunakan sebagai metode evaluasi. Accuracy tiap fold dihitung lalu diratarn– rata. Setelah perhitungan K – Fold Cross Validation pertama atribut dikurangi saturnlalu dilakukan lagi perhitungan K – Fold Cross Validation kedua. Hal tersebutrndilakukan hingga jumlah atribut tersisa satu. Hasil akhir untuk skenario pengujianrnditentukan dengan memilih rata – rata Accuracy tertinggi dari perhitunganrnpengurangan atribut. Dari hasil pengujian, didapatkan nilai Accuracy tertinggi sebesarrn72.1% dengan atribut berjumlah 1295 dari 2277 atribut. Hal ini berarti, pemilihan fiturrnyang baik dapat meningkatkan performa dari metode machine learning.
Deskripsi Lain
Indonesia is one of the countries with the most social media users. This can triggerrnthe emergence of cyberbullying. Cyberbullying is the repeated act of harassing, humiliating,rnthreatening harassing another person via computers, cell phones and other electronicrndevices, including online social networking websites. Twitter is one of the social media that isrnoften used for cyberbullying. This study detects cyberbullying originating from Indonesianlanguage tweets using the Random Forest method a classifier. Feature selection InformationrnGain is also used to features in the form of attributes. Random Forest is an ensemblernlearning technique that works based on the Decision Tree method, which uses rules to dividerndata in binary mode. Information Gain is a filter-based feature selection method that performsrnranking based on attributes. Cyberbullying detection in this research is composed of stages:rnpreprocessing, word weighting, feature selection and finally classification. The dataset used atrnthe classification stage is a dataset in the form of a matrix where words are weighted asrncolumns and have been sorted based on the entropy value calculation results. Sorting startsrnfrom the highest entropy value to the lowest. Then K – Fold Cross Validation which uses 10rnfolds is used an evaluation method. Accuracy for each fold is calculated and then averaged.rnAfter the first K-Fold Cross Validation calculation, the attribute is reduced by one, then thernsecond K-Fold Cross Validation calculation is performed. This is done until the number ofrnattributes remains one. The final result for the test scenario is determined by selecting thernhighest average accuracy from the attribute reduction calculation. From the test results, thernhighest accuracy value was 72.1% with 1295 attributes out of 2277 attributes. This means,rngood feature selection can improve the performance of machine learning methods.
Kontributor | : MULA’AB, S.SI., M.KOM; IKA OKTAVIA SUZANTI, S.KOM., M.CS. |
Tanggal tercipta | : 2022-12-13 |
Jenis(Tipe) | : Text |
Bentuk(Format) | |
Bahasa | : Indonesia |
Pengenal(Identifier) | : TRUNOJOYO-Tugas Akhir-26877 |
No Koleksi | : 160411100049 |
Ketentuan (Rights) :
2022










Tidak ada !

- SENTIMENT ANALYSIS TWEETS KEBIJAKAN PUBLIK BERBAHASA INDONESIA DENGAN METODE PRINCIPAL COMPONENT ANALYSIS DAN EXPECTATION MAXIMIZATION
- Analisis Sentimen dari Media Sosial Menggunakan Metode Information Gain dan Naive Bayes
- OPINI MAHASISWA TERHADAP CYBERBULLYING DI MEDIA SOSIAL INSTAGRAM (Studi Terhadap Mahasiswa Ilmu Komunikasi Universitas Trunojoyo Madura)
- Body Shaming Sebagai Pesan Cyberbullying Di Media Sosial Instagram
- PENERAPAN METODE IMPROVED RANDOM FOREST DAN ALGORITMA C4.5 SEBAGAI CLASSIFIER UNTUK MENDETEKSI RANSOMWARE BERDASARKAN FREKUENSI KEMUNCULAN API CALLS
