Anda belum Log-in!
Silahkan Log in
Selamat Datang di Portal Digital Content Publisher
Minggu , 24 November 2024
Perpustakaan sebagai jantung pendidikan tinggi di Indonesia, harus mampu memberi kontribusi yang berarti bagi pelaksanaan proses belajar mengajar di perguruan tinggi.
di-posting oleh 070411100144 pada 2015-02-16 05:31:34 • 612 klik
KLASIFIKASI DOKUMEN WEB BERITA UNIVERSITAS MENGGUNAKAN METODE K-NN (K-NEAREST NEIGHBOR)
Classification of university news web document using k-NN (K-Nearest Neighbor) method
disusun oleh ROHMI NUR HIDAYAH
Subyek: | Information Retrieval web portal klasifikasi dokumen data mining |
Kata Kunci: | k-Nearest Neighbour cosine similaity text classification cache first paragraph |
[ Anotasi Abstrak ]
Sebagian besar situs web universitas di Indonesia belum menerapkan klasifikasi terhadap content yang disediakannya. Tiga situs web telah mengaplikasikan klasifikasi manual adalah ITB, UGM dan IPB dimana hasilnya masih rancu. Pengunjung dari situs web universitas membutuhkan informasi yang fokus mengenai topik tertentu, cepat dalam pemrosesan query pengguna dan terbarukan. Kami melakukan penelitian untuk membangun sistem bernama k-NN Portal yang dimaksudkan untuk mengklasifikasikan dokumen berita dari 10 situs web terpilih menggunakan metode klasifikasi teks k-NN (k-nearest neighbor). Hasil klasifikasi selanjutnya digunakan untuk meningkatkan kinerja dari proses penanganan query pengguna. Kemiripan antara query dengan daftar dokumen yang terdapat dalam repository k-NN Portal dihitung dengan cosine similairity. Teknik cache diikutsertakan untuk mempercepat pemrosesan query tersebut. Hasil pengujian memperlihatkan bahwa akurasi klasifikasi k-NN untuk dokumen teks berita mampu mencapai 95% saat dokumen diwakili oleh judul dan paragraf pertama (k=20, 25 dan 45) tetapi hanya maksimal 40% saat dokumen diwakili oleh judul dan isi lengkap. Adanya klasifikasi terbukti meningkatkan presisi hasil pencarian dan mempersingkat proses pencarian tersebut. Kehadiran cache menjadikan waktu pemrosesan query yang telah ada sebelumnya menjadi jauh lebih cepat, rata-rata hanya memerlukan 7 mili detik.
Deskripsi Lain
Most of the university's website in Indonesia has not implemented the classification of the content it provides. Three web site has been applying manual classification is ITB, UGM and IPB, where the result is still ambiguous. Visitors from the university's website require information that focus on a specific topic, fast in processing user queries and renewable. We conducted a study to establish a system called kNN portal intended to classify documents from chosen 10 news web sites using text classification method kNN (k-nearest neighbor). Classification results are then used to improve the performance of the process of handling user queries. Similarity between the query with a list of documents contained in the kNN Portal repository is calculated by the cosine similairity. Caching techniques are included to speed up the query processing. The test results show that the k-NN classification accuracy for news text document is able to achieve 95% when a document is represented by the title and first paragraph (k = 20, 25 and 45) but only a maximum of 40% when a document is represented by the title and complete text. The existence of the classification is able to improve the precision of search results and shorten the searching process. The presence of the cache makes the preexisting query processing time become much faster, on average only requires 7 milliseconds.
Kontributor | : Firdaus Solihin, S. Kom., M. Kom; Hermawan, S.T, M. Kom |
Tanggal tercipta | : 2015-01-20 |
Jenis(Tipe) | : Text |
Bentuk(Format) | |
Bahasa | : Indonesia |
Pengenal(Identifier) | : TRUNOJOYO-Tugas Akhir-6460 |
No Koleksi | : 070411100144 |
Download File Penyerta (khusus anggota terdaftar)
1. TRUNOJOYO-Tugas Akhir-6460-TA - Abstrak.pdf - 70 KB
2. TRUNOJOYO-Tugas Akhir-6460-TA- Cover.pdf - 466 KB
3. TRUNOJOYO-Tugas Akhir-6460-TA - Bab 1.pdf - 107 KB
4. TRUNOJOYO-Tugas Akhir-6460-TA - Bab 2.pdf - 907 KB
5. TRUNOJOYO-Tugas Akhir-6460-TA - Bab 3.pdf - 626 KB
6. TRUNOJOYO-Tugas Akhir-6460-TA - Bab 4.pdf - 823 KB
7. TRUNOJOYO-Tugas Akhir-6460-TA - Bab 5.pdf - 83 KB
8. TRUNOJOYO-Tugas Akhir-6460-TA - Daftar Pustaka.pdf - 99 KB
9. TRUNOJOYO-Tugas Akhir-6460-TA - Lampiran.pdf - 148 KB
Dokumen sejenis...
Tidak ada !
Dokumen yang bertautan...
- Prediksi Ketepatan Kelulusan Mahasiswa Menggunakan Algoritma C5.0
- RANCANG BANGUN E-DOCUMENT DI KANTOR PELAYANAN PERIJINAN TERPADU KABUPATEN BANGKALAN MENGGUNAKAN NAIVE BAYES CLASSIFIER
- REKOMENDASI DENAH TATA LETAK BARANG MENGGUNAKAN METODE ASSOCIATION RULE BERBASIS MULTIPLE MINIMUM SUPPORT (Studi Kasus: El Malik Swalayan)
- Analisis Dampak Penerapan Metode Diskretisasi Data terhadap Performa Diagnosis Penyakit Liver Berbasis K-Nearest Neighbor
- Penerapan Data Mining Pada Market Basket Analysis dengan Metode Algoritma Apriori Association Rules
Kembali ke Daftar