Anda belum Log-in!
Silahkan Log in

Selamat Datang di Portal Digital Content Publisher
Minggu , 24 November 2024

Perpustakaan sebagai jantung pendidikan tinggi di Indonesia, harus mampu memberi kontribusi yang berarti bagi pelaksanaan proses belajar mengajar di perguruan tinggi.

TRUNOJOYO » Tugas Akhir & Skripsi » Informatika
di-posting oleh 070411100144 pada 2015-02-16 05:31:34  •  612 klik

KLASIFIKASI DOKUMEN WEB BERITA UNIVERSITAS MENGGUNAKAN METODE K-NN (K-NEAREST NEIGHBOR)
Classification of university news web document using k-NN (K-Nearest Neighbor) method

disusun oleh ROHMI NUR HIDAYAH


SubyekInformation Retrieval
web portal
klasifikasi dokumen
data mining
Kata Kuncik-Nearest Neighbour
cosine similaity
text classification
cache
first paragraph

[ Anotasi Abstrak ]

Sebagian besar situs web universitas di Indonesia belum menerapkan klasifikasi terhadap content yang disediakannya. Tiga situs web telah mengaplikasikan klasifikasi manual adalah ITB, UGM dan IPB dimana hasilnya masih rancu. Pengunjung dari situs web universitas membutuhkan informasi yang fokus mengenai topik tertentu, cepat dalam pemrosesan query pengguna dan terbarukan. Kami melakukan penelitian untuk membangun sistem bernama k-NN Portal yang dimaksudkan untuk mengklasifikasikan dokumen berita dari 10 situs web terpilih menggunakan metode klasifikasi teks k-NN (k-nearest neighbor). Hasil klasifikasi selanjutnya digunakan untuk meningkatkan kinerja dari proses penanganan query pengguna. Kemiripan antara query dengan daftar dokumen yang terdapat dalam repository k-NN Portal dihitung dengan cosine similairity. Teknik cache diikutsertakan untuk mempercepat pemrosesan query tersebut. Hasil pengujian memperlihatkan bahwa akurasi klasifikasi k-NN untuk dokumen teks berita mampu mencapai 95% saat dokumen diwakili oleh judul dan paragraf pertama (k=20, 25 dan 45) tetapi hanya maksimal 40% saat dokumen diwakili oleh judul dan isi lengkap. Adanya klasifikasi terbukti meningkatkan presisi hasil pencarian dan mempersingkat proses pencarian tersebut. Kehadiran cache menjadikan waktu pemrosesan query yang telah ada sebelumnya menjadi jauh lebih cepat, rata-rata hanya memerlukan 7 mili detik.


Deskripsi Lain

Most of the university's website in Indonesia has not implemented the classification of the content it provides. Three web site has been applying manual classification is ITB, UGM and IPB, where the result is still ambiguous. Visitors from the university's website require information that focus on a specific topic, fast in processing user queries and renewable. We conducted a study to establish a system called kNN portal intended to classify documents from chosen 10 news web sites using text classification method kNN (k-nearest neighbor). Classification results are then used to improve the performance of the process of handling user queries. Similarity between the query with a list of documents contained in the kNN Portal repository is calculated by the cosine similairity. Caching techniques are included to speed up the query processing. The test results show that the k-NN classification accuracy for news text document is able to achieve 95% when a document is represented by the title and first paragraph (k = 20, 25 and 45) but only a maximum of 40% when a document is represented by the title and complete text. The existence of the classification is able to improve the precision of search results and shorten the searching process. The presence of the cache makes the preexisting query processing time become much faster, on average only requires 7 milliseconds.

Kontributor: Firdaus Solihin, S. Kom., M. Kom; Hermawan, S.T, M. Kom
Tanggal tercipta: 2015-01-20
Jenis(Tipe): Text
Bentuk(Format): pdf
Bahasa: Indonesia
Pengenal(Identifier): TRUNOJOYO-Tugas Akhir-6460
No Koleksi: 070411100144


 Download File Penyerta (khusus anggota terdaftar)

 File PDF  1. TRUNOJOYO-Tugas Akhir-6460-TA - Abstrak.pdf - 70 KB
 File PDF  2. TRUNOJOYO-Tugas Akhir-6460-TA- Cover.pdf - 466 KB
 File PDF  3. TRUNOJOYO-Tugas Akhir-6460-TA - Bab 1.pdf - 107 KB
 File PDF  4. TRUNOJOYO-Tugas Akhir-6460-TA - Bab 2.pdf - 907 KB
 File PDF  5. TRUNOJOYO-Tugas Akhir-6460-TA - Bab 3.pdf - 626 KB
 File PDF  6. TRUNOJOYO-Tugas Akhir-6460-TA - Bab 4.pdf - 823 KB
 File PDF  7. TRUNOJOYO-Tugas Akhir-6460-TA - Bab 5.pdf - 83 KB
 File PDF  8. TRUNOJOYO-Tugas Akhir-6460-TA - Daftar Pustaka.pdf - 99 KB
 File PDF  9. TRUNOJOYO-Tugas Akhir-6460-TA - Lampiran.pdf - 148 KB


 Dokumen sejenis...

     Tidak ada !

 Dokumen yang bertautan...





 Kembali ke Daftar