Mari Belajar Information Retrieval…

Kali ini kita akan membahas mengenai materi kuliah kami di semester 0910-2 yaitu Information Retrieval, materi ini merupakan materi pilihan jurusan Teknik Informatika di Institut Teknologi Telkom atau disingkat IT Telkom. Dengan kode mata kuliah CS4323 dan termasuk dalam kbk IF-RPLD atau IFX-RPLD, information retrieval menjadi materi yang cukup diminati untuk dipelajari dan sering menjadi topik pengerjaan TA (Tugas Akhir).
Information retrieval merupakan teknik pencarian berupa material (dokumen) yang berada dalam sekumpulan dokumen yang sangat banyak, dapat berupa text, gambar. Fungsinya adalah untuk menemukan kembali informasi-informasi  yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis. Salah satu aplikasi yang menggunakan IR (information retrieval ini adalah search engine. Ciri khas information retrival ini adalah hasil pencariannya ditampilkan secara ranking, beda dengan string matching biasa yang digunakan untuk mencari sebuah dokumen melalui proses pencocokan string.

Apa saja proses yang terjadi dalam Information Retrieval?

1. Indexing Subsystem, yang dilakukan dengan membentuk basis data terhadap koleksi dokumen yang dimasukkan. Tahap ini merupakan tahap persiapan dokumen sehingga dokumen siap untuk diproses.

Tahap yang terjadi pada Indexing Subsystem:

– Word Token : dengan menghapus semua karakter dalam tanda baca yang terdapat dalam dokumen dan mengubah kumpulan term menjadi lower case

– Stop word Removal : proses penghapusan kata-kata penghubung yang sering muncul dalam dokumen seperti yang, dan, atau, dsb.

– Stemming : proses pengubahan suatu kata menjadi kata dasarnya

– Term Weighting : proses pembobotan setiap term dalam dokumen

Proses pembobotan term dalam dokumen :

2. Searching subsystem yaitu proses menemukan kembali dokumen yang relevan dengan query yang dimasukkan, hal ini dilakukan sebab tidak semua dokumen yang diambil (retrieved) oleh sistem merupakan dokumen yang benar-benar sesuai dengan keinginan user (relevan).

Ukuran efektifitas pencarian dapat dilakukan dengan menghitung nilai precision dan recall. Precision adalah jumlah dokumen relevan yang ditemukan dengan total jumlah dokumen yang ditemukan search engine.

Recall adalah rasio jumlah dokumen relevan yang ditemukan kembali dengan total jumlah dokumen dalam kumpulan dokumen yang dianggap relevan.

adver: situs jejaring telkom…. iface ittelkom disini

4 Komentar »

  1. dini Said:

    nice info 😀

  2. hanarika Said:

    wew

  3. ayu Said:

    wah!!!

  4. hookyou Said:

    Tambahin lagi materi IRnya dunk,,


{ RSS feed for comments on this post} · { TrackBack URI }

Tinggalkan komentar