Survey
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
Perkenalan Pertemuan ke-1 Sistem Temu-Balik Informasi yasmi afrizal [email protected] Jurusan Teknik Informatika Universitas Ahmad Dahlan Copyright 2001. Semester Ganjil 2010/2011 Perkenalan Pertemuan ke-1 Sistem Temu-Balik Informasi? • Information Retrieval (IR) 1. Aktifitas menemukan sesuatu (biasanya dokumen) dari sesuatu yang tak-terstruktur (unstructured, biasanya teks) yang memenuhi kebutuhan informasi dari dalam koleksi berukuran besar (biasanya disimpan pada komputer). 2. Mengenai representasi, penyimpanan, organisasi, pencarian dan akses ke item-item informasi Jurusan Teknik Informatika Universitas Ahmad Dahlan Copyright 2001. Semester Ganjil 2010/2011 Perkenalan Pertemuan ke-1 Database Buku dengan judul manajemen database? Penerbit lokasi di Yogya? Jurusan Teknik Informatika Universitas Ahmad Dahlan Semester Ganjil 2010/2011 Perkenalan Pertemuan ke-1 unstructured Siapa pemain dalam novel tersebut ? Jurusan Teknik Informatika Universitas Ahmad Dahlan Semester Ganjil 2010/2011 Perkenalan Pertemuan ke-1 Data Unstructured (text) vs. Structured (database) pada 1996 Jurusan Teknik Informatika Universitas Ahmad Dahlan Copyright 2001. Semester Ganjil 2010/2011 Perkenalan Pertemuan ke-1 Data Unstructured (text) vs. Structured (database) pada 2009 Jurusan Teknik Informatika Universitas Ahmad Dahlan Copyright 2001. Semester Ganjil 2010/2011 Perkenalan Pertemuan ke-1 IR Kemarin & Sekarang • Pemanfaatan Information retrieval adalah aktifitas yang melibatkan hanya sedikit orang: pustakawan referensi, pembantu pengacara dan pencari profesional lainnya. • Saat ini, ratusan juta orang menggunakan IR setiap hari ketika menggunakan web search engine, mencari file atau email mereka. • Tidak dapat disangkal, IR adalah Copyright 2001. Jurusan Teknik Informatika Universitas Ahmad Dahlan Semester Ganjil 2010/2011 teknologi paling penting bagi pengguna Perkenalan Pertemuan ke-1 Text Book & Referensi • Textbook – Christopher D. Manning, Prabhakar Raghavan and Hinrich Schutze. An Introduction to Information Retrieval, Cambridge University Press, Cambridge, England, 2008. – Ricardo Baeza-Yates and Berthier Ribeiro-Neto. Modern Information Retrieval, Addison Wesley, 1999. • Referensi: – Ashok N. Srivastava, Mehran Sahami, Text Mining Classification, Clustering, and Applications, CRC Press, 2009 – Ronen Feldman, James Sanger, The Text Mining Handbook Advanced Approaches in Analyzing Unstructured Data Cambridge University Press, 2007 – Bing Liu, Web DataMining Exploring Hyperlinks, Contents, and Usage Data, Springer, 2007 Jurusan Teknik Informatika Universitas Ahmad Dahlan Copyright 2001. Semester Ganjil 2010/2011 Perkenalan Pertemuan ke-1 Outline Kuliah • Pendahuluan • Konsep Dasar IR – Model-model IR, – Analisis Teks, – Evaluasi Retrieval, – Bahasa & Operasi Query, – Operasi Teks, – Indexing & Searching • Web IR – Web basics, Web crawling, Indexing and search – Link analysis, Scoring dan ranking – Sistem Rekomendasi Jurusan Teknik Informatika Universitas Ahmad Dahlan Copyright 2001. Semester Ganjil 2010/2011 Perkenalan Pertemuan ke-1 Penting! • Penilaian – UTS (tertulis) – UAS (proyek) – Tugas-tugas – Partisipasi – Kehadiran Jurusan Teknik Informatika Universitas Ahmad Dahlan : 20% : 40% : 30% : 10% : 5% Copyright 2001. Semester Ganjil 2010/2011 Perkenalan Pertemuan ke-1 Sistem Temu-Balik Informasi? • Buat kelompok beranggotakan 2 orang. Cari topik tentang Web IR untuk dijadikan proyek pemrograman. Deadline proposal proyek adalah UTS. • Proyek dipresentasikan sebagai pengganti UAS. • Hasil proyek yang dikumpulkan: laporan, kode program & software pendukung. Jurusan Teknik Informatika Universitas Ahmad Dahlan Copyright 2001. Semester Ganjil 2010/2011 Perkenalan Pertemuan ke-1 Pengertian Information Retrieval • Information Retrieval merupakan bagian dari computer science yang berhubungan dengan pengambilan informasi dari dokumen-dokumen yang didasarkan pada isi dan konteks dari dokumen-dokumen itu sendiri. • Information Retrieval merupakan suatu pencarian informasi (biasanya berupa dokumen) yang didasarkan pada suatu query (inputan user) yang diharapkan dapat memenuhi keinginan User dari kumpulan dokumen yang ada. • Definisi query dalam Information Retrieval merupakan sebuah formula yang digunakan untuk mencari informasi yang dibutuhkan oleh user, dalam bentuk yang paling sederhana, sebuah query merupakan suatu keywords (kata kunci) dan dokumen yang mengandung keywords merupakan dokumen yang dicari dalam IRS. Jurusan Teknik Informatika Universitas Ahmad Dahlan Semester Ganjil 2010/2011