Download Pendahuluan

Survey
yes no Was this document useful for you?
   Thank you for your participation!

* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project

Document related concepts
no text concepts found
Transcript
Perkenalan
Pertemuan ke-1
Sistem Temu-Balik
Informasi
yasmi afrizal
[email protected]
Jurusan Teknik Informatika Universitas Ahmad Dahlan
Copyright 2001.
Semester Ganjil 2010/2011
Perkenalan
Pertemuan ke-1
Sistem Temu-Balik Informasi?
• Information Retrieval (IR)
1. Aktifitas menemukan sesuatu (biasanya
dokumen) dari sesuatu yang tak-terstruktur
(unstructured, biasanya teks) yang memenuhi
kebutuhan informasi dari dalam koleksi
berukuran besar (biasanya disimpan pada
komputer).
2. Mengenai representasi, penyimpanan,
organisasi, pencarian dan akses ke item-item
informasi
Jurusan Teknik Informatika Universitas Ahmad Dahlan
Copyright 2001.
Semester Ganjil 2010/2011
Perkenalan
Pertemuan ke-1
Database
Buku dengan judul
manajemen
database?
Penerbit lokasi di
Yogya?
Jurusan Teknik Informatika Universitas Ahmad Dahlan
Semester Ganjil 2010/2011
Perkenalan
Pertemuan ke-1
unstructured
Siapa pemain dalam
novel tersebut ?
Jurusan Teknik Informatika Universitas Ahmad Dahlan
Semester Ganjil 2010/2011
Perkenalan
Pertemuan ke-1
Data Unstructured (text) vs. Structured
(database) pada 1996
Jurusan Teknik Informatika Universitas Ahmad Dahlan
Copyright 2001.
Semester Ganjil 2010/2011
Perkenalan
Pertemuan ke-1
Data Unstructured (text) vs. Structured
(database) pada 2009
Jurusan Teknik Informatika Universitas Ahmad Dahlan
Copyright 2001.
Semester Ganjil 2010/2011
Perkenalan
Pertemuan ke-1
IR Kemarin & Sekarang
• Pemanfaatan Information retrieval
adalah aktifitas yang melibatkan hanya
sedikit orang: pustakawan referensi,
pembantu pengacara dan pencari
profesional lainnya.
• Saat ini, ratusan juta orang
menggunakan IR setiap hari ketika
menggunakan web search engine,
mencari file atau email mereka.
• Tidak dapat disangkal, IR adalah
Copyright 2001.
Jurusan Teknik Informatika Universitas Ahmad Dahlan
Semester Ganjil 2010/2011
teknologi paling penting bagi pengguna
Perkenalan
Pertemuan ke-1
Text Book & Referensi
• Textbook
– Christopher D. Manning, Prabhakar Raghavan and Hinrich
Schutze. An Introduction to Information Retrieval, Cambridge
University Press, Cambridge, England, 2008.
– Ricardo Baeza-Yates and Berthier Ribeiro-Neto. Modern
Information Retrieval, Addison Wesley, 1999.
• Referensi:
– Ashok N. Srivastava, Mehran Sahami, Text Mining Classification,
Clustering, and Applications, CRC Press, 2009
– Ronen Feldman, James Sanger, The Text Mining Handbook
Advanced Approaches in Analyzing Unstructured Data
Cambridge University Press, 2007
– Bing Liu, Web DataMining Exploring Hyperlinks, Contents, and
Usage Data, Springer, 2007
Jurusan Teknik Informatika Universitas Ahmad Dahlan
Copyright 2001.
Semester Ganjil 2010/2011
Perkenalan
Pertemuan ke-1
Outline Kuliah
• Pendahuluan
• Konsep Dasar IR
– Model-model IR,
– Analisis Teks,
– Evaluasi Retrieval,
– Bahasa & Operasi Query,
– Operasi Teks,
– Indexing & Searching
• Web IR
– Web basics, Web crawling, Indexing and search
– Link analysis, Scoring dan ranking
– Sistem Rekomendasi
Jurusan Teknik Informatika Universitas Ahmad Dahlan
Copyright 2001.
Semester Ganjil 2010/2011
Perkenalan
Pertemuan ke-1
Penting!
• Penilaian
– UTS (tertulis)
– UAS (proyek)
– Tugas-tugas
– Partisipasi
– Kehadiran
Jurusan Teknik Informatika Universitas Ahmad Dahlan
: 20%
: 40%
: 30%
: 10%
: 5%
Copyright 2001.
Semester Ganjil 2010/2011
Perkenalan
Pertemuan ke-1
Sistem Temu-Balik Informasi?
• Buat kelompok beranggotakan 2 orang. Cari
topik tentang Web IR untuk dijadikan proyek
pemrograman. Deadline proposal proyek adalah
UTS.
• Proyek dipresentasikan sebagai pengganti UAS.
• Hasil proyek yang dikumpulkan: laporan, kode
program & software pendukung.
Jurusan Teknik Informatika Universitas Ahmad Dahlan
Copyright 2001.
Semester Ganjil 2010/2011
Perkenalan
Pertemuan ke-1
Pengertian Information Retrieval
• Information Retrieval merupakan bagian dari computer
science yang berhubungan dengan pengambilan informasi
dari dokumen-dokumen yang didasarkan pada isi dan
konteks dari dokumen-dokumen itu sendiri.
• Information Retrieval merupakan suatu pencarian informasi
(biasanya berupa dokumen) yang didasarkan pada suatu
query (inputan user) yang diharapkan dapat memenuhi
keinginan User dari kumpulan dokumen yang ada.
• Definisi query dalam Information Retrieval merupakan
sebuah formula yang digunakan untuk mencari informasi
yang dibutuhkan oleh user, dalam bentuk yang paling
sederhana, sebuah query merupakan suatu keywords (kata
kunci) dan dokumen yang mengandung keywords
merupakan dokumen yang dicari dalam IRS.
Jurusan Teknik Informatika Universitas Ahmad Dahlan
Semester Ganjil 2010/2011