Survey
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
1 Referensi : •The Data Warehouse Toolkit by Ralph Kimball (John Wiley and Sons, 1996) •Building the Data Warehouse by William Inmon (John Wiley and Sons, 1996) • Building the Data Warehouse Bill Inmon, 1992 •The Data Warehousing, Institute profit organization, 1995 • Releases the Data Vault, Daniel Linstedf, 2000 • Budi Santoso, Data Mining, ( Graha Ilmu, 2007 ) DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO 2 TUJUAN MATAKULIAH 1. Memahami Perbedaan data Warehouse dan data Mining. 2. Menguasai metode penggunaan Data Warehouse dan Data Mining. 3. Menguasai metode pengolahan data yang benar. 4. Mampu mengcluster data dengan methode clustering data mining. 5. Menyediakan alat dan metodologi untuk mengekplorasi pola dan makna dalam sejumlah data yang besar. 6. Diharapkan mampu menciptakan knowledge Information. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO 3 Beda Data Warehouse dan Data Minning 1. Data Mining Data mining adalah metode analisis data menggunakan pola pengenalan logika (pattern recognition logic) untuk mengidentifikasikan trend di dalam sebuah set sampel data dan meramalkan kemungkinan informasi tersebut terhadap data yang lebih besar. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO 4 Beda Data Warehouse dan Data Minning Penggunaan data mining pada umumnya untuk : a. Membuat program marketing yang ditargetkan secara khusus b. Mengidentifikasikan financial fraud c. Menandai pola-pola yang tidak biasa pada sudut pandang keamanan. d. Mengcluster suatu data dengan pola acak secara cepat. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO 5 Beda Data Warehouse dan Data Minning 2. Data Warehouse Menurut W.H. Inmon dan Richard D.H., data warehouse adalah koleksi data yang mempunyai sifat berorientasi subjek,terintegrasi,time-variant, dan bersifat tetap dari koleksi data dalam mendukung proses pengambilan keputusan management. Menurut Vidette Poe, data warehouse merupakan database yang bersifat analisis dan read only yang digunakan sebagai fondasi dari sistem penunjang keputusan. Menurut Paul Lane, data warehouse merupakan database relasional yang didesain lebih kepada query dan analisa dari pada proses transaksi, biasanya mengandung history data dari proses transaksi dan bisa juga data dari sumber lainnya. Data warehouse memisahkan beban kerja analisis dari beban kerja transaksi dan memungkinkan organisasi menggabung/konsolidasi data dari berbagai macam sumber. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO 6 Beda Data Warehouse dan Data Minning Jadi, data warehouse merupakan metode dalam perancangan database, yang menunjang DSS(Decission Support System) dan EIS (Executive Information System). Secara fisik data warehouse adalah database, tapi perancangan data warehouse dan database sangat berbeda. Dalam perancangan database tradisional menggunakan normalisasi, sedangkan pada data warehouse normalisasi bukanlah cara yang terbaik. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO 7 Beda Data Warehouse dan Data Minning Sebuah data warehouse merupakan sebuah produk software yang digunakan untuk menyimpan data berukuran besar dan menjalankan query dan report yang dirancang khusus. Mis : SQL, ORACLE, UNIX DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO 8 DATA WAREHOUSE CONCEPT DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO 9 DATA WAREHOUSE CONCEPT Data Warehouse merupakan tempat menampung berbagai jenis data dari Proses, Extract, Laporan, Sistem Operasi, Data murni, Analisa dll. 3 Kelompok Data warehouse : a. Data mentah ( Raw data ) b. Data Ringkasan laporan c. Data pengelompokan / extract DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO 10 DATA WAREHOUSE CONCEPT Ada empat tugas yang bisa dilakukan dengan adanya data warehouse : 1. Pembuatan Laporan / Report Create Pembuatan laporan merupakan salah satu kegunaan data warehouse yang paling umum dilakukan. Dengan menggunakan query sederhana didapatkan laporan perhari, perbulan, pertahun atau jangka waktu kapanpun yang diinginkan. 2. On-Line Analytical Processing (OLAP) OLAP mendayagunakan konsep data multi dimensi dan memungkinkan para pemakai menganalisa data sampai mendetail, tanpa mengetikkan satupun perintah SQL. Hal ini dimungkinkan karena pada konsep multi dimensi, maka data yang berupa fakta yang sama bisa dilihat dengan menggunakan fungsi yang berbeda. Fasilitas lain yang ada pada sofware OLAP adalah fasilitas rool-up dan drill-down. Drill-down adalah kemampuan untuk melihat detail dari suatu informasi dan roll-up adalah kebalikannya. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO 11 DATA WAREHOUSE CONCEPT 3. Data mining Data mining merupakan proses untuk menggali pengetahuan dan informasi baru dari data yang berjumlah banyak pada data warehouse, dengan menggunakan kecerdasan buatan (Artificial Intelegence), statistik dan matematika. Data mining merupakan teknologi yang diharapkan dapat menjembatani komunikasi antara data dan pemakainya. 4. Proses informasi executive Data warehouse dapat membuat ringkasan informasi yang penting dengan tujuan membuat keputusan bisnis, tanpa harus menjelajahi keseluruhan data. Dengan menggunakan data warehouse segala laporan telah diringkas dan dapat pula mengetahui segala rinciannya secara lengkap, sehingga mempermudah proses pengambilan keputusan. Informasi dan data pada laporan data warehouse menjadi target informative bagi user DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO 12 DATA MINING CONCEPT Data mining muncul setelah banyak dari pemilik data baik perorangan maupun organisasi mengalami penumpukan data yang telah terkumpul selama beberapa tahun, misalnya data pembelian, data penjualan, data nasabah, data transaksi, email dan sebagainya. Kemudian muncul pertanyaan dari pemilik data tersebut, apa yang harus dilakukan terhadap tumpukan data tersebut. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO 13 DATA MINING CONCEPT Beberapa solusi yang diberikan data mining antara lain : 1. Menebak Target Pasar Data mining dapat mengelompokkan (clustering) model-model pembeli dan melakukan klasifikasi terhadap setiap pembeli dan melakukan klasifikasi terhadap setiap pembeli sesuai dengan karakteristik yang diinginkan. 2. Melihat Pola Beli dari waktu ke waktu Data mining dapat digunakan untuk melihat pola beli dari waktu ke waktu. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO 14 DATA MINING CONCEPT 3. Cross-Market analysis Data mining dapat dimanfaatkan untuk melihat hubungan antara satu produk dengan produk lainnya. 4. Profil pelanggan Data mining bisa membantu pengguna untuk melihat profil pembeli sehingga dapat diketahui kelompok pembeli tertentu cenderung kepada suatu produk apa saja. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO 15 DATA MINING CONCEPT 5. Informasi Summary Data mining dapat membuat laporan summary yang bersifat multi dimensi dan dilengkapi dengan informasi statistik lainnya. DATA WAREHOUSE DAN DATA MINING EKO GANDHI SISWANTO 16