Survey
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
FAKULTAS TEKNOLOGI INFORMASI UNIVERSITAS BUDI LUHUR Pemodelan Data Dimensional dengan OLAP www.bl.ac.id Universitas Budi Luhur Pertemuan ke-14 HAL : 1 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE DW-based Decision Support System • Tujuan: untuk mendapatkan keputusan yang lebih tepat secara lebih cepat. • Prinsip: data sebagai representasi lingkungan: situasi konsumen, pasar & persaingan, kemampuan perusahaan sendiri. – Dibangun diatas data warehouse – Gabungan dari pelaporan (reporting), analisa pemodelan dan eksplorasi data (query). GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 2 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE OnLine Analysis Processing (OLAP) • Merepresentasikan data dengan kubus multidimensional: lebih mudah dibaca • Aspek: ukuran (metric) dan dimensi (dimension) – Ukuran: besaran data – Dimensi: konteks data (parameter bisnis) – Contoh: melihat penjualan (ukuran) menurut wilayah, waktu, dan produk (dimensi-dimensi) • Ukuran disimpan dalam tabel fakta (fact table), dimensi dalam tabel dimensi (dimension table). GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 3 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Multidimensional Representation Penjualan Finance DB W i l a y a h Produk Account DB Ad Hoc Product DB Data Cube Representation GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 4 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Dimensional Data Model “Penjualan per jenis produk dalam 6 bulan terakhir” “Penjualan per dealer antara tahun 1990 dan 1995” Info Agen Ukuran numerik dari tabel fakta Kolom-kolom kunci dari tabel fakta juga kunci dari tabel-tabel dimensi Kode Produk Kode Waktu Kode Agen Penjualan Jumlah Info Produk Tabel-tabel dimensi GASAL 2008/2009 ... ... ... ... ... Tabel fakta Info Waktu PERANCANGAN BASIS DATA (KP130) HAL : 5 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Dimensions • Dimensi dapat memiliki atribut – Misal, dimensi dealer memiliki atribut alamat, nama manajer, dsb – Misal, dimensi produk memiliki harga, merk, warna. • Dimensi umumnya memiliki hirarki – Misal, dimensi waktu: hari bulan kuartal – Misal, dimensi produk: produk jenis produk merk • Skala dimensi tergantung dari kerincian (granularity) dari tabel fakta. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 6 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Dimension Hierarchy Dimensi Dealer Dimensi Produk Total Wilayah Distrik Agen GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) Total Pabrik Merk Produk HAL : 7 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE 3-D Data Cubes Kubus 3-dimensi: Tabel fakta: sale prod-Id p1 p2 p1 p2 p1 p1 store-Id s1 s1 s3 s2 s1 s2 GASAL 2008/2009 tgl 1 1 1 1 2 2 jumlah 12 11 50 8 44 4 tgl 2 tgl 1 p1 p2 p1 p2 s1 44 s1 12 11 PERANCANGAN BASIS DATA (KP130) s2 4 s2 s3 s3 50 8 HAL : 8 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Operations on Dimensional Models • Operasi analisa – Slice & dice – Role up & drill down – Pivot Produk 850 323 714 Rabu Selasa 001 Senin 002 Pelanggan Penjualan $ 003 GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 9 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Slice, Dice & Pivot • Slicing & Dicing – Mengambil potongan kubus berdasarkan nilai tertentu pada satu atau beberapa dimensinya • Pivoting – Menampilkan nilai-nilai ukuran dalam tata letak tabel yang berbeda – Menggabungkan dua atau lebih dimensi kedalam hierarki sub-dimensi dalam tampilan tabel GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 10 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Slicing tgl 2 tgl 1 p1 p2 p1 p2 s1 44 s1 12 11 s2 4 s2 s3 s3 50 8 WAKTU = tanggal 1 p1 p2 GASAL 2008/2009 s1 12 11 s2 s3 50 8 PERANCANGAN BASIS DATA (KP130) HAL : 11 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Slice & Pivot Produk Toko t1 Toko t2 Electronics Toys Clothing Cosmetics Electronics Toys Clothing Cosmetics Produk Toko t1 Toko t2 GASAL 2008/2009 Electronics Toys Clothing Cosmetics Electronics Toys Clothing Penjualan (juta $) Waktu Tgl-1 Tgl-2 $5.2 $1.9 $2.3 $1.1 $8.9 $0.75 $4.6 $1.5 Penjualan (juta $) Tgl-1 Toko t1 Toko t2 $5.2 $8.9 $1.9 $0.75 $2.3 $4.6 $1.1 $1.5 PERANCANGAN BASIS DATA (KP130) HAL : 12 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Roll-up & Drill-down • Roll-up – Generalisasi satu atau beberapa dimensi dengan merangkum nilai-nilai ukurannya – Generalisasi: naik ke tingkat atasnya dalam hirarki dimensi • Drill-down – Memilih dan menampilkan data rincian dalam satu atau beberapa dimensi – Kebalikan dari operasi roll-up GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 13 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Roll-up vs Drill-down Contoh: penghitungan total tgl 2 tgl 1 p1 p2 p1 p2 s1 44 s2 4 s1 12 11 s2 s3 ... s3 50 8 sum p1 p2 s1 56 11 s2 4 8 rollup drill-down GASAL 2008/2009 s1 67 s2 12 s3 50 s3 50 129 p1 p2 sum 110 19 PERANCANGAN BASIS DATA (KP130) HAL : 14 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Hierarchy-based Aggregation tgl 2 tgl 1 p1 p2 p1 p2 s1 44 s1 12 11 s2 4 s2 s3 s3 50 8 toko wilayah negara p1 p2 GASAL 2008/2009 wil A 56 11 wil B 54 8 (toko s1 di wilayah A; toko s2, s3 di wilayah B) PERANCANGAN BASIS DATA (KP130) HAL : 15 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Cubes with Aggregate Data • Data agregat disimpan (dihitung dan ditam-bahkan) dalam tabel fakta, untuk mening-katkan kinerja query. p1 p2 * s1 s1 56 11 67 s2 44 4 s2 44 s3 4 50 * tgl 2 tgl 1 p1 p2 * p1 p2 s1 * 12 11 23 GASAL 2008/2009 8 8 50 s2 4 8 12 s3 * 62 19 81 s3 50 *50 48 48 * 110 19 129 penjualan(*,p2,*) PERANCANGAN BASIS DATA (KP130) HAL : 16 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Other Operations Operasi kalkulasi: • Ranking – Misal: top 20% produk dengan penjualan tertinggi. • Fungsi waktu – Penghitungan rata-rata per hari. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 17 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE OLAP Application Architecture • Arsitektur 3-lapis (3-tier) RDBMS Server MDBMS Server Client (OLAP Server) Multidimensional access SQL-Read Warehouse data Meta data Derived data Multidimensional Viewer Multidimensional data Tier 3 SQL-Reach Through Tier 1 Tier 2 Report Viewer SQL-Read GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 18 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Storage Technology OLAP Technology: • ROLAP • MOLAP • HOLAP • Bagaimana memilih? GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 19 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE ROLAP • Relational DBMS dengan SQL standard dengan optimasi kinerja (minimasi operasi join) • Membutuhkan tambahan meta layer khusus • Membutuhkan tambahan front end layer khusus • Skema data: bintang (star) dan kristal salju (snowflake) GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 20 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE ROLAP (2) • Keuntungan: – Dapat menampung volume data besar (scalability) – Menggunakan teknologi yang telah mapan (RDB): kinerja lebih baik/teruji – Memungkinkan DW untuk berubah (berevolusi) tanpa harus merubah skema data. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 21 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE OLAP Operations in RDBM Roll-up: Total amounts untuk day 1 dalam SQL: SELECT sum(amt) FROM SALE WHERE date = 1 sale prodId p1 p2 p1 p2 p1 p1 GASAL 2008/2009 storeId s1 s1 s3 s2 s1 s2 date 1 1 1 1 2 2 amt 12 11 50 8 44 4 81 PERANCANGAN BASIS DATA (KP130) HAL : 22 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE OLAP Operations in RDBM (2) Total amounts menurut date dalam SQL: SELECT date, sum(amt) FROM SALE GROUP BY date sale prodId p1 p2 p1 p2 p1 p1 GASAL 2008/2009 storeId s1 s1 s3 s2 s1 s2 date 1 1 1 1 2 2 amt 12 11 50 8 44 4 result PERANCANGAN BASIS DATA (KP130) date 1 2 sum 81 48 HAL : 23 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE OLAP Operations in RDBM (3) Total amounts menurut date dan product-ID dalam SQL: SELECT prodId, date, sum(amt) FROM SALE GROUP BY date, prodId sale prodId p1 p2 p1 p2 p1 p1 storeId s1 s1 s3 s2 s1 s2 date 1 1 1 1 2 2 amt 12 11 50 8 44 4 result prodId p1 p2 p1 date 1 1 2 sum 62 19 48 rollup drill-down GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 24 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Implementasi ROLAP Skema Bintang dan Keping Salju GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 25 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Star Schema GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 26 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Classical Star Schema Skema Bintang Dasar: Tabel fakta tunggal berisi data rinci dan agregat. Satu kolom kunci (key) untuk tiap dimensi sebagai kunci primer (primary key) tabel fakta. Nilai-nilai kolom kunci asing (foreign key) telah terdefinisi. Setiap dimensi direpresentasikan dalam satu tabel yang umumnya sangat ter-denormalisasi. • Keuntungan: Mudah dipahami, mudah untuk merepresentasikan hirarki dimensi, metadata tidak rumit, low maintenance, jumlah operasi join minimal. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 27 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Star Schema Example GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 28 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Problems with Aggregates • Sumber masalah: penggabungan data rinci dan agregat dalam tabel fakta tunggal. • Solusi: tabel-tabel dimensi harus memiliki indikator level (tingkat agregasi) yang dapat digunakan sebagai kondisi syarat dalam query • Akibat: kinerja pemrosesan query untuk tingkat agregat rendah, apalagi dengan besarnya tabel fakta. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 29 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Problems with Aggregates (2) • … Tabel-tabel dimensi harus memiliki indikator level (tingkat agregasi) yang dapat digunakan sebagai kondisi syarat dalam query SELECT A.STORE_KEY, A.PERIOD_KEY, A.dollars FROM Fact_Table A WHERE A.STORE_KEY IN (SELECT STORE_KEY FROM Store_Dimension B WHERE region = “North” AND level = 2) AND … ) • Indikator level berpotensi menjadi sumber kesalahan: sangat mudah terlupakan, berakibat nilai yang dihasilkan salah (menjerumuskan). GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 30 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE From Star to Snowflake • Alternatif solusi: normalisasi tabel dimensi berdasarkan atribut level, lalu tabel-tabel dimensi kecil yang dihasilkan diacukan pada tabel-tabel fakta tersendiri untuk setiap level. • Skema kristal salju (snowflake) diperoleh. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 31 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Aggregate Fact Tables Dimensi Agen KODE_AGEN Kode_Distrik Kode_Kota Nama Agen Alamat No Telpon Kode_Distrik Nama Distrik Kode_Kota Nama Kota Manajer Kota Nama Distrik Kode_Kota Nama Kota Manajer Kota Tabel Fakta Utama KODE_AGEN KEY_PRODUK KEY_PERIODE Nilai Jumlah Biaya Tabel Fakta Distrik Kode_Distrik KEY_PRODUK KEY_PERIODE Nilai Jumlah Biaya Tabel Fakta Kota Kode_Kota KEY_PRODUK KEY_PERIODE Nilai Jumlah Biaya tabel agregat (rangkuman) GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 32 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Snowflake Schema (2) • Attribut level tidak diperlukan lagi. • Setiap tabel dimensi tambahan memiliki satu kolom kunci (key) untuk setiap level dalam hirarki dimensi. • Tabel dimensi pada level terendah menggabungkan atribut-atribut tabel dimensi lainnya. • Level terendah masih berupa tabel fakta yang terdenormalisasi: untuk query-query kompleks dan adhoc. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 33 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Snowflake Schema (3) • Prakteknya: – Mulai dengan skema bintang, lalu buat kembangkristal salju-nya dengan query. – Keuntungan: referential integrity terjamin. • Kelebihan: – Kinerja pemrosesan query tinggi untuk queryquery yang melibatkan agregasi (hitungan total). • Kelemahan: – Rumit dalam pemeliharaan dan metadata-nya – Jumlah tabel dalam database membengkak. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 34 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Multiple Aggregate Tables Kode Produk Kode Waktu Kode Agen Nilai Jumlah Info Agen ... Info Produk ... ... Distrik ... ... ... ... ... ... ... ... Bulanan ... Tabel-tabel fakta agregat Kuartalan Produk Waktu Agen Nilai Jml Tahunan Produk Waktu Agen Nilai Jml ... ... . . .Produk . . .Waktu . . . Agen Nilai Jml ... GASAL 2008/2009 ... Kota Produk Waktu Agen Nilai Jml Produk Waktu Agen Nilai Jml ... Info Waktu ... ... ... ... ... ... ... ... ... PERANCANGAN BASIS DATA (KP130) ... HAL : 35 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Multiple DW Subjects • DW dengan topik (business subject) banyak – Setiap topik direpresentasikan oleh sebuah tabel fakta – Data masing-masing topik mungkin diperoleh dari sistem aplikasi sumber yang berbeda – Dimensi-dimensi yang dipakai oleh lebih dari satu tabel fakta harus seragam (conformed) baik dalam hal nama dan nilai atribut-atribut maupun hierarkinya. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 36 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Conformed Dimensions Subject 1 GASAL 2008/2009 Subject 2 PERANCANGAN BASIS DATA (KP130) HAL : 37 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE MOLAP • Menyimpan data sesuai dengan struktur kubus: – Ukuran disimpan dalam array multi dimensi – Array di-indeks oleh dimensi • Akses langsung ke array • Teknologi proprietary • Belum ada standard access API/language • Ada juga yang internalnya menggunakan RDBMS. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 38 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE MOLAP (2) Keuntungan: • Kinerja pemrosesan query tinggi dibanding ROLAP • Lebih efisien, fleksibel dan intuitif dalam merepresentasikan hierarki-hierarki dimensi Kelemahan: • Volume data (scalability) umumnya terbatas • Relatif mahal dan bukan open architecture GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 39 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE HOLAP • Gabungan ROLAP dengan MOLAP – Menyimpan data rinci dengan RDBMS dan data agregat dengan MDBMS – Akses data secara MOLAP. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 40 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE ROLAP, MOLAP or HOLAP GASAL 2008/2009 ? PERANCANGAN BASIS DATA (KP130) HAL : 41 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Use ROLAP when ... • Data pada tingkat transaksi (lowest granularity level) • Hanya membutuhkan data rinci • Banyak menggunakan query ad-hoc (bukan hasil prekomputasi) • Contoh: – Telekomunikasi: call data records (CDRs) – Situs e-Commerce – Perusahaan kartu kredit. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 42 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Use MOLAP when ... • Data yang tersedia berupa data agregat • Hanya membutuhkan data agregat • Contoh: – Analisa dan penyusunan anggaran oleh bagian keuangan – Analisa penjualan – Dsb. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 43 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Use HOLAP when ... • Menggunakan OLAP baik dengan data rincian maupun agregat • User groups dengan kebutuhan yang bervariasi • Volume data rinci yang tinggi • Contoh: – Ritel – Bank dan penyedia jasa finansial. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 44 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Teknik-teknik ROLAP GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 45 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Dealing with Dimension Changes Kunci pengganti (surrogate key) • Antisipasi perubahan dimensi bisnis Revisi insidentil dimensi bisnis • Tipe 1: Koreksi kesalahan • Tipe 2: Perubahan status • Tipe 3: Nilai atribut paralel Dimensi bisnis yang sering berubah Aturan (policy) perubahan dimensi GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 46 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Surrogate Key • Pemakaian kunci pengganti untuk mengantisipasi perubahan nilai kunci – Penggantian nama, nomor induk, kode, dsb. – Masalah daur ulang kode atau nomor yang sudah tidak digunakan. • Nilai kunci pengganti adalah nomor unik yang diciptakan oleh sistem • Nilai kunci aslinya disimpan sebagai atribut dalam tabel dimensi. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 47 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Surrogate Key Example NAMA NIP TGL_LAHIR ALAMAT DEPT Andi Matalata Nana Suryana Sujono Ahmad Qadri Edi Harahap Hermanto Ferdi Silalahi Frans Jaelani 123456789 333445555 999887777 987654321 666884444 453453453 987987987 888665555 09-JAN-75 08-DEC-65 19-JUL-58 19-JUN-72 15-SEP-62 31-JUL-69 29-MAR-69 10-NOV-67 Jl. Jl. Jl. Jl. Jl. Jl. Jl. Jl. 5 5 4 4 5 5 4 1 key pengganti Kelinci 33 Kapuk 17 Duren 20 Sawah 4A Anggrek 3 Sawo 15 Mawar 23 Rawa 15 key asli KEY_PEG NAMA NIP TGL_LAHIR ALAMAT DEPT 010234 010456 010478 020125 020136 020167 030224 030350 Andi Matalata Nana Suryana Sujono Ahmad Qadri Edi Harahap Hermanto Ferdi Silalahi Frans Jaelani 123456789 333445555 999887777 987654321 666884444 453453453 987987987 888665555 09-JAN-75 08-DEC-65 19-JUL-58 19-JUN-72 15-SEP-62 31-JUL-69 29-MAR-69 10-NOV-67 Jl. Kelinci 33 Jl. Kapuk 17 Jl. Duren 20 Jl. Sawah 4A Jl. Anggrek 3 Jl. Sawo 15 Jl. Mawar 23 Jl. Rawa 15 5 5 4 4 5 5 4 1 GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 48 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Slowly Changing Dimensions • Jenis perubahan insidentil pada tabel dimensi: – Tipe 1: Koreksi kesalahan • Misal: Kesalahan tulis nama pelanggan. – Tipe 2: Pergantian status • Misal: Dari status membujang ke status menikah. – Tipe 3: Nilai atribut ganda/paralel • Misal: Jabatan rangkap karyawan. • Proses updating dilakukan saat full refresh (maintenance) GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 49 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Type 1 Changes • Tipe 1: Koreksi Kesalahan • Karakteristik: – Nilai lama yang salah digantikan dengan nilai baru. – Perubahan terjadi pada aplikasi sumber data tanpa mengubah status record data yang bersangkutan. – Nilai lama tidak diperlukan lagi oleh aplikasi sumber data maupun DW. • Implementasi: – Nilai lama dalam tabel dimensi dibuang dan digantikan dengan nilai baru. – Tidak ada perubahan lain di tabel fakta dan dimensi. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 50 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Type 1 Change Example Dimensi: PELANGGAN Nama: Dony Wijaya Nama: Donnie Wijaya Alamat: Jl. Salemba Raya 4 Alamat: Jl. Salemba Raya 4 Cust ID: 9901245 Cust ID: 9901245 Koreksi kesalahan nama GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 51 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Type 2 Changes • Tipe 2: Perubahan Status • Karakteristik: – Perubahan status record pada aplikasi sumber data: nilai atribut baru menandai periode historis baru (periode historis berganda). – Nilai lama harus tetap disimpan sebagai data historis DW. • Implementasi: – Tambahkan record baru dalam tabel dimensi dengan nilai atribut baru (atribut yang lain sama dengan record lama) ... GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 52 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Type 2 Changes (2) • Implementasi: – Tambahkan record baru dalam tabel dimensi dengan nilai atribut baru (atribut yang lain sama dengan record lama). – Jika surrogate key digunakan, record baru ini mendapat surrogate key baru. – Tambahkan atribut berlaku_mulai dan berlaku_ sampai dalam tabel dimensi (jika belum ada) – Tulis tanggal berlakunya perubahan (pada record baru) dan tanggal tidak berlaku (pada record lama/sebelumnya) GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 53 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Type 2 Change Example Key Pelanggan: 100237 Kode Pelanggan: N203077 Nama: Nia Daniati Status Nikah: tidak Alamat: Jl. Salemba Raya 7 Kode Pos: Jakarta 12345 1 Key Pelanggan: 101724 Kode Pelanggan: N203077 Nama: Nia Darmawan Status Nikah: menikah Alamat: Jl. Salemba Raya 7 Kode Pos: Jakarta 12345 Berlaku Mulai: 10-07-2002 Berlaku Sampai: 04-01-2003 2 Perubahan status record dimensi PELANGGAN: 3 periode historis untuk pelanggan yang sama GASAL 2008/2009 Key Pelanggan: 102015 Kode Pelanggan: N203077 Nama: Nia Darmawan Status Nikah: menikah Alamat: Jl. Barito 26 Kode Pos: Jakarta 14202 Berlaku Mulai: 05-01-2003 PERANCANGAN BASIS DATA (KP130) HAL : 54 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Type 3 Changes • Tipe 3: Nilai Atribut Paralel • Karakteristik: – Biasanya disebabkan oleh perubahan sementara nilai atribut pada aplikasi sumber data. – Nilai baru dan nilai lama masih digunakan/diperlukan baik oleh aplikasi sumber data maupun DW. • Implementasi: – Tambahkan kolom nilai_lama dalam tabel dimensi, dan pindahkan nilai yang lama ke kolom ini. – Masukkan nilai baru pada kolom nilai aslinya. – Jika perlu tambahkan/pakai kolom berlaku_mulai untuk mencatat tanggal berlakunya perubahan. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 55 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Type 3 Change Example Dimensi: Salesman Sales Key: 101724 Sales Code: AM203 Nama: Arman Munawar Wilayah: Jakarta Pusat Daerah: DKI Jakarta Sales Key: 101724 Sales Code: AM203 Nama: Arman Munawar Wilayah Lama: Jakarta Pusat Wilayah: Jakarta Selatan Daerah: DKI Jakarta Nilai atribut ganda/paralel GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 56 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Rapidly Changing Dimensions • Problem: – Dimensi yang sering dan banyak berubah. – Perubahan pada tabel-tabel dimensi besar (misal: dimensi customer dengan jutaan records) akan sangat tidak efisien. • Implementasi: – Bagi/partisi tabel dimensi menjadi dua (atau lebih) dimensi dengan mengeluarkan atribut-atribut yang sering berubah ke tabel dimensi baru. – Tambahkan kunci primer tabel dimensi baru tersebut ke tabel fakta sebagai kunci eksternal. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 57 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Partitioned Dimension PELANGGAN Key Pelanggan Nama Alamat Kode Pos Telp sebelum PELANGGAN Key Pelanggan Nama Alamat Kode Pos Telp PENJUALAN Key Pelanggan Metrics tabel fakta GASAL 2008/2009 sesudah PERILAKU Key Perilaku Key Pelanggan Rating Kredit Status Nikah Range Pembelian Tingkat Penghasilan Kepemilikan Rumah PERANCANGAN BASIS DATA (KP130) statis PENJUALAN Key Pelanggan Key Perilaku Metrics banyak berubah HAL : 58 PERTEMUAN 14 – KASUS DATA WAREHOUSE DATABASE Slowly-Changing Dimension Policy • Tidak semua perubahan pada nilai atribut harus/dapat diperlakukan sebagai perubahan tipe 2 atau tipe 3. • Spesifikasi kebutuhan menentukan atribut-atribut mana yang harus menerapkan pencatatan perubahan tipe 2 dan tipe 3. • Perubahan pada atribut-atribut lainnya diperlakukan sebagai perubahan tipe 1: dilakukan dengan operasi overwrite. GASAL 2008/2009 PERANCANGAN BASIS DATA (KP130) HAL : 59