Survey
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
Data Warehouse Day 3 Day 2 Review / Recall What are the 4 key characteristics of Data Warehouse ? Explain them ! Define a Independent and a dependent Data Mart ! Name the distinctions between Data Warehouses and Data Marts ! What are the most common schema designs ? What different kind of data are in a Data Warehouse ? Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 1 Data Warehouse and Analysis Where we are ? Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 2 Data Warehouse and Analysis Where we are ? Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 3 Data Warehouse and Analysis Where we are ? Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 4 Data Warehouse and Analysis Analysewerkzeuge: Darstellung Tabellen • Pivot-Tabellen := Kreuztabellen • Analyse durch Vertauschen von Zeilen und Spalten • Veränderung von Tabellendimensionen • Schachtelung von Tabellendimensionen (Integration weiterer Dimensionen) Graphiken • Bildliche Darstellung großer Datenmengen - Wuerfel • Netz-, Punkt-, Oberflächengraphen Text und Multimedia-Elemente • Ergänzung um Audio- oder Videodaten • Einbeziehung von Dokumentenmanagementsystemen Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 5 Data Warehouse and Analysis Analysewerkzeuge: Darstellung - Pivot Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 6 Data Warehouse and Analysis Analysewerkzeuge: Realisierung Standard Reporting: • Reporting-Werkzeuge des klassischen Berichtswesens Berichtshefte: • Graphische Entwicklungsumgebungen zur Erstellung von Präsentationen von Tabellen, Graphiken, etc. Ad-hoc Query & Reporting: • Werkzeuge zur Erstellung und Präsentation von Berichten • Verbergen von Datenbankanbindung und Anfragesprachen Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 7 Data Warehouse and Analysis Analysewerkzeuge: Realisierung II Analyse-Clients: • Werkzeuge zur mehrdimensionalen Analyse • beinhalten Navigation, Manipulation (Berechnung), erweiterte Analysefunktionen und Präsentation Spreadsheet Add-Ins: • Erweiterung von Tabellenkalkulationen für Datenanbindung und Navigation Entwicklungsumgebungen: • Unterstützung der Entwicklung eigener Analyseanwendungen • Bereitstellung von Operationen auf multidimensionalen Daten Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 8 Data Warehouse and Analysis Werkzeuge fuer Entscheider • Report- u. Abfragegeneratoren • Statistik • Dokumenten-Retrieval • aktive Informationsfilter • Prozeßmodellierung • geographische Informationssysteme • Führungsinformation • Entscheidungsunterstützung • Abteilungsspezifische Tools • industriespezifische Tools • Online Analytical Processing • Data Mining Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 9 Data Warehouse and Analysis Online Analytical Processing (OLAP) dynamische, multidimensionale Analyse von Daten mit dem Ziel der Aufdeckung neuer oder unerwarteter Beziehungen zwischen Variablen Typische Fragestellungen: • „Mit welchem Produkt wird der größte Umsatz in einer Region gemacht ?“ •„Wie verhält sich der Umsatz im Vergleich zum letzten Jahr?“ Ansatz: • multidimensionale Sichtweise auf Daten • Anpassung des Datenmodells • Präsentationsunterstützung Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 10 Data Warehouse and Analysis OLAP - Coddsche Regeln E.F. Codd (1993): Anforderungen an OLAP-Werkzeuge 1. Multidimensionale konzeptionelle Sichtweise • Betrachtung von (betriebwirtschaftlichen) Kenngrößen aus Sicht verschiedener Dimensionen 2. Transparenz • bzgl. Zugriff auf Daten aus unterschiedlichen Quellen 3. Zugriffsmöglichkeit • interne und externe Quellen 4. Gleichbleibende Antwortzeit bei der Berichterstellung • Antwortzeit unabhängig von der Anzahl der Dimensionen und des Datenvolumens Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 11 Data Warehouse and Analysis OLAP - Coddsche Regeln II E.F. Codd (1993): Anforderungen an OLAP-Werkzeuge 5. Client-Server-Architektur • Trennung von Speicherung, Verarbeitung, Präsentation • offene Schnittstelle zum OLAP-Server 6. Generische Dimensionalität • einheitliche Behandlung aller Dimensionen • aber -> spezielle Zeitdimensionen 7. Dynamische Behandlung dünn besetzter Matrizen • Anpassung des physischen Schemas an die Dimensionalität und Datenverteilung (sparsity) 8. Mehrbenutzer-Unterstützung • konkurrierende Zugriffe • Sicherheits- und Integritätsmechanismen, Zugriffsrechte Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 12 Data Warehouse and Analysis OLAP - Coddsche Regeln III E.F. Codd (1993): Anforderungen an OLAP-Werkzeuge 9. Uneingeschränkte kreuzdimensionale Operationen • automatische Ableitung der Berechnungen, die sich aus den Hierarchiebeziehungen der Dimensionen ergeben (Aggregationen) • Definition eigener Berechnungen 10. Intuitive Datenbearbeitung • ergonomische, intuitive Datenbearbeitung • Navigation über Daten, Ausrichtung von Konsolidierungspfaden 11. Flexible Berichterstellung • Erstellung von Berichten mit beliebiger Datenanordnung 12. Unbegrenzte Anzahl von Dimensionen und Ebenen • keine Einschränkungen der Anzahl der unterstützten Dimensionen (häufig jedoch max. 5-8) Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 13 Data Warehouse and Analysis OLAP - Definition FASMI (Fast Analysis of Shared Multidimensional Information) • Es soll ein schneller Zugriff (nicht länger als 20 Sekunden) selbst bei aufwendigen Abfragen möglich sein. • Datenanalysen sollen mit Hilfe von statistischen Verfahren und Geschäftslogik durchführbar sein. • Die OLAP-Datenbasis muß von mehreren Benutzern gleichzeitig genutzt werden können. • Für den Benutzer sollen alle von ihm benötigten Daten, unabhängig von Menge oder Herkunft, bereitgestellt werden. Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 14 Data Warehouse and Analysis OLAP - FASMI II • Die konzeptionelle Sicht auf die Daten muß von mehrdimensionaler Natur sein. - physischer multidimensionaler Datenstruktur - virtuellen Multidimensionalität der Datenbank * beruht auf einer relationalen Datenhaltung in denormalisierter Form (Star- bzw. Snowflake-Schema) • Unter einer multidimensionalen Datenstruktur ist die Darstellung von Daten anhand von mehrdimensionalen Datenwürfeln zu verstehen und nicht wie im relationalen Datenmodell in zweidimensionalen Tabellen. Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 15 Data Warehouse and Analysis OLAP - Sources 1. Operational System 2. Warehouse a) Relational b) Multidimensional Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 16 Data Warehouse and Analysis OLAP - Architectures ROLAP Relational On Line Analytical Processing • relationale Datenspeicherung - Tabellenform MOLAP Multidimensional On Line Analytical Processing • multidimensional Datenspeicherung, n-dimensionaler Würfel (n-dim data cube) HOLAP Hybrid On Line Analytical Processing • Speicherung eines Teils des DWH’s in Form von Würfeln (Performance), bei miss-hit wird aus relationalen RDBMS ein neuer Würfel generiert. DOLAP Desktop On Line Analytical Processing • Analysesoftware und Datenspeicherung erfolgt auf der Clientseite Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 17 Data Warehouse and Analysis OLAP - ROLAP Presentationschicht (Clientseite) API Visualisierung durch multidimensionale Kreuztabellen, Reports, Top10 Ranking, Business Charts, etc. Dynamische Berichte mit OLAP Funktionalität Ben Martin Operationale Datenbankschicht Applikationsschicht Summary Tabels (Serverseite) Applikationsserver SQL Data Warehouse Metadaten multidimensional modelliertes DWH, basierend auf einem relationalen Datenbanksystem BA Lörrach, WI 4.Semester 4/21/2002 operationale Datenbestände, legacy systeme, externe Datenquellen, Benchmarking, Börsendienste, etc. Business Intelligence/Data Warehouse, 18 Data Warehouse and Analysis OLAP - ROLAP Eigenschaften relationale Datenbank als Datenbasis für die OLAP Analyse • multidimensionale Sichten (views) durch tabellarische Aufbereitung der Daten, mittels standard SQL Abfragen (multidimensionalen Anfragen - GROUP-BYErweiterungen CUBE-Operator) • Multidimensionale Erweiterungen: MDX, OLE DB for OLAP (Microsoft), Oracle Express, Discoverer • basieren auf relationalem Starschema (oder Snowflake Schema) mit Facts, Dimensions • Vorberechnete Summary Tables (materialized views) verbessern die Performance Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 19 Data Warehouse and Analysis OLAP - ROLAP Vorteile und Nachteile • Verwendet robuste (bereits bewährte) relationale Datenbanken • Verständlicher (DBA) Datenzugriff (nur SQL) • Datenimport • Sicherheitsmechanismen bestehen bereits (auf relationaler Ebene) • Große Datenmengen (größer als 100 Gbyte) Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 20 Data Warehouse and Analysis OLAP - MOLAP Presentationschicht (Clientseite) API Visualisierung durch multidimensionale Kreuztabellen, Reports, Top10 Ranking, Business Charts, etc. Dynamische Berichte mit OLAP Funktionalität Ben Martin Operationale Datenbankschicht Applikationsschicht (Serverseite) Applikationsserver Metadaten MQL SQL Multidimensionale Datenbank DWH in Form von Würfeln physikalisch gespeichert, intelligente Indexstrategie BA Lörrach, WI 4.Semester 4/21/2002 operationale Datenbestände, legacy systeme, externe Datenquellen, Benchmarking, Börsendienste, etc. Business Intelligence/Data Warehouse, 21 Data Warehouse and Analysis OLAP - MOLAP Eigenschaften • Multidimensionale Datenbank für effiziente Speicherung von multidimensionale OLAP Abfragen • multidimensionale Sicht durch Aufbereitung der Daten in einem n-dimensionalen Würfel • multidimensionales Datenmodell -> Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 22 Data Warehouse and Analysis OLAP - MOLAP Vorteile und Nachteile + Performance bei kleineren Datenmengen ( < 10 Gbyte) + Meist eigene multidimensionale Abfragesprache (verständlicher als SQL) + Hinzufügen von Dimensionen und Hierarchien ist leichter +/- Problematik von dünnbesetzten Würfel muß gelöst werden - Eingeschränkte Datenmengen (Performance sinkt) - multidimensionale Abfragesprache -> Transformation Standard SQL notwendig - Nicht jeder mögliche Datenwürfel kann vorberechnet werden. - Bei miss-hit muß auf dahinterliegendes relationale RDBMS zugegriffen werden. Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 23 Data Warehouse and Analysis OLAP - HOLAP Presentationschicht (Clientseite) API Visualisierung durch multidimensionale Kreuztabellen, Reports, Top10 Ranking, Business Charts, etc. Dynamische Berichte mit OLAP Funktionalität Ben Martin Applikationsschicht (Serverseite) Applikationsserver Operationale Datenbankschicht MQ L Metadaten Data Warehouse BA Lörrach, WI 4.Semester 4/21/2002 operationale Datenbestände, legacy systeme, externe Datenquellen, Benchmarking, Börsendienste, etc. Business Intelligence/Data Warehouse, 24 Data Warehouse and Analysis OLAP - HOLAP Eigenschaften • Nutzt die Vorteile der relationalen als auch multidimensionalen OLAP Anwendung • multidimensonale Datenbank wird für häufige Abfragen erstellt • multidimensionale Data Marts • hochaggregierte Daten - schnelle Antwortzeit • relationale Datenbank wird für seltenere Abfragen verwendet große Mengen an Daten Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 25 Data Warehouse and Analysis OLAP - HOLAP Vorteile und Nachteile + Vereinigt das beste aus den beiden (ROLAP && MOLAP) Welten + MDDB System greift nicht mehr auf die operationalen Daten zu, sondern auf ein relationales DWH + keine Summary Tabelen (Problem DWH Maintenance !) mehr notwendig - Aufwendige Architekturkonzept, unterschiedliche Technologien werden vermischt Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 26 Data Warehouse and Analysis OLAP - DOLAP Operationale Datenbankschicht Presentationschicht (Clientseite) API Applikationsserver ODBC PC-DBMS Extrakt aus einem DWH oder operationalen Datenbeständen Metadaten Visualisierung durch multidimensionale Kreuztabellen, Reports, Top10 Ranking, Business Charts, etc. Dynamische Berichte mit OLAP Funktionalität Ben Martin oft wird auch ein spezielle Filestruktur als Datenbasis für den DOLAP Applikationsserver generiert. BA Lörrach, WI 4.Semester 4/21/2002 operationale Datenbestände, legacy systeme, externe Datenquellen, Benchmarking, Börsendienste, etc. Business Intelligence/Data Warehouse, 27 Data Warehouse and Analysis OLAP - DOLAP Eigenschaften • Speicherung der Daten am Client (PC) • OLAP Applikations- und Datenbankserver laufen auf der Clientseite • Antwortzeit wird gering gehalten (kein Kommunikationsoverhead durch Netzwerk) • begrenzte Kapazität (PC Datenbank, Ressourcen) • Endanwender wird ein Auszug aus dem zentralen Data Warehouse auf seinen Client gestellt. Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 28 Data Warehouse and Analysis OLAP - DOLAP Vorteile und Nachteile + Für kleinere klar abgegrenzte Anwendungsgebiete gut geeignet + Sicherheit kann gewährleistet werden, DWH (DBA) Administrator steuert die Erstellung der Extrakte für die einzelnen Endanwender - Endanwender sieht zumeist nur einen Ausschnitt aus dem zentralen Data Warehouse, Analysen könnten dadurch falsch interpretiert werden - Anwendungen sind oft alte Reportgeneratoren (statische Berichte) mit hinzugefügter OLAP Funktionalität - Anwendungen verwenden zum Teil keine Datenbank, sondern erzeugen eine Filestruktur auf dem Client - Oft greifen DOLAP Anwendungen direkt auf die operationalen Datenbestände zu. Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 29 Data Warehouse and Analysis OLAP - Multidimensionales Datenmodell • Datenmodell ausgerichtet auf Unterstützung der Analyse • Datenanalyse im Entscheidungsprozeß - Betriebswirtschaftliche Kennzahlen (Erlöse, Gewinne, Verluste, etc.) stehen im Mittelpunkt - Betrachtung der Kennzahlen aus unterschiedlichen Perspektiven (zeitlich, regional, produktbezogen) -> Dimensionen - Unterteilung der Auswertedimensionen möglich (Jahr, Quartal, Monat) -> Hierarchien oder Konsolidierungsebenen Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 30 Data Warehouse and Analysis OLAP - Multidimensionales Datenmodell II Kennzahlen/Fakten (engl. facts): • (verdichtete) numerische Meßgrößen • Beschreiben betriebswirtschaftliche Sachverhalte • Beispiele: Umsatz, Gewinn, Verlust, Deckungsbeitrag Typen: • Additive Fakten: (additive) Berechnung zwischen sämtlichen Konsolidierungsebenen der Dimensionen möglich, z.B. Einkaufswert • Semi-additive Fakten: (additive) Berechnung nur für ausgewählte Menge von Hierarchieebenen, z.B. Lagerbestand • Nicht-additive Fakten: keine additive Berchnung möglich, z.B. Durchschnitts- oder prozentuale Werte Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 31 Data Warehouse and Analysis OLAP - Multidimensionales Datenmodell III Dimension: • beschreibt mögliche Sicht auf die assoziierte Kennzahl • endliche Menge von Dimensionselementen (Hierarchieobjekten), die eine semantische Beziehung aufweisen • dienen der orthogonalen Strukturierung des Datenraums • Hierarchien in Dimensionen: einfach und parallel - Examples ? Beispiele: Produkt, Geographie, Zeit Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 32 Data Warehouse and Analysis OLAP - Multidimensionales Datenmodell IV Würfel (engl. cube, eigentlich Quader): • Grundlage der multidimensionalen Analyse • Kanten -> Dimensionen • Zellen -> ein oder mehrere Kennzahlen (als Funktion der Dimensionen) • Anzahl der Dimensionen -> Dimensionalität Visualisierung • 2 Dimensionen: Tabelle • 3 Dimensionen: Würfel • >3 Dimensionen: Multidimensionale Domänenstruktur Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 33 Data Warehouse and Analysis OLAP - Cube Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 34 Data Warehouse and Analysis OLAP - Cube Example Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 35 Data Warehouse and Analysis OLAP - Operationen auf multidimensionalen Datenstrukturen Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 36 Data Warehouse and Analysis OLAP - Operationen auf multidimensionalen Datenstrukturen Standardoperationen • Pivotierung • Roll-Up, Drill-Down • Drill-Across • Slice, Dice Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 37 Data Warehouse and Analysis OLAP - Operationen - Pivotierung/Rotation Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 38 Data Warehouse and Analysis OLAP - Operationen -Drill/Roll-Up Beispiel: Land->Staat->Region Tag -> Monat -> Quartal -> Jahr • Beim Drill-/Roll-up werden die Werte auf der nächst höheren Hierarchieebene analysiert • Dimensionalität bleibt erhalten Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Dimension REGION Business Intelligence/Data Warehouse, 39 Data Warehouse and Analysis OLAP - Operationen -Drill-Down / Across • komplementär zu Roll-Up • Navigation von aggregierten Daten zu Detail-Daten entlang der Klassifikationshierarchie • Untersuchen der Daten in einem feineren Detaillierungsgrad innerhalb einer Dimension Dimension REGION • Untersuchen von Detaildaten Drill-Across: • Wechsel von einem Würfel zu einem anderen Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 40 Data Warehouse and Analysis OLAP - Operationen - Roll-Up, Drill-Down Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 41 Data Warehouse and Analysis OLAP - Operationen - Slice Erzeugen individueller Sichten Slice: • Herausschneiden von „Scheiben“ aus dem Würfel • Verringerung der Dimensionalität • Beispiel: alle Werte des aktuellen Jahres Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 42 Data Warehouse and Analysis OLAP - Operationen - Slice Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 43 Data Warehouse and Analysis OLAP - Operationen - Slice - Beispiel Regionale Sicht z.B. Gebietsleiter Region Region Produkt Sicht z.B. Produktmanager Produkt Produkt alle Regionen gesamter Zeitraum ein Produkt (Filter) Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 alle Produkte gesamter Zeitraum eine Region (Filter) Business Intelligence/Data Warehouse, 44 Data Warehouse and Analysis OLAP - Operationen - Dice Erzeugen individueller Sichten Dice: • Herausschneiden einen „Teilwürfels“ • Erhaltung der Dimensionalität, Veränderung der Hierarchieobjekte • Beispiel: die Werte bestimmter Produkte oder Regionen Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 45 Data Warehouse and Analysis OLAP - Operationen - Dice - Example Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 46 Data Warehouse and Analysis OLAP - Analyse-Werkzeuge • Business Objects: Business Objects • Cognos: Powerplay, BI Platform •Hyperion: Hyperion OLAP Essbase • IBM: Visualizer • Informix: Metacube • Seagate: Holos, Seagate Info • Oracle: Express Server • Brio: Brio Enterprise • Arcplan Information Servies: inSigth, dynaSight Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 47 Data Warehouse and Analysis Data Mining and the Sept. 11th ? • Applied Systems Intelligence (ASI): - eine Global Information Base, die feindliche Operationen automatisch aufspüren soll • Nips, ein Numerically Integrated Profiling System - stellt Verbindungen zwischen Bankgeschäften und Reiseaktivitäten her • Choice Point - verkauft Kundendaten an das FBI • Nora (Non-Obvious Relationship Awareness) - Reservierungen für Flüge, Hotels und Mietwagen - Informationen aus über 4000 Quellen, in denen Daten von über einer Million Menschen zusammenlaufen - Datenmuster eines Passagiers mit dem eines Elements auf der Liste der bad guys überein - Alarm am Ticketschalter Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 48 Data Warehouse and Analysis Data Mining - Definition • Der Begriff Data Mining steht für das Suchen nach wertvollen Geschäftsinformationen in einer großen Datenbank und für „das Graben nach einer wertvollen Informationsader.“ • Data Mining kann als Teilprozess des Knowledge Discovery angesehen werden • Knowledge Discovery ist ein neuer Begriff in der Data Warehouse-, OLAP und Data Mining Problematik. • Er bezeichnet den gesamten Entdeckungsprozeß ausgehend von der Formulierung einer Frage bis zur Interpretation der Ergebnisse. • Data Mining ist der „Kunde“ im Data Warehouse Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 49 Data Warehouse and Analysis Data Mining - Knowledge Discovery in Databases (KDD) Iterativer und interaktiver Prozeß 1. Festlegung von Problembereich und Zielen 2. Datensammlung und –bereinigung 3. Auswahl und Parametrisierung der Analysefunktionen und –methoden 4. Data Mining/Mustererkennung 5. Bewertung und Interpretation der Ergebnisse 6. Nutzung des gefundenen Wissens Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 50 Data Warehouse and Analysis Data Mining - Data Warehouse - Kunde Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 51 Data Warehouse and Analysis Data Mining - Data Warehouse - Donator Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 52 Data Warehouse and Analysis Data Mining - Verfahren • Erkennung von Abhängigkeiten: - Aufdeckung statistischer Abhängigkeiten zwischen Variablen relevanter Datensätze -> Assoziationsregeln, Wahrscheinlichkeitsnetze - Bsp.: Warenkorbanalyse • Klassifikation: - Zuordnung von Objekten zu verschiedenen vorgegebenen Klassen - Ableitung des Klassifikationsmodells aus einer Trainingsmenge - Bsp.: Kundenklassifkation bzgl. Schadensrisiko Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 53 Data Warehouse and Analysis Data Mining - Verfahren II Clustering: - Einordnung ähnlicher Objekte in neu gebildete Gruppen daß Ähnlichkeit innerhalb der Gruppen möglichst groß sowie zwischen Gruppen möglichst gering - Bsp.: Segmentierung von Kunden im Marketing Generalisierung: - Methoden zur Aggregation und Verallgemeinerung großer Datenmengen auf höherer Abstraktionsebene - Bsp.: interaktive Datenexploration Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 54 Data Warehouse and Analysis Data Mining - Verfahren III Sequenzanalyse: • Suche nach häufig auftretenden Episoden oder Ereignisfolgen in Datenbeständen mit (zeitlicher) Ordnung • Bsp.: Clickstream-Analyse Regression: • Ermittlung des Ursache-Wirkung-Zusammenhangs zwischen einzelnen Merkmalen • Bsp.: Entwickung von Aktienkursen Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 55 Data Warehouse and Analysis Data Mining - Verfahren - Beispiele (Clickstream) Cognos PowerPlay • Clickstream-Verhalten der Besucher Ihrer Website nachvollziehen und multidimensional analysieren. Antworten und Ergebnisse zu Fragestellungen wie: • Welches Unternehmen besuchte meine Website? • Für welche Web-Seiten interessieren sich meine Kunden besonders? • Wie navigiert der Besucher durch meine Web-Seiten? • Wie lange hält sich der Besucher auf den einzelnen Web-Seiten auf? • Wann wird meine Website am häufigsten besucht? Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 56 Data Warehouse and Analysis Data Mining - Verfahren - Beispiele (Clickstream) Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 57 Data Warehouse and Analysis Data Mining - Verfahren - Beispiele (Clustering) Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 58 Data Warehouse and Analysis Data Mining - Verfahren - Beispiele (Klassifikationen) Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 59 Data Warehouse and Analysis Data Mining - Verfahren - Beispiele (Assoziationsregeln) Ableitung von Regeln aus Itemsets: „Wenn ein Kunde Milch kauft, dann kauft er auch Butter.“ ! Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 60 Data Warehouse and Analysis Data Mining - Verfahren - Beispiele (Decision Tree) Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 61 Data Warehouse and Analysis Data Mining - Verfahren - Beispiele (weitere) Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 62 Data Warehouse and Analysis Data Mining Weitere Anwednungen Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 63 Data Warehouse and Analysis Data Mining - Weitere Methoden und Techniken Aktienkurse, Bildauswertung, Biometrie, Meteorolgie Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 64 Data Warehouse and Analysis Data Mining - Weitere Methoden und Techniken Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 65 Data Warehouse and Analysis Data Mining - What it does • Discovers facts and data relationship • find patterns - Examples ? • determines rules - Examples ? • Retains and reuses rules - Example ? • Present Information for the users • may take many hours • needs little human intervention (Einmischung) • but requires knowledgeable people to analyze results ! Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 66 Data Warehouse and Analysis Data Mining - What it does Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 67 Data Warehouse and Analysis Data Mining and OLAP Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 68 Data Warehouse and Analysis Data Mining Tools - Kriterien Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 69 Data Warehouse and Analysis Data Mining Tools - Kriterien II Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 70 Data Warehouse and Analysis Data Mining Tools - Kriterien III Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 71 Data Warehouse and Analysis Data Mining Tools - Kriterien IV Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 72 Data Warehouse Projects The Business Case for a Data Warehouse - Example Wal * Mart (www.wal-mart.com) • Marktführer im amerikanischen Einzelhandel • Unternehmensweites Data Warehouse - Größe: ca. 25 TB - Täglich bis zu 20.000 DW-Anfragen - Hoher Detaillierungsgrad (tägliche Auswertung von Artikelumsätzen, Lagerbestand Kundenverhalten) - Basis für Warenkorbanalyse, - Kundenklassifizierung, ... Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 73 Data Warehouse Projects The Business Case for a Data Warehouse - Example II • Überprüfung des Warensortiments zur Erkennung von Ladenhütern oder Verkaufsschlagern • Standortanalyse zur Einschätzung der Rentabilität von Niederlassungen • Untersuchung der Wirksamkeit von Marketing-Aktionen • Auswertung von Kundenbefragungen, Reklamationen bzgl. Bestimmer Produkte etc. • Analyse des Lagerbestandes • Warenkorbanalyse mit Hilfe der Kassenbons Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 74 Data Warehouse Projects The Business Case for a Data Warehouse - Example III Beispiel einer Anfrage: Welche Umsätze sind in den Jahren 1998 und 1999 in den Abteilungen Kosmetik, Elektro und Haushaltswaren in den Bundesländern Sachsen-Anhalt und Thüringen angefallen ? Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 75 Data Warehouse Projects The Business Case for a Data Warehouse - Example IV Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 76 Data Warehouse Projects The Business Case for a Data Warehouse - Example V Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 77 Data Warehouse Projects The Business Case - ROI “Data Warehousing, often described as the ‘holy grail’ that will lead companies to success through a better understanding of their business, is delivering on it’s promise …” Average Three Year ROI: Enterprise Data Warehouse ROI - 322% Discrete Data Warehouse ROI - 533% Source International Data Corporation Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 78 Data Warehouse Projects The Business Case for a Data Warehouse Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 79 Data Warehouse Projects The Business Case DWH A well rounded and complete Business Case should include a picture of: • the likely Benefits to the company • an indication of the Costs of the solution: both initial and year on year • an indication of the Risks, together with any risk mitigation (Minderung) Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 80 Data Warehouse Projects The Business Case DWH - Benefits Categorizing • Tangible (greifbare) Benefits: - cost savings associated with the cost reduction in OLTP - DWH will remove the need to update the old mainframe • Intangible Benefits: - e.g. organization decisions making capabilities being enhanced Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 81 Data Warehouse Projects The Business Case DWH - Benefits Categorizing by Objectives (Zielen) • increased revenue (Einkuenfte) • decreased costs Quantifying the Benefits • Time - reducing cycle time to perform and activity • Quantity - e.g. Reduced customer defection by 5% within 1 year to doubled profit • Quality - e.g. Increased Staff satisfaction = increased customer satisfaction = reduction in churn (Beschwerde) = savings in acquisition costs Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 82 Data Warehouse Projects The Business Case for a DWH - Costs Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 83 Data Warehouse Projects The Business Case for a DWH - Costs II Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 84 Data Warehouse Projects The Business Case for a DWH - Risks Business Environment • political and cultural world within which the company operates - dependencies to other companies (network, merger, acquisitions) - corporate strategy changes - departmental politics • Effective sponsorship • change of the organization itself brought about by the Warehouse Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 85 Data Warehouse Projects The Business Case for a DWH - Risks Technical Environment • new technologies vers old • technical surprises • lack of understanding the source system • interfaces to other systems Project Risks Project Management !!! • resources ?! • Inter project dependencies Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 86 Data Warehouse Projects Overwiev - Die Andersartigkeit des DW-Projektes • Durch die Größe der Datenbasis müssen frühzeitig Überlegungen der Datenbankadministration und Performancesicherung mit einbezogen werden • Auch dem effizienten Import der Daten muss viel Zeit gewidmet werden • Flexible Architektur nötig, da kein Unternehmen seinen künftigen Informationsbedarf voraussehen • DW muss so aufgebaut werden, dass es sich ständig verändern kann • Gefahr beim Wasserfall-Modell: Paralyse durch Analyse; man wird nie mit analysieren fertig und setzt somit nie um Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 87 Data Warehouse Projects Overwiev - Die Andersartigkeit des DW-Projektes II • Ein DW ist i.d.R. breit angelegt und umfaßt meist große Datenbanken mit über 100 Gbyte - Fehler im System-/HW-Aufbau ‚rächen‘ sich unmittelbar • Die Anforderungen an ein DW sind i.d.R. nur sehr unvollständig definierbar und ändern sich zudem im Laufe der Zeit - Damit steigt die Gefahr einer ständigen Veränderung der Anforderungen ohne Fertigstellung „Paralyse durch Analyse“ • Oftmals werden im Zusammenhang mit einem DW auch die Geschäftsprozesse überarbeitet • Zeitliche Dimension: 18-24 Monate Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 88 Data Warehouse Projects Project Management Methods Why ? Success is composed of: • On time delivery, within budget costs • contracted functionality delivered • happy clients ! Which ? • E.g. Oracle: Data Warehouse Method • e.g. Roche: Price Waterhouse Coopers Summit D • In-house used Methods Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 89 Data Warehouse Projects Project Management - Tasks • Control and Reporting - determine scope and approach (Zweck) of the project - manage change and control risks - report progress status externally - control the quality plan • Work Management - define, monitor and direct all work performed on the project - financial view of the project Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 90 Data Warehouse Projects Project Management - Tasks II • Resource Management - helps to provide the project with right level of staffing (Mitarbeiter) and skills • Quality Management - implement quality measures to verify the project meets the client’s purpose • Configuration Management - store, organize, track and control all documents and deliverables - Computerized System Validation Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 91 Data Warehouse Projects Project Management - Phases Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 92 Data Warehouse Projects Project Management - Phases - Strategy Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 93 Data Warehouse Projects Project Management - Phases - Strategy II • focus: understanding the business goals and initiatives • defining the purpose and objectives for the total DW solution (vision, big picture) • key outputs: defining the implementation and infrastructure development • business case with measurable objectives • DW architecture and technical architecture, strategies for each component of DW • Project Plan Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 94 Data Warehouse Projects Project Management - Phases - Definition Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 95 Data Warehouse Projects Project Management - Phases - Definition II • to define the scope and objectives for the incremental development effort while complying (vergleichen) with the enterprise vision • to create initial models • to document data sources • to define data quality • to create technical architecture and DW architecture for the scoped solution • tactical plans for addressing data acquisition, data access, DW administration, Training, meta data management Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 96 Data Warehouse Projects Project Management - Phases - Analysis Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 97 Data Warehouse Projects Project Management - Phases - Analysis II • to formulate the detailed requirements for the selected increment • focus is on the user’s information, data acquisition and data access requirements for business analysis and decision making • refresh cycles, data mappings • to produce relational and/or multidimensional modal as appropriate (angemessen) • requirements for hardware, software, network, backup and recovery (credit application !) Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 98 Data Warehouse Projects Project Management - Phases - Design Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 99 Data Warehouse Projects Project Management - Phases - Design II • to translate analysis phase requirements into detailed desing specifications while taking into account the technical architecture and available technologies • data acquisition and load modules are designed, data elements, levels of summarization and granularity are validated, data integrity is checked, metadata docuemented • data access, query, reporting components are defined • using the logical models, detailed data requirements data mappings, the physical structures for relational/ multidimensional metadata database objects are designed Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 100 Data Warehouse Projects Project Management - Phases - Build Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 101 Data Warehouse Projects Project Management - Phases - Build II • to create and test - the database structures, data acquisition modules, DW administration tools, metadata modules, data access modules, reports and queries - test scripts • to develop, integrate and test the increment before it is prepared for the transition phase • user and operation guides, technical and metadata references are produced • training database is developed, training material are completed Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 102 Data Warehouse Projects Project Management - Phases - Transition Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 103 Data Warehouse Projects Project Management - Phases - Transition II • to install the incremental solution • to prepare the client personnel to use and manage the solution • to go to production and begin managing the growth and maintenance of the Warehouse • Monitoring • user acceptance tests Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 104 Data Warehouse Projects Project Management - Phases - Discovery Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 105 Data Warehouse Projects Project Management - Phases - Discovery II • to identify and plan for the next increment • to select the next effort based on business need and DW infrastructure need • to evaluate the implemented increment and identify increment opportunities (Moeglichkeiten) • user/client involvement • “lessons learned” Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 106 Data Warehouse Projects Project Management - Processes Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 107 Data Warehouse Projects Project Management - Roles Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 108 Data Warehouse Projects Business Requirements Questions Answers Who defines the business benefit ? The Business Who derives the business benefit ? The Business Who holds the purse string ? The Business Who do we need to impress ? The Business Who needs a Data Warehouse ? IT ? Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 The Business ! Business Intelligence/Data Warehouse, 109 Data Warehouse Projects Business Requirements Definition Process • defines the requirements • clarifies the scope • establishes the implementation roadmap • with the direction of the client organization: - definition of strategic business goals and initiatives - used to direct the strategies, purpose and goals of the DWH solution Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 110 Data Warehouse Projects Business Requirements Definition Process II Early in the process: • the focus is on the enterprise aspect of the DW solution - information requirements - subject areas - implementation roadmap - business case Process continues … • scoping the solution to be developed and delivered • identifying the client’s information needs • modeling the requirements Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 111 Data Warehouse Projects Business Requirements II Analyze the business NOT the data ! - Identify the business events that are of interest - a single business event may result in a number of transactional records - some key events may be masked (verdeckt) or not recorded at all - the business meaning is critical - business meaning may also enforce operational requirements on the Warehouse Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 112 Data Warehouse Projects Business Requirements III Identify the types of users - to support their needs effectively • Monitor - status reports • Manager - overview • Investigator - identify meaning/reasons of anomalies, power drilling • Innovator - details, multi-step ananlysis • Communicator - identify, acquire and retain users Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 113 Data Warehouse Projects Solution Definition Strategies Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 114 Data Warehouse Projects Solution Definition Strategies II Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 115 Data Warehouse Projects Solution Definition Strategies III Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 116 Data Warehouse Projects Solution Definition Strategies IV • “Big Bang” • Independent Data Mart • Incremental Data Warehouse top- down • Incremental Data Warehouse bottom-up • Migration - Independent Data Mart Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 117 Data Warehouse Projects Solution Definition Strategies - „Big Bang“ • top-down “big bang” is a high risk • extended time to achieve business benefits • requirements will change during analysis • longer and deeper “valley of despair” • if the business is being re-engineered, the Data Warehouse may not have management focus • but having a “big picture” before starting a DW (vision) Clients: • start-up (e-) business where IT is the key enabler (Amazon.com) • organizations where information is seen as critical • the foolish ! Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 118 Data Warehouse Projects Solution Definition Strategies - Independent Data Marts + low entry costs + fast to accrue (zufallen) business benefits + Adopted easily be LOB (line of business) - islands of information - lack any synergy among the subject area - no high-level understanding of business needs - no future direction esteblished - no cross functional view of the business (no single version of truth) Clients • immediate needs outweigh (ueberwiegen) potential future benefits • powerful and dynamic LOB management • smaller companies or budget held at LOB level Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 119 Data Warehouse Projects Solution Definition Strategies - Top-Down Incremental + provides relatively quick implementation & payback + significant lower risk than “Big Bang” + achieves synergy among subject areas - one version of truth - more difficult to “sell” because of higher up-front costs Clients: • cross functional reporting seen as important • strategic vision • matrix management with an open view to information • organizations that believe the press about DW benefits • organizations that are trying to re-align business & IT Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 120 Data Warehouse Projects Solution Definition Strategies - Bottom-Up Incremental + proof of concept type of approach proves the “technical” concept quickly + easier product lead sale - tenets (Grundsaetze) are completely compromised - high costs of re-engineering between increments - cultural rejection by the next LOB as definitions are imposed (aufgezwungen) Clients: • IT lead Data Warehouse project • IT attempting to regain (zurueckgewinnen) or maintain control • Nike IT culture - Just do it ! • concerns about overall risk & benefit, fixed price DW implementations Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 121 Data Warehouse Projects Solution Definition Strategies - DM-DW Migration + client/user has matured through the use of DM’s, derived business value and moved on + sound (vernuenftig) approach to IT + strong alignment business & IT - Benefits are mainly in terms of organization capability & readiness Clients • external consulting used rather than internal IT project • balance of power lies with the business not IT • new senior appointment wants it this way Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 122 Data Warehouse Projects Meeting the Technical Challenge - Tenets Data Warehouse Tenets (Grundsaetze) • Extensible - possible to add new types of transactional data as well as new levels of aggregations as information change over time • Scalable - DW may grow by an order of magnitude (Groessenordnung) over time (transactions and business) • Flexible - flexible to support all types of access (multidimensional, ad-hoc, drilldown) Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 123 Data Warehouse Projects Meeting the Technical Challenge - Tenets II • Integrated - any solution must be fully integrated with existing systems and operational environments - data from multiple disparate systems • Reliable (zuverlaessig) - all data have to be accurate and consistent for a given point in time • Manageable - trade off (Kompromis) between the cost of automating any solution and cost of managing a system on a day to day basis • Accessible - 24/7, information must be timely and represented in a useful fashion Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 124 Data Warehouse Projects Meeting the Technical Challenge - Summary Ben Martin BA Lörrach, WI 4.Semester 4/21/2002 Business Intelligence/Data Warehouse, 125