Survey
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
* Your assessment is very important for improving the workof artificial intelligence, which forms the content of this project
Data Warehouse Spaziali idee preliminari maria luisa damiani dico - milano Kick off GeoPKDD - Pisa, 14.3.05 1 WP1: Privacy-aware trajectory warehouse • Obiettivo : definizione di un modello per il “data warehouse delle traiettorie” – Modello dei dati per le traiettorie – Trajectory data warehouse con meccanismi OLAP – Architettura di un data warehouse per trattare flussi continui di dati Kick off GeoPKDD - Pisa, 14.3.05 2 Data warehouse • Data warehouse come insieme di dati organizzati secondo un modello multidimensionale – Fatti, misure, dimensioni – Operazioni OLAP: roll-up, drill-down …… Kick off GeoPKDD - Pisa, 14.3.05 3 Data warehouse spaziale • Si basa su un’ estensione del modello dei dati multidimensionale per la gestione di dati spaziali – Dimensioni e misure spaziali – Spatial OLAP • Alcuni approcci: – J. Han & al., Selective Materialization: An Efficient Method for Spatial Data Cube Construction. Proc. Pacific-Asia Conf. on Knowledge Discovery and Data Mining (PAKDD'98) – C.Jensen & al., Multidimensional data modeling for location-based services. The VLDB Journal, 2004 – E. Malinowski & al., Representing Spatiality in a Conceptual Multidimensional Model. ACM GIS 04 Kick off GeoPKDD - Pisa, 14.3.05 4 Esempio (Han&al. 1998) Stazioni di rilevamento meteo in una zona del Canada Regione A1 A2 … A1 A2 …… A1 Data 1/1/97 1/1/97 …… 1/2/97 1/2/97 ……. 1/3/97 Temp. -4 -7 Precip. 1.5 2 -5 1 3 1 Regione meteo Stazione Citta Provincia Regione Data Regione Temperatura Precipitazione Data --------------------AreaGeografica Superficie Temperatura Intervallo Precipitazione giorno mese stagione Intervallo Kick off GeoPKDD - Pisa, 14.3.05 5 Esempio determinare le aree omogenee rispetto al grado di piovosita e temperatura calcolate sul mese Tempo Temp. Precip. Aree geografiche Febbraio Febbraio Febbraio …. Marzo Fredda Freddo Mite 0.1-0.3 0.3-1 {A2,B3,B9….} {A1, B4…} {A6} …. A seconda del livello di aggregazione si ottengono mappe diverse ……. Kick off GeoPKDD - Pisa, 14.3.05 6 Alcuni problemi aperti • Non vi e’ ancora un modello dei dati definito in modo completo e rigoroso • Spatial OLAP, what is it? • Enfasi sugli aspetti di efficienza piuttosto che quelli di modellazione • Oltre al merge efficiente di poligoni, cosa si puo’ fare? • Sono solo considerati dati spaziali con geometrie semplici • E le traiettorie ? • Non si tiene conto di alcuni aspetti peculiari del dato geografico, come pure delle pratiche correnti di analisi dei dati geografici • Ad esempio la diversa risoluzione spaziale dei dati Kick off GeoPKDD - Pisa, 14.3.05 7 Esempio Time Cause #Victims Jan-03 Speed 2 Jan-03 Speed 1 Feb-04 Weather 1 Time Cause #Victims Jan-03 Speed 2 Jan-03 Speed 1 Feb-04 Weather 1 Kick off GeoPKDD - Pisa, 14.3.05 Position Position 8 Alcuni requisiti per un primo modello Time Cause #Victims Jan-03 Speed 2 Jan-03 Speed 1 Feb-04 Weather 1 Position • Il caso interessante e’ quello della posizione di un fatto come misura spaziale • La misura spaziale comprende la geometria. Gli aspetti spaziali dovrebbero essere definiti in accordo agli standard OGC (Open GeoSpatial Cons.) • Dovrebbero essere definite funzioni di aggregazione delle misure spaziali • Le misure spaziali dovrebbero poter essere rappresentate a livelli di dettaglio differente • Deve essere estesa l’ algebra di operatori OLAP • Il modello deve essere rigoroso e indipendente Kick off GeoPKDD - Pisa, 14.3.05 dalla piattaforma 9 Possibile pianificazione • L’idea generale e’ di articolare il lavoro come segue: – – • Primo passo: Studio di un modello base per la definizione di un data warehouse “solo” spaziale Secondo passo: Generalizzazione del modello al caso spazio-temporale (traiettorie e oggetti in movimento ) Challenges? – Integrazione delle tecniche Spatial OLAP con Spatial Data Mining Kick off GeoPKDD - Pisa, 14.3.05 10 Un altro tema • Un argomento diverso ma correlato e’ lo sviluppo di tecniche di controllo degli accessi a data warehouse spaziali – Si tratta di definire tecniche per stabilire chi puo’ accedere a quali risorse e come – Esempio: • la posizione puntuale degli incidenti e’ accessibile ai funzionari dell’ISTAT; quella a piu’ bassa risoluzione ai funzionari regionali, che non possono effettuare operazioni di aggregazione – Role Based Access Control (RBAC) come standard di riferimento Kick off GeoPKDD - Pisa, 14.3.05 11 Stato dei lavori • Studio di modelli per il controllo dell’accesso a dati spaziali. Ricerca iniziata nel 2003 – E. Bertino, M.L. Damiani, D. Momini, An Access Control System for a Web Map Management Service. IEEE RIDE 2004 – A. Belussi, E. Bertino, B. Catania, M.L. Damiani, A. Nucita, An authorization model for geographical maps. ACM GIS 2004 – E. Bertino, B.Catania, M.L.Damiani, P. Perlasca, GEO-RBAC: a Spatially Aware RBAC. ACM SACMAT 2005 • E’ ancora inesplorato l’ estensione del concetto al caso di data warehouse spaziali Kick off GeoPKDD - Pisa, 14.3.05 12 In conclusione • Sono proposti 2 temi di ricerca • Sistemi OLAP per l’analisi di dati spaziali e spazio-temporali ( da mese 0 a mese 23) • Accesso controllato a spatial data warehouses (da mese 12 a mese 23) Kick off GeoPKDD - Pisa, 14.3.05 13