Survey
* Your assessment is very important for improving the work of artificial intelligence, which forms the content of this project
* Your assessment is very important for improving the work of artificial intelligence, which forms the content of this project
Data Warehouse Spaziali
idee preliminari
maria luisa damiani
dico - milano
Kick off GeoPKDD - Pisa, 14.3.05
1
WP1: Privacy-aware trajectory warehouse
• Obiettivo : definizione di un modello per il “data
warehouse delle traiettorie”
– Modello dei dati per le traiettorie
– Trajectory data warehouse con meccanismi OLAP
– Architettura di un data warehouse per trattare flussi continui di
dati
Kick off GeoPKDD - Pisa, 14.3.05
2
Data warehouse
• Data warehouse come insieme di dati organizzati
secondo un modello multidimensionale
– Fatti, misure, dimensioni
– Operazioni OLAP: roll-up, drill-down ……
Kick off GeoPKDD - Pisa, 14.3.05
3
Data warehouse spaziale
• Si basa su un’ estensione del modello dei dati multidimensionale per
la gestione di dati spaziali
– Dimensioni e misure spaziali
– Spatial OLAP
• Alcuni approcci:
– J. Han & al., Selective Materialization: An Efficient Method for Spatial Data Cube
Construction. Proc. Pacific-Asia Conf. on Knowledge Discovery and Data Mining
(PAKDD'98)
– C.Jensen & al., Multidimensional data modeling for location-based services. The
VLDB Journal, 2004
– E. Malinowski & al., Representing Spatiality in a Conceptual Multidimensional
Model. ACM GIS 04
Kick off GeoPKDD - Pisa, 14.3.05
4
Esempio
(Han&al. 1998)
Stazioni di rilevamento meteo in una zona del Canada
Regione
A1
A2
…
A1
A2
……
A1
Data
1/1/97
1/1/97
……
1/2/97
1/2/97
…….
1/3/97
Temp.
-4
-7
Precip.
1.5
2
-5
1
3
1
Regione
meteo
Stazione
Citta
Provincia
Regione
Data
Regione
Temperatura
Precipitazione
Data
--------------------AreaGeografica
Superficie
Temperatura
Intervallo
Precipitazione
giorno
mese
stagione
Intervallo
Kick off GeoPKDD - Pisa, 14.3.05
5
Esempio
determinare le aree omogenee rispetto al grado di piovosita e
temperatura calcolate sul mese
Tempo
Temp.
Precip.
Aree geografiche
Febbraio
Febbraio
Febbraio
….
Marzo
Fredda
Freddo
Mite
0.1-0.3
0.3-1
{A2,B3,B9….}
{A1, B4…}
{A6}
….
A seconda del livello di
aggregazione si ottengono
mappe diverse
…….
Kick off GeoPKDD - Pisa, 14.3.05
6
Alcuni problemi aperti
• Non vi e’ ancora un modello dei dati definito in modo completo e
rigoroso
• Spatial OLAP, what is it?
• Enfasi sugli aspetti di efficienza piuttosto che quelli di modellazione
• Oltre al merge efficiente di poligoni, cosa si puo’ fare?
• Sono solo considerati dati spaziali con geometrie semplici
•
E le traiettorie ?
• Non si tiene conto di alcuni aspetti peculiari del dato geografico,
come pure delle pratiche correnti di analisi dei dati geografici
• Ad esempio la diversa risoluzione spaziale dei dati
Kick off GeoPKDD - Pisa, 14.3.05
7
Esempio
Time
Cause
#Victims
Jan-03
Speed
2
Jan-03
Speed
1
Feb-04
Weather
1
Time
Cause
#Victims
Jan-03
Speed
2
Jan-03
Speed
1
Feb-04
Weather
1
Kick off GeoPKDD - Pisa, 14.3.05
Position
Position
8
Alcuni requisiti per un primo modello
Time
Cause
#Victims
Jan-03
Speed
2
Jan-03
Speed
1
Feb-04
Weather
1
Position
•
Il caso interessante e’ quello della posizione di un fatto come misura
spaziale
•
La misura spaziale comprende la geometria. Gli aspetti spaziali
dovrebbero essere definiti in accordo agli standard OGC (Open
GeoSpatial Cons.)
•
Dovrebbero essere definite funzioni di aggregazione delle misure spaziali
•
Le misure spaziali dovrebbero poter essere rappresentate a livelli di
dettaglio differente
•
Deve essere estesa l’ algebra di operatori OLAP
•
Il modello deve essere
rigoroso
e indipendente
Kick
off GeoPKDD
- Pisa, 14.3.05 dalla piattaforma
9
Possibile pianificazione
•
L’idea generale e’ di articolare il lavoro come segue:
–
–
•
Primo passo: Studio di un modello base per la definizione di
un data warehouse “solo” spaziale
Secondo passo: Generalizzazione del modello al caso
spazio-temporale (traiettorie e oggetti in movimento )
Challenges?
–
Integrazione delle tecniche Spatial OLAP con Spatial Data
Mining
Kick off GeoPKDD - Pisa, 14.3.05
10
Un altro tema
• Un argomento diverso ma correlato e’ lo sviluppo di
tecniche di controllo degli accessi a data warehouse
spaziali
– Si tratta di definire tecniche per stabilire chi puo’
accedere a quali risorse e come
– Esempio:
• la posizione puntuale degli incidenti e’ accessibile ai
funzionari dell’ISTAT; quella a piu’ bassa risoluzione ai
funzionari regionali, che non possono effettuare operazioni di
aggregazione
– Role Based Access Control (RBAC) come standard
di riferimento
Kick off GeoPKDD - Pisa, 14.3.05
11
Stato dei lavori
• Studio di modelli per il controllo dell’accesso a dati
spaziali. Ricerca iniziata nel 2003
– E. Bertino, M.L. Damiani, D. Momini, An Access Control System for a Web Map
Management Service. IEEE RIDE 2004
– A. Belussi, E. Bertino, B. Catania, M.L. Damiani, A. Nucita, An authorization
model for geographical maps. ACM GIS 2004
– E. Bertino, B.Catania, M.L.Damiani, P. Perlasca, GEO-RBAC: a Spatially Aware
RBAC. ACM SACMAT 2005
• E’ ancora inesplorato l’ estensione del concetto al caso
di data warehouse spaziali
Kick off GeoPKDD - Pisa, 14.3.05
12
In conclusione
• Sono proposti 2 temi di ricerca
• Sistemi OLAP per l’analisi di dati spaziali e spazio-temporali (
da mese 0 a mese 23)
• Accesso controllato a spatial data warehouses (da mese 12
a mese 23)
Kick off GeoPKDD - Pisa, 14.3.05
13