Data Warehouse
Che cos'è un data warehouse?
Un data warehouse è un database appositamente ottimizzato per le analisi. Riunisce dati provenienti da fonti diverse e con strutture diverse. In questo modo si ottiene una visione globale delle informazioni.
Come funziona un data warehouse?
L’archiviazione e il consolidamento dei dati in un data warehouse centrale (DWH) seguono un processo con diverse fasi. Questa operazione è chiamata anche data warehousing e si articola come segue:
Passo | Descrizione |
---|---|
1. acquisizione e integrazione dei dati | Estrarre i dati dalle fonti, trasformarli e caricarli nel magazzino dati |
2. gestione dei dati | Archiviazione a lungo termine dei dati nel data warehouse |
3. Valutazione dei dati | Analisi dei dati |
4. fornitura di dati | Memorizzazione dei dati per la richiesta separata di file di dati (Data Marts) con lo socpo di analisi speciali |
Data Warehouse vs. Data lake
Un data warehouse non deve essere confuso con un data lake. Quest’ultimo è responsabile solo della conservazione di grandi quantità di dati grezzi (Big Data), mentre le informazioni in un data warehouse vengono già elaborate utilizzando Data Mining.
Cosa si intende per processo ETL?
Il processo ETL è responsabile dell’integrazione dei dati provenienti da fonti diverse nei data warehouse. Viene utilizzato in particolare in scenari con grandi quantità di dati, come quelli dei settori Big Data e business intelligence. ETL è l’abbreviazione delle seguenti fasi:
- Extract: estrazione di dati da sistemi di origine (ad esempio da sistemi operativi come ERP o fonti esterne)
- Transform: conversione dei contenuti e delle strutture dei dati nello schema e nel formato del database di destinazione
- Load: caricare i dati trasformati nel data warehouse (o in un altro sistema)
In passato, il caricamento veniva spesso effettuato a rotazione (ad esempio, mensilmente) per motivi di risorse. Nel recente passato, tuttavia, la tendenza è stata chiaramente quella di caricare in tempo reale. Si parla anche di data warehousing in tempo reale.
Come vengono utilizzati i data warehouse?
Il data warehousing offre diverse possibilità di applicazione alle aziende. Le principali sono le seguenti:
- Fornitura rapida e flessibile di dati per statistiche, rapporti e cifre chiave
- Determinare correlazioni e modelli nei dati attraverso il data mining o l’elaborazione analitica online
- Creare trasparenza sulle questioni di gestione aziendale
- Fornire informazioni complete sugli oggetti di business
- Utilizzo dei dati di produzione nel contesto di Industria 4.0
Articoli correlati