Data Warehouse

Che cos'è un data warehouse?

Un data warehouse è un database appositamente ottimizzato per le analisi. Riunisce dati provenienti da fonti diverse e con strutture diverse. In questo modo si ottiene una visione globale delle informazioni.

Indice dei contenuti
    Add a header to begin generating the table of contents
    Tempo di lettura: 4:45 min

    Come funziona un data warehouse?

    L’archiviazione e il consolidamento dei dati in un data warehouse centrale (DWH) seguono un processo con diverse fasi. Questa operazione è chiamata anche data warehousing e si articola come segue:

    Passo Descrizione
    1. acquisizione e integrazione dei dati Estrarre i dati dalle fonti, trasformarli e caricarli nel magazzino dati
    2. gestione dei dati Archiviazione a lungo termine dei dati nel data warehouse
    3. Valutazione dei dati Analisi dei dati
    4. fornitura di dati Memorizzazione dei dati per la richiesta separata di file di dati (Data Marts) con lo socpo di analisi speciali
    grafico Data Warehouse

    Data Warehouse vs. Data lake

    Un data warehouse non deve essere confuso con un data lake. Quest’ultimo è responsabile solo della conservazione di grandi quantità di dati grezzi (Big Data), mentre le informazioni in un data warehouse vengono già elaborate utilizzando Data Mining.

    Cosa si intende per processo ETL?

    Il processo ETL è responsabile dell’integrazione dei dati provenienti da fonti diverse nei data warehouse. Viene utilizzato in particolare in scenari con grandi quantità di dati, come quelli dei settori Big Data e business intelligence. ETL è l’abbreviazione delle seguenti fasi:

      • Extract: estrazione di dati da sistemi di origine (ad esempio da sistemi operativi come ERP o fonti esterne)
      • Transform: conversione dei contenuti e delle strutture dei dati nello schema e nel formato del database di destinazione
      • Load: caricare i dati trasformati nel data warehouse (o in un altro sistema)

    In passato, il caricamento veniva spesso effettuato a rotazione (ad esempio, mensilmente) per motivi di risorse. Nel recente passato, tuttavia, la tendenza è stata chiaramente quella di caricare in tempo reale. Si parla anche di data warehousing in tempo reale.

    Come vengono utilizzati i data warehouse?

    Il data warehousing offre diverse possibilità di applicazione alle aziende. Le principali sono le seguenti:

      • Fornitura rapida e flessibile di dati per statistiche, rapporti e cifre chiave
      • Determinare correlazioni e modelli nei dati attraverso il data mining o l’elaborazione analitica online
      • Creare trasparenza sulle questioni di gestione aziendale
      • Fornire informazioni complete sugli oggetti di business
      • Utilizzo dei dati di produzione nel contesto di Industria 4.0
    Indice dei contenuti
      Add a header to begin generating the table of contents
      About weclapp
      weclapp Teamwork Video Cover
      Ertan Özdil Autore
      L'autore di questo articolo è , CEO, fondatore e partner di weclapp, soluzione ERP in cloud.