Big Data

Big Data, cosa sono?

Per definizione, il termine inglese Big Data (tradotto letteralmente "grandi dati") indica una grande quantità di dati complessi, non strutturati e variabili. Questi volumi di dati non possono essere analizzati con i metodi tradizionali di elaborazione dei dati. Per questo sono necessarie speciali tecnologie di analisi.
  In altre parole la definizione di Big Data si riferisce a dati sempre più diversificati e che si accumulano in quantità e velocità sempre maggiori. Questo concetto è noto anche come le tre V.

Indice dei contenuti
    Add a header to begin generating the table of contents
    Tempo di lettura: 4:10 min

    Cosa sono le tre V (più due) dei Big Data?

    Nel 2001, Doug Laney, allora vicepresidente della società Meta Group, aveva descritto il modello delle 3 V dei Big Data: Volume, Velocità e Varietà. Un modello semplice e preciso per definire i nuovi dati creati dall’aumento delle fonti di informazione e dallo sviluppo delle tecnologie.

     
    Volume Grandissima quantità di dati provenienti da fonti differenti (social media, transazioni comerciali, acquisti online...)
    Velocità Si riferisce sia alla velocità con cui si riceve e acquisisce questa mole di dati, sia alla necessità di elaborazione spesso in tempo reale
    Varietà Si riferisce all'eterogeneità dei dati ricevuti in tutti i formati possibile (di testo, foto, video, audio, e-mail, transazioni bancarie...)
    Recentemente si sono aggiunte altre due V al modello di Laney, poichè i dati sono diventati fonte a dir poco indispensabile di capitale:
    • Veridicità: si tratta della qualità e affidabilità dei dati (la fonte è importante). Per le aziende si parla per questo anche di “valore”.
    • Variabilità: i flussi di dati sono in continuo cambiamento. Per le aziende è fondamentale capire il loro significato in base al contesto (esempio temporale: tendenze sui social)

    Come funzionano i Big Data?

    In un mondo sempre più digitalizzato, i Big Data si creano da soli. Ogni giorno vengono generate nuove informazioni, il che comporta un aumento costante della quantità di dati. I dati provengono, tra l’altro, dalle seguenti fonti:

    • Utilizzo dei servizi internet e dei social media
    • Comunicazione elettronica (soprattutto tramite smartphone)
    • Utilizzo di sistemi di pagamento
    • Dispositivi elettrici (ad es. indossabili come gli Smart Watches)
    • Sistemi in rete nell’industria
    • Tecnologia domestica in rete
    • Veicoli in rete

    In sintesi, come già descritto nel paragrafo delle V, l’analisi di questi dati nel contesto della business intelligence è difficile non solo per l’elevato volume, ma anche per le numerose strutture (formati) differenti. Un altro fattore di complicazione è che i Big Data di solito cambiano rapidamente (Variabilità).

     
    Dashboard finanze weclapp

    Come si possono elaborare i Big Data?

    I database e i sistemi di analisi tradizionali (relazionali) non sono in grado di elaborare i Big Data. Piuttosto, sono necessarie nuove soluzioni per l’archiviazione e l’analisi dei dati in grandi quantità. In particolare, i software per i Big Data si differenziano dai sistemi tradizionali come i data warehouse per i seguenti aspetti:

    • Possibilità di elaborazione parallela di molti dati
    • Importazione molto veloce dei dati (a volte anche in tempo reale o quasi)
    • Ricerca veloce e consultazione parallela dei dati
    • Valutazione dei diversi tipi di informazioni possibili

    Da un punto di vista tecnico, sono i database in-memory o approcci come MapReduce (conosciuti attraverso MongoDB e Apache Hadoop) che possono essere utilizzati per implementare questi requisiti.

    Poiché le correlazioni nei Big Data non possono più essere riconosciute manualmente, si ricorre sempre più spesso al Machine Learning. Questo approccio proveniente dal campo dell’intelligenza artificiale consente, tra l’altro, di identificare informazioni utili, modelli nascosti e correlazioni precedentemente sconosciute nei dati.

    A causa delle enormi risorse di calcolo necessarie per l’analisi dei big data, sempre più aziende si rivolgono alla gestione dei dati tramite il cloud computing. Ciò significa che non tengono in casa l’hardware e il software necessari, ma accedono alle soluzioni Big Data via Internet.

     

    Esempi di Big Data

    L’analisi dei big data può essere utilizzata in diversi modi nelle aziende. Ecco alcuni esempi di applicazioni:

    • Industria: valutazione dei dati dei sensori di macchine e sistemi per la manutenzione e la gestione della qualità
    • Analisi del comportamento dei clienti su Internet, realizzazione di offerte personalizzate
    • Analisi e previsione dei cambiamenti del mercato (ad esempio, sulla base dei sentimenti nei social network).
    • Ottimizzazione della pianificazione dei percorsi nella logistica
    • Rilevamento delle frodi

    Quali sono i vantaggi e gli svantaggi dei Big Data per le aziende?

    Grazie al cloud computing, Big Data non è più un termine astratto. Piuttosto, le tecnologie di analisi possono essere utilizzate in modo economico e possono portare numerosi vantaggi alle aziende. Nel segmento della business intelligence, ad esempio, il software corrispondente può fornire informazioni sicure al Management  per prendere decisioni. Le tecnologie consentono inoltre di riconoscere tempestivamente le tendenze e di sviluppare nuovi servizi e modelli di business.

    Una sfida importante nell’ambiente dei big data, tuttavia, è la protezione dei dati. Le aziende hanno ora l’opportunità di ottenere informazioni approfondite sul comportamento e sulla privacy delle persone. Dal punto di vista dell’utente, la tracciabilità è particolarmente problematica. Ad esempio, quasi nessun utente di Internet è pienamente consapevole di quali dei suoi dati vengono memorizzati da chi e per quanto tempo.

    Infine, ma non meno importante, i big data sono un campo di attività interessante per gli hacker. Molte aziende archiviano i propri dati nel cloud. Soprattutto nei sistemi distribuiti, dove i server possono essere situati in qualsiasi parte del mondo, la protezione dei dati rappresenta una grande sfida.

    Indice dei contenuti
      Add a header to begin generating the table of contents
      About weclapp
      weclapp Teamwork Video Cover
      Ertan Özdil Autore
      L'autore di questo articolo è , CEO, fondatore e partner di weclapp, soluzione ERP in cloud.