giovedì, Gennaio 20, 2022
HomeTecnologiaLe 6 principali tendenze in termini di dati e analisi per il...

Le 6 principali tendenze in termini di dati e analisi per il 2022

Credito immagine: NatalyaBurova/Getty

Ascolta CIO, CTO e altri dirigenti di livello dirigenziale e senior su dati e strategie di intelligenza artificiale al Future of Work Summit il 12 gennaio 2022.

Questo articolo è stato contribuito da Kumar Goswami, CEO e cofondatore di Komprise.

Per decenni la gestione dei dati ha significato essenzialmente raccogliere, archiviare e di tanto in tanto accedervi. Tutto è cambiato negli ultimi anni, mentre le aziende cercano le informazioni critiche che possono essere estratte dalle enormi quantità di dati generati, accessibili e archiviati in una miriade di posizioni, dai data center aziendali al cloud e all’edge. Dato che, l’analisi dei dati –

aiutata da tecnologie moderne come l’intelligenza artificiale (AI) e l’apprendimento automatico

– è diventata una capacità irrinunciabile e nel 2022 l’importanza sarà amplificata. Le aziende devono analizzare rapidamente i dati, molti dei quali non strutturati, per trovare le informazioni che guideranno le decisioni aziendali. Devono anche creare un ambiente dati moderno in cui realizzare ciò.

Di seguito sono riportate alcune tendenze nella gestione dei dati che verranno alla ribalta nel 2022.

I data lake sono più organizzati, ma esiste ancora il gap di dati non strutturati

Esistono due approcci all’analisi dei dati aziendali. Il primo è prendere i dati da applicazioni aziendali come CRM ed ERP e importarli in un data warehouse per feed Strumenti di BI. Ora quei data warehouse si stanno spostando sul cloud, con tecnologie come Snowflake. Questo approccio è ben compreso, poiché i dati hanno uno schema coerente.

Il secondo approccio consiste nel prendere tutti i dati grezzi e importarli direttamente in un data lake, senza richiedere alcuna pre- in lavorazione. Questo è interessante perché qualsiasi tipo di dati può essere incanalato in un data lake, ed è per questo che Amazon S3 è diventato un enorme data lake. Il problema è che alcuni dati sono più facili da elaborare rispetto ad altri. Ad esempio, file di registro, dati genomici, audio, video, file di immagini e simili non si adattano perfettamente ai data warehouse perché mancano di una struttura coerente, il che significa che è difficile cercare tra i dati. Per questo motivo, i data lake finiscono per diventare paludi di dati: è troppo difficile cercare, estrarre e analizzare ciò di cui hai bisogno.

La grande tendenza ora e una tendenza continua dei dati per il 2022 è l’emergere di data lake house, rese popolari da DataBricks, per creare data lake con dati semi-strutturati che hanno una certa consistenza semantica. Ad esempio, un file Excel è come un database anche se non lo è, quindi le case dei data lake sfruttano lo schema coerente dei dati semi-strutturati. Sebbene funzioni per file .csv, file Parquet e altri dati semi-strutturati, non risolve il problema dei dati non strutturati, poiché questi dati non hanno una struttura comune ovvia. Hai bisogno di un modo per indicizzare e dedurre una struttura comune per i dati non strutturati, in modo che possa essere ottimizzata per l’analisi dei dati. Questa ottimizzazione dei dati non strutturati per l’analisi è una grande area di innovazione, soprattutto perché almeno l’80% dei dati mondiali oggi non è strutturato.

La scienza dei cittadini sarà un 2022 influente e correlato tendenza

Nel tentativo di democratizzare la scienza dei dati, i fornitori di servizi cloud svilupperanno e rilasceranno più applicazioni di apprendimento automatico e altri strumenti di base come i flussi di lavoro di apprendimento automatico specifici del dominio. Questa è una tendenza seminale, perché, nel tempo, il livello di ciò di cui gli individui avranno bisogno codificare sta per diminuire. Ciò aprirà l’apprendimento automatico a molti più ruoli professionali: alcuni di questi scienziati cittadini saranno all’interno dell’IT centrale e alcuni vivranno all’interno delle linee di business. Amazon Sagemaker Canvas è solo un esempio di low-code/no- strumenti di codice che vedremo di più nel 2022. La scienza dei cittadini è piuttosto nascente, ma è sicuramente la direzione in cui si sta dirigendo il mercato e un’imminente tendenza dei dati per il 2022. Piattaforme di dati e soluzioni di gestione dei dati che forniscono agli utenti una semplicità di tipo consumer per cercare, estrarre e utilizzare i dati guadagnerà importanza.

L’analisi dei “dati corretti” supererà l’analisi dei Big Data come tendenza chiave del 2022

I Big Data sono quasi troppo grandi e stanno creando paludi di dati difficili da sfruttare. Trovare con precisione i dati giusti sul posto, indipendentemente da dove sono stati creati e assimilarli per l’analisi dei dati è un punto di svolta perché farà risparmiare tempo e sforzi manuali fornendo analisi più pertinenti. Quindi, invece dei Big Data, una nuova tendenza sarà lo sviluppo dei cosiddetti “dati giusti” analitici.

L’analisi dei dati “sul posto” dominerà

Alcuni pronosticatori affermano che il cloud data lake sarà il luogo ideale in cui i dati verranno raccolti ed elaborati per diverse attività di ricerca. Mentre i data lake cloud guadagneranno sicuramente trazione, i dati si accumulano ovunque: su edge, nel cloud e nell’archiviazione locale . Ciò richiede in alcuni casi la necessità di elaborare e analizzare i dati dove si trovano, anziché spostarli in una posizione centrale perché è più veloce ed economico farlo. Come è possibile non solo cercare dati all’edge, ma anche elaborarne molti localmente, prima ancora di inviarli al cloud? Potresti utilizzare strumenti di analisi basati su cloud per progetti più grandi e complessi. Vedremo più “edge cloud”, dove il calcolo arriva al limite del datacenter invece dei dati che vanno al cloud.

La gestione dei dati indipendente dallo storage diventerà un elemento critico componente del tessuto dati moderno

Un data fabric è un’architettura che fornisce visibilità dei dati e la capacità di spostare, replicare e accedere ai dati attraverso storage ibrido e risorse cloud. Attraverso l’analisi quasi in tempo reale, consente ai proprietari dei dati di controllare dove risiedono i loro dati nei cloud e nello storage, in modo che i dati possano risiedere nel posto giusto al momento giusto. I responsabili dell’IT e dello storage sceglieranno le architetture del data fabric per sbloccare i dati dallo storage e abilitare la gestione incentrata sui dati rispetto a quella incentrata sullo storage. Ad esempio, invece di archiviare tutte le immagini mediche sullo stesso NAS, i professionisti dell’archiviazione possono utilizzare l’analisi e il feedback degli utenti per segmentare questi file, ad esempio copiando le immagini mediche per l’accesso tramite l’apprendimento automatico in uno studio clinico o spostando i dati critici su un archivio cloud immutabile per difendersi dal ransomware.

Il multicloud si evolverà con diverse strategie di dati

Molte organizzazioni oggi hanno un ambiente cloud ibrido in cui la maggior parte dei dati viene archiviata e sottoposta a backup in data center privati ​​su più sistemi di fornitori. Poiché i dati non strutturati (file) sono cresciuti in modo esponenziale, il cloud viene utilizzato come livello di archiviazione secondario o terziario. Può essere difficile vedere attraverso i silos per gestire i costi, garantire le prestazioni e gestire il rischio. Di conseguenza, i leader IT si rendono conto che estrarre valore dai dati su cloud e ambienti on-premise è una sfida formidabile. Le strategie multicloud funzionano meglio quando le organizzazioni utilizzano cloud diversi per casi d’uso e set di dati diversi. Tuttavia, ciò comporta un altro problema: lo spostamento dei dati è molto costoso quando e se è necessario spostare successivamente i dati da un cloud all’altro. Un concetto più recente consiste nell’indirizzare l’elaborazione verso dati che risiedono in un unico luogo. Quel posto centrale potrebbe essere un centro di colocation con collegamenti diretti ai fornitori di servizi cloud. Il multicloud si evolverà con strategie diverse: a volte il calcolo arriva ai tuoi dati, a volte i dati risiedono in più cloud.

Le aziende continuano a subire una crescente pressione per adottare strategie di gestione dei dati che consentano loro di ricavare informazioni utili dallo tsunami di dati per guidare decisioni aziendali critiche. L’analisi sarà al centro di questo sforzo, oltre a creare tessuti di dati aperti e basati su standard che consentano alle organizzazioni di tenere tutti questi dati sotto controllo per l’analisi e l’azione.

Kumar Goswami è il CEO e cofondatore di

Compressione.

DataDecisionMakers

Benvenuto nella community di VentureBeat!

DataDecisionMakers è il luogo in cui gli esperti, compresi i tecnici che lavorano sui dati, possono condividere informazioni e innovazioni relative ai dati.

Se vuoi leggere idee all’avanguardia e fino a -informazioni sulla data, le migliori pratiche e il futuro dei dati e della tecnologia dei dati, unisciti a noi su DataDecisionMakers.

Potresti anche considerare

contribuendo con un articolo tutto tuo!

Leggi di più da DataDecisionMakers

Per saperne di più

RELATED ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisment -

Most Popular

Recent Comments