Come ti cambio lo storage a colpi di “selfie” e “like”

Come ti cambio lo storage a colpi di “selfie” e “like”

Roma, 2016. Post-pranzo a casa della famiglia di mia moglie. Un bambino di 10 anni ripassa storia accanto a me. Sta leggendo qualcosa riguardo la seconda rivoluzione industriale: quella dei generatori dinamo, dei motori a scoppio, della diffusione delle telecomunicazioni. Mi guarda concentrato, sta riflettendo su qualcosa. E’ completamente assorto. Passa così qualche minuto prima che mi chieda con tono interrogativo: “Scusa Matteo, mi chiedevo…nel passato c’è stata l’età della pietra, quella dei metalli, quella del vapore, poi quella dell’elettricità. Adesso in che età siamo? [segue una lunga, interminabile pausa. Pensa, pensa, pensa e pensa ancora.] Ma certo! In quella dei selfie!”

Oltre che simpatico, questo aneddoto risulta estremamente emblematico. Nell’immaginario di un bambino, selfie, like e simili, costituiscono il fattore tecnologico distintivo dell’epoca contemporanea; i social network assurgono allo stesso ruolo che la lavorazione della pietra, le leghe metalliche, il vapore e la corrente continua hanno assunto nelle precedenti rivoluzioni storiche (sociali).

Per quanto possa sembrare strano, la visione del bambino non è poi così avulsa dalla realtà. Il numero di interazioni che ogni cittadino quadratico medio ha giornalmente con i canali social è elevatissimo: decine , se non centinaia di ‘puntatine’ su pagine Facebook, Twitter, LinkedIn, Instagram. Su scala mondiale, la percentuale di penetrazione di account social attivi ammonta a circa il 30%, risultando in una media di 5.5 account attivi per ogni utente internet [1].

Che si tratti di profili utilizzati per scopi personali o lavorativi, di marketing o un mix di questi non ha importanza. Le reti sociali hanno un ruolo sempre più centrale nei processi sociali, tanto da arrivare a influenzare più dei 3/5 delle decisioni di acquisto dei consumatori [2].

E’ noto che in contesto social media, i dati generati e utilizzati sono tipicamente di tipo non-strutturato, si tratta di: immagini, video, file audio, documentazione testuale, tweets.  A differenza dei dati strutturati (vedi database e ERP), i dati non-strutturati hanno dimensioni, contenuto e importanza scarsamente predicibile. Una foto su social network può essere scattata oggi con risoluzione scelta sul momento, non acceduta per mesi, ma poi improvvisamente visualizzata e condivisa da più utenti contemporaneamente. E magari avere anche un contenuto informativo “da prima pagina”. Questo, unitamente al fatto che di tutti questi dati, solo un 20% verrà eventualmente (e raramente) acceduto nuovamente, ne rende la gestione estremamente impegnativa dal punto di vista dello storage. Per di più, il rate di crescita dell’universo digitale ha un trend esponenziale: secondo IDC esso cuberà 44ZB (ovvero 10^12GB!) già nel 2020.

I file-systems di tipo tradizionale non hanno, per costruzione, la capacità di scalare facilmente per gestire una mole di dati così elevata (a causa dei meccanismi di locking e di coordinazione dei metadati associati) e, soprattutto, risultano estremamente poco efficienti, dal momento che  la protezione dei dati richiede RAID di dischi, repliche su più siti ed eventualmente soluzioni di backup.  Una soluzione su tape, benché caratterizzata da costi contenuti ed elevate densità di store, per molti use-cases risulta essere troppo limitata in termini di latenza. Nessun utente social è disposto ad aspettare minuti per visualizzare un documento, una foto o un video prodotti tempo addietro (anche se mai acceduti fino a quel momento).

L’object storage indirizza questo tipo di esigenze, proponendo un paradigma di accesso completamente diverso da quello tradizionale “a file”: i dati risiedono in un namespace non più gerarchico, ma piatto, e vengono acceduti via interfaccia REST attraverso una stringa identificativa univoca che codifica in se le informazioni necessarie per il recall del dato stesso. Il sistema è virtualmente scalabile senza limiti, e consente di editare i metadati associati all’oggetto in maniera arbitraria (slegandosi dagli attributi dei file), consentendo di arricchire il dato con informazioni aggiuntive che ne facilitano la ricerca e l’organizzazione: un concetto molto simile a quello di #hastag, restando in tema social. L’informazione è protetta da algoritmi di erasure-coding, che consentono di includere ridondanza informativa, senza necessità di replicare il dato, a tutto vantaggio dei costi (in termini di TCO). La modalità di accesso via semplici REST API, rende l’object storage il miglior candidato al servizio di utilizzi “app-oriented”, tipici dei dispositivi mobile.

IBM Cloud Object Storage (brevemente, COS) è la soluzione IBM di Software Defined Storage per la gestione di dati non-strutturati. Considerata da IDC e Gartner come soluzione di punta in campo object storage, COS consente di implementare un’infrastruttura storage geograficamente distribuita in ambienti on-premise, Cloud o ibridi. Grazie all’unione dell’algoritmo di erasure-coding e della dispersione geografica (Information Dispersal Algorithm) IBM COS è in grado di assicurare gli stessi SLA di un infrastruttura tradizionale protetta da architetture di dischi RAID replicate su tre siti a fronte del salvataggio di una singola copia del dato, corredata di una ridondanza configurabile a piacere.

In configurazione standard (3-sites) COS consente di raggiungere una permantent reliability di 10 9’s, ovvero avere una probabilità di perdere il dato in un dato anno di circa lo 0.0000000029%. In termini di Mean Time to Data Loss significa una perdita di dati ogni 34.633.083.744 anni.

Se i dinosauri avessero usato IBM COS, i loro selfie sarebbero ancora on-line.


[1] http://wearesocial.com/it/report-ricerche/digital-social-mobile-2015-tutti-numeri-globali-italiani

[2] http://www.socialmediatoday.com/marketing/masroor/2015-05-28/social-media-biggest-influencer-buying-decisions

[3] http://thebizloft.com/universo-digitale-big-data/

Per visualizzare o aggiungere un commento, accedi

Altre pagine consultate