Questo sito utilizza cookies solo per scopi di autenticazione sul sito e nient'altro. Nessuna informazione personale viene tracciata. Leggi l'informativa sui cookies.
Username: Password: oppure
Da IBM un sistema di storage da 120 petabyte
Paper

Da IBM un sistema di storage da 120 petabyte

Gli ingegneri di IBM stanno mettendo a punto quello che ad oggi risulta essere il più capiente sistema di storage mai costruito: un cliente anonimo ha infatti commissionato a Big Blue la costruzione di un supercomputer abbinato ad un sistema di stoccaggio dati dalla capienza di 120 petabyte, laddove i più grandi sistemi di storage disponibili ad oggi sono caratterizzati da una capienza di 15 petabyte.

120 petabyte, o 120 milioni di gigabyte, sono equivalenti grossomodo a 24 miliardi di file MP3 di medie dimensioni: per ottenere questo risultato gli ingegneri di IBM hanno utilizzato 200 mila hard disk convenzionali che operano in sinergia tra loro. Un sistema di storage di questo tipo è capace di conservare 60 copie dell'Internet Archive di WayBack Machine.

Bruce Hillsberg, responsabile della divisione Storage Research per IBM, ha commentato: "Questo sistema da 120 petabyte rappresenta attualmente un esempio estremo, ma nel giro di pochi anni diventerà qualcosa di estremamente ordinario. Mantenere traccia di nomi, tipi ed attributi dei file stoccati nel sistema richiederà circa 2 petabyte della sua capienza totale".

La costruzione di un sistema di storage di tale complessità pone numerose sfide dinnanzi agli ingegneri, anzitutto dal punto di vista pratico con la realizzazione di un opportuno sistema di raffreddamento a liquido, e in seconda battuta dal punto di vista funzionale: in particolare i ricercatori hanno sviluppato un meccanismo che consenta di recuperare i dati in caso di guasti in maniera tale che da non compromettere le prestazioni del supercomputer.

Il sistema di storage fa uso inoltre di un file system denominato GPFS - General Parallel File System. Sviluppato dalla stessa IBM, permette un più rapido accesso ai dati distribuendo il singolo file tra dischi multipli, in maniera tale che le diverse parti di un file possano essere lette o scritte simultaneamente. Il file system GPFS agevola inoltre l'indicizzazione delle informazioni: lo scorso mese IBM ha dimostrato che un sistema con GPFS è in grado di indicizzare 10 miliardi di file in 43 minuti, annichilendo il precedente record di un miliardo di file indicizzati in tre ore.


Aggiungi un commento

Inserisci il tuo commento qui
Esegui il login oppure registrati per inviare commenti