Blogikirjoitus:

Internet on täynnä ja tulvii reunojen yli

Kirjoittanut: Taavi Havre


Väite että internet on täynnä, kuulostaa naurettavalta. Väite pitää kuitenkin paikkansa, ainakin osittain. Sekä laitevalmistajat että analyytikot ovat jo vuosia puhuneet, että tulevaisuudessa törmätään datan kapasiteettikuiluun, missä tallennustilan tarve ylittää tuotantomäärät. Ennusteiden mukaisesti, vuonna 2020 tuotetaan kuusi Zettatavua enemmän dataa, kuin tallennustilaa.

”By 2020, we can predict a minimum capacity gap of over six zettabytes – nearly double all the data that was produced in 2013.” – Mark Whitby, Senior VP, Branded Products Group at Seagate Technology, EMEA (1)

Tiedon kasvu johtuu ihmisten tottumuksista säilyttää dataa mahdollisimman pitkään. Säilytetystä tiedosta hyödynnetään vain murto-osaa, mutta datan poistaminen tuntuu vastenmieliseltä ja turhalta.
Toinen kasvuun vaikuttava tekijä on teknologian kehitys ja sitä mukaan uusien liiketoiminta alueiden esiin nousu (esimerkiksi Big Data ja Business Inteligence). Uusien teknologioiden yhtenäisenä tekijänä on ison datamassan säilytys ja analysointi. Myös sosiaalisenmedian yritykset, jotka luovat eniten dataa, ovat tällä sektorilla.

Datan räjähdysmäinen kasvu ei ole pelkkä tulevaisuuden ongelma, vaan nähtävissä jo nyt. Laite- ja komponenttivalmistajilla on haasteita tuottaa tarvittavaa määrää tallennustilaa. Kyse ei ole vaan muutamasta toimittajasta, kun loppujen lopuksi komponentit tulevat samoista tehtaista. Vuoden 2006 tsunami näytti, miten muutaman tehtaan sulkeminen vaikuttaa komponenttien saatavuuteen ja hintaan.

Myös kuluttajatuotteiden, eli erilaisten älylaitteiden raju kasvu, asettaa entisestään enemmän paineita tuotannolle, koska ne hyödyntävät samoja teknologioita mitä yritystuotteetkin. On aiheellista huomioida, että kuluttajatuotteiden lievemmät laatuvaatimukset ja sitä kautta korkeampi tuotto, siirtää valmistajien fokusta pois yritystuotteista ja siten myös teknologiakehityksestä. Tämä tarkoittaa, että edessä on hintakorotuksia, mikä koskee kaikkia tallennusvälineitä.

“3D NAND is still ramping up at most suppliers, and as a consequence, there is an expected shortage in flash memory that will occur in the not too distant future—not sure if this is the next few months, that depends upon demand,” – Thomas Coughlin, Storage Visions (2)

Tämän kirjoituksen ideana ei ole pelotella ketään. Halusin nostaa kyseisen aiheen esiin, koska se vaikuttaa suoranaisesti yritysten kustannuksiin kaikessa, missä käytetään levyjä tai muistia. Jatkossa ei ole vaihtoehtoa että ”lyödään vaan lisää levyjä kiinni” ja tämä kannattaa ottaa huomioon infransuunnittelussa.

Tietysti, tallennuslaitteetkin kehittyvät. Laboratorioista tulee uutisia onnistuneista kokeista esimerkiksi kristalli- ja dna-tallennusratkaisuista, mutta niiden hyödyntäminen tosielämässä, ei ainakaan lähiaikoina ole mahdollista.

Ratkaisuja kuitenkin löytyy ja suurimmaksi osaksi ne liittyvät käytäntöihin ja toimintatapoihin. Tiedon käsittelyn teknologiat, kuten thin-provisioning, deduplication ja compression vähentävät jo nyt tallennustilan tarvetta. Simplivity perusti koko oman yrityksen idean periaatteeseen, että ”No I/O is the best I/O” ja HPE:n yritysosto näytti, että ideassa on järkeä. Myös GDPR tulee vaikuttamaan datan määrään, koska turhaa tietoa ei saa olla tallessa 25.5.2018 jälkeen.

Toinen vaihtoehto on ulkoistaa kapasiteettiongelma jollekin kumppanille. Palvelutarjoajien konesalien levyjen käyttöaste ja joustavuus ovat varmasti parempia, kun paikallisen levylaitteen tai jopa oman pilvenkin. Ulkoistuksessa siirtyy sekä murheet että vastuu. Mutta jos ulkoistus ei ole esimerkiksi lakisääteisistä syistä mahdollista ja on pakko rakentaa oma konesali, ovat hyperkonvergenssi ja järkevä datan varastointi kohdillaan. Eli jatkoa ajatellen, vähemmän kirjoituksia levyille ja vanhat datat arkistoon.

Mikäli haluat keskustella aiheesta lisää, autamme mielellämme, olkoon kyseessä sitten ulkoistus, oma konesali tai vaikka päätelaitteiden hankinta.


TL;DR: Ollaan tilanteessa missä tiedon tallennustarve ja kysyntä ylittää tuotantomäärät ja se kannattaa ottaa huomioon infran kehityksissä ja hankesuunnitteluissa.

Aiheesta lisää:

Kategoriat: Taavi Havre, Blogit