De inhaalrace van flash

Jason Nadeau

Interview met storage-expert Jason Nadeau

De harde schijf is zestig jaar oud. Flash geheugen, of ‘solid state-drives’, vierde twee jaar geleden zijn dertigste verjaardag. Tot voor kort werd flash vooral gebruikt in diverse consumententoepassingen zoals camera’s, mp3-spelers en dergelijke. Maar flash is bezig aan een indrukwekkende inhaalrace ten opzichte van de harde schijf. Op het hoofdkantoor van Pure Storage in Mountain View, California, sprak ICT/Magazine met Jason Nadeau, expert op het gebied van storage.

 

Nadeau loopt al een jaar of vijftien mee in de wereld van storage bij bedrijven als VERITAS (later Symantec) en HP. Volgens hem zijn er momenteel drie voorname ontwikkelingen die voor grote veranderingen gaan zorgen. “Flash opslag begint nu overal impact te hebben. Opslag met betere prestaties begint nu echt de harddisk te vervangen. Ten tweede komen de hyper converged apparaten opzetten, waardoor mensen hun structuren gaan herzien met software defined. En dan hebben we natuurlijk de cloud en in het verlengde daarvan Internet of Things.”

Deze ontwikkelingen zullen leiden tot een veranderde vraag naar het soort storage.

 

Data-reductie

Het is goed om ons voor het vervolg van dit artikel te realiseren dat deze storage-expert voor eigen parochie predikt. Pure Storage, het bedrijf waar Nadeau werkzaam is, richt zich volledig op flash en heeft er dus belang bij dit geheugentype de hemel in te prijzen. Desondanks zit er veel belofte in wat Nadeau te vertellen heeft. Zo beweert hij dat een overstap van disk naar flash niet alleen tot betere prestaties leidt, maar dat het zelfs een kostenbesparing oplevert.

“Om te beginnen is er de economische wet van vraag en aanbod”, vertelt hij. “Zo rond 2010 kostte flash nog 40 tot 80 dollars per gigabyte. Disk kostte toen slechts 5 dollar per gigabyte. Maar de enorme vraag naar flash aan de consumentenkant heeft geholpen om dit verschil te verkleinen. Maar, toegegeven, de initiële aanschaf van flash is nog altijd duurder dan voor disk. Aan de kant van de techniek helpen data-reductietechnieken enorm om de kosten van opslag te verlagen. Vreemd genoeg denkt de markt of de klant niet vanzelfsprekend aan data-reductie. Dat komt deels omdat het deduplicatie-algoritme niet goed werkt voor disk. De disk wordt continu heen en weer geslingerd, omdat het algoritme de data in een willekeurige volgorde aanpakt. Voor flash werkt dit perfect, omdat willekeurige toegang tot de data bij dit medium geen enkel probleem is. Dit maakt verregaande data-reductie mogelijk, voornamelijk via deduplicatie en compressie. Deze functie is standaard in de engine ingebouwd, dus het staat altijd aan en zorgt voor een gemiddelde reductie van vijf tot één, afhankelijk van het soort data. Dit alleen al zorgt ervoor dat wat ooit een duur medium was, nu al minder kost dan de 15K RPM disks.”

 

Software defined

In de wereld van opslag zijn betrouwbaarheid en veerkracht enorm belangrijk. Met deze twee pijlers in het achterhoofd, begrijpt Nadeau de hype rondom software defined niet echt. “Deze mensen willen hun omgeving programmatisch kunnen beheren, wat uiteindelijk neerkomt om meer veerkracht, agility. Ze willen zogezegd een meer cloud georiënteerd model. SD gaat over de infrastructuur. Het is niets anders dan een vorm van virtualisatie. Ten tweede gaat het over kostenverlaging. Met de SD-virtualisatie kunnen ze commodity hardware gebruiken. Dat is allemaal waar, maar deze beide doelstellingen worden ook al behaald met flash, op een andere manier. Qua veerkracht is de volledige flash array met software te beheren. Met onze interfaces kunnen we ook inpluggen in een SD management stack. Vroeger of later moet de data toch ergens worden opgeslagen. En met SD krijg je nooit dezelfde betrouwbaarheid en veerkracht. Het oplossen van problemen is vrijwel altijd een nachtmerrie met SD. En wat de kosten betreft; ook daar doen wij iets waar de markt niet bij kan achterblijven. Binnen een periode van zes jaar is iemand met flash half zo duur als uit als met disk, zelfs met SD. Dat is mogelijk omdat wij alle zogeheten ‘forklift upgrades’ hebben geëlimineerd.”

Dit vraagt om nadere uitleg.

 

Geen extra kosten

Nadeau legt uit dat alle hardware vroeger of later aan de ‘end of lifecyle’ komt en dus moet worden vervangen. Wanneer je met disk moet overstappen naar een nieuwe generatie is dat een moeizaam proces. “Alle data moet worden gemigreerd en je moet nieuwe hardware aanschaffen. Natuurlijk moet flash ook worden vervangen. Het grote voordeel is dat een flash array zodanig is gebouwd dat dit tijdens de operatie zonder disruptie kan worden gedaan. Maar de echte kostenbesparing zit erin dat wij niets extra’s rekenen voor het vervangen van de oude drives met nieuwe. Stel dat jouw flash array drie jaar draait. Je hebt tegen die tijd beter presterende controllers nodig en misschien ook meer capaciteit. Wij leveren aan klanten de nieuwste controllers, die zij zelf zonder onderbreking op een dinsdagmiddag kunnen inpluggen. Dit maakt deel uit van het onderhoudscontract dat men met ons heeft. Dat bedrijf heeft dus altijd de beschikking over de laatste generatie controllers. Er gaan weer drie jaar voorbij. Een traditionele storage array is dan aan vervanging toe. Flash houdt het langer vol, maar na ongeveer tien jaar komt er toch wel een eind aan. Binnen de normale zes jaar hoeft flash dus niet eens te worden vervangen, alleen zal het qua capaciteit waarschijnlijk moeten worden aangevuld. Maar als dat moment van vervanging dan toch aanbreekt, sturen wij kosteloos de nieuwste drives toe. Ook weer deel van het onderhoudscontract. Zij kunnen zelf de oude drives verwijderen en de nieuwe erin zetten. De array stopt niet, verliest geen enkele data en het heeft geen impact op de performance. Het geheim zit hem in de slimme architectuur waardoor onze flash array volledig ‘on-the-fly’ kan worden vervangen zonder prestatieverlies of impact op de beschikbaarheid.”

Met deze filosofie wordt flash in één keer een stuk interessanter. Dat onderhoudscontract is een vast onderdeel die iedere storage-leverancier hanteert, dus ook op dat punt is het verhaal van Nadeau overtuigend. Bedrijven die on premise hun datacenter hebben, vermijden een tweede en derde aankoop van hardware, besparen stevig op hun onderhoudskosten en vermijden het moeizame aanbestedingstraject.

 

Democratisering van flash

Zetten we het voorgaande op een rijtje dan komt er zonder meer een interessant plaatje uit voor flash. Niet alleen qua kosten, maar ook qua betrouwbaarheid en veerkracht. Flash levert een soort van Storage-as-a-Service, want de hardware – of dan toch in ieder geval de controllers – is altijd up-to-date.

Tot voort kort waren harddisks voor datacenters het enige betaalbare opslagmedium. De laatste jaren wordt flash gedemocratiseerd. “Dit is pas het begin van de transformatie in geïnstalleerde terrabytes”, voorspelt Nadeau. “Tot voor kort was flash vooral zinvol op plaatsen waar performance er echt toe deed, de applicaties, databases voor primaire data enzovoort. Nu er op de langere termijn niet meer extra hoeft te worden betaald, wordt het interessant om ook voor back-ups, archieven – de datameren zogezegd – te kiezen voor flash. Daar waar prestaties minder belangrijk zijn of waren. Want nu ook daar een veel betere performance haalbaar is, kan de hele arena van ongestructureerde data ook voor analyses worden gebruikt. Het liefst zouden de data-analysten hun algoritmes op hun totale dataoceaan afvuren. Dat kan nu met flash.”

En dat is goed nieuws nu alle data van het Internet of Things op ons afstormt.

Jason Nadeau is erg optimistisch over de toekomst van flash. Volgens hem zullen alle harddisks in datacenters door flash zijn vervangen rond het jaar 2020. “De transitie gaat nu echt heel erg snel.” We gaan het zien. Of niet natuurlijk.

 

120487,1221079271,17   309823781

 

 

 

Geschiedenisles

 

De harddisk

De eerste harde schijf dateert van 1956, de RAMAC (Random Access Method of Accounting and Control). Op deze vinding van IBM – die twee koelkasten groot was – kon maar liefst 5 Megabyte aan informatie worden opgeslagen. In een enorme cilinder draaiden vijftig loodzware aluminium schijven met een snelheid van 1200 rotaties per minuut, terwijl de leesarm in en uit floepte, om de data met 100.000 bits per seconde te lezen. Zestig jaar verder ziet opslag er iets anders uit. We hebben anno 2016 dan ook aanmerkelijk meer op te slaan dan destijds. De harde schijven van nu werken in wezen nog volgens hetzelfde technische principe als de RAMAC van toen. Al is de rotatiesnelheid inmiddels opgevoerd tot 15.000 rpm, bedraagt de gemiddelde dataoverdracht nu een slordige 1 Tbit/s, zijn de twee koelkasten naar formaat sigarenkistje gekrompen en past daar nu ongeveer 8 Tb op.

Solid State Drive

Flash geheugen werd in 1980 ontwikkeld door Toshiba en in 1984 op de markt gebracht. De voordelen ten opzichte van disk spreken tot de verbeelding. De lees- en schrijfsnelheid is vele malen hoger. Omdat een SSD geen bewegende delen heeft produceert het geen geluid. Het is aanmerkelijk lichter dan disk. Het produceert minder warmte. En een flash array verbruikt vergeleken met een disk array slechts 15 procent van de fysieke ruimte en van de energie.

Een nadeel is de prijs. Per gigabyte is SSD nog altijd duurder dan disk. Daarnaast is er sprake van zogeheten ‘memory wear’. De cellen verliezen na een bepaald aantal malen schrijven en wissen (gemiddeld zo’n 5000 keer) hun geheugencapaciteit. Een speciale techniek zorgt voor ‘wear leveling’, waarbij alle geheugencellen nagenoeg gelijk worden belast, zodat de hele drive langer meegaat.

Voor het onderhoud van 250 terrabytes aan traditionele opslag zou één FTE nodig zijn. Volgens Jason Nadeau is dat voor flash niet of nauwelijks meer nodig. “De meeste opslagbeheerders zijn nu virtualisatie beheerders geworden, die de flash arrays meenemen in hun normale werk.”