De begrafenisondernemer van applicaties – 2

Het begraven van applicaties - wat doen we met de data?

Deel 2: Het vraagstuk van de data

In het eerste deel over het uitfaseren van applicaties – zie de maarteditie – bespraken we de twee voornaamste ‘personages’ die daarbij een rol spelen: die van de moordenaar en van de begrafenisondernemer. Dit artikel behandelt het vraagstuk van de data.

Volgens Andy Kyte, Vice President en Gartner Fellow bij Gartner Research, worden er de komende vijf jaar waarschijnlijk tien tot twintig keer meer applicaties uitgefaseerd dan de afgelopen tien jaar. Het begraven van applicaties is slechts één deel van het hele verhaal. Zelden worden de data die rondgingen in het oude systeem overgezet naar het nieuwe systeem. Dit heeft diverse legitieme oorzaken. “Om te beginnen”, vertelt Kyte, “onderscheiden we twee types data waarmee we te maken hebben. De gereguleerde data zijn omgeven met regelgeving, zoals de regel dat bepaalde soorten transactionele data voor een bepaalde tijd bewaard moeten blijven.” Iedere sector heeft zijn eigen regels, waarbij de financiële sector toch wel de meest verstrekkende regels hanteert over het vasthouden van data.

Het tweede type zijn de analytische data. Deze data hoeven we niet vanwege regelgeving te bewaren, maar bewaren we toch omdat we geloven dat het wellicht iets interessants kan opleveren, nu of in de toekomst. Kyte noemt dit gekscherend de ‘just-in-case-data’. “Dit type data zorgt voor de toestroom in wat zo vriendelijk het ‘datameer’ wordt genoemd. In werkelijkheid dekt de term ‘datamoeras’ de lading treffender. Je wilt daar niet in rondwaden, want het is er giftig en naargeestig. En bovendien is het niet zonder kosten. Opslag is dan misschien nagenoeg gratis tegenwoordig, maar denk eens aan het jaar in jaar uit managen van deze data, verspreid over diverse content managementsystemen, databases, analytische talen enzovoort. Als je toch besluit deze data te bewaren, wees er dan zeker van dat de waarde die je eruit kunt en zal halen, groter is dan wat de opslag je kost.”

Juridisch

Nu we de twee datatypen hebben gesignaleerd, starten we deze data-exercitie met de juridische experts. Gereguleerde data valt namelijk onder hun verantwoordelijkheid. Zij – en niet IT – moeten het beleid formuleren omtrent databehoud en het verdedigbaar verwijderen van data. De it-manager gaat met de juridische of compliancy-mensen om de tafel, zodat hij hun beleid en wensen leert begrijpen. “Toch kan zich een probleem voordoen”, meldt Kyte. “Een goed geoliede en sterk bezette juridische afdeling is zich vast en zeker bewust van zijn verantwoordelijkheid in deze kwestie. De juridische experts hebben ongetwijfeld een effectieve strategie. Loopt het juridische team op zijn tenen omdat het onderbezet is, dan is de kans groot dat het beleid luidt: alle data vasthouden. Alles bewaren is echt het ergst denkbare beleid. Bovendien moeten we ons realiseren dat een juridische afdeling geen enkel probleem heeft met het uitgeven van andermans geld. Want met hun eis dat alle data tot in lengte der dagen moeten worden bewaard, wordt impliciet verondersteld dat dit ten laste komt van het it-budget. Het is dan ook verstandig om als it-afdeling precies te kunnen aangeven wat de kosten zijn van het vasthouden van data. Op vragen van het hoger management kun je direct aantonen in welke activiteiten die niet echt toegevoegde waarde leveren, de kosten zitten. Zorg ervoor dat je er een duidelijk hek omheen zet, dat je het separaat rapporteert en dat je uitlegt dat je door de juridische afdeling wordt ‘verplicht’ dit te doen.”

Metadata

Andy Kyte, Vice President en Gartner Fellow bij Gartner Research: uitfaseren overleden applicaties

Andy Kyte, Vice President en Gartner Fellow bij Gartner Research

Vervolgens moeten alle data worden getraceerd. Normaal gesproken wordt een deel van de data overgezet van de legacy-applicatie naar het nieuwe systeem: doorgaans alle live data en een klein deel van de historische data. Bij een nieuw inkoopsysteem zetten we bijvoorbeeld alle recente inkooporders en de ordergeschiedenis van de afgelopen zes maanden over. Maar de afgelopen 28 jaar hebben we niet meer nodig. Kyte ziet ook hier een probleem. “Het is zelden zo overzichtelijk dat alle data keurig in de database van het legacy-systeem zitten. Dat is immers een oude database met oude standaards, slechte prestaties en overvol. In de loop der tijd hebben diverse opschoonprogramma’s data uit de database verwijderd en het in een bepaalde structuur gearchiveerd. Zo is er in 28 jaar een flinke data-archeologie ontstaan. Het is essentieel dat je de structuur begrijpt van al deze verschillende archieven, met hun eigen smart coderingen, encrypties en compressietechnieken. Kortom: de metadata. Als een toezichthouder wil weten in welk land twintig jaar geleden een bepaald onderdeel is aangeschaft, moet je niet in de situatie komen dat je query alleen maar terugkomt met ‘landcode 14’ en je geen flauw benul meer hebt waaraan die 14 refereert. Zoals je ziet, is het niet zo simpel als het een-op-een kopiëren van de oude database naar het nieuwe systeem.”

Als data echt niet weg mogen

Wat betreft legacy-data adviseert Gartner nadrukkelijk: ‘indien enigszins mogelijk, gooi het weg’. In de woorden van Kyte: “Houd alsjeblieft geen spullen vast alleen omdat het kan en omdat het misschien ooit eens nodig kan zijn.” Hij noemt enkele scenario’s voor het geval je de data echt niet kunt weggooien.

  • Je houdt de oude applicatie nog enige tijd in de lucht, totdat het dataprobleem is opgelost. “Dat is prima voor één jaar, of misschien zelfs anderhalf jaar”, zegt Kyte. “Het is niet okay als je dat 18 jaar laat aanslepen. Ook al houd je de applicatie nog even in de lucht, je kunt het probleem niet oneindig lang uitstellen.”
  • Ontwikkel een applicatie die je helpt bij het uitfaseren. “We hebben alle benodigde data in een of ander archief- of BI-systeem opgeslagen. Natuurlijk moeten we dan wel de data op een zinvolle manier kunnen laten zien. Daarvoor een applicatie ontwikkelen, zodat je aan de eisen van een toezichthouder voldoet, is helemaal geen slecht idee.”
  • Iets vergelijkbaars kun je doen als je bijvoorbeeld zeven verschillende warehouse managementsystemen moet uitfaseren. “Zolang die systemen genoeg op elkaar lijken en zolang je de betrokken datastructuren begrijpt, kun je hiervoor een applicatie ontwikkelen. Wederom helemaal geen slecht idee.”
  • Je kunt ook kiezen voor een universele oplossing. “Er is een aantal goede data-archiveringsoplossingen op de markt. Evalueer deze vooral. Maar bedenk daarbij dat alle problemen die je met het archiveren van data ondervindt niet in één keer door één oplossing worden verholpen.”
  • Natuurlijk zijn er leveranciers die beloven dat ze de problemen voor je kunnen oplossen.
  • Als laatste scenario noemt Kyte zijn eigen favoriet: “If you can’t bin it, print it! Bij voorkeur op disk. Als je een legacy-applicatie hebt die over diverse printmogelijkheden beschikt en die landcode 14 voor je kan interpreteren, cross-referentie integriteit biedt, gecomprimeerde en geëncrypte data kan uitpakken zodat het leesbaar wordt, waarom dan niet simpelweg de printprogramma’s laten draaien, zodat het archief op print beschikbaar blijft? Mocht het ooit nodig zijn – want hoe vaak vraagt een toezichthouder daadwerkelijk om dergelijke oude informatie? – dan kun je er nog een zoekmachine op zetten. Dit printscenario kost een fractie van iedere andere denkbare aanpak. Ik adviseer krachtig deze optie als eerste te overwegen.”

Brandoefeningen

Stel, het is 2031 en je hebt al die gearchiveerde data, historische data en gereguleerde data in dataopslag. De toezichthouder vraagt iets specifieks over data die in 2016 zijn opgeslagen. Hoe maak je die data bereikbaar? Wat zijn de datastructuren? En wat zijn de ontsluitingsmechanismen? De kans dat de mensen die deze vragen konden beantwoorden al niet meer bij het bedrijf werkzaam zijn, is levensgroot. We hebben dus de data, we weten alleen niet meer hoe we erbij kunnen komen. Om dit scenario te voorkomen, adviseert Kyte om regelmatig brandoefeningen te houden. “Het heeft weinig zin om een brandblusmachine te hebben, als je niet weet hoe die werkt. Het is aan de begrafenisondernemer van de applicaties om met enige regelmaat de mensen aan te sporen tot training, zodat ze in staat zijn de benodigde rapporten op te leveren wanneer daarom wordt gevraagd.” Kyte begrijpt heel goed dat niemand in de organisatie hierop zit te wachten. “Maar wat je echt niet wilt, is dat iedere projectmanager zijn eigen oplossinkje verzint voor het archiveren van de legacy-data. Je wilt dat onder één hoed, namelijk die van de begrafenisondernemer. Hij neemt de beslissingen, hij investeert in technologie, hij definieert de methodologie en hij bewaakt het volledige proces.”

 

Schema

 

Praktisch stappenplan

  • Begin met het detecteren van de kosten van het behouden van gereguleerde data, en rapporteer dat separaat.
  • Bekijk de (grote) applicaties in je portfolio en stel jezelf de vraag: welke komen de komende vijf jaar in aanmerking voor uitfaseren en welke daarvan kunnen problemen opleveren qua gereguleerde en historische data?
  • Bereid jezelf voor op het gesprek met de juridische experts. Vraag zelf de dialoog aan.
  • Begin met een proof-of-concept voor één applicatie, die als voorbeeld kan dienen voor het managen van je data.
  • Stel een begrafenisondernemer aan. Iemand die eigenaar wordt van het uitfaseringsproces.
  • Verzeker je ervan dat in ieder project waarbinnen applicaties worden uitgefaseerd een aangewezen moordenaar zit. Iemand die het overleden lichaam van de applicatie overhandigt aan de begrafenisondernemer.
  • Maak eventueel een ontwerp voor de uitfasering.
  • Alle applicaties moeten een life cycle plan hebben. Niet alleen de wankele en oudere applicaties. Alle!
  • Behoud kostentransparantie. Dit is belangrijk, omdat de kosten van het beheren van gereguleerde data de komende jaren onvermijdelijk zullen stijgen.

Gerelateerde berichten...