Data kwaliteit: Get clean & stay clean | KPMG | NL

Data kwaliteit: Get clean & stay clean

Data kwaliteit: Get clean & stay clean

In de voorgaande blog is de noodzaak van een goede datakwaliteit beschreven voor bijvoorbeeld het verbeteren van de dienstverlening, optimalisatie van de processen en voor meer zekerheid omtrent de juistheid van individuele rechten van klanten. Deze blog richt zich op de ‘hoe’.

1000

Gerelateerde content

Meet het concreet

Startpunt is een analyse van de huidige situatie op basis van een algemeen geaccepteerd normenkader: bijvoorbeeld het Data Management Maturity Model (DMM). DMM biedt een model met zes deelgebieden (bijvoorbeeld je strategie, de rollen en verantwoordelijkheden en de processen) op basis waarvan de volwassenheid van data management kan worden bepaald. Met concrete duidelijkheid over waar je nu staat, en je ambitie (wil je een Rolls Royce of een Volkswagen) stel je de gap vast en daarmee de benodigde activiteiten.

Externe ondersteuning helpt hierbij ook met voorbeeld uitwerkingen en processen om het project nog concreter te maken. Verder is een initiële data analyse (ook wel data profiling genoemd) aan te raden. Door middel van laagdrempelige software krijg je snel gevoel bij de huidige data kwaliteit. Zo kan je zo de noodzaak onderschrijven, de communicatie verrijken met eigen voorbeelden en biedt dit ook de mogelijkheid om de volgtijdigheid van de verschillende data verzamelingen te bepalen. Concreter kan je het bijna niet maken!

Get clean

De volgende stap is om de data op te knippen in behapbare brokken. Handig om te starten met iets concreet zoals een financiële rapportage aangezien de betrokken afdelingen al enige ervaring hebben met data management. Gaande weg breid je het aantal betrokken afdelingen uit. Hierdoor blijft het behapbaar en zorg je ervoor dat de olievlek steeds groter wordt. Organisatie brede initiatieven voor iets wat toch snel abstract wordt zijn vaak niet succesvol.

Je begint achteraan in het proces met het uiteindelijke data producten zoals de financiële of risicorapportage, informatie nodig voor klanten (bijvoorbeeld individuele rechten) of stuurgegevens voor het management. Vanuit de producten werk je terug, via de rapportage systemen, richting de uiteindelijke bronsystemen van de data. Dus terugwerken richting de bak en niet starten vanuit de grote bak van gegevens. Veel gegevens worden vastgelegd maar halen het uiteindelijk tot informatie. Het inzichtelijk maken van de wijze waarop welke data elementen getransformeerd worden tot uiteindelijke informatieproducten wordt ook wel dataflow of datalineage genoemd.

Doel van de analyse om vast te stellen welke data echt van belang is. Deze individuele data elementen met beschrijvende karakteristieken zoals nummer, naam, type (bijvoorbeeld bedrag, datum, postcode etc), bron, dataeigenaar en data kwaliteitsregels etc worden vastgelegd in ‘het woordenboek’ (data dictionary) van de organisatie. Data kwaliteitsregels zijn de basis voor het meten en het uiteindelijk verbeteren van de data kwaliteit. Soms zijn redelijke simpele maatregelen bij de eerste vastlegging heel effectief in het verhogen van de datakwaliteit. Dat afdelingen alleen al van elkaar weten welke data voor hen van belang is helpt al enorm.

Stay clean

Twee belangrijke maatregelen om schoon te blijven zijn de data beheerprocessen en de rollen en verantwoordelijkheden (ook wel data governance genoemd). Net als bijvoorbeeld voor IT dienen er processen te worden ingericht voor het afhandelen van data-incidenten en datawijzigingen. Hoe zien de processen en de bijbehorende governance eruit: wie heeft welke rol? Wie is dataeigenaar, wie is de databeheerder (veelal data steward genoemd). Maar ook hoe de verschillende dataeigenaren en stewards onderling communiceren en hoe ze bijvoorbeeld bij IT of proceswijzigingen worden betrokken die impact hebben op data.

En dan nog het belangrijkste proces en het sluitstuk op de data management maatregelen: de daadwerkelijke monitoring van data kwaliteit van de data uit de dictionary op basis van de data kwaliteit regels. De hiervoor benodigde tooling is afhankelijk van de situatie; kleinschalig op basis van Excel of grootschalig op basis van specifieke tooling. Met dit proces is cirkel van data management maatregelen rond.

De eerste werkzaamheden worden veelal projectmatig uitgevoerd maar het is zaak om ‘de lijn’ tijdig te betrekken bij het verbeteren van de data kwaliteit. Dit is essentieel om niet alleen schoon te worden maar schoon te blijven.

Door volgtijdig behapbare delen van de data op te pakken en de lijn op tijd te betrekken wordt data kwaliteit stap voor stap geïmplementeerd. Goed om gedurende het project data te blijven analyseren door middel van data profiling om na te gaan in hoeverre de genomen maatregelen effectief zijn. Data kwaliteit kan heel weerbarstig zijn dus zaak om goed te blijven communiceren en het personeel tijdig te trainen. De uitkomsten uit de data profiling helpen ook om het concreet te houden en het doel scherp: get clean & stay clean!

In de laatst blog in deze reeks gaan we verder in op hoe data kwaliteit in de keten kan worden gerealiseerd.

Mede auteurs van deze blog zijn Peter Smit en Henk Hendriks

Neem contact met ons op

 

Offerteaanvraag (RFP)

 

Bevestig