Waarom bedrijven aarzelen om hun datakwaliteit te analyseren en te meten ?

Geplaatst op door Wim Lagae

Businesspeople Looking at Graph in MeetingData vormt het hart van elke applicatie. Zonder data, geen applicaties. Zonder goede data geen goede applicaties.

Goede data bepaalt de snelheid waarmee het hart kan kloppen. Elke vorm van data die ontbreekt, van slechte kwaliteit is of gewoon dubbel voorkomt in het systeem kan evenzeer worden gemist als hartritmestoornissen. Want elke vorm van slechte data kan leiden tot frustratie van de eindgebruiker, foute keuzes tussen dubbele gegevens, rapporten die niet de volledige scope weergeven omwille van ontbrekende data, enz.

We zijn het er dus over eens dat alle data waarmee we werken van een minimale kwaliteit dient te zijn. Maar wat is de definitie van die minimale kwaliteit ? Hoe weten we dat we die waarde bereikt hebben ? En vooral hoe weten we welke data die kwaliteit niet heeft, zodat we er iets aan kunnen doen.?

Veel vragen waarop ik hier stap per stap een antwoord wil formuleren.

Ten eerste moeten we in kaart brengen waar onze data vandaan komt. Wat zijn onze bronnen ? Let hierbij op dat niet enkel machines (systemen) onze bronnen vertegenwoordigen, maar ook personen. Die laatste groep is zeer belangrijk, want het zijn mensen die meestal het slechtst scoren op datakwaliteit.

Dan moeten we onze bronnen leren kennen. We moeten alle metadata van de bron verzamelen, om voor die bron doelstellingen te kunnen vooropstellen.

Het in kaart brengen van de gebruikers is een veel moeilijkere taak. Want hier bepalen de processen wie wat mag doen met een bepaald dataobject. Dus buiten de databron zelf moet ook het proces verduidelijkt worden. Processen in kaart brengen kan moeilijk geautomatiseerd worden, niettegenstaande er systemen bestaan die deze reverse engineering claimen te kunnen doen. ARIS business process reengineering is er ééntje van.

Eens we deze bronnen hebben opgelijst kunnen we overgaan tot de volgende stap: het meten van de kwaliteit van die bron.

Struisvogel

In deze fase spelen we vaak de rol van struisvogel. Er zijn namelijk risico’s verbonden aan het meten van de datakwaliteit. Meten is weten. En dit weten kan leiden tot KPI’s voor teammanagers die nu opeens gemeten worden op datakwaliteit, wat niet altijd wenselijk is.

Toch is deze stap zeer belangrijk. Want het ontbreken van een goede datakwaliteit kan zeer veel ongewenste neveneffecten hebben. Gebruikers kunnen gefrusteerd raken, er komen klachten, mensen raken overwerkt door het inefficiënte werk … maar er is natuurlijk ook een business impact. Alle data zit onderaan in de “information ladder”. Vermits onze data onderaan zit, is de kwaliteit ervan bepalend voor alles wat eruit voortvloeit. Een slecht fundament kan enkel leiden tot slechte informatie die doorvloeit naar de top.

Mappen we dit gegeven op de business impact dan wordt het duidelijk dat we alle dubbele data, slechte adressen en andere onvolledige gegevens kunnen missen als kiespijn.

Wim1

Bewustmaking

De vraag is nu hoe we de organisatie bewustmaken van de noodzaak van datakwaliteit ?

Dit kan enerzijds door het opleggen van KPI’s of door een goede rapportering. KPI’s op datakwaliteit kunnen echter repressief overkomen waardoor ik eerder zou opteren voor de aanpak van rapportering.

In de meeste organisaties is een rapportering op datakwaliteit nagenoeg onbestaande. Nochtans kan een goede en eenvoudige rapportering aantonen dat het management het belangrijk vind dat iedereen de data juist invult in het systeem.

Indien deze rapportering gekoppeld is aan de kost van foute data, dan is de bewustmaking volledig. Het is immers pas wanneer er kosten bespaard kunnen worden dat organisaties het belang inzien van datakwaliteit.

Waar is het pijnpunt ?

De rapportering gaat dan meestal over het aantal dubbele records in de dataset, het percentage aan niet ingevulde velden, foute templates die gebruikt worden, emailadressen die in een fout veld werden ingevuld, enzovoort. Elk bedrijf kan gemakkelijk een honderdtal regels vinden die gemeten dienen te worden.

Deze regels komen natuurlijk niet uit de lucht gevallen. Datakwaliteit moet beschouwd worden als een project dat start met een analyse van de huidige data. Hiervoor zijn er tools die dit automatiseren, en die de business helpen met het definiëren van regels op de data. Na het definiëren van de regels kunnen deze gekoppeld worden aan de brondata, zodat er een score aan foute of goede records kan worden berekend. De volgende stap is dan deze scores te combineren in een overzichtelijk dashboard.

Indien dit dashboard dan gepubliceerd wordt op het intranet is er een eerste aanzet tot bewustmaking gezet.

Hieronder een voorbeeld van een dashboard dat gegenereerd werd door SAP Information Steward :

Wim2

Business Case

Ik hoop dat ik bewezen heb dat het cruciaal is om de datakwaliteit in kaart te brengen. Toch is het zeker niet evident om als organisatie te starten met dit proces. De organisatie zelf moet er immers klaar voor zijn.

Dat kan in vele vormen. Sommige bedrijven hebben een data steward rol in de organisatie. Soms is de interne auditor de belanghebbende. Soms zijn de departementshoofden vragende partij.

Hoe het ook wordt opgezet, er is steeds een buy-in nodig vanuit het management. Eén van de manieren om deze te krijgen is door het uitwerken van een business case. Hiervoor zijn vaak externe services nodig die enerzijds de organisatie klaarstomen voor het project, en die anderzijds de vervuiling van de huidige data in kaart proberen te brengen.

Veel van onze partners hebben hiervoor service offererings. Eén ervan wil ik even uitlichten, omdat deze een korte studie omvat met meetbare resultaten. Backoffice Associates noemt het “Data Quality as a Service”. Het voordeel van deze éénmalige korte service is dat de resultaten kunnen worden gekoppeld aan een lange-termijn visie. De regels die worden gemeten kunnen immers worden opgeladen in SAP Information Steward zodat het bovengenoemde dashboard permanent ter beschikking staan.

Zo is de cirkel rond.

Share on LinkedInShare on FacebookTweet about this on TwitterShare on Google+Email this to someone

Ce message est également disponible en Engels (Français)

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *

De volgende HTML tags en attributen zijn toegestaan: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>