KAVE-ecosysteem ontsluit het potentieel van Big Data

Bouwblokken voor schaalbare, beheersbare en kostenefficiënte data-analyse.

1000

De enorme hoeveelheid data waarover we beschikken, neemt exponentieel toe. Die groei biedt ons steeds meer kansen om waarde te creëren via data-analyse. Met Big Data kunnen we aanzienlijke vooruitgang boeken, van eenvoudige bestandsreductie tot de optimalisering van milieusystemen in kantoren en op maat gemaakte consumentenpromoties, en zelfs meer gerichte kankerbehandelingen. We staan nog maar aan het begin: de meest waardevolle toepassingen moeten nog komen.

Door ten volle gebruik te maken van je eigen data, creëer je waarde: voor mensen, voor de samenleving, voor klanten, voor bedrijven en overheden. Om op een eenvoudige manier inzichten uit interne en externe data te halen en daarmee nieuwe toepassingen te bedenken, moet je eerst echter een aantal obstakels overwinnen waarmee veel organisaties worstelen. Om welke obstakels gaat het onder meer?

1. Datasilo's

Data analyseren is vaak een traag proces. Een van de belangrijkste oorzaken is de huidige structuur waarmee partijen dat proberen. Of, beter gezegd, het ontbreken van een goede structuur. Dat geldt voor interne organisaties, maar wordt vooral duidelijk wanneer een organisatie externe data wil gebruiken en daarvoor steeds opnieuw een gelegenheidspartnerschap moet smeden met een of meerdere partijen. Steeds weer moeten zulke organisaties uitvinden welke technologie geschikt is, welke analysesoftware en algoritmes ze zullen gebruiken, hoe ze de privacy kunnen waarborgen en hoe ze de voorwaarden zullen vastleggen voor het gebruik van de gegevens. Dat moedigt bedrijven en overheden allerminst aan om het maximum te halen uit data-analyse, en dat is nog zacht uitgedrukt.

2. Het idee van een ecosysteem

In de ideale wereld bestaat er een ecosysteem waarin organisaties (gecontroleerd) inzichten uit data met elkaar kunnen delen. Een ecosysteem waarin verschillende opties bestaan over de wijze waarop die inzichten worden gedeeld. In de ideale omgeving krijgt iedereen bovendien de ruimte om applicaties te bouwen met behulp van de beschikbare data. De een zal bijvoorbeeld mogelijkheden zien voor een app die de files beter voorspelt op basis van locatiedata in combinatie met meteorologische data. Een ander zal zich richten op modellen om te voorspellen welke auto-onderdelen moeten worden vervangen: het ecosysteem voorziet in de vereiste mechanismen om die inzichten te verwerven als alle telecomproviders, autofabrikanten en het lokale meteorologisch instituut eraan meewerken. In deze ideale wereld krijgen alle partijen de vrijheid om een idee te realiseren op basis van de data in het ecosysteem – uiteraard volgens de voorwaarden die de eigenaars stellen aan het gebruik van hun data.

3. Inzichten delen als een bron van waardecreatie

Het echte potentieel van data-analyse zit in het delen van inzichten uit data. Denk bijvoorbeeld aan de sprong voorwaarts die er gemaakt kan worden in het verbeteren van medische diagnoses en behandelingen. Dat is mogelijk als we inzichten in (geanonimiseerde) data uit verschillende bronnen kunnen combineren, ten gunste van het algemene welzijn. Hetzelfde is van toepassing op organisaties. Een financiële instelling zou het gebruik van een krediet- of debetkaart nog veiliger kunnen maken als ze inzicht heeft in locatiedata: als een kredietkaart op een andere locatie wordt gebruikt dan waar de smartphone van de eigenaar zich bevindt, kan mogelijke fraude worden vermeden. Daarvoor moet de bank de informatie over de locatie van de telefoon (bijvoorbeeld met behulp van data van een telecomprovider) kunnen combineren met de eigen informatie over het kaartgebruik.

Elementen van het ecosysteem

De hierboven besproken thema's gaven aanleiding tot de ontwikkeling van KAVE. KAVE vormt het hart van een nieuw ‘Big Data Ecosystem’, waar de praktische bezwaren om tot een snelle, eenvoudige en consistente Big Data-analyse te komen, verdwijnen. Met KAVE biedt KPMG een nieuwe manier om op een veel eenvoudigere manier applicaties voor data-analyse te ontwikkelen. Standaardisering van data of technologie is niet langer nodig; er zijn afspraken gemaakt over de voorwaarden voor het delen van zowel inzichten uit data als data-analyseapplicaties. Tegelijk is het hoogste niveau van gegevensbeveiliging gegarandeerd, evenals een volledige transparantie over het gebruik van persoonsgegevens. Inzichten uit de toenemende hoeveelheid data en data-analyses van overheden, bedrijven en individuen kunnen dankzij KAVE op een betrouwbare, snelle en eenvoudige manier worden geïntegreerd en gedeeld. Deze voorwaarden worden ondersteund door de essentiële kenmerken van KAVE.

Naleving van de privacyregels is zonder twijfel onze voornaamste prioriteit. Dat doen we door met Trusted Third Parties (TTP's) te werken. Persoonsgegevens worden omgezet in geanonimiseerde data, en noch de TTP, noch de leverancier, noch de verwerker kan deze anonimisering opheffen. Een ontwikkelaar of datawetenschapper kan de data dus niet koppelen aan een persoon. De naleving van de privacyregels, zoals vastgelegd bij wet, wordt ondersteund door de technologie en de structuur van het systeem.

Als de gebruiker uitdrukkelijk verklaart dat zijn of haar persoonsgegevens voor een bepaald doel mogen worden gebruikt, of in geval van een rechtmatig belang, zoals een rechterlijk vonnis, kunnen de geanonimiseerde data worden teruggekoppeld, en zal de partij die aan alle juridische en ethische vereisten voldoet, de data aan de juiste persoon kunnen koppelen (dit proces heet re-identificatie). Daarvoor is de samenwerking van alle partijen in het geanonimiseerde proces vereist, en die verdeling van de verantwoordelijkheden zorgt ervoor dat de regels en richtlijnen worden nageleefd.

De omgeving moet alle gebruikelijke dataformaten en -structuren kunnen verwerken. Voorheen was dat vaak een obstakel. Nu beschikken we echter over geavanceerde tools, methodes en technologie waarmee we nagenoeg alle data kunnen verwerken. Zo zijn data eigenlijk Legoblokjes geworden: ze passen altijd en je kunt er elk gewenst model mee bouwen. Bovendien wordt data-analyse horizontaal uitgevoerd en is het dus eenvoudig schaalbaar: je kunt de capaciteit onmiddellijk opvoeren door het aantal computers te verhogen (en eenvoudig verminderen in een cloudomgeving). Ter vergelijking: klassieke databases opschalen zorgt vaak voor technische en/of financiële problemen.

Er moeten duidelijke afspraken mogelijk zijn rond de voorwaarden van de dataverwerkende partij voor de analyse van de data en de voorwaarden van de data-analyserende partij voor het gebruik van de analyse. Verder is er ook overleg nodig over de fees voor het gebruik van de data (bijvoorbeeld via abonnementen), de gebruikskosten van de omgeving en de doelstellingen van de analyse.

Het ecosysteem moet open zijn. De kracht van een ecosysteem, waarin een grote hoeveelheid data wordt verwerkt, zit in het open-sourceplatform dat wordt gebruikt om applicaties te bedenken en te ontwikkelen. De ontwikkelaars zijn vrij om voorwaarden op te leggen voor het gebruik van hun apps, en de dataverwerkers zijn vrij om voorwaarden te bepalen voor de apps die zij willen gebruiken voor hun data-analyse.

Data-analyse is kwaliteitscontrole. Data-analyse is meer dan alleen de verwerking van gegevens. De kwaliteit van met name complexe analyses wordt niet bepaald door de rekenkracht van de computer maar door het werk van de data-analist. De uitdaging bestaat er niet zozeer in om patronen te vinden, maar om patronen in data te begrijpen en te interpreteren, zonder vooroordelen. Alleen dan leidt data-analyse tot waardevolle – niet rampzalige – conclusies. Er moet bij de analyse van grote hoeveelheden data rekening worden gehouden met het risico op verkeerde interpretatie, omdat er bij de analyse van grote dataverzamelingen altijd wel een opmerkelijke correlatie te vinden is. Daarom kan, indien gewenst, de kwaliteit van een analyse worden gecontroleerd met een peer-reviewsysteem. Dat is een essentieel kenmerk van het ecosysteem, om te vermijden dat er onjuiste conclusies worden getrokken. Naast deze controle kunnen desgewenst ook onafhankelijke derde partijen de analyse bekrachtigen.

Lees de andere artikelen

Ga terug naar de overzichtspagina

The KPMG Difference

© 2024 KPMG Central Services, een Belgische vennootschap onder firma ("VOF/SNC") en lid van de KPMG wereldwijde organisatie van zelfstandige ondernemingen die verbonden zijn aan KPMG International Limited, een "private English company limited by guarantee". Alle rechten voorbehouden.

Ga voor meer informatie over de wereldwijde structuur van KPMG naar https://kpmg.com/governance.

Neem contact met ons op

Zoek kantoorlocaties kpmg.findOfficeLocations
kpmg.emailUs
Sociale media @ KPMG kpmg.socialMedia

Mijn profiel

Blader door artikelen en kies uw interesses.

Printvriendelijke versie

KAVE-ecosysteem ontsluit het potentieel van Big Data

KAVE-ecosysteem ontsluit het potentieel van Big Data

Lees de andere artikelen

Ga terug naar de overzichtspagina

Neem contact met ons op

Mijn profiel

Welkom

Welkom