Data analyse laat je niet over aan een slim neefje | KPMG | NL

Data analyse laat je niet over aan een slim neefje

Data analyse laat je niet over aan een slim neefje

We zijn verslaafd aan data en nemen steeds meer beslissingen (mede) op basis van data analyse. Dat stelt ook hoge eisen aan hoe data scientists de onderliggende algoritmes ontwikkelen. En dat mag wel een tandje professioneler.

1000

Senior Manager Big Data & Analytics

KPMG Nederland

Contact

Gerelateerde content

Toen internet eind vorige eeuw bij de massa begon door te breken wilde vrijwel elke organisatie een website en was er altijd wel het spreekwoordelijke neefje dat raad en daad beschikbaar had. Inmiddels zijn we enkele decennia verder en is er sprake van een enorme professionalisering in de (uitvoering van) online strategieën van organisaties. Tot op zekere hoogte is er iets soortgelijks aan de hand in de opkomst van data analyse die nu nog enigszins in de kinderschoenen staat. Veel organisaties zijn er mee bezig en een aantal van hen boekt mooie successen. Toch is er onderhuids nog veel verbetering mogelijk en is een professionele aanpak soms ook ver te zoeken. Data scientists werken namelijk vaak met groot enthousiasme en kennis van zaken maar laten ook nogal eens steken vallen ten aanzien van belangrijke randvoorwaarden. Zo is bijvoorbeeld het versiebeheer vaak niet goed geregeld en is het ontwikkeltempo laag omdat onvoldoende wordt voortgebouwd op beschikbare modules van collega’s die zich al in de praktijk hebben bewezen.

Dat is zonde en zet in de praktijk een rem op het benutten van het volledige potentieel van data analyse. In onze visie moet het anders en kan het ook anders. Het KPMG Big Data team heeft daartoe Eskapade ontwikkeld, dat de open source bouwstenen biedt voor structurering van het ontwikkelproces, een grote mate van herbruikbaarheid van software code en het snel in productie nemen van ontwikkelde analyses. Eskapade maakt het data scientists daarmee mogelijk om kosteloos naar het volgende niveau van professionalisering te gaan.

Deze aanpak stimuleert tot daadwerkelijke implementatie en succesvolle toepassing van data analyse. In de praktijk zijn feedback loops daarbij essentieel: een model genereert immers bepaalde uitkomsten en de gebruikers daarvan (vaak de business) grijpen die uitkomsten vaak aan om wensen te formuleren over hoe het beter kan. Dat leidt dan in het ultieme geval tot een continue verbetercyclus waarin de data analyse modellen nooit ‘af’ zijn. Juist dat vraagt om professionalisering van de ontwikkelprocessen.

Eskapade integreert naadloos met andere open-source projecten gericht op big data toepassingen en machine learning problemen. Het kan gebruikt worden als een zelf-lerend framework voor typische feedback problemen zoals hierboven geschetst. Getrainde algoritmes kunnen voorspellingen leveren op real-time of batch data bronnen en experts geven feedback. Deze machine learning algoritmes verbeteren over de tijd, en Eskapade verzorgt de evaluatie en boekhouding daarvan.

De ontwikkeling van Eskapade is gebaseerd op eerdere werkervaringen van teamleden bij CERN. Het onderzoek naar het Higgs-boson deeltje in het Zwitserse Genève was eigenlijk het decor voor de Champions League in data analyse. In die omgeving werd ook duidelijk dat naadloos samenwerken aan geavanceerde data analyse in teamverband niet vanzelf gaat, maar vraagt om goede instrumenten waarmee data scientists verder kunnen bouwen op elkaars werk en waarin ook kwaliteitseisen goed zijn geborgd.

Deze ervaringen zijn vertaald naar Eskapade dat nu die professionele standaarden voor iedereen bereikbaar maakt. Data scientists kunnen met het pakket in teamverband hun aanpak op een eenvoudige wijze professionaliseren, gebruik makend van de programmeertaal Python. Een van de voordelen is hergebruik van analyse code: ontwikkelaars kunnen op elkaars werk voortbouwen volgens de open source principes. Dat is voor vrijwel elk project nuttig, want meestal is er sprake van een aantal standaardonderdelen zoals het beoordelen van de datakwaliteit of het bouwen en valideren van voorspellende analyses. Data scientists kunnen daartoe middels Eskapade eenvoudig generieke modules hergebruiken of zelf bouwen. Een ander belangrijk voordeel is versiebeheer van analyses, een domein wat in dit nog jonge vakgebied veel minder ver ontwikkeld is dan in bijvoorbeeld de ontwikkeling van IT-systemen. Zo biedt Eskapade eigenlijk de mogelijkheid om alle benodigdheden voor professionaliteit aan elkaar te klikken, als waren het Lego steentjes.

De aanpak van Eskapade is vernieuwend en is nodig voor het volwassen worden van het vakgebied. Er staat veel op het spel. Beslissingen worden steeds meer ondersteund door data en analyses, variërend van voorspellend onderhoud van spoorwegwissels tot diagnose van patiënten door huisartsen. In alle gevallen is het zaak dat de onderliggende data analyse kan worden vertrouwd en kan worden ge-audit. Dat vraagt om professionele code die in productie kan draaien, en dat is precies wat Eskapade biedt.

Decision Management (ESKAPADE)

Decision Management (ESKAPADE)

Een zelf-lerende data gedreven open source oplossing dat door continue feedback, veranderende situaties en inzichten zich blijft verbeteren.

Neem contact met ons op

 

Offerteaanvraag (RFP)

 

Bevestig

Nieuwe digitale platform van KPMG

KPMG International heeft een state of the art digitaal platform ontwikkeld dat uw digitale ervaring verbetert en het vinden van nieuwe en relevante content optimaliseert.

 
Lees meer