Hoe haal je harde feiten uit miljoenen Paradise Papers? |

Hoe haal je de harde feiten uit 13 miljoen Paradise Papers?

Hoe haal je harde feiten uit miljoenen Paradise Papers?

Afgelopen zondag kwam het journalistencollectief International Consortium of Investigative Journalists (ICIJ) naar buiten met de onthulling van schimmige belastingconstructies van vele beroemdheden en bedrijven van overal ter wereld. Meer dan 380 journalisten uit 67 landen hebben in meer dan een jaar tijd 13,4 miljoen bestanden doorzocht. Het doorzoeken en linken van allerlei documenten zoals e-mails, spreadsheets, scans en andere typen documenten lijkt een onmogelijk opdracht. Hoe kan je uit zo een berg ongestructureerde data toch tot een helder verhaal komen?

1000

Gerelateerde content

Harde feiten uit miljoenen papers

In de eerste plaats wil je natuurlijk weten waar je moet zoeken. Wat de Paradise Papers uniek maakt is de combinatie van 2 verschillende databronnen. Ten eerste is de administratie van een belastingadvieskantoor doorzocht. Maar wat uniek is aan deze casus, is dat deze informatie is verrijkt met registers (zeg maar de Kamer van Koophandel) uit 19 belastingparadijzen waardoor een goed beeld is te reconstrueren over hoe de geldstromen lopen. Om van al deze data een helder verhaal te maken, moet de data doorzoekbaar worden gemaakt en moeten er koppelingen tussen documenten en de registers gemaakt worden.

Om de documenten doorzoekbaar te maken heeft het ICIJ de software Nuix gebruikt. Deze applicatie maakt het mogelijk om door alle 13,4 miljoen bestanden te zoeken door middel van filters en zoektermen. Hiermee kan je op zoek naar een specifiek individu of bedrijf, maar dan moet je nog steeds per persoon en per bedrijf al deze documenten bekijken om relaties met andere personen en bedrijven op te kunnen sporen. Voor de nieuw gevonden personen bedrijven zullen tevens zoekopdrachten geschreven worden om het totale netwerk aan betrokkenen in kaart te kunnen brengen. Best veel werk dus!

Naast zoeken is het in Nuix ook mogelijk om op geautomatiseerde wijze zogenaamde ‘entiteiten’ uit de bestanden te halen. Hiermee worden alle personen en bedrijven per document uit ieder document gehaald. Dit is hele handige informatie om te koppelen aan de registers, want zo kan een netwerk gemaakt worden dat duidelijk maakt welke entiteiten aan elkaar te koppelen zijn en uit welke documenten dit blijkt. Dit geeft al gelijk een beeld van welke documenten interessant zijn.

Hoewel je met slimme applicaties en analyses gericht kunt zoeken en potentiële verbanden kunt leggen, blijft het aan journalisten om deze verbanden te onderzoeken en hier correcte conclusies aan te verbinden. Hiervoor moeten er echt documenten bekeken en gelezen worden. Nuix maakt het naast analyseren van de documenten ook mogelijk om deze documenten te lezen en de conclusie direct vast te leggen. Dit word doorgaans het taggen van documenten genoemd en zo’n tag kan bijvoorbeeld aangeven dat een document relevant is en op welke bedrijven of personen dit document betrekking heeft. Technologie staat het toe om dit op één centrale locatie op te slaan en toegankelijk te maken middels een beveiligede verbinding. Hierdoor konden alle leden van het ICIJ verspreid over de wereld via internet zelf hun onderzoeken uitvoeren en een verhaal vormen uit de ruwe data.

Het omvormen van een enorme bak data tot verhalen en artikelen die insloegen als een bom in alle media is een kunst. De leden van het ICIJ hebben over deze de Paradise Papers meer dan een jaar gedaan. Zonder een e-discovery tool als Nuix had het nog vele malen langer geduurd om tot deze resultaten te kunnen komen. Daarbij komt dat je met alleen e-discovery software nog lang niet klaar bent. Het onderzoeken en vastleggen van verbanden op een productieve en gestructureerde wijze blijft gedeeltelijk handwerk en vereist onderzoeksvaardigheden. Dit is een realiteit waar wij bij KPMG in de forensische onderzoeken voor onze klanten ook op dagelijkse basis mee te maken hebben.

De Paradise Papers zijn de nieuwste editie in een reeks onthullingen over belastingparadijzen van de afgelopen jaren. Het zal naar alle waarschijnlijkheid niet de laatste zijn en onderzoeken naar dit soort grote hoeveelheden ongestructureerde data zullen voor journalisten en andere onderzoekers een interessante uitdaging blijven.

Referenties

Rol van nuix bij het onderzoek: https://www.arnnet.com.au/article/597317/nuix-essential-icij-panama-papers-investigation/

Site van collectief: https://www.icij.org/investigations/paradise-papers/about/

Nuix featue Named Entity Extraction, onderdeel van nuix gebruikt om uit ongesturctureerde data mbv regular expressions entiteiten te extracten en te linken met andere data: https://www.nuix.com/2014/07/01/textual-analytics-named-entity-extraction

Artikelen van trouw met onhullingen: https://www.trouw.nl/home/nieuwe-onthullingen-uit-belastingparadijzen~af083af4/


https://www.trouw.nl/home/~a3f377f8
 

Neem contact met ons op

 

Offerteaanvraag (RFP)

 

Bevestig