De financiële wereld kan miljoenen euro’s besparen door, in plaats van productiedata, synthetische data te gebruiken bij testprocessen. Door recente software- en securityblunders zijn HSBC, Credit Suisse en UBS voor grote bedragen het schip in gegaan door diefstallen uit hun testsystemen.

Wat is synthetische data?

Synthetische data is data die voortkomt uit statistische modellen waarbij de input gevarieerd wordt. Hierdoor komt er steeds andere output, ook wel de synthetische data genoemd. Deze data wordt dus speciaal gecreëerd om modellen te testen en om de conclusies daaruit vervolgens in te zetten voor bedrijfsprocessen. Productiedata daarentegen is “echte” data die voortkomt vanuit het echte bedrijfsproces en die daar ook weer voor kan worden ingezet.

De Europese Unie moedigt het gebruik van synthetische data aan, aangezien er aan nieuwe wetten wordt gewerkt die in 2016 van kracht zullen gaan en waarbij in veel gevallen het gebruik van productiedata wordt verboden.

Waarom geen productiedata meer?

Maar waarom wordt het gebruik van productiedata verboden? Dit komt voornamelijk doordat het gebruik van productiedata gewoonweg te gevaarlijk is. Zelfs wanneer deze data wordt geanonimiseerd, zijn de risico’s nog groot.

Samuel Mischler, hoofd software development bij SQS, zegt hierover: “De afgelopen decennia hebben we productiedata gebruikt voor het testen van applicaties. Daar kleven, behalve de veiligheid, nog andere nadelen aan, zoals een gebrek aan variatie. Ondertussen is de aanpak om synthetische data te gebruiken volwassen geworden. Daarmee is het een betrouwbare aanpak geworden die de zwakheden en risico’s aan het gebruik van productiedata voorkomt.”

Gebruik van synthetische data neemt toe

Mischler gaat verder: “Gelukkig wordt het gebruik van synthetische data steeds meer gemeengoed bij banken”, zegt Samuel Mischler, hoofd software development bij SQS, ‘s werelds meest toonaangevende specialist op het gebied van softwarekwaliteit. Bij synthetische data zijn alle persoonlijke gegevens en persoonlijk identificeerbare data geanalyseerd en geheel vervangen.”

“Iedereen in de software development wereld weet dat de businessvalue in de softwarecode zit. Toch worden applicatie-ontwikkeling en het testen van bedrijfskritische data uitbesteed. Mischler: “Maar meer nog dan in de code, ligt de waarde in de data zelf. Als je software ontwikkeling met productie gerelateerde data uitbesteed, dan neem je als bedrijf enorme risico’s, omdat producten en businesscases gekopieerd kunnen worden. Door het gebruik van synthetische data, bescherm je de businessvalue van je organisatie.”

De grote voordelen van testen met synthetische data zijn dat de data herbruikbaar is en dat het niet zal worden gestolen of misbruikt, omdat het zonder context niet veel waarde heeft. Hoe u controle kunt houden over data en hoe u deze kunt analyseren, kunt u vinden in de onderstaande whitepapers:

Door: Birgit Bunt, Bron: SQS