Redproof: AI-red-teaming in Europa & beveiligingstests EU AI Act

Q: Wat als we het niet eens zijn met een bevinding?

Dat bespreken we in het walkthrough-gesprek. Elke bevinding komt met een werkende proof of exploit en een vaste severity-rubriek, maar als iets echt niet exploiteerbaar is of bekende, geaccepteerde schuld is, zeggen we dat en annoteren we het. Het bewijs is alleen nuttig als het eerlijk is.

De klok die al loopt

2 aug
2026

Het grootste deel van de EU AI-verordening wordt dan van kracht voor AI-systemen met een hoog risico en AI voor algemene doeleinden. Vanaf dat moment is adversarial testing geen luxe meer. Inkoopteams in gereguleerde sectoren in heel Europa vragen al om een red-teamrapport voordat ze iets tekenen. Ongeveer 3.200 Nederlandse bedrijven vallen er direct onder, en het werk zelf kost weken. Het echte risico is om te lang te wachten.

Wat ik test

Ik test het hele systeem, niet alleen het model.

Het basismodel is zelden de zwakke plek. De echte gaten zitten in je prompts, je retrieval-pipeline en de tools die je agent mag aanroepen. Daar ga ik zoeken.

LLM01

Prompt-injectie

Direct en indirect, inclusief multi-turn-jailbreaks en payloads verstopt in de documenten, webpagina's en tooluitvoer die je agent stilzwijgend vertrouwt.

LLM02

Lekken van gevoelige informatie

Het systeem verleiden om geheimen, trainingsdata, interne fouten of gegevens van andere gebruikers te lekken.

LLM05

Onveilige outputverwerking

Onveilige of niet-geëscapete output (XSS, SSRF, gelekte stacktraces) die de app rond het model vertrouwt en weergeeft.

LLM06

Excessieve autonomie

Een agent zover krijgen dat hij API's aanroept, geld verplaatst of acties uitvoert die nooit de bedoeling waren.

LLM07

Lekken van de system-prompt

Het extraheren van je system-prompt en het toolschema dat die zou moeten beschermen.

Op maat

Misbruik van bedrijfslogica

De exploits die specifiek zijn voor jouw product (je prijsstelling, je workflow, je datagrenzen), voorbij de OWASP-checklist.

Hoe een opdracht verloopt

Een vaste, voorspelbare volgorde.

Scope

Ik leg samen met jou het doelsysteem, het dreigingsmodel en de spelregels vast, allemaal op papier.

Aanvallen

Eerst automatische breedte, daarna handmatige diepgang waar de echte bevindingen zich verschuilen.

Triage

Elke bevinding gerangschikt op ernst, met een werkend bewijs van exploit.

Rapport

Bevindingen in begrijpelijke taal, gekoppeld aan OWASP LLM en de relevante artikelen van de AI-verordening.

Hertest

Jij verhelpt, ik test opnieuw, en je bewijs laat zien dat de fix standhield.

Tarieven

Pakketten met vaste scope. Geen "neem contact op met sales"-doolhof.

De meeste teams beginnen met een Volledige opdracht en stappen daarna over op een kwartaalretainer naarmate het product verandert.

Baseline

Baseline Scan

vanaf €3.500

Geautomatiseerde tests van één AI-functie (bijvoorbeeld je chatbot of documentsamenvatter)
Bevindingenrapport met ernstniveau
3-5 dagen

Populairste keuze

Volledige opdracht

vanaf €8.000

Geautomatiseerde + handmatige maataanvallen
Koppeling aan OWASP LLM + AI-verordening
Begeleiding bij herstel
2-3 weken

Agents

Agentopdracht

vanaf €15.000

Volledige opdracht op een tool-gebruikende agent
Tests op toolmisbruik & actieveiligheid
Hertest inbegrepen
3-4 weken

Doorlopend

Retainer

vanaf €1.500 / kwartaal

Hertest naarmate je systeem verandert
Dekking voor nieuwe aanvallen
Altijd actueel bewijs

Enterprise-leveranciers beginnen rond €15k voor één opdracht, en vaak doet een junior het eigenlijke testwerk. Bij Redproof is degene die je systeem begrijpt ook degene die het test. Geprijsd voor de fase waarin jij zit, niet die van hen.

Wie zit erachter

Geen scanner met een logo.

Ik ben Mohamad (Sam) Rostami, platform- en infrastructuur-engineer. Ik bouw en draai bij Together AI de productiesystemen achter grote AI-modellen. De meeste securitybureaus richten een tool op je endpoint en mailen je de uitdraai. Ik werk zoals een aanvaller dat echt doet, want weten hoe deze systemen worden gebouwd, uitgerold en gebroken is mijn dagelijks werk, geen bijzaak.

Ik scope je opdracht, ik voer de aanvallen uit en ik schrijf het rapport. Geen overdracht aan een junior, geen accountmanager ertussen. Naarmate het werk groeit betrek ik gescreende specialisten voor de grotere klussen, maar de norm blijft bij elke test gelijk: senior handen, van begin tot eind.

FAQ

De vragen die elk team als eerste stelt.

V. Kun je ons live productiesysteem testen?

Ik werk bij voorkeur op een staging- of testomgeving met geprepareerde data, maar ja, ik test productie met jouw getekende toestemming, strikte rate limits en duidelijke stopcondities. Als er risico ontstaat voor echte gebruikersdata of stabiliteit, pauzeer ik en bel ik je. Ik doe nooit load- of denial-of-service-tests.

V. Hoe lang duurt het?

Een Baseline Scan duurt 3-5 dagen, een Full Engagement 2-3 weken en een Agent Engagement 3-4 weken. Het testen zelf kost weken, dus teams die beginnen vóór procurement erom vraagt, komen niet in de knel.

V. Wat gebeurt er nadat ik een gesprek inplan?

Een scopinggesprek van 20 minuten om het doel en dreigingsmodel af te stemmen, en dan binnen een dag een vaste offerte. Geen "neem contact op met sales"-doolhof. Zodra de scope vaststaat teken je de opdrachtpapieren en de testtoestemming, geef je me toegang, test ik, en ontvang je een gerangschikt rapport plus een walkthrough-gesprek.

V. Wat heb je van ons nodig?

Wat je AI doet en de regels die het moet naleven, de tools en data die het kan bereiken, en een veilige manier om verbinding te maken. Je deelt je systeemprompt of beschrijft die gewoon. Ik werk ook met gesloten platforms van derden. Geen voorbereiding behalve een korte checklist die ik je stuur.

V. Wat als je het niet eens bent met een bevinding?

Dat loop ik met je door in het gesprek. Elke bevinding komt met een werkende proof of exploit en een vaste severity-rubriek, maar als iets echt niet exploiteerbaar is of bekende, geaccepteerde schuld is, zeg ik dat en annoteer ik het. Het bewijs is alleen nuttig als het eerlijk is.

V. Bied je doorlopende tests aan?

Ja. Nadat je hebt gepatcht draai ik de aanvallen opnieuw en laat het rapport zien dat de fixes standhouden. Naarmate je systeem verandert, houdt een kwartaal-retainer het bewijs actueel met dekking van nieuwe aanvallen. De meeste teams stappen over zodra het product regelmatig wijzigingen uitbrengt.

Breek het privé.
Bewijs het in het openbaar.