Onafhankelijke AI-red-teaming · Nederland & EU

Breek het privé.
Bewijs het in het openbaar.

Redproof valt je LLM- en agentproducten aan zoals een echte tegenstander dat zou doen, en geeft je vervolgens het bewijs dat je zelfbeoordeling onder de EU AI-verordening nodig heeft. Veel beter dat jij de zwakke plekken nu vindt dan dat een toezichthouder of de inkoopafdeling van een klant ze later vindt.

De klok die al loopt
2 aug
2026

Het grootste deel van de EU AI-verordening wordt dan van kracht voor AI-systemen met een hoog risico en AI voor algemene doeleinden. Vanaf dat moment is adversarial testing geen luxe meer. Inkoopteams in gereguleerde sectoren vragen al om een red-teamrapport voordat ze iets tekenen. Ongeveer 3.200 Nederlandse bedrijven vallen er direct onder, en het werk zelf kost weken. Het echte risico is om te lang te wachten.

Wat we testen

We testen het hele systeem, niet alleen het model.

Het basismodel is zelden de zwakke plek. De echte gaten zitten in je prompts, je retrieval-pipeline en de tools die je agent mag aanroepen. Daar gaan we zoeken.

LLM01

Prompt-injectie

Direct en indirect, inclusief payloads verstopt in de documenten, webpagina's en tooluitvoer die je agent stilzwijgend vertrouwt.

LLM02

Data-exfiltratie

Het systeem verleiden om system-prompts, geheimen, trainingsdata of gegevens van andere gebruikers te lekken.

LLM03

Jailbreaks

Multi-turn- en framing-aanvallen die je guardrails stap voor stap de deur uit werken.

LLM04

Tool- & agentmisbruik

Een agent zover krijgen dat hij API's aanroept, geld verplaatst of acties uitvoert die nooit de bedoeling waren.

LLM05

Onveilige output

Schadelijke, lasterlijke of niet-conforme inhoud die je gebruikers, of een toezichthouder, naar boven kunnen halen.

LLM06

Misbruik van bedrijfslogica

De exploits die specifiek zijn voor jouw product: je prijsstelling, je workflow, je datagrenzen.

Hoe een opdracht verloopt

Een vaste, voorspelbare volgorde.

01

Scope

We leggen samen het doelsysteem, het dreigingsmodel en de spelregels vast, allemaal op papier.

02

Aanvallen

Eerst automatische breedte, daarna handmatige diepgang waar de echte bevindingen zich verschuilen.

03

Triage

Elke bevinding gerangschikt op ernst, met een werkend bewijs van exploit.

04

Rapport

Bevindingen in begrijpelijke taal, gekoppeld aan OWASP LLM en de relevante artikelen van de AI-verordening.

05

Hertest

Jij verhelpt, wij testen opnieuw, en je bewijs laat zien dat de fix standhield.

Tarieven

Pakketten met vaste scope. Geen "neem contact op met sales"-doolhof.

De meeste teams beginnen met een Volledige opdracht en stappen daarna over op een kwartaalretainer naarmate het product verandert.

Baseline

Baseline Scan

vanaf €3.500
  • Geautomatiseerde tests op één LLM-functie
  • Bevindingenrapport met ernstniveau
  • 3–5 dagen
Populairste keuze

Volledige opdracht

vanaf €8.000
  • Geautomatiseerde + handmatige maataanvallen
  • Koppeling aan OWASP LLM + AI-verordening
  • Begeleiding bij herstel
  • 2–3 weken
Agents

Agentopdracht

vanaf €15.000
  • Volledige opdracht op een tool-gebruikende agent
  • Tests op toolmisbruik & actieveiligheid
  • Hertest inbegrepen
  • 3–4 weken
Doorlopend

Retainer

vanaf €1.500 / kwartaal
  • Hertest naarmate je systeem verandert
  • Dekking voor nieuwe aanvallen
  • Altijd actueel bewijs

Enterprise-leveranciers beginnen rond €15k voor één opdracht, en vaak doet een junior het eigenlijke testwerk. Bij Redproof is degene die je systeem begrijpt ook degene die het test. Geprijsd voor de fase waarin jij zit, niet die van hen.

Wie zit erachter

Geen scanner met een logo.

Redproof is de praktijk van een production-AI-engineer die voor zijn werk grote modellen bouwt en evalueert. De meeste securitybureaus richten een tool op je endpoint en mailen je de uitdraai. Redproof werkt zoals een aanvaller dat echt doet, want het bouwen én breken van deze systemen is hier het dagelijks werk, geen bijzaak.

Degene die je opdracht scopet, is dezelfde die de aanvallen uitvoert en het rapport schrijft. Geen overdracht aan een junior, geen accountmanager ertussen. Naarmate het werk groeit, betrekt Redproof gescreende specialisten voor de grotere klussen, maar de norm blijft bij elke test gelijk: senior handen, van begin tot eind.

Ontdek waar je AI breekt voordat iemand anders dat doet.

Begin met een kort gesprek om het werk te scopen. Je krijgt binnen een dag een vaste offerte en een paar weken later de bevindingen in handen.