Prompt-injectie
Direct en indirect, inclusief payloads verstopt in de documenten, webpagina's en tooluitvoer die je agent stilzwijgend vertrouwt.
Redproof valt je LLM- en agentproducten aan zoals een echte tegenstander dat zou doen, en geeft je vervolgens het bewijs dat je zelfbeoordeling onder de EU AI-verordening nodig heeft. Veel beter dat jij de zwakke plekken nu vindt dan dat een toezichthouder of de inkoopafdeling van een klant ze later vindt.
Het grootste deel van de EU AI-verordening wordt dan van kracht voor AI-systemen met een hoog risico en AI voor algemene doeleinden. Vanaf dat moment is adversarial testing geen luxe meer. Inkoopteams in gereguleerde sectoren vragen al om een red-teamrapport voordat ze iets tekenen. Ongeveer 3.200 Nederlandse bedrijven vallen er direct onder, en het werk zelf kost weken. Het echte risico is om te lang te wachten.
Het basismodel is zelden de zwakke plek. De echte gaten zitten in je prompts, je retrieval-pipeline en de tools die je agent mag aanroepen. Daar gaan we zoeken.
Direct en indirect, inclusief payloads verstopt in de documenten, webpagina's en tooluitvoer die je agent stilzwijgend vertrouwt.
Het systeem verleiden om system-prompts, geheimen, trainingsdata of gegevens van andere gebruikers te lekken.
Multi-turn- en framing-aanvallen die je guardrails stap voor stap de deur uit werken.
Een agent zover krijgen dat hij API's aanroept, geld verplaatst of acties uitvoert die nooit de bedoeling waren.
Schadelijke, lasterlijke of niet-conforme inhoud die je gebruikers, of een toezichthouder, naar boven kunnen halen.
De exploits die specifiek zijn voor jouw product: je prijsstelling, je workflow, je datagrenzen.
We leggen samen het doelsysteem, het dreigingsmodel en de spelregels vast, allemaal op papier.
Eerst automatische breedte, daarna handmatige diepgang waar de echte bevindingen zich verschuilen.
Elke bevinding gerangschikt op ernst, met een werkend bewijs van exploit.
Bevindingen in begrijpelijke taal, gekoppeld aan OWASP LLM en de relevante artikelen van de AI-verordening.
Jij verhelpt, wij testen opnieuw, en je bewijs laat zien dat de fix standhield.
De meeste teams beginnen met een Volledige opdracht en stappen daarna over op een kwartaalretainer naarmate het product verandert.
Enterprise-leveranciers beginnen rond €15k voor één opdracht, en vaak doet een junior het eigenlijke testwerk. Bij Redproof is degene die je systeem begrijpt ook degene die het test. Geprijsd voor de fase waarin jij zit, niet die van hen.
Redproof is de praktijk van een production-AI-engineer die voor zijn werk grote modellen bouwt en evalueert. De meeste securitybureaus richten een tool op je endpoint en mailen je de uitdraai. Redproof werkt zoals een aanvaller dat echt doet, want het bouwen én breken van deze systemen is hier het dagelijks werk, geen bijzaak.
Degene die je opdracht scopet, is dezelfde die de aanvallen uitvoert en het rapport schrijft. Geen overdracht aan een junior, geen accountmanager ertussen. Naarmate het werk groeit, betrekt Redproof gescreende specialisten voor de grotere klussen, maar de norm blijft bij elke test gelijk: senior handen, van begin tot eind.
Begin met een kort gesprek om het werk te scopen. Je krijgt binnen een dag een vaste offerte en een paar weken later de bevindingen in handen.