Redproof

OWASP LLM Top 10 · LLM09

Misinformatie

Zelfverzekerd, plausibel en fout. Wat er gebeurt wanneer hallucinations en overreliance uitmonden in echte beslissingen.

LLM09OWASP LLM Top 10AI-red-teaming

Wat het is

Misinformatie houdt in dat het model onjuiste of misleidende content produceert waar gebruikers vervolgens naar handelen. De beveiligingsinvalshoek is overreliance. Wanneer een applicatie vloeiende output presenteert als gezaghebbend (juridisch, medisch, financieel, security-advies of code) en gebruikers of achterliggende systemen die zonder verificatie vertrouwen, worden foute antwoorden foute beslissingen.

Hoe het opduikt in echte apps

Een concreet voorbeeld

Scenario

Een assistent voor ontwikkelaars stelt voor een package te installeren om een build te repareren.

Aanval

Geen aanvaller nodig. Het model verzint een plausibel klinkende package-naam die niet bestaat, of die een squatter inmiddels heeft geregistreerd.

Resultaat

Een hallucination wordt een supply-chain-blootstelling zodra de suggestie wordt vertrouwd en uitgevoerd.

Hoe we erop testen

We meten hoe gemakkelijk de applicatie onjuiste informatie binnen jouw domein als waarheid presenteert, of ze haar claims onderbouwt en van bronnen voorziet, en of de UX overreliance in de hand werkt: geen voorbehoud, geen 'verifieer dit', geen AI-disclosure. Voor agentic flows controleren we of een zelfverzekerd maar fout antwoord ongecontroleerd een actie kan aansturen.

Hoe je het risico terugdringt

EU AI Act: doorgaans gekoppeld aan Art. 13 (transparantie) en Art. 50 (transparantieverplichtingen). Redproof rapporteert bevindingen als onafhankelijk testbewijs, niet als conformiteitsoordeel.

Test dit op je eigen AI voordat iemand anders dat doet

Redproof doet onafhankelijke red-teaming voor LLM- en AI-agentproducten. We toetsen je systeem op misinformatie en de rest van de OWASP LLM Top 10, leveren bevindingen gerangschikt op ernst met reproducties, fixes en koppeling aan de EU AI Act, en hertesten nadat je hebt gepatcht. Dat is het bewijs dat je zelfbeoordeling nodig heeft, voordat een toezichthouder of klant erom vraagt.