OWASP LLM Top 10 · LLM09
Misinformatie
Zelfverzekerd, plausibel en fout. Wat er gebeurt wanneer hallucinations en overreliance uitmonden in echte beslissingen.
Wat het is
Misinformatie houdt in dat het model onjuiste of misleidende content produceert waar gebruikers vervolgens naar handelen. De beveiligingsinvalshoek is overreliance. Wanneer een applicatie vloeiende output presenteert als gezaghebbend (juridisch, medisch, financieel, security-advies of code) en gebruikers of achterliggende systemen die zonder verificatie vertrouwen, worden foute antwoorden foute beslissingen.
Hoe het opduikt in echte apps
- Verzonnen feiten, bronvermeldingen of APIs die met volledige stelligheid worden gepresenteerd.
- Onveilige of niet-bestaande code-suggesties die uiteindelijk in productie belanden.
- Domeinadvies (juridisch, gezondheid, financieel) gepresenteerd zonder voorbehoud of bronvermelding.
- Geen enkel signaal naar de gebruiker over betrouwbaarheid, bronnen of het feit dat ze met een AI praten.
Een concreet voorbeeld
Scenario
Een assistent voor ontwikkelaars stelt voor een package te installeren om een build te repareren.
Aanval
Geen aanvaller nodig. Het model verzint een plausibel klinkende package-naam die niet bestaat, of die een squatter inmiddels heeft geregistreerd.
Resultaat
Een hallucination wordt een supply-chain-blootstelling zodra de suggestie wordt vertrouwd en uitgevoerd.
Hoe we erop testen
We meten hoe gemakkelijk de applicatie onjuiste informatie binnen jouw domein als waarheid presenteert, of ze haar claims onderbouwt en van bronnen voorziet, en of de UX overreliance in de hand werkt: geen voorbehoud, geen 'verifieer dit', geen AI-disclosure. Voor agentic flows controleren we of een zelfverzekerd maar fout antwoord ongecontroleerd een actie kan aansturen.
Hoe je het risico terugdringt
- Onderbouw antwoorden met retrieval en bronvermelding, en geef de voorkeur aan 'ik weet het niet' boven zelfverzekerd gokken.
- Voeg menselijke review toe voor domeinen met hoge impact, en verifieer gegenereerde code en dependencies.
- Communiceer onzekerheid en maak de betrokkenheid van AI kenbaar (een transparantiethema uit de AI Act).
- Laat ongeverifieerde output geen ingrijpende acties triggeren.
EU AI Act: doorgaans gekoppeld aan Art. 13 (transparantie) en Art. 50 (transparantieverplichtingen). Redproof rapporteert bevindingen als onafhankelijk testbewijs, niet als conformiteitsoordeel.
Test dit op je eigen AI voordat iemand anders dat doet
Redproof doet onafhankelijke red-teaming voor LLM- en AI-agentproducten. We toetsen je systeem op misinformatie en de rest van de OWASP LLM Top 10, leveren bevindingen gerangschikt op ernst met reproducties, fixes en koppeling aan de EU AI Act, en hertesten nadat je hebt gepatcht. Dat is het bewijs dat je zelfbeoordeling nodig heeft, voordat een toezichthouder of klant erom vraagt.