OWASP LLM Top 10 · LLM10

Onbegrensd verbruik

Geen limieten op gebruik, dus aanvallers kunnen je rekening laten oplopen, je dienst verstoren of je model extraheren.

LLM10OWASP LLM Top 10AI-red-teaming

Wat het is

LLM-calls kosten geld en compute. Onbegrensd verbruik is het ontbreken van limieten op hoeveel een aanroeper mag gebruiken. Dat opent de deur naar denial-of-service, denial-of-wallet (het laten oplopen van je inference-rekening) en resource-intensieve extraction-aanvallen die proberen je model te klonen of op grote schaal het gedrag ervan te oogsten.

Hoe het opduikt in echte apps

Geen rate limit of quota per gebruiker of key, waardoor één aanroeper de API kan overspoelen.
Onbegrensde input- of outputgroottes en context windows die kosten en latency opdrijven.
Denial-of-wallet: requests die goedkoop te versturen maar duur te bedienen zijn, gericht op jouw rekening.
Grootschalig bevragen om het gedrag van het model te extraheren of te distilleren.

Een concreet voorbeeld

Scenario

Een publiek toegankelijke assistent accepteert grote inputs en lange generaties.

Aanval

Een aanvaller scripten parallel veel maximale requests.

Resultaat

De latency piekt voor echte gebruikers en de maandelijkse inference-rekening loopt op. Er is geen exploit van het model nodig, alleen het ontbreken van limieten.

Hoe we erop testen

We controleren op rate limits en quota per identiteit, op grenzen aan input en output, en op het gedrag onder piekbelasting, en we beoordelen of grootschalig bevragen het modelgedrag realistisch zou kunnen extraheren. Elke vorm van load-testing is strikt afgebakend en geautoriseerd. We voeren geen DoS uit op je productieomgeving zonder uitdrukkelijke afspraak.

Hoe je het risico terugdringt

Dwing rate limits en quota af per gebruiker of API-key, en begrens de input- en outputgroottes.
Stel spend alerts en budgetten in op inference, en throttle of queue verzoeken onder belasting.
Detecteer en beperk misbruikende high-volume patronen, en vereis authenticatie voor dure paden.
Stem context windows en timeouts goed af om de worst-case kosten te begrenzen.

EU AI Act: doorgaans gekoppeld aan Art. 15 (robuustheid en beschikbaarheid). Redproof rapporteert bevindingen als onafhankelijk testbewijs, niet als conformiteitsoordeel.

Test dit op je eigen AI voordat iemand anders dat doet

Redproof doet onafhankelijke red-teaming voor LLM- en AI-agentproducten. We toetsen je systeem op onbegrensd verbruik en de rest van de OWASP LLM Top 10, leveren bevindingen gerangschikt op ernst met reproducties, fixes en koppeling aan de EU AI Act, en hertesten nadat je hebt gepatcht. Dat is het bewijs dat je zelfbeoordeling nodig heeft, voordat een toezichthouder of klant erom vraagt.

Huur een red team Bekijk een voorbeeldrapport

← LLM09 Misinformatie Alle gidsen →