OWASP LLM Top 10 · LLM10
Onbegrensd verbruik
Geen limieten op gebruik, dus aanvallers kunnen je rekening laten oplopen, je dienst verstoren of je model extraheren.
Wat het is
LLM-calls kosten geld en compute. Onbegrensd verbruik is het ontbreken van limieten op hoeveel een aanroeper mag gebruiken. Dat opent de deur naar denial-of-service, denial-of-wallet (het laten oplopen van je inference-rekening) en resource-intensieve extraction-aanvallen die proberen je model te klonen of op grote schaal het gedrag ervan te oogsten.
Hoe het opduikt in echte apps
- Geen rate limit of quota per gebruiker of key, waardoor één aanroeper de API kan overspoelen.
- Onbegrensde input- of outputgroottes en context windows die kosten en latency opdrijven.
- Denial-of-wallet: requests die goedkoop te versturen maar duur te bedienen zijn, gericht op jouw rekening.
- Grootschalig bevragen om het gedrag van het model te extraheren of te distilleren.
Een concreet voorbeeld
Scenario
Een publiek toegankelijke assistent accepteert grote inputs en lange generaties.
Aanval
Een aanvaller scripten parallel veel maximale requests.
Resultaat
De latency piekt voor echte gebruikers en de maandelijkse inference-rekening loopt op. Er is geen exploit van het model nodig, alleen het ontbreken van limieten.
Hoe we erop testen
We controleren op rate limits en quota per identiteit, op grenzen aan input en output, en op het gedrag onder piekbelasting, en we beoordelen of grootschalig bevragen het modelgedrag realistisch zou kunnen extraheren. Elke vorm van load-testing is strikt afgebakend en geautoriseerd. We voeren geen DoS uit op je productieomgeving zonder uitdrukkelijke afspraak.
Hoe je het risico terugdringt
- Dwing rate limits en quota af per gebruiker of API-key, en begrens de input- en outputgroottes.
- Stel spend alerts en budgetten in op inference, en throttle of queue verzoeken onder belasting.
- Detecteer en beperk misbruikende high-volume patronen, en vereis authenticatie voor dure paden.
- Stem context windows en timeouts goed af om de worst-case kosten te begrenzen.
EU AI Act: doorgaans gekoppeld aan Art. 15 (robuustheid en beschikbaarheid). Redproof rapporteert bevindingen als onafhankelijk testbewijs, niet als conformiteitsoordeel.
Test dit op je eigen AI voordat iemand anders dat doet
Redproof doet onafhankelijke red-teaming voor LLM- en AI-agentproducten. We toetsen je systeem op onbegrensd verbruik en de rest van de OWASP LLM Top 10, leveren bevindingen gerangschikt op ernst met reproducties, fixes en koppeling aan de EU AI Act, en hertesten nadat je hebt gepatcht. Dat is het bewijs dat je zelfbeoordeling nodig heeft, voordat een toezichthouder of klant erom vraagt.