Over ons

Blinqx biedt AI workflow platorms die dienstverlenende professionals versterken in hun groei en succes.

Sectoren

Blinqx ontwikkelt AI workflow platforms voor financieel en zakelijk dienstverleners in geselecteerde sectoren.

Insights

Alle insights vanuit en over Blinqx lees je hier. Blijf op de hoogte van alles wat speelt; awards, overnames, kennis, cases.

Zoeken

AI mag niet gokken: de les voor B2B SaaS

Bijgewerkt op
Geschreven door Ynze Sipkema

Tijdens mijn studententijd had ik een vaste strategie bij tentamens. Een deel van de vragen wist ik zeker. De rest? Daar gokte ik. Met 25% kans kon je zomaar een puntje meepakken.

Dat werkte prima in een collegezaal. Maar in de wereld van enterprise AI en B2B SaaS is gokken funest. Toch doen Large Language Models (LLM’s) precies dat. Wanneer ze het antwoord niet weten, geven ze tóch een antwoord. In de wetenschap heet dat een hallucinatie: een ogenschijnlijk overtuigend, maar feitelijk fout resultaat.

Voor een tentamen misschien slim. Voor een AI-systeem dat beslissingen neemt in juridische, financiële of operationele processen is het onacceptabel.

Waarom LLM’s hallucineren

Recent las ik onderzoek van OpenAI waarin ze dit fenomeen verklaren. De vergelijking met een tentamen is treffend: LLM’s functioneren als een student die geen straf krijgt voor foute antwoorden.

Het trainingsproces beloont zekerheid, niet eerlijkheid. “Ik weet het niet” wordt afgestraft. Gevolg: modellen leren liever altijd iets te zeggen dan eerlijk hun onzekerheid te tonen.

Dit verklaart waarom benchmarkscores vaak indrukwekkend zijn. Modellen scoren hoog op multiple-choice tests zoals SWE-bench, maar doen dat deels door te gokken. Net zoals ik destijds bij tentamens. Voor wetenschappers interessant; voor bedrijven riskant.

De prijs van AI-hallucinaties in B2B SaaS

Voor een consument die een leuk recept vraagt, is een fout antwoord onschuldig. Voor een verzekeraar, advocaat of accountant is dat anders. Een verkeerd geanalyseerde schadeclaim kan leiden tot foutieve uitbetalingen. Een juridische AI-agent die een document verkeerd samenvat, kan de procespositie van een cliënt schaden. Een verkeerde berekening in accountancy kan fiscale risico’s veroorzaken.In B2B SaaS draait alles om betrouwbare AI. Een AI die gokt, ondermijnt het vertrouwen van de klant. En in B2B SaaS geldt: zonder vertrouwen geen adoptie.

Onze aanpak bij Blinqx: betrouwbare AI vanaf het begin

Bij Blinqx hebben we dit probleem vanaf het begin serieus genomen. Binnen ons Qore/AI-platform bouwen we betrouwbaarheid in onze modellen. Dat betekent:

  • Eerlijk aangeven als iets niet zeker is. Onze modellen kunnen expliciet teruggeven dat ze onvoldoende zekerheid hebben.
  • Fallback-mechanismen. Als de kennis ontbreekt, kan een extra check worden gevraagd, bijvoorbeeld via retrieval of menselijke validatie.
  • Centrale guardrails. In Qore/AI zijn veiligheidsmechanismen standaard ingebouwd, waardoor agents die we bouwen voorspelbaar en controleerbaar blijven.

Deze principes maken AI bruikbaar en schaalbaar in onze sectoren, waar foutieve outputs directe impact kunnen hebben voor gebruikers.

OpenAI en de noodzaak van betrouwbare AI

De recente publicatie van OpenAI over het verminderen van AI-hallucinaties laat zien dat dit geen nice-to-have is, maar een noodzakelijke stap in de evolutie van agentic AI.

Door modellen anders te belonen – niet alleen op juistheid, maar ook op eerlijkheid – kan de frequentie van hallucinaties drastisch omlaag. Dat bevestigt de aanpak die wij bij Blinqx al hanteren: liever een AI die zegt “ik weet het niet”, dan een die met overtuiging iets foutiefs teruggeeft. Omdat het graag een antwoord geeft.

Van gokmachine naar digitale collega

De overgang van generatieve AI naar agentic AI maakt dit thema nog urgenter. Agents werken niet alleen reactief, maar nemen zelfstandig beslissingen en voeren acties uit. Als zo’n agent gokt, kan de impact veel groter zijn dan één verkeerd antwoord: complete processen kunnen ontsporen.

Daarom zie ik het als fundamentele verantwoordelijkheid van elke CAIO of CTO: bouw geen AI die gokken toestaat. Bouw betrouwbare AI die weet wat het weet, en eerlijk aangeeft wat het niet weet. Alleen dan kan jouw agent de rol van betrouwbare digitale collega waarmaken.

Mijn eigen gokstrategie werkte prima in de collegebanken. Maar voor B2B SaaS is één ding duidelijk: in de praktijk van onze klanten is gokken geen optie.

Ontdek onze AI-first aanpak

Veelgestelde vragen over hallucinatie door LLM’s

Wat bedoelen we met “AI die gokt”?

Veel Large Language Models (LLM’s) geven tóch een antwoord, zelfs als ze het niet zeker weten. Dit wordt een hallucinatie genoemd: een ogenschijnlijk overtuigend, maar feitelijk fout antwoord. Voor consumentenapplicaties kan dat onschuldig zijn, maar in enterprise SaaS is het riskant.

Waarom hallucineren LLM’s eigenlijk?

Het trainingsproces van LLM’s beloont zekerheid, niet eerlijkheid. “Ik weet het niet” wordt afgestraft. Daardoor leren modellen altijd iets te zeggen, zelfs als ze twijfelen. Benchmarkscores lijken indrukwekkend, maar bevatten vaak ook “gokwerk”.

Hoe zorgt Blinqx voor betrouwbare AI-oplossingen?

Ons Qore/AI-platform voorkomt gokken door:
Eerlijkheid: AI geeft aan wanneer ze iets niet weet
Checks & fallback: extra validatie via retrieval of experts
Guardrails: ingebouwde veiligheidsmechanismen voor voorspelbare output

Gerelateerde artikelen