1 / 1
Presentatie

LLM, Tokens
& Prompts

Werken met taalmodellen — van token tot instructie.

7 hoofdstukken zaterdag 30 mei 20206
Hoofdstuk 1

Wat is een LLM?

Large Language Model. Een statistisch model dat tekst voorspelt op basis van patronen uit enorme hoeveelheden data.

Kern · klik op een woord

Voorspelt het
volgende woord.

Hetzelfde principe als je toetsenbord op WhatsApp — alleen veel slimmer.

M
Mam
online
Hoi! Kom je vanavond eten?
Ja, ik
Ja, ik |
3
Drie suggesties per stap. Het model rekent kansen uit op basis van de hele zin tot nu toe.
Schaal — klik om te zien
15T
tokens trainingsdata

Hoeveel is dat eigenlijk? Klik op een vergelijking:

0M
romans van 300 pagina's
1 boek ≈ 100.000 tokens. 15 biljoen tokens komt neer op 150 miljoen boeken — meer dan ooit door mensen geschreven.
Jij in een leven15T
← daar zit jij ergens
0×
de hele Engelse Wikipedia
Engelse Wikipedia = ~4 miljard tokens. 15T tokens is 3.750 keer alle Wikipedia-artikelen bij elkaar.
elk vakje = 1× hele Wikipedia (eerste 100 zichtbaar)
0M
mensenlevens aan lezen
Gemiddeld leest iemand ~5 boeken per jaar, ~80 jaar lang = 400 boeken. 15T tokens = 30 miljoen volledige leeslevens.
1 mensenleven aan lezen30 miljoen levens
0×
de Library of Congress
's Werelds grootste bibliotheek heeft ~25 miljoen boeken. 15T tokens = 6.000 keer de complete collectie.
Library of Congress15T tokens
Snelheid · klik op een punt

Humanity's Last Exam.

2.500 vragen op expert-niveau in 100+ vakgebieden. Begin 2025 haalden de beste modellen 3 à 4%. Hoe staat het er nu voor — en waar zit de gemiddelde mens?

50% 40% 30% 20% 10% 0% jan '25 apr '25 aug '25 jan '26 apr '26 Mens-expert ≈ 90% (buiten beeld) Gemiddelde mens ~7%
Klik op een datapunt
→ voor details
Van bijna nul naar bijna de helft in vijftien maanden.

Bron: Scale AI / CAIS leaderboard, Artificial Analysis. Niet-lineaire tijdas.

Hoofdstuk 2

Hoe werken tokens?

Een LLM leest geen woorden. Het leest tokens — kleine stukjes tekst van enkele letters tot hele woorden.

Schaal · Tokens per maand

Monthly Tokens Processed

Across all AI surfaces  ·  mei 2024 – mei 2026

~330×
groei in 2 jaar
3500T 1750T 0 mei '24 mei '25 mei '26 3.2Q+
9.7T
2024
tokens / maand
480T
2025
tokens / maand
3.2Q+
vandaag · 2026
tokens / maand
Voorbeeld

"Onbegrijpelijk" wordt:

On be grijp elijk

Eén woord = vier tokens. De splitsing volgt patronen, geen grammatica.

Vuistregel
1

token

4

karakters

¾

woord (Engels)

Nederlands gebruikt meer tokens per woord dan Engels.

Context window

De geheugenlimiet.

Alles in het gesprek — vraag, geschiedenis, antwoord — telt mee. Loopt het vol, dan vergeet het model het begin.

Prompt
Geschiedenis
← Vrije ruimte voor antwoord
Hoofdstuk 3

AI Fluency
Framework.

Effectief, efficiënt, ethisch en veilig samenwerken met AI. Een model dat niet over tools gaat, maar over jouw vaardigheden.

Drie modaliteiten

Hoe werk je met AI?

01

Automation

AI voert taak uit
Voorbeeld: e-mail samenvatten, social post, basis-code.
02

Augmentation

Mens + AI samen
Voorbeeld: essay schrijven, onderzoek, complexe code.
03

Agency

AI handelt zelfstandig
Voorbeeld: chatbot, tutor, autonome agent.
De vier competenties

De 4 D's.

D
Delegation
Wanneer zet je AI in?
D
Description
Hoe leg je het uit?
4D
D
Discernment
Is de output goed?
D
Diligence
Wie is verantwoordelijk?
D #1 · Delegation

Wanneer zet je
AI in?

Niet elke taak is een AI-taak. Splits het werk: wat doet de mens, wat de AI, wat samen?

  • Begrijp het doel én de taak.
  • Ken de sterktes van je tools.
  • Kies bewust: automatisch, samen of zelfstandig.
D #2 · Description

Hoe leg je het
goed uit?

De brug tussen jouw idee en de output van de AI. Hoofdstuk 4 en 5 gaan hier dieper op in.

  • Product: wat moet eruit komen?
  • Proces: hoe werk je samen, stap voor stap?
  • Performance: hoe moet de AI zich gedragen?
D #3 · Discernment

Is de output
écht goed?

Een vlot antwoord is niet automatisch een juist antwoord. Beoordeel kritisch — altijd.

KLAKKELOOS

"Klinkt goed, ik plak het er zo in."

KRITISCH

"Klopt dit feitelijk? Past de toon? Wat mist?"

D #4 · Diligence

Jij blijft
verantwoordelijk.

"De AI deed het" is geen excuus. Transparantie en zorgvuldigheid horen bij het werk.

  • Creatie: ethisch werken, bias herkennen.
  • Transparantie: wees open over AI-gebruik.
  • Deployment: feiten checken, output testen.
In de praktijk

Hoe pas je dit toe?

Delegate
Describe
Discern
Diligence

Loop deze vier checks bij elke serieuze AI-taak. Niet één keer — elke keer.

Hoofdstuk 4

Onderdelen van
een prompt.

Een goede prompt heeft structuur. Vier elementen bepalen of je een bruikbaar antwoord krijgt.

De vier bouwstenen
01 · ROL

Wie ben je?

"Je bent een ervaren copywriter." Stuurt de toon en expertise.

02 · TAAK

Wat moet er gebeuren?

Concrete actie. Eén werkwoord, geen vaagheid.

03 · CONTEXT

Achtergrond

Doelgroep, situatie, beperkingen. Alles wat het model moet weten.

04 · FORMAT

Hoe lever je op?

Lijst, tabel, JSON, lengte, taal. Maak het output-formaat expliciet.

In de praktijk

Alles samen:

[ROL] Je bent een marketingspecialist.
[TAAK] Schrijf 3 onderwerpregels voor een nieuwsbrief.
[CONTEXT] Doelgroep: HR-managers in MKB. Onderwerp: nieuwe AI-tool.
[FORMAT] Max 60 tekens. Genummerde lijst.
Hoofdstuk 5

Hoe schrijf je
een instructie?

Een vage prompt levert een vaag antwoord. Specificiteit is het belangrijkste verschil.

Vergelijk
VAAG

"Schrijf iets over koffie."

SPECIFIEK

"Schrijf een productbeschrijving van 80 woorden voor een biologische espressoboon. Toon: warm en ambachtelijk. Voor webshop."

Vier regels
  • 1Wees concreet — getallen, namen, voorbeelden.
  • 2Geef voorbeelden van het gewenste resultaat.
  • 3Splits complexe taken op in stappen.
  • 4Zeg wat je niet wilt, niet alleen wat je wel wilt.
Itereer

Eerste prompt = ruwe schets.

Schrijf
Test
Verfijn
Hergebruik

Bewaar prompts die werken. Bouw je eigen bibliotheek op.

Hoofdstuk 6

Drie lagen
van instructies.

Niet elke instructie hoort op dezelfde plek. Wat geldt altijd? Wat geldt voor dit project? Wat alleen nu?

De stapeling · klik op een laag

Elke laag erft van de laag erboven.

LAAG 1 · ALTIJD ACTIEF
Persoonlijke instellingen
Geldt voor élke chat — ongeacht onderwerp of rol.
LAAG 2 · PER CONTEXT
Project · Custom GPT · Gem
Specifieke rol, kennis of werkwijze voor een afgebakende taak.
LAAG 3 · PER GESPREK
De prompt zelf
Eenmalige instructie voor déze specifieke vraag.
Wat hoort waar?
Soort instructie Persoonlijk Project Prompt
Schrijf in het Nederlands
Geen emoji's, kort en zakelijk
Ik werk als marketingmanager
Wij zijn merk X, doelgroep Y
Gebruik onze tone-of-voice gids
Ken de productcatalogus (PDF)
Schrijf nu een nieuwsbrief over Z
Geef 3 varianten in tabelvorm
Hoe ze samenwerken

Eén vraag, drie lagen.

Persoonlijk
"Schrijf altijd in zakelijk Nederlands, zonder emoji's."
+
Project "Nieuwsbrief"
"Doelgroep: HR-managers MKB. Tone-of-voice: helder en concreet. Max 200 woorden."
+
Prompt
"Schrijf de openingsalinea voor onze april-editie over AI-tools."
=
RESULTAAT
Een korte, zakelijke openingsalinea in het Nederlands, gericht op HR-managers, in de stijl van het project — over AI-tools.
Hoofdstuk 7

RAG.

Retrieval-Augmented Generation. De manier waarop een LLM toegang krijgt tot kennis die niet in zijn training zat — jouw documenten, je intranet, vandaag-actuele data.

RETRIEVAL
Ophalen
AUGMENTED
Aangevuld
GENERATION
Antwoord
Het probleem

Een LLM weet veel,
maar niet alles.

Algemene kennis
Wat in trainingsdata zat. Stopt bij de cutoff-datum.
KENT
Jouw bedrijfsdata
Procedures, klantgegevens, productspecs — nooit gezien.
ONBEKEND
Recent nieuws
Alles na de trainingscutoff. Nieuwe wetten, prijzen, gebeurtenissen.
ONBEKEND
Privé-informatie
Persoonlijke notities, intern beleid, vertrouwelijke data.
ONBEKEND

Zonder RAG: het model gokt of "verzint". Met RAG: het krijgt eerst de juiste documenten, dan pas een antwoord.

Hoe werkt het? · klik op Start

Vier stappen, van vraag tot antwoord.

1
Vraag
"Wat is ons retourbeleid voor B2B-klanten?"
2
Zoek
Doorzoek alle documenten, vind 3 meest relevante stukken.
3
Combineer
Plak gevonden tekst bij de vraag in de prompt.
4
Antwoord
LLM antwoordt op basis van die context — met bronvermelding.
Vraag
"Wat is ons retourbeleid voor B2B?"
Documenten (vector database)
retourbeleid_b2b.pdf
algemene_voorwaarden.pdf
personeelshandboek.pdf
leveringsvoorwaarden.pdf
marketing_strategie.pdf
jaarverslag_2025.pdf
Antwoord
— wachtend op input —
Onder de motorkap

Embeddings.

Hoe vindt het systeem het juiste document? Door betekenis om te zetten in coördinaten — woorden met vergelijkbare betekenis komen dicht bij elkaar te staan.

DIEREN hond kat paard VOERTUIGEN auto fiets trein EMOTIES blij boos verdrietig je vraag
Het idee: elk document — en elke vraag — krijgt een coördinaat in een ruimte met duizenden dimensies.
Zoeken = de vraag plaatsen in die ruimte en kijken welke documenten het dichtst bij staan.
Krachtig: "auto kapot" matcht ook met "voertuig defect" — de woorden verschillen, de betekenis is dichtbij.
Wanneer wel, wanneer niet?
Zonder RAG
  • Verzint plausibel klinkende details
  • Verouderde informatie
  • Geen toegang tot jouw data
  • Geen bronvermelding mogelijk
"Het retourbeleid is meestal 14 dagen..."
(gokwerk — kan kloppen, kan ook niet)
Met RAG
  • Antwoord op basis van échte documenten
  • Altijd actueel (zolang docs dat zijn)
  • Toegang tot interne kennis
  • Bronnen aanwijsbaar
"B2B-klanten hebben 30 dagen retourrecht volgens art. 4.2 in retourbeleid_b2b.pdf."

Gebruik RAG zodra je antwoorden over specifieke, actuele of interne kennis nodig hebt.

Samenvatting

Onthoud dit.

  • LLM voorspelt — op basis van patronen.
  • Tokens zijn de bouwstenen.
  • 4 D's: Delegation, Description, Discernment, Diligence.
  • Rol · Taak · Context · Format.
  • Drie lagen: persoonlijk · project · prompt.
  • RAG = LLM + jouw documenten.
  • Specifiek wint van vaag.
Wallaroe
WALLAROE

Vragen?

Bedankt voor jullie aandacht.