Presentatie

LLM, Tokens
& Prompts

Werken met taalmodellen — van token tot instructie.

7 hoofdstukken zaterdag 30 mei 20206

Hoofdstuk 1

Wat is een LLM?

Large Language Model. Een statistisch model dat tekst voorspelt op basis van patronen uit enorme hoeveelheden data.

Kern · klik op een woord

Voorspelt het
volgende woord.

Hetzelfde principe als je toetsenbord op WhatsApp — alleen veel slimmer.

‹

M

Mam

online

Hoi! Kom je vanavond eten?

Ja, ik

Ja, ik |

3

Drie suggesties per stap. Het model rekent kansen uit op basis van de hele zin tot nu toe.

Schaal — klik om te zien

15T

tokens trainingsdata

Hoeveel is dat eigenlijk? Klik op een vergelijking:

0M

romans van 300 pagina's

1 boek ≈ 100.000 tokens. 15 biljoen tokens komt neer op 150 miljoen boeken — meer dan ooit door mensen geschreven.

Jij in een leven15T

← daar zit jij ergens

0×

de hele Engelse Wikipedia

Engelse Wikipedia = ~4 miljard tokens. 15T tokens is 3.750 keer alle Wikipedia-artikelen bij elkaar.

elk vakje = 1× hele Wikipedia (eerste 100 zichtbaar)

0M

mensenlevens aan lezen

Gemiddeld leest iemand ~5 boeken per jaar, ~80 jaar lang = 400 boeken. 15T tokens = 30 miljoen volledige leeslevens.

1 mensenleven aan lezen30 miljoen levens

0×

de Library of Congress

's Werelds grootste bibliotheek heeft ~25 miljoen boeken. 15T tokens = 6.000 keer de complete collectie.

Library of Congress15T tokens

Snelheid · klik op een punt

Humanity's Last Exam.

2.500 vragen op expert-niveau in 100+ vakgebieden. Begin 2025 haalden de beste modellen 3 à 4%. Hoe staat het er nu voor — en waar zit de gemiddelde mens?

Klik op een datapunt

→ voor details

—

Van bijna nul naar bijna de helft in vijftien maanden.

Bron: Scale AI / CAIS leaderboard, Artificial Analysis. Niet-lineaire tijdas.

Hoofdstuk 2

Hoe werken tokens?

Een LLM leest geen woorden. Het leest tokens — kleine stukjes tekst van enkele letters tot hele woorden.

Schaal · Tokens per maand

Monthly Tokens Processed

Across all AI surfaces · mei 2024 – mei 2026

~330×

groei in 2 jaar

9.7T

2024

tokens / maand

→

480T

2025

tokens / maand

→

3.2Q+

vandaag · 2026

tokens / maand

Voorbeeld

"Onbegrijpelijk" wordt:

On be grijp elijk

Eén woord = vier tokens. De splitsing volgt patronen, geen grammatica.

Vuistregel

1

token

≈

4

karakters

≈

¾

woord (Engels)

Nederlands gebruikt meer tokens per woord dan Engels.

Context window

De geheugenlimiet.

Alles in het gesprek — vraag, geschiedenis, antwoord — telt mee. Loopt het vol, dan vergeet het model het begin.

Prompt

Geschiedenis

← Vrije ruimte voor antwoord

Hoofdstuk 3

AI Fluency
Framework.

Effectief, efficiënt, ethisch en veilig samenwerken met AI. Een model dat niet over tools gaat, maar over jouw vaardigheden.

Drie modaliteiten

Hoe werk je met AI?

01

Automation

AI voert taak uit

Voorbeeld: e-mail samenvatten, social post, basis-code.

02

Augmentation

Mens + AI samen

Voorbeeld: essay schrijven, onderzoek, complexe code.

03

Agency

AI handelt zelfstandig

Voorbeeld: chatbot, tutor, autonome agent.

De vier competenties

De 4 D's.

D

Delegation

Wanneer zet je AI in?

D

Description

Hoe leg je het uit?

4D

D

Discernment

Is de output goed?

D

Diligence

Wie is verantwoordelijk?

D #1 · Delegation

Wanneer zet je
AI in?

Niet elke taak is een AI-taak. Splits het werk: wat doet de mens, wat de AI, wat samen?

→Begrijp het doel én de taak.
→Ken de sterktes van je tools.
→Kies bewust: automatisch, samen of zelfstandig.

D #2 · Description

Hoe leg je het
goed uit?

De brug tussen jouw idee en de output van de AI. Hoofdstuk 4 en 5 gaan hier dieper op in.

→Product: wat moet eruit komen?
→Proces: hoe werk je samen, stap voor stap?
→Performance: hoe moet de AI zich gedragen?

D #3 · Discernment

Is de output
écht goed?

Een vlot antwoord is niet automatisch een juist antwoord. Beoordeel kritisch — altijd.

KLAKKELOOS

"Klinkt goed, ik plak het er zo in."

KRITISCH

"Klopt dit feitelijk? Past de toon? Wat mist?"

D #4 · Diligence

Jij blijft
verantwoordelijk.

"De AI deed het" is geen excuus. Transparantie en zorgvuldigheid horen bij het werk.

→Creatie: ethisch werken, bias herkennen.
→Transparantie: wees open over AI-gebruik.
→Deployment: feiten checken, output testen.

In de praktijk

Hoe pas je dit toe?

Delegate

→

Describe

→

Discern

→

Diligence

Loop deze vier checks bij elke serieuze AI-taak. Niet één keer — elke keer.

Hoofdstuk 4

Onderdelen van
een prompt.

Een goede prompt heeft structuur. Vier elementen bepalen of je een bruikbaar antwoord krijgt.

De vier bouwstenen

01 · ROL

Wie ben je?

"Je bent een ervaren copywriter." Stuurt de toon en expertise.

02 · TAAK

Wat moet er gebeuren?

Concrete actie. Eén werkwoord, geen vaagheid.

03 · CONTEXT

Achtergrond

Doelgroep, situatie, beperkingen. Alles wat het model moet weten.

04 · FORMAT

Hoe lever je op?

Lijst, tabel, JSON, lengte, taal. Maak het output-formaat expliciet.

In de praktijk

Alles samen:

        [ROL] Je bent een marketingspecialist.

        [TAAK] Schrijf 3 onderwerpregels voor een nieuwsbrief.

        [CONTEXT] Doelgroep: HR-managers in MKB. Onderwerp: nieuwe AI-tool.

        [FORMAT] Max 60 tekens. Genummerde lijst.

Hoofdstuk 5

Hoe schrijf je
een instructie?

Een vage prompt levert een vaag antwoord. Specificiteit is het belangrijkste verschil.

Vergelijk

VAAG

"Schrijf iets over koffie."

SPECIFIEK

"Schrijf een productbeschrijving van 80 woorden voor een biologische espressoboon. Toon: warm en ambachtelijk. Voor webshop."

Vier regels

1Wees concreet — getallen, namen, voorbeelden.
2Geef voorbeelden van het gewenste resultaat.
3Splits complexe taken op in stappen.
4Zeg wat je niet wilt, niet alleen wat je wel wilt.

Itereer

Eerste prompt = ruwe schets.

Schrijf

→

Test

→

Verfijn

→

Hergebruik

Bewaar prompts die werken. Bouw je eigen bibliotheek op.

Hoofdstuk 6

Drie lagen
van instructies.

Niet elke instructie hoort op dezelfde plek. Wat geldt altijd? Wat geldt voor dit project? Wat alleen nu?

De stapeling · klik op een laag

Elke laag erft van de laag erboven.

LAAG 1 · ALTIJD ACTIEF

Persoonlijke instellingen

Geldt voor élke chat — ongeacht onderwerp of rol.

∞

LAAG 2 · PER CONTEXT

Project · Custom GPT · Gem

Specifieke rol, kennis of werkwijze voor een afgebakende taak.

⊙

LAAG 3 · PER GESPREK

De prompt zelf

Eenmalige instructie voor déze specifieke vraag.

→

Wat hoort waar?

Soort instructie	Persoonlijk	Project	Prompt
Schrijf in het Nederlands
Geen emoji's, kort en zakelijk
Ik werk als marketingmanager
Wij zijn merk X, doelgroep Y
Gebruik onze tone-of-voice gids
Ken de productcatalogus (PDF)
Schrijf nu een nieuwsbrief over Z
Geef 3 varianten in tabelvorm

Hoe ze samenwerken

Eén vraag, drie lagen.

Persoonlijk

"Schrijf altijd in zakelijk Nederlands, zonder emoji's."

+

Project "Nieuwsbrief"

"Doelgroep: HR-managers MKB. Tone-of-voice: helder en concreet. Max 200 woorden."

+

Prompt

"Schrijf de openingsalinea voor onze april-editie over AI-tools."

=

RESULTAAT

Een korte, zakelijke openingsalinea in het Nederlands, gericht op HR-managers, in de stijl van het project — over AI-tools.

Hoofdstuk 7

RAG.

Retrieval-Augmented Generation. De manier waarop een LLM toegang krijgt tot kennis die niet in zijn training zat — jouw documenten, je intranet, vandaag-actuele data.

RETRIEVAL

Ophalen

AUGMENTED

Aangevuld

GENERATION

Antwoord

Het probleem

Een LLM weet veel,
maar niet alles.

Algemene kennis

Wat in trainingsdata zat. Stopt bij de cutoff-datum.

KENT

Jouw bedrijfsdata

Procedures, klantgegevens, productspecs — nooit gezien.

ONBEKEND

Recent nieuws

Alles na de trainingscutoff. Nieuwe wetten, prijzen, gebeurtenissen.

ONBEKEND

Privé-informatie

Persoonlijke notities, intern beleid, vertrouwelijke data.

ONBEKEND

Zonder RAG: het model gokt of "verzint". Met RAG: het krijgt eerst de juiste documenten, dan pas een antwoord.

Hoe werkt het? · klik op Start

Vier stappen, van vraag tot antwoord.

1

Vraag

"Wat is ons retourbeleid voor B2B-klanten?"

→

2

Zoek

Doorzoek alle documenten, vind 3 meest relevante stukken.

→

3

Combineer

Plak gevonden tekst bij de vraag in de prompt.

→

4

Antwoord

LLM antwoordt op basis van die context — met bronvermelding.

Vraag

"Wat is ons retourbeleid voor B2B?"

Documenten (vector database)

retourbeleid_b2b.pdf

algemene_voorwaarden.pdf

personeelshandboek.pdf

leveringsvoorwaarden.pdf

marketing_strategie.pdf

jaarverslag_2025.pdf

Antwoord

— wachtend op input —

Onder de motorkap

Embeddings.

Hoe vindt het systeem het juiste document? Door betekenis om te zetten in coördinaten — woorden met vergelijkbare betekenis komen dicht bij elkaar te staan.

Het idee: elk document — en elke vraag — krijgt een coördinaat in een ruimte met duizenden dimensies.

Zoeken = de vraag plaatsen in die ruimte en kijken welke documenten het dichtst bij staan.

Krachtig: "auto kapot" matcht ook met "voertuig defect" — de woorden verschillen, de betekenis is dichtbij.

Wanneer wel, wanneer niet?

Zonder RAG

Verzint plausibel klinkende details
Verouderde informatie
Geen toegang tot jouw data
Geen bronvermelding mogelijk

"Het retourbeleid is meestal 14 dagen..."
(gokwerk — kan kloppen, kan ook niet)

Met RAG

Antwoord op basis van échte documenten
Altijd actueel (zolang docs dat zijn)
Toegang tot interne kennis
Bronnen aanwijsbaar

"B2B-klanten hebben 30 dagen retourrecht volgens art. 4.2 in retourbeleid_b2b.pdf."

Gebruik RAG zodra je antwoorden over specifieke, actuele of interne kennis nodig hebt.

Samenvatting

Onthoud dit.

→LLM voorspelt — op basis van patronen.
→Tokens zijn de bouwstenen.
→4 D's: Delegation, Description, Discernment, Diligence.
→Rol · Taak · Context · Format.
→Drie lagen: persoonlijk · project · prompt.
→RAG = LLM + jouw documenten.
→Specifiek wint van vaag.

WALLAROE

Vragen?

Bedankt voor jullie aandacht.

LLM, Tokens& Prompts

Wat is een LLM?

Voorspelt hetvolgende woord.

Humanity's Last Exam.

Hoe werken tokens?

Monthly Tokens Processed

"Onbegrijpelijk" wordt:

De geheugenlimiet.

AI FluencyFramework.

Hoe werk je met AI?

Automation

Augmentation

Agency

De 4 D's.

Wanneer zet jeAI in?

Hoe leg je hetgoed uit?

Is de outputécht goed?

Jij blijftverantwoordelijk.

Hoe pas je dit toe?

Onderdelen vaneen prompt.

Wie ben je?

Wat moet er gebeuren?

Achtergrond

Hoe lever je op?

Alles samen:

Hoe schrijf jeeen instructie?

Eerste prompt = ruwe schets.

Drie lagenvan instructies.

Elke laag erft van de laag erboven.

Eén vraag, drie lagen.

RAG.

Een LLM weet veel,maar niet alles.

Vier stappen, van vraag tot antwoord.

Embeddings.

Onthoud dit.

Vragen?

LLM, Tokens
& Prompts

Voorspelt het
volgende woord.

AI Fluency
Framework.

Wanneer zet je
AI in?

Hoe leg je het
goed uit?

Is de output
écht goed?

Jij blijft
verantwoordelijk.

Onderdelen van
een prompt.

Hoe schrijf je
een instructie?

Drie lagen
van instructies.

Een LLM weet veel,
maar niet alles.