AI Fundamentals

3 essentiële tips als je met AI-taalmodellen wil gaan werken als bedrijf

Job van den Berg
Job van den Berg
May 5, 2024
2
min read
3 essentiële tips als je met AI-taalmodellen wil gaan werken als bedrijf
AI-taalmodellen zijn een sterrenhemel aan datapunten

Er zijn drie belangrijke essentials die je moet weten als je met taalmodellen wil gaan werken en deze op maat wil gaan maken.

  1. Een ongetraind taalmodel is een generalist, geen specialist

Allereerst is het heel belangrijk om te realiseren dat een ongetraind taalmodel een generalist is. Taalmodellen zoals ChatGPT, Gemini, Copilot of Claude van Anthropic, die zijn getraind op data van het internet. Dat betekent dus ook dat ze vooral generieke informatie hebben, kennis hebben van wat er in het algemeen gezien terug is te vinden op het internet. Het is een hele goede generalist en geen goede specialist. Dus als jij een taalmodel wil gebruiken voor specifieke taken, dan moet je deze gaan trainen en is de standaard variant van het taalmodel ongeschikt.

  1. it’s all about statistics

Het tweede wat je moet weten is dat een taalmodel een statistisch model is en dat alle regels omtrent statistiek die je ongetwijfeld geleerd hebt op de universiteit of hogeschool, dat die ook hier gelden. En dan hebben we het heel vaak over hallucineren en vaak vinden we het heel raar dat een taalmodel hallucineert. Maar een hallucinerend taalmodel is heel logisch, het is een logisch statistisch verschijnsel. Nou wat is hallucineren ook alweer, dat is dat zo'n taalmodel eigenlijk een eigen werkelijkheid gaat creëren en zelf bevestiging gaat zoeken voor onwaarheden. En hoe komt dat? Nou, statistiek is altijd op zoek naar bevestiging, naar het vinden van patronen. Het is een statistisch gegeven dat als er een patroon is gevonden, dat er op zoek wordt gegaan naar bewijs om dat patroon te bevestigen. En daarom is het heel belangrijk dat je statistische kennis hebt als je een taalmodel op maat gaat maken. Want hoe kun je hallucinaties voorkomen? Dat is onder andere door te kijken naar de parameters van het taalmodel. Eigenlijk de statistische vergelijking. Je hebt onder andere de parameter temperature. En een temperature geeft eigenlijk aan in welke mate een taalmodel eigenlijk vrij uit mag denken. Moet hij heel strikt antwoorden geven? Of mag hij wel een beetje creatief nadenken en zelf met suggesties komen? En dit soort parameters in het statistische model van het taalmodel zijn onder andere middelen om hallucinaties te voorkomen. Maar het hallucineren op zich is een heel logisch, statistisch verschijnsel. Daarom moet je het ook vanuit een statistisch oogpunt benaderen.

  1. Data waren, zijn en blijven de sleutel

Ten derde, data zijn key. We hebben het al heel veel over data. En er zijn best wat misvattingen als het gaat over data en taalmodellen. Want heel veel mensen denken, ja, die taalmodellen die zijn al getraind. Waarom heb je dan nog data nodig? Nou, die data heb je nodig om zo'n taalmodel een specialist te maken. Dus van een generalist naar een specialist te maken. Want die data zijn kennis en informatie. En als je een taalmodel voedt met die specifieke kennis en informatie, dan kun je zo'n taalmodel echt trainen op jouw bedrijfsspecifieke data en richtlijnen. En hoe beter de data zijn die je voedt aan het taalmodel, hoe beter je ervoor kan zorgen dat het taalmodel ook met betrouwbare en consistente antwoorden komen. En daarmee kan het heel goed helpen bij cognitieve complexe taken in jouw werk. En dit is de derde essential die ongelooflijk belangrijk is als jij zelf met taalmodellen aan de slag wil gaan.

Remy Gieling
Job van den Berg

Like the Article?

Share the AI experience with your friends