La fenêtre de contexte, c'est la quantité de texte qu'un modèle peut garder en tête en une fois, mesurée en tokens. Tout ce que tu écris plus l'historique de la conversation doit y tenir. Quand c'est plein, le modèle oublie le début. Plus la fenêtre est grande, plus tu peux lui donner de documents d'un coup.
Exemple — Un modèle avec une fenêtre de 200 000 tokens peut analyser un livre entier en une seule requête.