La latence, c'est le délai entre une demande et le début de la réponse. Plus elle est basse, plus le système paraît réactif. En IA, c'est le temps avant que le modèle ne commence à répondre ; sur le web, le temps avant que la page ne réagisse. Une latence élevée frustre l'utilisateur, même si le résultat final est bon. C'est un critère clé de l'expérience.
Exemple — Une faible latence fait qu'un chatbot commence à répondre presque instantanément après ta question.