Le transformer, c'est l'architecture de réseau de neurones qui fait tourner la plupart des modèles de langage modernes. Son idée clé, l'attention, lui permet de peser l'importance de chaque mot par rapport aux autres dans une phrase. C'est cette mécanique, introduite en 2017, qui a rendu possibles ChatGPT et consorts. Le « T » de GPT vient de là.
Exemple — Le « T » de GPT signifie Transformer, l'architecture qui sous-tend le modèle.