// GLOSSAIRE IA

IA & LLM, Technique

Quantification (quantization)

Définition

La quantification, c’est la réduction de la précision des nombres d’un modèle pour le rendre plus petit et plus rapide.

La quantification, c'est la réduction de la précision des nombres d'un modèle pour le rendre plus petit et plus rapide. On remplace des valeurs très précises par des approximations plus légères. Résultat : le modèle tient sur moins de mémoire et tourne sur du matériel modeste, avec une perte de qualité souvent minime. C'est une technique clé pour faire tourner l'IA en local.

Exemple – Quantifier un modèle permet de le faire tourner sur un ordinateur portable au lieu d'un gros serveur.

Pour transformer cette notion en workflows qui tournent chez toi, le guide L'IA qui tourne vraiment réunit le mode d'emploi et 12 workflows n8n téléchargeables (14,99 € au lancement).

→ Voir tous les termes : Glossaire IA