Un data lake, c'est un vaste réservoir où l'on stocke des données brutes de toute nature, structurées ou non, sans les organiser à l'avance. À la différence d'un entrepôt qui range proprement, le lac garde tout tel quel pour le trier plus tard selon les besoins. C'est utile quand on veut tout conserver sans savoir encore comment on l'exploitera.
Exemple — Déverser logs, vidéos et fichiers bruts dans un data lake pour les analyser plus tard relève de cette approche.