Stable Diffusion : l’IA capable de compresser des images avec une grande efficacité

Aymeric Geoffre-Rouland , le 28 septembre 2022

À la suite d’une flopée de tests et d’essais, l’ingénieur Matthias Bühlmann a démontré que l’intelligence artificielle Stable Diffusion était capable de compresser des images avec bien moins d’artefacts visuels que le JPEG ou le WebP.

Les résultats de compression obtenus avec Stable Diffusion © Matthias Bühlmann

La semaine dernière, l’ingénieur logiciel suisse Matthias Bühlmann a découvert que le modèle de synthèse d’images populaire Stable Diffusion pouvait compresser des images bitmap existantes. Le rendu se fait avec bien moins d’artefacts visuels que JPEG ou WebP, et ce, à des taux de compression élevés.

Mieux que JPEG et WebP ?

Stable Diffusion est un modèle de synthèse d’images par l’IA qui génère généralement des images basées sur des descriptions textuelles. Comme d’autres, ce modèle d’IA a appris cette capacité en étudiant des millions d’images extraites d’Internet. Au cours du processus de formation, le modèle établit des associations statistiques entre les images et les mots associés, en créant une représentation beaucoup plus petite des informations clés sur chaque image.

Lorsque Stable Diffusion analyse et compresse les images, elles résident dans ce que les chercheurs appellent l’espace latent. Avec Stable Diffusion 1.4, chaque fichier fait environ 4 Go. Ce fichier représente en revanche des connaissances sur plus d’une centaine de millions d’images.

Lors de l’exécution de plusieurs tests, Bühlmann a découvert qu’une nouvelle image compressée avec Stable Diffusion semblait subjectivement meilleure, à des taux de compression plus élevés que JPEG ou WebP. Dans un exemple, il montre une photo d’un lama (à l’origine 768 Ko) qui a été compressée à 5,68 Ko en utilisant JPEG, 5,71 Ko en utilisant WebP et 4,98 Ko en utilisant Stable Diffusion. Cette dernière affiche bien moins d’artefacts de compression que celles compressées dans les autres formats.

Bien que cette utilisation de Stable Diffusion ne soit pas conventionnelle (et soit plus un hack amusant qu’une solution pratique), elle pourrait potentiellement sous-entendre une future utilisation de ces modèles de synthèse d’images. Le code de Bühlmann peut être trouvé sur Google Colab. Vous trouverez aussi plus de détails techniques sur son expérience dans son article sur Towards AI.

Aymeric Geoffre-Rouland

Twitter LinkedIn

Journaliste depuis 2012, spécialisé en jeux vidéo, PC, hardware.

Les commentaires sont fermés.

Les derniers articles

Bitchat : une nouvelle ère de messagerie à l’épreuve de la censure
11 juillet 2025 17:00
Retirer du liquide chez son commerçant, c’est bientôt possible partout !
11 juillet 2025 12:00
One UI 8 arrive cet été : ce qu’il faut savoir
11 juillet 2025 08:00
Robots et voitures autonomes bientôt dotés d’une vision quasi humaine
10 juillet 2025 17:00
Constructeurs européens : un retour en force sur le marché de l’électrique
10 juillet 2025 12:00
Gemini peut contrôler vos messages et appels, même désactivé : faut-il s’inquiéter ?
10 juillet 2025 08:00
Atom : la nouvelle ère des robots humanoïdes téléopérés à distance
9 juillet 2025 17:00
Serrures connectées, purificateurs d’air, ventilateurs… SwitchBot casse les prix pour le Prime Day 2025 !
9 juillet 2025 14:10
Dites adieu aux câbles, la recharge sans fil arrive pour vos vélos électriques
9 juillet 2025 12:00
pCloud : vos fichiers et mots de passe protégés à vie pour le 14 juillet, jusqu’à 70 % de réduction !
9 juillet 2025 09:14

Stable Diffusion : l’IA capable de compresser des images avec une grande efficacité

Mieux que JPEG et WebP ?

La rédaction vous conseille aussi...