Firma Stability AI zdecydowanie przoduje na rynku w przypadku modeli AI, które są zdolne do generowania obrazów z opisów tekstowych. Modele obrazu tego przedsiębiorstwa z serii Stable Diffusion stają się coraz lepsze, a ogłoszona w lutym (2024) rodzina Stable Diffusion 3 miała się wyróżniać największymi możliwościami — zarówno pod kątem tworzenia realistycznych grafik, jak i dokładnego tekstu. Upłynęło już trochę czasu od prezentacji i pierwszy model właśnie stał się dostępny.

Rodzina modeli obrazu Stable Diffusion 3 wyróżnia się kilkoma cechami: poszczególne wersje są w stanie lepiej rozróżniać konkretne obiekty na generowanych obrazach, potrafią tworzyć bardziej realistyczną grafikę, a przy tym sam tekst powinien być dokładnie odwzorowany. Kiedy na początku lutego 2024 roku Stability AI zapowiedziało całą serię, mogliśmy się dowiedzieć, że znajdzie się w niej wiele wariantów, które będą się od siebie różnić możliwościami (konkretniej parametrami: od 800 milionów do 8 miliardów). Wprowadzony właśnie na rynek Stable Diffusion 3 Medium może się pochwalić 2 mld parametrów, więc do wspomnianej granicy jeszcze dość daleko. Niemniej jednak firma określiła omawianą edycję, jako najbardziej zaawansowany model, jaki się do tej pory pojawił.

