Stable Diffusion 3 - oficjalna prezentacja nowego modelu AI. Jeszcze lepsza jakość obrazów i generowanie dokładnego tekstu
W pierwszej połowie lutego 2024 roku Stability AI zaprezentowało swój nowy model zamiany tekstu na obraz o nazwie Stable Cascade. Nie minęło wiele czasu, a już ogłoszono kolejny. Tym razem jednak przedstawiono pokrótce możliwości Stable Diffusion 3, który według twórców ma największe możliwości ze wszystkich modeli, jakie do tej pory wprowadzono. Usprawniono wiele funkcji, a dodatkowo skupiono się także na zastosowaniu odpowiednich zabezpieczeń.
Stable Diffusion 3 został oficjalnie zaprezentowany. Nowy model zamiany tekstu na obraz nie jest jeszcze publicznie dostępny, natomiast Stability AI pokazało pokrótce jego możliwości. Generatory obrazów staną się jeszcze dokładniejsze, a przy tym bez problemu stworzą fotorealistyczną grafikę.
Stability AI wprowadza nowy model po Stable Diffusion. Stable Cascade wymaga mniejszych zasobów i szybciej generuje obrazy
Najnowsza odsłona Stable Diffusion 3 to przede wszystkim duże usprawnienia w kwestii jakości obrazów i tworzenia tekstu, jednak spotkamy się także z lepszym zrozumieniem wprowadzanych promptów (czyli poleceń tekstowych) przez model zamiany tekstu na obraz. Obecnie nowość jest we wczesnej wersji i nie ma do niej normalnie dostępu, natomiast możemy się zapisać na listę oczekujących pod tym adresem. Pierwszy aspekt możemy zobaczyć już na powyższej grafice, w której wygenerowany został napis z nazwą modelu - oczywiście razem z całym tłem. Drugi z kolei bardzo dobrze uwidacznia poniższy obraz, który przedstawia kameleona. Jeśli ktoś zobaczyłby taką grafikę, przeglądając internet, to z pewnością nie miałby wrażenia, że została sztucznie wygenerowana. Poziom tworzenia obrazów jest dziś naprawdę wysoki, a Stable Diffusion 3 tylko to potwierdza.
Stable Diffusion XL Turbo - generowanie obrazów w czasie rzeczywistym jest już możliwe. Stability AI wyprzedza rynek
Stability AI podało, że zaprezentowana nowość będzie się składać z kilku modeli. Zasadniczą różnicą będzie ilość ich parametrów, a więc możliwości. Najmniejsze będą się składać z 800 milionów, a największe z 8 miliardów parametrów - zakres jest więc całkiem spory. Raport techniczny nie został jednak upubliczniony, więc reszta szczegółów pozostaje jeszcze w ukryciu. Wiemy jednak, że twórcy wprowadzają do Stable Diffusion 3 odpowiednie zabezpieczenia, aby nie można było używać modelu do żadnych niewłaściwych celów, a to właśnie ta kwestia jest dziś dużo ważniejsza od samych możliwości. Oczywiście nie tak łatwo ograniczyć technologię w adekwatnym zakresie, jednak Stability AI otwarcie współpracuje z ekspertami w tej dziedzinie, więc jest szansa, że z czasem pojawi się dobre rozwiązanie.
Powiązane publikacje

Adobe Premiere za darmo na iPhone i iPad. Aplikacja do montażu wideo zawita też na system Android
17
Microsoft 6502 BASIC stał się otwartoźródłowy. Firma udostępniła cały kod na platformie GitHub
28
Naukowcy odkryli prosty sposób na zmuszenie AI do łamania zasad. Wystarczy jedna sztuczka psychologiczna i działa w 100 proc.
36
HunyuanWorld-Voyager, nowy model AI firmy Tencent, generuje kompletne, interaktywne sceny 3D z jednego zdjęcia
20