Stable Diffusion 3 - oficjalna prezentacja nowego modelu AI. Jeszcze lepsza jakość obrazów i generowanie dokładnego tekstu
W pierwszej połowie lutego 2024 roku Stability AI zaprezentowało swój nowy model zamiany tekstu na obraz o nazwie Stable Cascade. Nie minęło wiele czasu, a już ogłoszono kolejny. Tym razem jednak przedstawiono pokrótce możliwości Stable Diffusion 3, który według twórców ma największe możliwości ze wszystkich modeli, jakie do tej pory wprowadzono. Usprawniono wiele funkcji, a dodatkowo skupiono się także na zastosowaniu odpowiednich zabezpieczeń.
Stable Diffusion 3 został oficjalnie zaprezentowany. Nowy model zamiany tekstu na obraz nie jest jeszcze publicznie dostępny, natomiast Stability AI pokazało pokrótce jego możliwości. Generatory obrazów staną się jeszcze dokładniejsze, a przy tym bez problemu stworzą fotorealistyczną grafikę.
Stability AI wprowadza nowy model po Stable Diffusion. Stable Cascade wymaga mniejszych zasobów i szybciej generuje obrazy
Najnowsza odsłona Stable Diffusion 3 to przede wszystkim duże usprawnienia w kwestii jakości obrazów i tworzenia tekstu, jednak spotkamy się także z lepszym zrozumieniem wprowadzanych promptów (czyli poleceń tekstowych) przez model zamiany tekstu na obraz. Obecnie nowość jest we wczesnej wersji i nie ma do niej normalnie dostępu, natomiast możemy się zapisać na listę oczekujących pod tym adresem. Pierwszy aspekt możemy zobaczyć już na powyższej grafice, w której wygenerowany został napis z nazwą modelu - oczywiście razem z całym tłem. Drugi z kolei bardzo dobrze uwidacznia poniższy obraz, który przedstawia kameleona. Jeśli ktoś zobaczyłby taką grafikę, przeglądając internet, to z pewnością nie miałby wrażenia, że została sztucznie wygenerowana. Poziom tworzenia obrazów jest dziś naprawdę wysoki, a Stable Diffusion 3 tylko to potwierdza.
Stable Diffusion XL Turbo - generowanie obrazów w czasie rzeczywistym jest już możliwe. Stability AI wyprzedza rynek
Stability AI podało, że zaprezentowana nowość będzie się składać z kilku modeli. Zasadniczą różnicą będzie ilość ich parametrów, a więc możliwości. Najmniejsze będą się składać z 800 milionów, a największe z 8 miliardów parametrów - zakres jest więc całkiem spory. Raport techniczny nie został jednak upubliczniony, więc reszta szczegółów pozostaje jeszcze w ukryciu. Wiemy jednak, że twórcy wprowadzają do Stable Diffusion 3 odpowiednie zabezpieczenia, aby nie można było używać modelu do żadnych niewłaściwych celów, a to właśnie ta kwestia jest dziś dużo ważniejsza od samych możliwości. Oczywiście nie tak łatwo ograniczyć technologię w adekwatnym zakresie, jednak Stability AI otwarcie współpracuje z ekspertami w tej dziedzinie, więc jest szansa, że z czasem pojawi się dobre rozwiązanie.
Powiązane publikacje

Duolingo stawia na AI. Chodzi o automatyzację procesów, a także redukcję kontraktorów w edukacyjnej rewolucji
22
Microsoft Recall oraz Click to Do trafiły do zapoznawczej aktualizacji Windowsa 11 dla komputerów Copilot+ AI
17
Dystrybucja OpenMandriva Lx 6.0 Rock już dostępna. Stabilna odsłona z KDE Plasma 6, która oferuje jądro Linux 6.15
28
Windows 11 - kwietniowe aktualizacje systemu i zabezpieczeń powodują błędy BSOD, a także problemy z logowaniem
78