Stable Diffusion 3 - oficjalna prezentacja nowego modelu AI. Jeszcze lepsza jakość obrazów i generowanie dokładnego tekstu
W pierwszej połowie lutego 2024 roku Stability AI zaprezentowało swój nowy model zamiany tekstu na obraz o nazwie Stable Cascade. Nie minęło wiele czasu, a już ogłoszono kolejny. Tym razem jednak przedstawiono pokrótce możliwości Stable Diffusion 3, który według twórców ma największe możliwości ze wszystkich modeli, jakie do tej pory wprowadzono. Usprawniono wiele funkcji, a dodatkowo skupiono się także na zastosowaniu odpowiednich zabezpieczeń.
Stable Diffusion 3 został oficjalnie zaprezentowany. Nowy model zamiany tekstu na obraz nie jest jeszcze publicznie dostępny, natomiast Stability AI pokazało pokrótce jego możliwości. Generatory obrazów staną się jeszcze dokładniejsze, a przy tym bez problemu stworzą fotorealistyczną grafikę.
Stability AI wprowadza nowy model po Stable Diffusion. Stable Cascade wymaga mniejszych zasobów i szybciej generuje obrazy
Najnowsza odsłona Stable Diffusion 3 to przede wszystkim duże usprawnienia w kwestii jakości obrazów i tworzenia tekstu, jednak spotkamy się także z lepszym zrozumieniem wprowadzanych promptów (czyli poleceń tekstowych) przez model zamiany tekstu na obraz. Obecnie nowość jest we wczesnej wersji i nie ma do niej normalnie dostępu, natomiast możemy się zapisać na listę oczekujących pod tym adresem. Pierwszy aspekt możemy zobaczyć już na powyższej grafice, w której wygenerowany został napis z nazwą modelu - oczywiście razem z całym tłem. Drugi z kolei bardzo dobrze uwidacznia poniższy obraz, który przedstawia kameleona. Jeśli ktoś zobaczyłby taką grafikę, przeglądając internet, to z pewnością nie miałby wrażenia, że została sztucznie wygenerowana. Poziom tworzenia obrazów jest dziś naprawdę wysoki, a Stable Diffusion 3 tylko to potwierdza.
Stable Diffusion XL Turbo - generowanie obrazów w czasie rzeczywistym jest już możliwe. Stability AI wyprzedza rynek
Stability AI podało, że zaprezentowana nowość będzie się składać z kilku modeli. Zasadniczą różnicą będzie ilość ich parametrów, a więc możliwości. Najmniejsze będą się składać z 800 milionów, a największe z 8 miliardów parametrów - zakres jest więc całkiem spory. Raport techniczny nie został jednak upubliczniony, więc reszta szczegółów pozostaje jeszcze w ukryciu. Wiemy jednak, że twórcy wprowadzają do Stable Diffusion 3 odpowiednie zabezpieczenia, aby nie można było używać modelu do żadnych niewłaściwych celów, a to właśnie ta kwestia jest dziś dużo ważniejsza od samych możliwości. Oczywiście nie tak łatwo ograniczyć technologię w adekwatnym zakresie, jednak Stability AI otwarcie współpracuje z ekspertami w tej dziedzinie, więc jest szansa, że z czasem pojawi się dobre rozwiązanie.
Powiązane publikacje
![Gemini 1.5 Flash - nowa wersja chatbota dostępna za darmo. Google walczy z halucynacjami i zwiększa możliwości usługi](/files/Image/m165/44317.png)
Gemini 1.5 Flash - nowa wersja chatbota dostępna za darmo. Google walczy z halucynacjami i zwiększa możliwości usługi
3![Windows 11 pozwoli zdalnie zarządzać plikami ze smartfona z Androidem. Nowość już dostępna w progamie Windows Insider](/files/Image/m165/44316.png)
Windows 11 pozwoli zdalnie zarządzać plikami ze smartfona z Androidem. Nowość już dostępna w progamie Windows Insider
22![Linux Mint 22 - ceniona dystrybucja dla początkujących otrzymała nową wersję. Szereg usprawnień i równie prosta obsługa](/files/Image/m165/44315.png)
Linux Mint 22 - ceniona dystrybucja dla początkujących otrzymała nową wersję. Szereg usprawnień i równie prosta obsługa
19![Startup Runway, którego wspierała NVIDIA i Google, ukradł tysiące filmów z YouTube, aby szkolić swój generator wideo](/files/Image/m165/44314.png)
Startup Runway, którego wspierała NVIDIA i Google, ukradł tysiące filmów z YouTube, aby szkolić swój generator wideo
24![SearchGPT - OpenAI wkrótce rzuci rękawicę wyszukiwarce Google. Nadchodzi bardziej inteligentne znajdowanie rzeczy w internecie](/files/Image/m165/44312.png)