Google przedstawia Whisk. Masz dość żmudnego pisania promptów dla generatorów obrazów? Nowość jest stworzona dla Ciebie
Mimo że od dość dawna mamy możliwość generowania obrazów z opisów tekstowych, to często do uzyskania satysfakcjonujących efektów trzeba poświęcić nieco swojego czasu, aby ułożyć odpowiednie polecenie (ang. prompt). Proces ten wymaga poznania kilku zasad, a to dodatkowa nauka, na którą wiele osób może nie mieć chęci. Google startuje więc z nową usługą, która ma ułatwić wszystkie kroki. Zamiast opisów tekstowych można użyć obrazów, które określą główne aspekty.
Google ma zamiar bardzo ułatwić proces generowania obrazów. Dzięki usłudze Whisk nie trzeba już pisać "ściany tekstu", aby określić wszystkie aspekty tworzonej grafiki - wystarczy skorzystać ze wzorcowych obrazów.
Nowy generator filmów 4K od Google może się okazać lepszy niż Sora od OpenAI. Firma udoskonaliła także model obrazu Imagen 3
Nowość jest jeszcze we wczesnej fazie, a dostępność została ograniczona do USA - choć to tylko teoria, gdyż wystarczy skorzystać z VPN-a, a usługa Whisk stanie przed nami otworem i to, co ciekawe, niemal całkowicie w języku polskim. Na czym polega całość? Za pomocą konkretnych obrazów mamy określić styl, scenę oraz temat generowanej grafiki - ta może zostać stworzona w trzech "proporcjach": krajobraz, portret lub kwadrat. Whisk oparty jest na ulepszonym modelu obrazu Imagen 3. Rozwiązanie wyodrębnia główne cechy z przesłanych przez nas obrazów, tworzy zaawansowany opis i generuje grafiki wyjściowe. Nie zawsze więc stworzy to, czego oczekujemy, gdyż nie trzyma się ściśle podanych wzorów, jednak po stworzeniu grafiki możemy podejrzeć jej prompt i go zmienić, choć opcjonalne informacje możemy dodać jeszcze przed tym procesem. Jeśli mamy ochotę, to nadal jesteśmy w stanie tekstowo opisać styl, scenę i temat. Możliwości jest więc naprawdę sporo.
Veo - nowy generator wideo korzystający z mocy AI od Google. Nadchodzi pierwszy poważny rywal dla Sory od OpenAI
Rezultaty są bardziej niż zadowalające, o czym możemy się przekonać, spoglądając na załączone przykłady. Jeżeli akurat nie mamy pomysłu, to możemy skorzystać z trzech losowych grafik, które określą wspomniane już aspekty. Chcemy przekształcić styl realistycznego zdjęcia samochodu na bardziej komiksowy? Nie ma problemu. A może mamy zamiar zmienić scenerię dla konkretnej rzeczy, postaci lub zwierzęcia, ale całość nie ma być zbyt realistyczna? Ten proces także nie sprawi nam większych trudności. Whisk to naprawdę ciekawa usługa, którą z pewnością warto wypróbować. Jeżeli szukamy darmowego VPN-a, który umożliwi nam łączenie się z zagranicznymi serwerami, to warto wypróbować TunnelBear (osobiście korzystam z niego już od dłuższego czasu, gdyż w każdym miesiącu otrzymuje się bezpłatne 2 GB - a tak naprawdę w przypadku Whisk wystarczy połączyć się na chwilę z serwerem w USA, a po zalogowaniu się do usługi można się od niego odłączyć).
Większość "wejściowych" obrazów pochodzi z serwisu Pixabay, jeden to zrzut ekranu z gry wideo, inny pochodzi od Google, a ostatni przykład opiera się na losowych grafikach z Whisk.
Powiązane publikacje

CrystalMark Retro 2.0.0 to nowa wersja kultowego benchmarku z obsługą systemów od Microsoft Windows 95 do Windows 11
12
Google Gemini 2.5 Pro dostępny za darmo. Nowy model AI zaskakuje wynikami w testach i multimodalnością
23
Apple planuje rewolucję w aplikacji Zdrowie, wprowadzając wirtualnego lekarza wykorzystującego sztuczną inteligencję
24
Przeglądarka internetowa Vivaldi integruje się z Proton VPN. Użytkownicy mogą stać się bardziej anonimowi w Internecie
142