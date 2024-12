Mimo że od dość dawna mamy możliwość generowania obrazów z opisów tekstowych, to często do uzyskania satysfakcjonujących efektów trzeba poświęcić nieco swojego czasu, aby ułożyć odpowiednie polecenie (ang. prompt). Proces ten wymaga poznania kilku zasad, a to dodatkowa nauka, na którą wiele osób może nie mieć chęci. Google startuje więc z nową usługą, która ma ułatwić wszystkie kroki. Zamiast opisów tekstowych można użyć obrazów, które określą główne aspekty.

Google ma zamiar bardzo ułatwić proces generowania obrazów. Dzięki usłudze Whisk nie trzeba już pisać "ściany tekstu", aby określić wszystkie aspekty tworzonej grafiki - wystarczy skorzystać ze wzorcowych obrazów.

Nowość jest jeszcze we wczesnej fazie, a dostępność została ograniczona do USA - choć to tylko teoria, gdyż wystarczy skorzystać z VPN-a, a usługa Whisk stanie przed nami otworem i to, co ciekawe, niemal całkowicie w języku polskim. Na czym polega całość? Za pomocą konkretnych obrazów mamy określić styl, scenę oraz temat generowanej grafiki - ta może zostać stworzona w trzech "proporcjach": krajobraz, portret lub kwadrat. Whisk oparty jest na ulepszonym modelu obrazu Imagen 3. Rozwiązanie wyodrębnia główne cechy z przesłanych przez nas obrazów, tworzy zaawansowany opis i generuje grafiki wyjściowe. Nie zawsze więc stworzy to, czego oczekujemy, gdyż nie trzyma się ściśle podanych wzorów, jednak po stworzeniu grafiki możemy podejrzeć jej prompt i go zmienić, choć opcjonalne informacje możemy dodać jeszcze przed tym procesem. Jeśli mamy ochotę, to nadal jesteśmy w stanie tekstowo opisać styl, scenę i temat. Możliwości jest więc naprawdę sporo.

Rezultaty są bardziej niż zadowalające, o czym możemy się przekonać, spoglądając na załączone przykłady. Jeżeli akurat nie mamy pomysłu, to możemy skorzystać z trzech losowych grafik, które określą wspomniane już aspekty. Chcemy przekształcić styl realistycznego zdjęcia samochodu na bardziej komiksowy? Nie ma problemu. A może mamy zamiar zmienić scenerię dla konkretnej rzeczy, postaci lub zwierzęcia, ale całość nie ma być zbyt realistyczna? Ten proces także nie sprawi nam większych trudności. Whisk to naprawdę ciekawa usługa, którą z pewnością warto wypróbować. Jeżeli szukamy darmowego VPN-a, który umożliwi nam łączenie się z zagranicznymi serwerami, to warto wypróbować TunnelBear (osobiście korzystam z niego już od dłuższego czasu, gdyż w każdym miesiącu otrzymuje się bezpłatne 2 GB - a tak naprawdę w przypadku Whisk wystarczy połączyć się na chwilę z serwerem w USA, a po zalogowaniu się do usługi można się od niego odłączyć).

Większość "wejściowych" obrazów pochodzi z serwisu Pixabay, jeden to zrzut ekranu z gry wideo, inny pochodzi od Google, a ostatni przykład opiera się na losowych grafikach z Whisk.

Źródło: Google