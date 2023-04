Sztuczna inteligencja jest fascynująca i przerażająca jednocześnie. Z jednej strony można się cieszyć, że dożyliśmy czasów, kiedy niemal każdy może korzystać z jej pomocy. Potrzebujesz szybkiej odpowiedzi na trudne pytanie, poprawy kodu swojego programu albo wygenerowania pięknej ilustracji? Nie ma problemu! AI pomoże. Z drugiej jednak strony aż strach bierze, gdy się pomyśli, ile osób przez to może stracić prace w niedalekiej przyszłości. Przykładem jest choćby Adobe Firefly. Wpisujesz kilka wyrazów, zaznaczasz kilka opcji i klikasz jeden przycisk. Tyle wystarczy, aby stworzyć imponującą grafikę, która wyszkolonemu człowiekowi zajęłaby od kilku godzin do kilku dni. Adobe Firefly robi to kilkanaście sekund. W tej krótkiej publikacji prezentuję, jakie są podstawowe możliwości generowania obrazów w tej usłudze i jak ten proces wygląda.

Autor: Tomasz Duda

Adobe Firefly to narzędzie go generowania grafiki za pomocą algorytmów sztucznej inteligencji (AI). Największą siłą tego narzędzia jest to, że może tworzyć zarówno ozdobne napisy czy proste grafiki, jak i bardzo złożone, zaawansowane ilustracje. Takie, które artyście z wieloletnim doświadczeniem, niebywałą wyobraźnią i imponującymi umiejętnościami zajęłyby dni albo tygodnie ciężkiej pracy. W dodatku Adobe Firefly pozwala ekstremalnie łatwo zdefiniować nie tylko treść obrazu, ale też kolorystykę, nastrój lub wręcz naśladować konkretny styl, technikę i materiały. Chcesz zrobić pixelart? Nie ma problemu! Potrzebujesz okładki dla twojej książki? Proszę bardzo! Zamiast zdjęcia wolisz malowany obraz lub szkic? Wystarczy kilka kliknięć i dostaniesz dokładnie to, co chcesz. Daje to ogromne możliwości i stwarza równie duże ryzyko utraty pracy dla wielu artystów, którzy już teraz wyrażają głosy sprzeciwu przeciwko AI.

Adobe Firefly wciągnął mnie bezgranicznie. To AI ma niemal bezgraniczne możliwości generowania obrazów z tekstu i robi to imponująco. Człowiek łapie się na tym, że siedzi pół dnia i generuje kolejne obrazy, a potem następne i następne. Źródło jest niewyczerpane. Zdecydowanie polecam sprawdzić to samemu.

Adobe Firefly jest obecnie w fazie Beta, co oznacza, że nie jest to ukończone narzędzie, lecz znajduje się w fazie rozwojowej. Wciąż ulega zmianom, uczy się na coraz większej bazie materiałów, rozszerza swoje możliwości, a kolejne błędy są eliminowane. Jest ono dostępne dla wielu osób, ale przed rozpoczęciem wymagane jest zgłoszenie swojej chęci do korzystania z niego. Pierwszym krokiem jest wejście na stronę firefly.adobe.com, kliknięcie przycisku Request access w prawym górnym narożniku strony i wypełnienie koniecznych danych. Twórcy wymagają, aby osoby miały ukończone 18 lat i posiadały założone konto Adobe ID. Na dostęp trzeba niekiedy trochę poczekać. Ja na przykład oczekiwałem na niego prawie miesiąc.

Warto dodać, że dużą zaletą Adobe Firefly jest to, iż do generowania grafiki przez AI nie jest konieczna instalacja żadnego oprogramowania. Cała obsługa po stronie użytkownika odbywa się przez przeglądarkę internetową. Rzecz jasna do działania konieczne jest aktywne połączenie internetowe. Narzędzie działa tylko online, bo obliczenia wykonywane są na bardzo wydajnych maszynach po stronie Adobe, a nie na komputerze użytkownika. Moim zdaniem to też jest zaleta, bo dzięki temu przepiękne grafiki można wygenerować w kilka sekund, nawet jeśli masz słaby laptop. W obecnej fazie Adobe Firefly jest darmowy, na co chyba nikt nie będzie narzekał. Korzystajcie zatem, póki nie zostaną wprowadzone ewentualne ograniczenia i płatne plany. Przed rozpoczęciem korzystania chcę również dodać, że Firefly działa w tej chwili wyłącznie po angielsku. Nie tylko sam interfejs jest w tym języku, ale również komendy tekstowe potrzebne do wygenerowania grafiki trzeba wpisywać po angielsku.

Generowanie grafiki za pomocą tekstu w Adobe Firefly

Gdy już masz dostęp do narzędzia, to na stronie głównej zauważysz trzy podstawowe opcje generowania grafik. Pierwszą z nich jest Text to image (czyli tekst do obrazu), Text effects (efekty graficzne na tekście) i Recolor vectors (zmiana kolorów grafiki wektorowej). Zacznijmy jednak od pierwszej z tych opcji, która moim zdaniem jest najciekawsza i najbardziej użyteczna. W sekcji Text to image na dole strony wyświetla się szeroki, biały pasek. Tutaj po prostu wpisujesz za pomocą klawiatury to, co ma zostać wygenerowane. Zasadniczo polecenia składające się z większej liczby wyrazów są bardziej precyzyjne i pozwolą uzyskać lepsze efekty. Za krótkie w ogóle zostaną odrzucone. Tak więc jeśli chcesz wygenerować smoka, to nie wpisuj po prostu “dragon”, bo dla AI jest to zbyt ogólne polecenie. Wpisz np. “angry flame dragon head in volcano”. Interpunkcja nie jest konieczna, nie trzeba zachowywać konkretnej składni.

Adobe Firefly wyświetla cztery propozycje na raz. Jeśli nie podoba Ci się żadna z nich, to naciśnij niebieski przycisk Refresh (odśwież), aby AI wygenerowało dla Ciebie inne grafiki na podstawie tego samego polecenia. Natomiast jeśli podoba Ci się jedna z tych grafik, to możesz najechać na nią kursorem, w jej prawym górnym rogu kliknąć przycisk z trzema kropkami i wybrać opcję Use as reference image (użyj jako obrazu referencyjnego), wtedy ten jeden obraz będzie wzorcem dla tworzenia trochę innych wersji. Pozostawiając grafikę referencyjną, możesz też dopisać coś do polecenia. Przykładowo ja dopisałem słowa “and smoke” otrzymując polecenie “angry flame dragon head with blue accents and smoke in volcano fantasy” i dostałem podobną głowę smoka, lecz uzupełnioną o dym.

Na tym jednak nie koniec. Pozostawiając ten sam obraz referencyjny z głową smoka, ale zmieniając w poleceniu “dragon” na “wolf” otrzymałem podobne grafiki, ale zamiast głowy smoka otrzymałem głowę wilka. Wszystko było jednak utrzymane w bardzo podobnym stylu i schemacie kolorystycznym. To bardzo duża zaleta, ponieważ czasami do jakiegoś projektu potrzebne są grafiki z podobnym motywem, ale zawierających trochę inne obiekty. Tutaj nie ma problemu, by stworzyć polecenie składające się z kilkunastu wyrazów, które wygeneruje np. płonącego jednorożca, a następnie zmienić go w smoka, byka, feniksa lub konewkę. W praktyce im większa jest Twoja pomysłowość, tym ciekawsze mogą być efekty. Czasami bardzo odjechane komendy tekstowe są najbardziej imponujące. Zdecydowanie zachęcam do eksperymentowania.

Po prawej stronie od wygenerowanych obrazów wyświetlają się opcje, które pozwolą na zmianę stylu, barwy, efektów, technik malowania, szkicowania, użytych materiałów (np. papier, glina, metal), a także proporcji grafiki. Tak naprawdę to właśnie one pozwalają uzyskać najbardziej atrakcyjne efekty i moim zdaniem warto poświęcić kilka minut na zabawę nimi, bo może się okazać, że te obrazy, które wygenerowało AI, mogą wyglądać znacznie lepiej. Różnice bywają kolosalne. Np. wygenerowana scena może wyglądać jak malowany obraz albo jak grafika 3D. Portrety mogą mieć piękny bokeh (rozmazane tło), nastrojowe oświetlenie, a twarze nie muszą wyglądać jak z kreskówki, lecz mogą przypominać prawdziwe zdjęcie. Potężne różnice robią też efekty, np. bioluminescencja albo style synthwave, cyberpunk i steampunk.

Jakie opcje są do wyboru? Cóż, po prawej stronie na samej górze wybierasz proporcje. Domyślnie są one kwadratowe 1:1, ale możesz zmienić na pionowe 3:4, poziome 4:3 lub poziome 16:9 (czyli coś na kształt tapety lub miniatury do wideo np. na YouTube). Bardzo ważne i ciekawe jest to, że zmiana proporcji powoduje inne ułożenie obiektu w kadrze. Przykładowo kompozycja na tapecie 16:9 może być (i zapewne będzie) zupełnie inna, niż wtedy, gdy wybierzesz 3:4. Do grafik portretowych zdecydowanie polecam pionowe proporcje. AI lepiej wkomponuje postać w kadrze. Nieco niżej umieszczono Content type, czyli ogólny charakter zawartości: None (brak), Photo (zdjęcie), Graphic (grafika) oraz Art (dzieło sztuki). Jak można się domyślić opcje Graphic oraz Art dają efekty bardziej rysunkowe czy malowane, a Photo ma na celu większe upodobnienie do realnego obiektu. Widać to szczególnie wtedy, gdy chcesz wygenerować portret lub całą postać. Skóra i rysy twarzy są bardziej upodobnione do prawdziwych, naturalnych, w niektórych przypadkach wręcz fotorealistyczne. Choć oczywiście wiele zależy od tego, jaki obiekt generujesz.

Jeszcze niżej widoczne są style, podzielone na kilka zakładek. Nie będę opisywał ich wszystkich, ale w ogólnym zarysie chodzi o to, że tutaj możesz określić jakim motywem ma kierować się AI w czasie generowania obrazu. Jest np. steampunk, synthwave, vaporwave, psychedelic, fantasy i science fiction. Oprócz tego są motywy, które też mają potężny wpływ na wygląd grafiki. Przykładowo zaznaczenie opcji 3D art powoduje, jak można się domyślić, że obiekty wyglądają trochę bardziej, jak grafika 3D, Vector look daje bardziej płaski efekt, a Pixel art tworzy grafikę zbudowaną z widocznych fragmentów, które wcale nie oznaczają skupisk pikseli, lecz przynajmniej generują lekko “kanciaste” kształty tu i ówdzie. Choć ponownie zaznaczam, że wiele zależy od generowanej treści. W menu ze stylami można też określić techniki tworzenia obrazu, np. farba olejna, farba wodna, szkicowanie itp. Są również do wyboru materiały, takie jak m.in. glina, płótno, papier i metal.

Trzy ostatnie sekcje to Color and tone (kolor i odcień), Lightning (oświetlenie) oraz Composition (kompozycja). W pierwszej z nich można zdefiniować ogólne barwy, w jakich ma być utrzymana wygenerowana grafika. Przykładowo do klimatu cyberpunkowego pasują bardziej nasycona kolory (Vibrant color), do szkicu czarno-białe (Black and White), a do delikatnych, nastrojowych obrazów w zachodzącym słońcu lepsza będzie opcja Warm tone (ciepły odcień). Tak samo w menu oświetlenia można wybrać np. Golden hour (złota godzina), aby obraz miał ciepłe, złote odcienie lub np. Dramatic lightning, by nadać grafice więcej dramatyzmu, co pasuje do dynamicznych scen. Z kolei w menu kompozycji można dodać efekty fotograficzne, takie jak mała głębia ostrości, rozmyte tło, obiektyw szerokokątny itp.

Bardzo ważne jest to, że można dodawać większość powyższych opcji bez ogólnej zmiany wygenerowanej grafiki. Innym słowy jeśli na podstawie Twoich poleceń AI stworzyło portret, który Ci się podoba, to po wybraniu efektów, oświetlenia, materiałów i typu obrazu ten portret w zasadniczej części pozostanie taki sam, a zmienią się jedynie efekty na niego nałożone. Dzięki temu możesz raz stworzony obraz dopracować tak, aby wyglądał jeszcze bardziej atrakcyjnie. Pamiętaj tylko, że wyjątkiem jest zmiana proporcji obrazu. W tym przypadku cała stworzona scena ulegnie ponownemu wygenerowaniu, przez co stracisz to, co zapisałeś wcześniej. Ponadto za każdym razem, gdy przy obrazach klikniesz przycisk Refresh, to również usuniesz to, co było wyświetlone, a w tych miejscach pojawią się nowe grafiki.

Chcę od razu wspomnieć o czterech kwestiach, które przynajmniej dla mnie są wadami narzędzia Adobe Firefly. Po pierwsze: brakuje historii wygenerowanych wcześniej obrazów w interfejsie. Nie możesz zaznaczyć jakiegoś obrazu, który Ci się spodobał i wrócić do niego za jakiś czas, zwyczajnie cofając się do poprzedniego wpisu w historii. Można to do pewnego stopnia obejść, po prostu dodając stronę z aktualnie wygenerowanymi obrazami, do zakładek w przeglądarce. Następnym razem, gdy taką zakładkę otworzysz, załadują się grafiki gotowe do dalszej edycji. Po drugie: brakuje możliwości wczytywania własnych zdjęć i ich przetwarzania przez AI. Robię zdjęcia od około 25 lat i chciałbym móc wysłać je w celu przetworzenia na zupełnie inny styl przez AI, ale niestety nie mam takiej możliwości. Po trzecie: brakuje możliwości eksportu obrazów z większą rozdzielczością. W proporcjach 4:3 lub 3:4 można uzyskać 1408 x 1024 px, w opcji 1:1 jest to 1024 x 1024 px, a w 16:9 to 1792 x 1024 px. Rzecz jasna ponownie można tutaj użyć innych usług AI do powiększenia takiego obrazu nawet kilkukrotnie, z zachowaniem wysokiej jakości, ale to wciąż nie to samo, co oryginalny zapis z wyższą rozdzielczością. Moim zdaniem przydałaby się opcja eksportu obrazów przynajmniej do 4K. Po czwarte: obecnie nie można tych materiałów wykorzystywać komercyjnie. Na razie jest to bezpłatna faza Beta, więc nie można się dziwić. Jest duża szansa na to, że Adobe Firefly stanie się wybitnie przydatnym narzędziem komercyjnym, ale obecnie legalnie nie można na tym zarabiać. Na grafikę nakładany jest znak o tym informujący.