DALL-E 3 - nadchodzi nowa odsłona generatora obrazów od OpenAI. Zmiany mają wprowadzić niespotykane dotąd możliwości
Najpopularniejsze generatory obrazów z opisów tekstowych potrafią stworzyć naprawdę satysfakcjonujące grafiki, natomiast z pewnością nie można jeszcze o nich powiedzieć, że są idealne. Mimo że oferują nam coraz więcej, to często zdarza się im ignorować część naszych poleceń, a wygenerowany obraz znacząco odbiega od naszych wyobrażeń. Wszystko ma się zmienić dzięki nowej generacji od OpenAI - DALL-E 3 - która na dodatek zostanie zintegrowana z ChatGPT.
DALL-E 3 to następca popularnego generatora obrazów od OpenAI. Nowa odsłona ma wznieść możliwości na jeszcze wyższy poziom, a przy tym nasze polecenia będą wspierane przez ChatGPT.
Microsoft Bing wkrótce doczeka się integracji z generatorem DALL-E. Wstępna wersja narzędzia jest już dostępna do testowania
Najważniejszą zmianą, jaką ma przynieść DALL-E 3, ma być precyzyjne stosowanie się do poleceń użytkownika. To znaczy, że jeśli zechcemy wygenerować konkretny obraz z drobnymi szczegółami, to każdy z nich zostanie uwzględniony. Trzeba przyznać, że to właśnie ta cecha jest poniekąd bolączką dzisiejszych generatorów obrazów. Świetnie przedstawia to poniższy wpis z portalu X, gdzie opis do wygenerowanej grafiki brzmi: "Ilustracja przedstawiająca awokado siedzące na krześle u terapeuty, które mówi 'I just feel so empty inside' [celowo pominięte tłumaczenie] i ma pośrodku dziurę wielkości pestki. Terapeuta jest łyżką i sporządza notatki". Ciekawy jest fakt, że DALL-E 3 był w stanie wygenerować poprawny napis, co nadal jest sporym ograniczeniem dla wielu aktualnie dostępnych modeli.
Our new text-to-image model, DALL·E 3, can translate nuanced requests into extremely detailed and accurate images.
— OpenAI (@OpenAI) September 20, 2023
Coming soon to ChatGPT Plus & Enterprise, which can help you craft amazing prompts to bring your ideas to life:https://t.co/jDXHGNmarT pic.twitter.com/aRWH5giBPL
Poradnik - Sztuczna inteligencja generuje przepiękne obrazy. Jakie możliwości ma Adobe Firefly i jak z niego korzystać?
Trzecia odsłona DALL-E będzie dostępna dla użytkowników ChatGPT w wersji Plus i Enterprise już na początku października 2023 roku. Integracja z chatbotem nie jest przypadkowa, albowiem generator obrazów został stworzony właśnie na jego podstawie. Dzięki temu korzystając z ChatGPT, będziemy mogli otrzymać pomoc w stworzeniu idealnego polecenia - bez problemu uzyskamy adekwatne słowa po przedstawieniu naszego pomysłu. Co jednak najciekawsze, obrazy, które wygenerujemy, będą należeć całkowicie do nas i jeśli chcemy na nich zarabiać, to mamy na to pełną zgodę od twórców. Oczywiście model ma swoje ograniczenia - np. nie utworzymy obrazów przedstawiających przemoc. Jednak trzeba przyznać, że jest na co czekać, mimo że usługa będzie płatna.
Powiązane publikacje

CrystalMark Retro 2.0.0 to nowa wersja kultowego benchmarku z obsługą systemów od Microsoft Windows 95 do Windows 11
13
Google Gemini 2.5 Pro dostępny za darmo. Nowy model AI zaskakuje wynikami w testach i multimodalnością
24
Apple planuje rewolucję w aplikacji Zdrowie, wprowadzając wirtualnego lekarza wykorzystującego sztuczną inteligencję
24
Przeglądarka internetowa Vivaldi integruje się z Proton VPN. Użytkownicy mogą stać się bardziej anonimowi w Internecie
142