Najpopularniejsze generatory obrazów z opisów tekstowych potrafią stworzyć naprawdę satysfakcjonujące grafiki, natomiast z pewnością nie można jeszcze o nich powiedzieć, że są idealne. Mimo że oferują nam coraz więcej, to często zdarza się im ignorować część naszych poleceń, a wygenerowany obraz znacząco odbiega od naszych wyobrażeń. Wszystko ma się zmienić dzięki nowej generacji od OpenAI - DALL-E 3 - która na dodatek zostanie zintegrowana z ChatGPT.

DALL-E 3 to następca popularnego generatora obrazów od OpenAI. Nowa odsłona ma wznieść możliwości na jeszcze wyższy poziom, a przy tym nasze polecenia będą wspierane przez ChatGPT.

Najważniejszą zmianą, jaką ma przynieść DALL-E 3, ma być precyzyjne stosowanie się do poleceń użytkownika. To znaczy, że jeśli zechcemy wygenerować konkretny obraz z drobnymi szczegółami, to każdy z nich zostanie uwzględniony. Trzeba przyznać, że to właśnie ta cecha jest poniekąd bolączką dzisiejszych generatorów obrazów. Świetnie przedstawia to poniższy wpis z portalu X, gdzie opis do wygenerowanej grafiki brzmi: "Ilustracja przedstawiająca awokado siedzące na krześle u terapeuty, które mówi 'I just feel so empty inside' [celowo pominięte tłumaczenie] i ma pośrodku dziurę wielkości pestki. Terapeuta jest łyżką i sporządza notatki". Ciekawy jest fakt, że DALL-E 3 był w stanie wygenerować poprawny napis, co nadal jest sporym ograniczeniem dla wielu aktualnie dostępnych modeli.

Our new text-to-image model, DALL·E 3, can translate nuanced requests into extremely detailed and accurate images.



Coming soon to ChatGPT Plus & Enterprise, which can help you craft amazing prompts to bring your ideas to life:https://t.co/jDXHGNmarT pic.twitter.com/aRWH5giBPL — OpenAI (@OpenAI) September 20, 2023

Trzecia odsłona DALL-E będzie dostępna dla użytkowników ChatGPT w wersji Plus i Enterprise już na początku października 2023 roku. Integracja z chatbotem nie jest przypadkowa, albowiem generator obrazów został stworzony właśnie na jego podstawie. Dzięki temu korzystając z ChatGPT, będziemy mogli otrzymać pomoc w stworzeniu idealnego polecenia - bez problemu uzyskamy adekwatne słowa po przedstawieniu naszego pomysłu. Co jednak najciekawsze, obrazy, które wygenerujemy, będą należeć całkowicie do nas i jeśli chcemy na nich zarabiać, to mamy na to pełną zgodę od twórców. Oczywiście model ma swoje ograniczenia - np. nie utworzymy obrazów przedstawiających przemoc. Jednak trzeba przyznać, że jest na co czekać, mimo że usługa będzie płatna.

Źródło: OpenAI