Microsoft Bing wkrótce doczeka się integracji z generatorem DALL-E. Wstępna wersja narzędzia jest już dostępna do testowania
Microsoft nie ma zamiaru zatrzymywać się w rozwoju technologii opartych na sztucznej inteligencji. Doczekaliśmy się już integracji usług amerykańskiej firmy z elementami AI. Teraz przyszła kolej na generowanie obrazów. Wkrótce narzędzie DALL-E zostanie zintegrowane z wyszukiwarką Bing i przeglądarką Edge. Można już testować wstępną implementację usługi i rezultaty jej użycia bywają imponujące, a to dopiero wstępna wersja.
Microsoft zaprezentował Bing Image Creator. Narzędzie pozwala na generowanie obrazów przez algorytmy sztucznej inteligencji i będzie ciekawą alternatywą dla płatnego Midjourney.
Microsoft 365 Copilot - zestaw funkcji opartych na AI, które zrewolucjonizują sposób korzystania z pakietów biurowych
Generowanie obrazów przez AI nie jest czymś nowym. Takie możliwości ma chociażby Midjourney, który wymaga jednak opłacania regularnej subskrypcji. Dostępne są też alternatywy pokroju StarryAI, nie dają one jednak zadowalających efektów. Dużym krokiem naprzód może być nowa usługa Microsoftu, czyli Bing Image Creator. Firma z Redmond udostępniła już jego wstępną wersję. Na razie działa niezależnie od wyszukiwarki, ale to ma się w przyszłości zmienić. Docelowo możliwe będzie tworzenie obrazów z poziomu chatu zintegrowanego z Bing, po wybraniu opcji kreatywnej odpowiedzi. Narzędzie doczeka się także implementacji w ramach przeglądarki Edge.
NVIDIA H100 NVL - akcelerator GPU oparty na architekturze Hopper i przygotowany z myślą o popularnym ChatGPT
Na razie usługa nie posiada sztywnego limitu obrazów, które może wygenerować dla pojedynczego użytkownika, ale korzystając z niej używamy specjalnych punktów, które przyspieszają cały proces. Po ich wyczerpaniu tworzenie obrazu trwa dłużej. Pula ma być odnawiana każdego tygodnia. Choć usługa nie jest idealna, to w wielu przypadkach daje rezultat porównywalny z płatnym Midjourney. Wiele zatem wskazuje, że w niedalekiej przyszłości każdy użytkownik będzie mógł bezpłatnie skorzystać z bardzo potężnego narzędzia, którego zastosowanie ograniczy jedynie wyobraźnia. Można zatem mówić o kolejnym przełomie.
OpenAI zaprezentowało następcę ChatGPT. Model GPT-4 ma znacznie większe możliwości, w tym multimedialne. Rozumie nawet memy
Podczas moich testów narzędzia nie obyło się bez drobnych problemów. Usługa bowiem zawiesiła się podczas próby generowania pierwszego obrazu. Kolejne podejścia przebiegły już gładko, więc można przypuszczać, że był to jednostkowy przypadek. Trzeba brać pod uwagę to, że generator jest zapewne obecnie poddawany dużym obciążeniom. Choć efektywne korzystanie z niego wymaga nieco wprawy, to rezultaty mogą się podobać. Po dokonaniu odpowiednich szlifów, generowane obrazy będą mogły konkurować z pracami prawdziwych artystów. Na chwilę obecną narzędzie obsługuje wyłącznie język angielski. Poniżej przykładowe obrazy, które udało mi się wygenerować, wraz z danymi wejściowymi. Wiele zależy od tego, jak poinstruujemy generator, bo niektórzy uzyskują dużo lepsze rezultaty od innych.
Dane wejściowe: "futuristic huge building in a cyberpunk city during heavy rain, realistic, high detail, ultra hd image, lots of neon signs, big human crowd near the base of the building"
Dane wejściowe: "epic mage casting fireballs on a bridge connecting two mountains, high detail, ultra hd"
Dane wejściowe: "back alley in a cyberpunk Warsaw during heavy rain, a lot of detail"
Dane wejściowe: "big science-fiction spaceship orbiting Earth, sun leans out gently from
behind Earth"