Sora - największa rewolucja w świecie AI od czasu ChatGPT. Powstał fotorealistyczny generator wideo z opisów tekstowych

Natan Faleńczyk | 16-02-2024 14:30 |

Oprogramowanie

Sora - największa rewolucja w świecie AI od czasu ChatGPT. Powstał fotorealistyczny generator wideo z opisów tekstowych Jeszcze do niedawna jednym z większych osiągnięć technologicznych była możliwość generowania fotorealistycznych obrazów z opisów tekstowych. W międzyczasie pojawiały się także rozwiązania, które szły o krok dalej i pozwalały w ten sam sposób tworzyć kilkusekundowe materiały wideo. OpenAI podnosi poprzeczkę jeszcze wyżej i prezentuje model Sora, który potrafi tworzyć nawet minutowe filmy, a przy tym jest niezwykle zaawansowany - na tyle, że można go nazwać rewolucyjnym.

Firma OpenAI znana z chatbota ChatGPT oraz generatora obrazów DALL-E zaprezentowała nowe rozwiązanie o nazwie Sora. Jest to model, który może generować realistycznie materiały wideo z opisów tekstowych. Już teraz efekty są fascynujące i przerażające zarazem.

Lumiere - bardziej realistyczne generowanie filmów od Google. Firma prezentuje nowy model zamiany tekstu na wideo

W przypadku nowego modelu Sora ciężko jest nie mówić o rewolucji. OpenAI stworzyło produkt na tyle wyróżniający się z tłumu, że po prostu nie sposób nazwać go inaczej. Dotychczasowe rozwiązania co prawda pozwalały na tworzenie wideo z poleceń tekstowych, natomiast same materiały nie były dokładne, spójne, ani też nie trwały zbyt długo. Sora zmienia ten obraz. Wydając polecenie temu generatorowi, zostaje ono najpierw przekształcone w bardziej rozbudowaną komendę (dzięki modelowi GPT), a następnie tworzone jest jak najdokładniejsze odwzorowanie tego, co napisaliśmy. Co jednak ważne, nowość potrafi symulować to, jak zachowują się konkretne osoby i stworzenia, a do tego niejako pamięta ich istnienie, nawet kiedy znikną z kadru. Mamy możliwość kontrolowania pracy kamery, a do tego model może wpływać na interakcje ze światem (np. kiedy człowiek ugryzie burgera, to zostaje na nim ślad po tej czynności, w więc zupełnie jak w prawdziwym świecie - choć nie zawsze jest tak idealnie).

Zbiór wszystkich przykładów wideo wygenerowanych przez model Sora, jakie udostępniło OpenAI.

OpenAI wprowadza zmiany do generatora obrazów DALL-E 3. Sztuczne grafiki będą teraz łatwe do zidentyfikowania

Oprócz tego Sora może generować wideo z pojedynczego obrazu i opisu tekstowego, tworzyć brakujące klatki do istniejących filmów, czy też łączyć elementy z dwóch materiałów wideo w jeden film. Tak jak wspomniano, każde wygenerowane wideo może trwać maksymalnie minutę. Sora była szkolona na natywnych materiałach o wysokich rozdzielczościach (bez problemu radzi sobie z 1920 x 1080, 1080 x 1920 pikseli i wszystkimi wartościami pomiędzy), a nie niskich pokroju 256 x 256 pikseli jak inne modele. Dzięki temu końcowe wideo jest naprawdę wysokiej jakości. Model jest przy tym dość wszechstronny, ponieważ może tworzyć wideo w wielu rozdzielczościach i formatach. Oczywiście ma też swoje wady, takie jak nie zawsze adekwatnie przewidziana fizyka obiektów (np. szkło nie stłucze się w naturalny sposób), czy choćby przypadkowe pojawianie się różnych rzeczy. Na ten moment prowadzone są badania i testy z ekspertami w tej dziedzinie, więc nikt prócz garstki wybranych osób nie ma do Sory dostępu. OpenAI chce wdrożyć też odpowiednie zabezpieczenia, aby nie można było generować materiałów, które będą przedstawiały treści seksualne, podobizny sławnych osób lub przemoc. Powstaje też narzędzie, które ma pomóc zidentyfikować, czy dane wideo zostało stworzone przez model Sora. Trzeba jednak przyznać, że postęp, jaki nastąpił w ciągu ostatniego roku, przypomina dosłownie lata świetlne rozwoju w tej dziedzinie. Niewątpliwie jest to spore zagrożenie, nad którym ciężej będzie zapanować. Dlatego też ważne jest, aby wprowadzić odpowiednie środki zaradcze, zanim rozwiązanie trafi do pierwszych użytkowników.

Źródło: OpenAI

Bądź na bieżąco - obserwuj PurePC.pl na Google News

Tagi:

Zgłoś błąd

Powiązane publikacje

F-Droid - sklep z aplikacjami na Androida, o którym mogłeś nie wiedzieć. Łatwy dostęp do bazy FOSS

WhatsApp, Messenger, a może Signal? Jaki komunikator sprawdzi się dla nas najlepiej? Sprawdź zestawienie różnych rozwiązań

Linux kernel 6.16 rc4 - kolejna odsłona jądra systemu w wersji beta. Poprawki sterowników, stabilności oraz systemów plików

OpenAI wskazuje chiński startup Zhipu AI jako głównego konkurenta w globalnej rywalizacji o dominację w AI

Microsoft potwierdza aktualizację Windows 11 do wersji 25H2 na jesień 2025. Instalacja tym razem będzie szybsza niż przy 24H2

Liczba komentarzy: 63

Komentarze:

Załaduj komentarze

Sora - największa rewolucja w świecie AI od czasu ChatGPT. Powstał fotorealistyczny generator wideo z opisów tekstowych

Firma OpenAI znana z chatbota ChatGPT oraz generatora obrazów DALL-E zaprezentowała nowe rozwiązanie o nazwie Sora. Jest to model, który może generować realistycznie materiały wideo z opisów tekstowych. Już teraz efekty są fascynujące i przerażające zarazem.

Lumiere - bardziej realistyczne generowanie filmów od Google. Firma prezentuje nowy model zamiany tekstu na wideo

OpenAI wprowadza zmiany do generatora obrazów DALL-E 3. Sztuczne grafiki będą teraz łatwe do zidentyfikowania

Powiązane publikacje

F-Droid - sklep z aplikacjami na Androida, o którym mogłeś nie wiedzieć. Łatwy dostęp do bazy FOSS

WhatsApp, Messenger, a może Signal? Jaki komunikator sprawdzi się dla nas najlepiej? Sprawdź zestawienie różnych rozwiązań

Linux kernel 6.16 rc4 - kolejna odsłona jądra systemu w wersji beta. Poprawki sterowników, stabilności oraz systemów plików

OpenAI wskazuje chiński startup Zhipu AI jako głównego konkurenta w globalnej rywalizacji o dominację w AI

Microsoft potwierdza aktualizację Windows 11 do wersji 25H2 na jesień 2025. Instalacja tym razem będzie szybsza niż przy 24H2

Komentarze:

Jaki komputer do gier kupić? Polecane zestawy komputerowe na lipiec 2025. Komputery gamingowe w różnych cenach

Test chłodzenia AiO MSI MAG CoreLiquid A13 360 - Niedrogi zestaw o dobrej wydajności z efektownym podświetleniem ARGB

Test płyty głównej ASUS ROG Crosshair X870E Extreme - Kosmiczne wyposażenie w ekstremalnie wysokiej cenie

Test obudowy komputerowej MSI MPG Velox 300R Airflow PZ - Solidna konstrukcja plus wydajne 160 mm wentylatory ARGB

Wypasiony notebook do gier w naszych rękach. Test Predator Helios 18 AI z kartą NVIDIA GeForce RTX 5080 Laptop GPU

F-Droid - sklep z aplikacjami na Androida, o którym mogłeś nie wiedzieć. Łatwy dostęp do bazy FOSS

WhatsApp, Messenger, a może Signal? Jaki komunikator sprawdzi się dla nas najlepiej? Sprawdź zestawienie różnych rozwiązań

Max – filmowe i serialowe nowości VOD na 30 czerwca - 6 lipca 2025. Wśród premier Grzesznicy, Mr. & Mrs. Smith, Juno oraz Jumanji

Aktor głosowy z Assassin's Creed IV: Black Flag potwierdza nadchodzącą premierę remake'u popularnej czwórki

Implant mózgowy BrainGate2 pozwala sparaliżowanym mówić i śpiewać. Technologia UC Davis działa błyskawicznie i dokładnie

Test wydajności DOOM: The Dark Ages - Path Tracing to piekielne wymagania sprzętowe. Porównanie wydajności i jakości grafiki

Test kart graficznych AMD Radeon RX 9060 XT vs NVIDIA GeForce RTX 5060 Ti - Waga kogucia doładowana 16 GB pamięci?

NVIDIA z totalną dominacją na rynku kart graficznych dla PC. Intel na tym rynku praktycznie nie istnieje

AMD Radeon RX 9070 XT - modele z pamięciami GDDR6 od Samsunga są trochę wolniejsze od tych z modułami od SK hynix

AMD Radeon RX 9060 XT - pierwsze wyniki testów potwierdzają niższą wydajność od GeForce'a RTX 5060 Ti

O portalu PurePC

Najważniejsze

Znajdź PurePC na