Stability AI prezentuje Stable Virtual Camera oferując przełom w konwersji obrazów 2D na filmy 3D
Stability AI opracowało Stable Virtual Camera, narzędzie pozwalające na tworzenie trójwymiarowych filmów z pojedynczych obrazów 2D. Technologia umożliwia realistyczne odwzorowanie ruchu kamery bez konieczności fizycznego modelowania sceny. Użytkownicy mogą generować dynamiczne animacje i tworzyć sekwencje nawet do 1000 klatek. System wykorzystuje zaawansowane modele dyfuzyjne, oferując płynną i naturalną perspektywę.
Stability AI wprowadza Stable Virtual Camera, narzędzie przekształcające obrazy 2D w filmy 3D z realistyczną głębią i dynamicznymi efektami kamery. To przełom w syntezie wizualnej.
Stable Video 3D - nowość od Stability AI, która zamieni obraz w animację modelu 3D. Duże ułatwienie dla twórców gier
Stable Virtual Camera to innowacyjne narzędzie udostępnione przez Stability AI. Umożliwia ono zaawansowane przekształcanie pojedynczych obrazów 2D w immersyjne filmy 3D. Dzięki zaawansowanemu modelowi dyfuzyjnemu, użytkownicy mogą generować realistyczne ujęcia z różnych perspektyw bez konieczności skomplikowanej rekonstrukcji sceny, czy też optymalizacji specyficznej dla danego obrazu. Stable Virtual Camera pozwala na dynamiczne sterowanie trajektorią kamery, oferując takie ruchy jak obrót o 360°, spirala czy zoom.
Stability AI wprowadza nowy model po Stable Diffusion. Stable Cascade wymaga mniejszych zasobów i szybciej generuje obrazy
Narzędzie obsługuje różne proporcje obrazu, w tym kwadratowe (1:1), pionowe (9:16) i panoramiczne (16:9), a także umożliwia generowanie długich sekwencji wideo, nawet do 1000 klatek, zachowując spójność i płynność obrazu. Model osiąga najlepsze w swojej klasie wyniki w benchmarkach syntezy nowych widoków (NVS). Jest dostępny do celów badawczych na licencji niekomercyjnej. Można sprawdzić jego działanie na platformie Hugging Face. Kod źródłowy można pobrać z GitHub.
Powiązane publikacje

The Alliance for Open Media zapowiedziało wprowadzenie ulepszonego kodeka audio i wideo AV2 jeszcze w tym roku
33
Google udostępnia VaultGemma 1B, czyli pierwszy model językowy z pełną ochroną prywatności wykorzystującą differential privacy
6
Oficjalne badanie pokazuje prawdziwe zastosowania ChatGPT. Pisanie dominuje w pracy, programowanie to tylko 4,2 proc. użycia
16
Nadzór nad AI zawiódł. Jak warty 2,8 mln dolarów raport rządowy został podważony przez nieweryfikowane dane z modelu LLM
30