Voice Engine - technologia od OpenAI pozwala na realistyczne klonowanie głosu. Wystarczy zaledwie krótka próbka

Natan Faleńczyk | 30-03-2024 20:30 |

Oprogramowanie

Voice Engine - technologia od OpenAI pozwala na realistyczne klonowanie głosu. Wystarczy zaledwie krótka próbka Dzisiejsza technologia związana z AI to nie tylko chatboty i generatory obrazów lub filmów, ale także możliwość sklonowania praktycznie dowolnego głosu. Na rynku co prawda istnieje już wiele takich rozwiązań, natomiast organizacja OpenAI zaprezentowała właśnie model Voice Engine, który pozwala uzyskać imponujące efekty. Może on utworzyć bardzo realistyczny głos konkretnej osoby — w tym celu wystarczy mu zaledwie kilkunastosekundowa próbka.

OpenAI pokazało próbkę możliwości swojego modelu Voice Engine, który pozwala na zamianę tekstu na mowę z użyciem dowolnego głosu źródłowego. Organizacja chce jednak odpowiedzialnie podejść do tematu, więc rozwiązanie nie jest jeszcze publicznie dostępne.

Model GPT-4 od OpenAI został zdetronizowany. Użytkownicy wybrali następnego króla, którym jest nowość od Anthropic

Model Voice Engine jest rozwijany już od dłuższego czasu, natomiast teraz OpenAI postanowiło przedstawić jego możliwości. Trzeba przyznać, że uzyskiwane efekty są dosłownie rewelacyjne. Wspomniana 15-sekundowa próbka wystarcza nie tylko do tego, aby sklonować barwę głosu. Na jej podstawie można odwzorować różne emocje, a także zmieniać tempo mowy. Wszystko to składa się na bardzo realistyczny głos, który w niczym nie przypomina dawnych syntezatorów mowy. Przykłady pokazane przez OpenAI na tej stronie ukazują, że sklonowanym głosem można odczytywać teksty w innym języku i to z zachowaniem czyjegoś akcentu. Umożliwia to choćby płynne tłumaczenie filmów. Kolejnym pożytecznym wykorzystaniem Voice Engine jest pomoc dla osób, które z jakiegoś powodu nie mogą się normalnie i swobodnie wypowiadać. Można bowiem użyć krótkiej próbki głosu sprzed wypadku.

Stable Diffusion stworzy grafikę w ułamku sekundy. Badacze z MIT przedstawili metodę, która usprawni każdy model AI

Oczywiście omawiane rozwiązanie niesie za sobą równie wiele, a może nawet więcej zagrożeń. OpenAI zdaje sobie z tego sprawę, więc zamierza najpierw przedyskutować to, w jaki sposób można rozważnie wprowadzić tę technologię na szerszą skalę. Do tego w każdym nagraniu, które zostanie stworzone przy użyciu Voice Engine, zaimplementowany zostanie znak wodny. Ma to pozwolić na łatwą identyfikację źródła. Aktualnie tylko garstka wybranych osób uzyskała dostęp do tego modelu, a dopiero po wprowadzeniu wspomnianych środków bezpieczeństwa trafi on na rynek. Jest to bardzo dobre podejście, wszak już teraz wiele podobnych rozwiązań przyczyniło się do szerzenia dezinformacji. Świat zmienia się nie do poznania i z jednej strony jest to fascynujące, natomiast z drugiej dosłownie przerażające.

Źródło: OpenAI

Bądź na bieżąco - obserwuj PurePC.pl na Google News

Tagi:

Zgłoś błąd

Powiązane publikacje

Grok 4 debiutuje w cieniu skandalu. Czy nowy model xAI naprawdę przewyższa ChatGPT i Gemini w każdej dziedzinie?

Soundslice wprowadza import tabulatury ASCII w odpowiedzi na powtarzające się fałszywe informacje generowane przez ChatGPT

Lossless Scaling - pojawił się projekt LSFG-VK, który częściowo przenosi funkcjonalność programu na systemy Linux

Grok generuje kontrowersyjne treści po zmianach w moderacji. Polska i Turcja zapowiadają oficjalne kroki przeciwko platformie X

Google wdraża nowe narzędzie zarządzania subskrypcjami w Gmail, usprawniające obsługę newsletterów i promocji

Liczba komentarzy: 39

Komentarze:

Załaduj komentarze

Voice Engine - technologia od OpenAI pozwala na realistyczne klonowanie głosu. Wystarczy zaledwie krótka próbka

OpenAI pokazało próbkę możliwości swojego modelu Voice Engine, który pozwala na zamianę tekstu na mowę z użyciem dowolnego głosu źródłowego. Organizacja chce jednak odpowiedzialnie podejść do tematu, więc rozwiązanie nie jest jeszcze publicznie dostępne.

Model GPT-4 od OpenAI został zdetronizowany. Użytkownicy wybrali następnego króla, którym jest nowość od Anthropic

Stable Diffusion stworzy grafikę w ułamku sekundy. Badacze z MIT przedstawili metodę, która usprawni każdy model AI

Powiązane publikacje

Grok 4 debiutuje w cieniu skandalu. Czy nowy model xAI naprawdę przewyższa ChatGPT i Gemini w każdej dziedzinie?

Soundslice wprowadza import tabulatury ASCII w odpowiedzi na powtarzające się fałszywe informacje generowane przez ChatGPT

Lossless Scaling - pojawił się projekt LSFG-VK, który częściowo przenosi funkcjonalność programu na systemy Linux

Grok generuje kontrowersyjne treści po zmianach w moderacji. Polska i Turcja zapowiadają oficjalne kroki przeciwko platformie X

Google wdraża nowe narzędzie zarządzania subskrypcjami w Gmail, usprawniające obsługę newsletterów i promocji

Komentarze:

Test Dream Machines RT5090-16PL32 z AMD Ryzen 9 9955HX3D i GeForce RTX 5090 Laptop. Najmocniejszy notebook tej generacji

Jaki telefon kupić? Polecane smartfony na lipiec i sierpień 2025. Urządzenia na każdą kieszeń, w każdej półce cenowej

Test obudowy komputerowej Corsair Frame 5000D RS - Większa i lepiej wyposażona wersja Corsair Frame 4000D RS

Test smartfona Nothing Phone (3) - wydajny i oryginalny, ale czy na pewno godny miana flagowca?

Test smartfona OnePlus Nord CE5 - na zewnątrz muzeum, w środku... liceum? Oto prawdziwy sleeper wśród smartfonów

Alphabet, Meta i inni giganci bezskutecznie lobbują przeciwko wprowadzeniu przepisów dotyczących sztucznej inteligencji

Dożywotnie licencje na system Microsoft Windows 11 i pakiet Office. Czy jest słońce czy deszcz pada, olać promki nie wypada

Samsung Galaxy S26 - nowa seria flagowców bez modelu z plusem? Topowy wariant Ultra ma za to przynieść oczekiwane zmiany

Alienware 25 oraz Alienware 27 - Premiera nowych monitorów dla graczy z ekranami odpowiednio Fast IPS oraz QD-OLED

Crew Dragon z zapasowym systemem lądowania i kompozytową osłoną termiczną. SpaceX i NASA szykują się do historycznego startu

Test wydajności DOOM: The Dark Ages - Path Tracing to piekielne wymagania sprzętowe. Porównanie wydajności i jakości grafiki

AMD Radeon RX 9070 XT - modele z pamięciami GDDR6 od Samsunga są trochę wolniejsze od tych z modułami od SK hynix

Jaki komputer do gier kupić? Polecane zestawy komputerowe na lipiec 2025. Komputery gamingowe w różnych cenach

Karty graficzne AMD Radeon RX 9000 w cenach blisko MSRP. Sytuacja architektury RDNA 4 wygląda już dużo lepiej

NVIDIA GeForce RTX 5070 SUPER oraz GeForce RTX 5070 Ti SUPER - Nadchodzą lepiej wyposażone karty graficzne Blackwell

O portalu PurePC

Najważniejsze

Znajdź PurePC na