Zgłoś błąd
X
Zanim wyślesz zgłoszenie, upewnij się że przyczyną problemów nie jest dodatek blokujący reklamy.
Błędy w spisie treści artykułu zgłaszaj jako "błąd w TREŚCI".
Typ zgłoszenia
Treść zgłoszenia
Twój email (opcjonalnie)
Nie wypełniaj tego pola
.
Załóż konto
EnglishDeutschукраїнськийFrançaisEspañol中国

VALL-E - system Microsoftu bazujący na SI potrafi naśladować głos każdego człowieka na bazie małej próbki

VALL-E - system Microsoftu bazujący na SI potrafi naśladować głos każdego człowieka na bazie małej próbki2023 rok, jeśli chodzi o sztuczną inteligencję, zaczął się naprawdę ciekawie. Już pod koniec 2022 roku pojawił się robiący wrażenie chatbot ChatGPT od OpenAI, a następnie (projekt także od OpenAI) mogliśmy podziwiać ilustracje generowane przez DALL·E. Teraz przyszła pora na zapoznanie się z VALL-E - systemem od Microsoftu, który jest niezwykle skuteczny w imitowaniu cudzych głosów. Aby przemówić wybranym głosem, potrzebuje do tego zaledwie 3-sekundowej, modelowej próbki.

VALL-E to niesamowicie skuteczny system Microsoftu, który imituje brzmienie ludzkich głosów. Aby brzmieć niczym wybrana osoba, potrzebuje jedynie 3-sekundowej próbki.

VALL-E - system Microsoftu bazujący na SI potrafi naśladować głos każdego człowieka na bazie małej próbki [1]

ChatGPT - popularny bot jest w stanie napisać także złośliwe oprogramowanie. Każdy może stać się hakerem?

System Microsoftu nie jest pierwszym tego typu, jednak w porównaniu z innymi wypada nieporównywalnie lepiej. Głównym atutem VALL-E jest to, że aby przekonująco imitować barwę i styl wypowiedzi człowieka, system ów potrzebuje próbki głosu trwającej zaledwie 3 sekundy. Twórcy zapewniają również, że ich SI potrafi ponadto zachować emocje mówiącego, a nawet środowisko akustyczne, w jakim nagrano próbkę!

Microsoft bliski przejęcia Nuance Communications. Sztuczna inteligencja i rozwiązania medyczne tylko na tym zyskają

Aby wyćwiczyć VALL-E w syntezie mowy, wykorzystano około 60 tys. godzin nagrań w języku angielskim, co jest liczbą setki razy wyższą, niż w przypadku obecnie stosowanych systemów TTS (Text To Speech). Jeśli jesteście szczególnie zainteresowani tym zagadnieniem, to odsyłam do artykułu naukowego, który szczegółowo przedstawia procesy działania VALL-E, a od siebie dodam już tylko, że VALL-E pracuje w oparciu o rozwiązanie EnCodec, które zostało przedstawione przez spółkę Meta jesienią ubiegłego roku.

VALL-E - system Microsoftu bazujący na SI potrafi naśladować głos każdego człowieka na bazie małej próbki [2]

Źródło: Engadget
Bądź na bieżąco - obserwuj PurePC.pl na Google News
Zgłoś błąd
Liczba komentarzy: 32

Komentarze:

x Wydawca serwisu PurePC.pl informuje, że na swoich stronach www stosuje pliki cookies (tzw. ciasteczka). Kliknij zgadzam się, aby ta informacja nie pojawiała się więcej. Kliknij polityka cookies, aby dowiedzieć się więcej, w tym jak zarządzać plikami cookies za pośrednictwem swojej przeglądarki.