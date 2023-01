2023 rok, jeśli chodzi o sztuczną inteligencję, zaczął się naprawdę ciekawie. Już pod koniec 2022 roku pojawił się robiący wrażenie chatbot ChatGPT od OpenAI, a następnie (projekt także od OpenAI) mogliśmy podziwiać ilustracje generowane przez DALL·E. Teraz przyszła pora na zapoznanie się z VALL-E - systemem od Microsoftu, który jest niezwykle skuteczny w imitowaniu cudzych głosów. Aby przemówić wybranym głosem, potrzebuje do tego zaledwie 3-sekundowej, modelowej próbki.

System Microsoftu nie jest pierwszym tego typu, jednak w porównaniu z innymi wypada nieporównywalnie lepiej. Głównym atutem VALL-E jest to, że aby przekonująco imitować barwę i styl wypowiedzi człowieka, system ów potrzebuje próbki głosu trwającej zaledwie 3 sekundy. Twórcy zapewniają również, że ich SI potrafi ponadto zachować emocje mówiącego, a nawet środowisko akustyczne, w jakim nagrano próbkę!

Microsoft have announced their AI "VALL-E"



Using a 3-second sample of human speech, it can generate super-high-quality text-to-text speech from the same voice. Even emotional range and acoustic environment of the

sample data can be reproduced. Here are some examples. pic.twitter.com/ExoS2VWO6d