AudioCraft - AI do tworzenia treści audio. Meta przygotowała narzędzie, które ma być proste i dostępne dla każdego
Meta zaprezentowała właśnie AudioCraft, licencjonowaną platformę open-source do tworzenia wysokiej jakości realistycznej muzyki oraz dźwięku. Technologia ta została opracowana w celu wypełnienia luki na rynku generatywnej sztucznej inteligencji, ponieważ twórcy sztucznej inteligencji częściej oferują narzędzia do tworzenia tekstu lub obrazów. Mimo że poczyniono pewne postępy w dziedzinie audio to Meta słusznie zauważa, że istniejące rozwiązania są skomplikowane, płatne i niezbyt intuicyjne dla przeciętnego użytkownika.
Meta zaprezentowała AudioCraft, platformę open-source do tworzenia wysokiej jakości realistycznej muzyki oraz dźwięku. Ma być prosta i bogata.
Meta ma nietypowe pomysły na przyszłość - chatboty zasilane sztuczną inteligencją symulujące Abrahama Lincolna
Framework AudioCraft to nic innego, jak otwarta biblioteka PyTorch do maszynowego uczenia się, wykorzystywana także przy przetwarzaniu języka naturalnego. Składa się z takich komponentów takich jak MusicGen, AudioGen oraz EnCodec. Jak zauważa Meta, MusicGen generuje muzykę na podstawie danych wejściowych wprowadzonych przez użytkownika, podczas gdy AudioGen ma na celu tworzenie efektów dźwiękowych. EnCodec to z kolei roczna już technologia kodowania zdolna do „hiperkompresji” strumieni audio.
Meta Quest Pro - gogle okazały się małą porażką? Zaplanowano ograniczoną produkcję, a firma skupi się na modelu Quest 3
Innymi słowy wszystkie te trzy narzędzia umożliwiają przygotowanie od podstaw melodii / całych utworów, do tego przygotowanie środowiskowych efektów dźwiękowych, a na koniec wygenerowanie tego wszystkiego w możliwie wysokiej jakości i przy jak najmniejszej liczbie artefaktów. Twórcy AudioCraft podkreślają, że jest ono pierwszym tak prostym, a przy okazji otwartym narzędziem. Co więcej, idzie za tym także jakość, ponieważ model przeszkolony został ponoć na 400 tysiącach nagrań i 20 tysiącach godzin muzyki. To jak się spisuje można sprawdzić (odsłuchać) na oficjalnej stronie projektu - klik.
Powiązane publikacje

ARM ma już 40 lat. Architektura, która zasila smartfony, serwery i roboty, trafiła do ponad 250 miliardów urządzeń
22
Anthropic chce zajrzeć do wnętrza AI. Czy do 2027 roku odkryjemy, jak naprawdę myślą modele językowe?
22
Firma Elona Muska xAI chce pozyskać 25 miliardów dolarów na budowę superkomputera Colossus 2 z milionem GPU NVIDIA
60
Nowatorski interfejs mózg-komputer od Georgia Tech może zmienić sposób, w jaki ludzie komunikują się z technologią i otoczeniem
4