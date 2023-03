Technologia związana z algorytmami sztucznej inteligencji rozwija się w tak zawrotnym tempie, że już możemy być świadkami naprawdę wielu niesamowitych rzeczy. Zazwyczaj, kiedy ktoś wspominał o możliwości interpretacji naszych sygnałów mózgowych, a następnie przekształceniu ich w obrazy, mieliśmy do czynienia z filmem Sci-Fi. Obecnie sposobność ta jest już dosłownie na wyciągnięcie ręki, a pierwsze projekty chwalą się swoimi efektami.

Japońskim badaczom udało się dokonać prawie niemożliwego. Jesteśmy już w stanie generować obrazy z naszych myśli. Wszystko to z małą pomocą SI.

Któż z nas nie myślał w młodości, że kiedyś będzie możliwe odczytywanie naszych myśli w taki sposób, żeby inni mogli je zobaczyć. Było to wówczas jedynie pieśnią odległej przyszłości albo dość przerażającym wyobrażeniem. Jeszcze kilka lat temu, mało kto brał to pod uwagę. Nadeszła jednak mała rewolucja, która zdaje się rozwijać bardzo dynamicznie. Dzięki narzędziom, które wykorzystują algorytmy SI takim jak Midjourney czy też Stable Diffusion, jesteśmy w stanie generować obrazy z opisów. To właśnie drugi z wymienionych będzie bohaterem tego newsa. Wspomniani na początku badacze to adiunkt Yu Takagi oraz profesor Shinji Nishimoto z Uniwersytetu w Osace. Znaleźli oni sposób, dzięki któremu można przetworzyć aktywność mózgową na wysokiej jakości obrazy.

Rekonstrukcja wizualna wyobrażeń pochodzących z naszego umysłu może nam pomóc bardziej wniknąć w to, jak funkcjonujemy. Cały mechanizm interpretacji świata poprzez nasze narządy wzrokowe i późniejsze ich przetwarzanie przez nasz mózg, będzie teraz łatwiejszy do zrozumienia. Metoda, jaką można osiągnąć "zilustrowanie" naszych myśli, opiera się na skorzystaniu z badania funkcjonalnego rezonansu magnetycznego (fMRI). Następnie z pomocą modelu generatywnego LDM (latent diffusion model) wyniki się przetwarzane, aż do uzyskania końcowego obrazu. Model LDM w przeciwieństwie do DM jest dużo wydajniejszy. Służy on do generowania danych, które będą podobne do tych, na jakich został wytrenowany. Jego sposób działania opiera się na ich niszczeniu, a następnie stopniowym dodawanie szumu gaussowskiego. W następnej kolejności uczy się odtwarzać te dane poprzez odwrócenie całego procesu. W tym wypadku użyty został model generowania obrazów Stable Diffusion. Efekty, jakie możemy zobaczyć, są doprawdy imponujące. Mimo, że technologia ta wymaga jeszcze dopracowania, to niewątpliwie to, co udało się osiągnąć jest dużym krokiem do przodu.

Źródło: Vice