AlphaZero - SI, które niedługo wygra z ludźmi w DOTA i StarCrafta
AlphaZero - tak nazywa się Sztuczna Inteligencja stworzona przez DeepMind, filię Alphabet w Londynie. System ten potrafi sam nauczyć się grać w gry znając tylko podstawowe ich zasady. Póki co, są to gry, w których "siły" obu stron są od razu widoczne w całości. Tak jak to ma miejsce w szachach, Shogi czy Go. Pisząc "uczy się sam" - mamy na myśli dostarczenie Si tylko podstawowych informacji na temat zasad gry. AlphaZero uczy się następnie grając z przeciwnikiem lub sam ze sobą. Wyciąga wnioski i zdobywa wiedzę na temat najlepszych posunięć oraz rozwiązań w błyskawicznym tempie. Badania na ten temat zostały opublikowane własnie w czasopiśmie naukowym Science.
Badania nad AlphaZero prowadził zespół Davida Silvera z DeepMind. Artykułowi w Science towarzyszył komentarz Murraya Campbella, badacza AI w IBM, współtwórcy Deep Blue.
Ta sama firma - DeepMind stworzyła AlphaGo, program komputerowy do gry w Go zasilany przez sieci neuronowe DeepMind. Pokonał on w październiku 2015 roku mistrza Europy Fan Hui. Po raz pierwszy sztuczna inteligencja pokonała wówczas profesjonalnego gracza Go. AlphaGo potrzebował ludzkiej pomocy, aby przejść przez trwający kilka miesięcy kurs uczenia i doskonalenia. AlphaZero przeszkoliło się w grze w Go w zaledwie trzy dni. I bez problemu pokonało AlphaGo. "Ta praca zamknęła kilkadziesiąt lat w badaniach nad sztuczną inteligencją" - pisze Campbell, który był członkiem zespołu, który zaprojektował Deep Blue firmy IBM. To superkomputer, który w 1997 roku pokonał Garry Kasparowa, ówczesnego mistrza świata w szachach. "Naukowcy zajmujący się sztuczną inteligencją muszą szukać nowej generacji gier, aby zapewnić im kolejne wyzwania."
Google mówi armii: NIE - To koliduje z wartościami naszej AI
AlphaZero może złamać każdą grę, która zawiera wszystkie informacje istotne dla podejmowania decyzji. Co z innymi? Takimi gdzie nie wszystkie informacje potrzebne do zdecydowania o następnym posunięciu są widoczne? Jako przykład takiej gry podać można na przykład pokera, gdzie gracz widzi tylko swoje karty. Inne podane w artykule przykłady obejmują wiele gier wieloosobowych, takich jak StarCraft II czy Dota. Naukowcy twierdzą, że mogą one stanowić godne wyzwanie, ale nie na długo. "AlphaZero pokonała już najlepszych graczy w Dota 2, choć była to ograniczona wersja gry. StarCraft może być nieco trudniejszy. Uważam jednak, że obie gry są do wygrania przez SI w ciągu dwóch, góra trzech lat".
Intel Neural Compute Stick 2 - sieć neuronowa dostępna w pendrive
Doskonale wiemy, że rozwiązując prawdziwe życiowe problemy rzadko mamy wszystkie informacje potrzebne do ich rozwiązania. Właśnie dlatego Sztuczna Inteligencja, która opanuje każdą grę z niedoskonałymi informacjami, może znaleźć zastosowanie w praktycznie każdej dziedzinie - w modelowaniu finansowym, prowadzeniu pojazdów, a nawet na wojnie. AlphaZero, to system uczenia ze wzmocnieniem (reinforcement learning system), który jak sama nazwa wskazuje, oznacza, że uczy się poprzez wielokrotne granie w grę oraz na podstawie zdobytych doświadczeń. Jest to podobne do tego, w jaki sposób uczą się ludzie. System wykorzystał również metodę wyszukiwania znaną jako Monte-Carlo Tree Search (w skrócie MCTS). Połączenie obu tych technologii pozwala systemowi nauczyć się, jak poprawić grę. Naukowcy nadali systemowi testowemu dużą moc,