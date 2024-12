Nie tak dawno firma Google zaprezentowała możliwości modeli AI z rodziny o nazwie Gemini 2.0, a już teraz wprowadzono do niej nową odsłonę, która ma się okazać mądrzejsza. Wszystko dzięki temu, że może dłużej pomyśleć i rozbić swoje zadania na poszczególne, mniejsze kroki. Na dodatek cały ten proces możemy podejrzeć. Rozwiązanie stanowi konkurencję dla nowych modeli od OpenAI z serii o1, które też przed odpowiedzią poświęcają więcej czasu na myślenie.

Nowym kierunkiem dla rozwoju modeli AI stało się pozwalanie im na dłuższe myślenie przed udzieleniem odpowiedzi. W praktyce oznacza to, że każde zadanie rozbijane jest na wiele mniejszych, a czas na odpowiedź wydłuża się w zależności od tego, z jak trudnym zagadnieniem model ma do czynienia.

O wprowadzeniu nowości poinformował Jeff Dean (Google DeepMind) na platformie X. Gemini 2.0 Flash Thinking jest eksperymentalną wersją, którą bezpłatnie możemy wypróbować już teraz przez platformę Google AI Studio. Mamy do czynienia z multimodalnym dużym modelem językowym, który ma się okazać dużo lepszy dzięki temu, że ma czas do namysłu - nie jest skupiony na tym, aby jak najszybciej udzielić nam odpowiedzi. Firma zapewnia, że jest on w stanie rozwiązywać bardziej skomplikowane zagadnienia - także te, które dotyczą programowania, czy też matematyki. Całemu procesowi myślenia możemy się przyglądać na bieżąco - pozwala to przy okazji zrozumieć, dlaczego nasza odpowiedź wygląda tak, a nie inaczej.

Want to see Gemini 2.0 Flash Thinking in action? Check out this demo where the model solves a physics problem and explains its reasoning. pic.twitter.com/Nl0hYj7ZFS — Jeff Dean (@JeffDean) December 19, 2024

Curious how it works? Check out this demo where the model solves a tricky probability problem. pic.twitter.com/F3kJv4R9Gy — Noam Shazeer (@NoamShazeer) December 19, 2024

Oczywiście im bardziej skomplikowane jest zagadnienie, tym dłużej Gemini 2.0 Flash Thinking będzie się nad nim zastanawiał. Jak nowe rozwiązanie wypada w praktyce? Naprawdę całkiem nieźle, choć warto samemu się o tym przekonać. Każdy aspekt jest dokładnie analizowany pod różnymi kątami. Można się naprawdę mocno zdziwić, kiedy podejrzymy np. to, jak model rozwiązuje nawet trudne zadania matematyczne, rozkładając je na czynniki pierwsze. Widać, że Google zaczyna nadrabiać straty, gdyż początkowo OpenAI było na prowadzeniu pod każdym względem. Teraz okazuje się, że generator filmów Sora wypada bardzo słabo przy Veo 2 od Google (szczególnie pod względem odwzorowania fizyki), a przy tym firma umożliwiła skorzystanie z "myślącego" modelu AI za darmo, a w przypadku OpenAI za dostęp do serii o1 trzeba zapłacić (ograniczony dostęp za 20 lub nieograniczony za 200 dolarów miesięcznie).

Źródło: X @JeffDean @NoamShazeer