Działanie wyszukiwarki internetowej Google jest od wielu lat analizowane przez wiele osób. Algorytmy, które stworzyła firma, są dosłownie na wagę złota, gdyż to one określają, jakie strony będą się pojawiały na szczycie rankingu wyszukiwania. Do tej pory udało się ustalić pewne reguły, choć część odkryć była szybko dementowana przez Google. Na jaw wyszła jednak wewnętrzna dokumentacja, która pozwala nam wniknąć w systemy firmy bardziej niż kiedykolwiek.

W internecie pojawiła się wewnętrzna dokumentacja firmy Google, która dotyczy sposobu działania wyszukiwarki i innych usług przedsiębiorstwa. Zawiera ona kilkanaście tysięcy reguł, jakimi kierują się algorytmy.

Wewnętrzne dane Google pojawiły się w internecie dzięki... samej firmie. Opublikowała je ona bowiem w serwisie GitHub 27 marca, a usunęła dopiero 7 maja 2024 roku. W międzyczasie całość została skopiowana i umieszczona na różnych stronach internetowych. Obszerny dokument (Google API Content Warehouse) mający ponad 2,5 tys. stron daje nam wgląd do ponad 14 tys. atrybutów (wraz z ich objaśnieniem), które są wykorzystywane w algorytmach różnych usług Google. Jest to niejako instrukcja obsługi dla pracowników firmy, która wyjaśnia sposób działania konkretnych funkcji. Wiele z nich odnosi się do pozycjonowania wyników w wyszukiwarce Google, natomiast nie wiadomo, jak wielkie mają one znaczenie w skali innych. Całość daje nam jednak naprawdę duży wgląd w to, jakimi zasadami kierują się algorytmy firmy. Analiza dokumentacji dopiero się zaczęła, więc mamy jeszcze sporo niewiadomych, choć udało się już odkryć kilka ciekawych aspektów.

Na ten moment wiadomo, że nie wszystkie informacje dotyczące SEO, jakie podawało Google, były zgodne z prawdą. Kiedy we wcześniejszych latach ktoś wskazywał na związek różnych kwestii z wynikami wyszukiwania, to firma stanowczo zaprzeczała. Były to jednak zwykłe kłamstwa, gdyż wiele z dawnych reguł zostało właśnie potwierdzonych. Przykładem może być wykorzystywanie danych z przeglądarki Google Chrome przez algorytm — śledzone są kliknięcia użytkowników i na podstawie tego jest tworzony np. ranking najważniejszych adresów na danej stronie (atrybut: topUrl). Systemy Navboost i Glue wpływają na wyniki wyszukiwania, a jedną z ich funkcji jest śledzenie "jakości" kliknięć użytkowników — np. jeśli dana osoba kliknie link, ale szybko z niego wróci do poprzedniej strony, to odnośnik może być później gorzej pozycjonowany (atrybuty: goodClicks, badClicks, lastLongestClicks). Istnieje atrybut (hostAge), który jest przypisywany nowym stronom, gdyż najpierw trafiają one do tzw. piaskownicy (ang. sandbox), czyli do miejsca, z którego są słabiej widoczni w wynikach wyszukiwania (trochę jak limbo, jednak jest pewna wzmianka o ich istnieniu). W rankingu wyszukiwania uwzględniany jest autor treści. Potwierdzonych rzeczy wciąż przybywa, a jeśli jesteśmy zainteresowani wniknięciem w dokumentację osobiście, to znajdziemy ją pod tymi adresami: v0.4.0 i v0.5.0.

Źródło: SparkToro