-->

Все про алгоритм Google: як думає пошукова система

Адаптований переклад статті із блогу Moz.

Алгоритм Google є мільйонами рядків програмного коду, які виконуються на сотнях тисяч серверів у більш ніж 20 дата-центрах. Ця система складається з евристичних алгоритмів та машинного навчання. Вона постійно адаптується до поведінки мільярдів користувачів.

Все про алгоритм Google

Щоб бути фахівцем з просування в Google, недостатньо знати основи сканування, індексування та ранжування сайтів. Потрібно розуміти, як Google "думає", як працює його алгоритм. У статті якраз про це.

    Як змінювався алгоритм Google

    Алгоритм Google постійно адаптується до прийомів SEO. Фактори SEO, на які покладалися ранні пошукові системи, ми сьогодні називаємо «посторінковими» або On-page факторами. До них відносяться метадані та контент. Цими факторами SEO-фахівцям було відносно легко керувати.

    Коли Ларрі Пейдж та Сергій Брін розробили алгоритм PageRank (PR), вони відкрили світ «off-page» факторів, що ґрунтуються на вазі зовнішніх посилань.

    Хоча посиланнями було складніше керувати, оскільки вони не залежали від одного сайту, згодом SEO-фахівці почали створювати, купувати, обмінювати посилання і навіть будувати складні мережі посилань.

    Тому Google знову довелося адаптуватись. У 2011 році Ерік Шмідт повідомив, що Google вніс до алгоритму 516 змін, заснованих на результатах більш ніж 8000 експериментів. У 2020 році це число збільшилося до 4050 поліпшень, заснованих на результатах 600000 експериментів.

    Розглянемо, як основні оновлення алгоритму Google впливали на SEO (і як SEO впливало на них).

    Panda - контроль якості контенту

    Гугл панда

    Розробка оновлення Panda розпочалася у 2011 році. Зрештою, воно складалося з 28 офіційно підтверджених оновлень і стало початком серйозної боротьби з неякісним контентом у результатах пошуку. Оновлення Panda було додано до основного алгоритму Google у 2015 році.

    Спочатку оновлення Panda було спрямоване на контент-ферми - сайти, які створюють безліч SEO-текстів. Але в результаті воно стало стосуватися також і повторюваного контенту, неякісного контенту і малокорисного контенту, який створювався виключно як місце для розміщення реклами.

    Разом із цим оновленням з'явилася філософія, що багато контенту – не гарантія успіху. Цій філософії Google слідує і сьогодні. У контенту має бути певна мета.


    Penguin - боротьба з SEO - посиланнями

    Гугл пінгвін

    Penguin розробили спеціально для того, щоб карати сайти, які маніпулювали результатами пошуку. Багато оновлень алгоритму Penguin були спрямовані на боротьбу з SEO посиланнями.

    Наслідки були настільки важкими, що в 2016 році Google скасував багато каральних заходів Penguin і натомість впровадив нове оновлення алгоритму, яке знецінило більшість неякісних лінків.

    Посилання, як і раніше, відіграють важливу роль, але будь-які зусилля, спрямовані на створення неякісних посилань — це марно витрачений час і гроші.

    Pigeon - локальний / мобільний інтент

    Оновлення Pigeon (Голуб) розмило межі між локальною та органічною пошуковою видачею. У блоках локальної видачі стало використовуватися більше органічних чинників якості контенту, а в органічної видачі з'явилося більше локалізованих результатів пошуку.

    Протягом тривалого часу (Pigeon - лише частина цього процесу) спостерігалося підвищення важливості локалізації для результатів пошуку, що знаходяться за межами блоку локальної пошукової видачі, і ця тенденція йде пліч-о-пліч зі зростанням популярності мобільних пристроїв. Якщо у вас локальний бізнес чи конкуруєте з компаніями, які продають товари в офлайн магазинах, а не тільки через інтернет, то все ваше SEO - це локальне SEO.

    Rankbrain - машинне навчання (ML)

    Через роки ми все ще не знаємо, як працює оновлення Rankbrain, але його запуск став першим відкритим визнанням Google, що машинне навчання (ML, machine learning) — частина алгоритму органічного пошуку.

    Докладніше про роль ML у SEO ми поговоримо нижче, але один із довгострокових його наслідків полягає в тому, що різні галузі та галузеві вертикалі починають сильніше відрізнятися одна від одної. Більше не існує єдиного зводу правил, який регулює всі варіанти пошукової видачі, і важливо розуміти, в якому конкурентному середовищі знаходитесь саме ви.

    Hummingbird - природна мова (NLP)

    Фахівці з SEO, як правило, не беруть до уваги такі оновлення інфраструктури Google, як Caffeine і Hummingbird.

    Випустивши оновлення Hummingbird наприкінці 2013 року, Google по суті переписав основну архітектуру пошуку, підготувавши умови для змін та інновацій на роки вперед, включаючи досягнення у галузі обробки природної мови (NLP, natural language processing).

    Ми все частіше формулюємо пошукові запити саме так, як говоримо в житті: скільки коштує ноутбук, скільки служить ноутбук. Тому Google почав ефективно працювати з природною мовою та відповідати на такий тип запитів:


    Результати пошуку в органічній видачі за запитом "скільки служить ноутбук".

    Хоча ці досягнення дуже корисні для користувачів пошукових систем, вони можуть збентежити SEO-фахівців. Як нам орієнтуватися на десятки чи навіть сотні варіацій однієї й тієїж фрази?

    Пошук на основі природної мови часто ототожнюється з голосовим пошуком та голосовими пристроями. Але хоча голосові пристрої прискорили використання природної мови, зміни, внесені Google, стосуються всього алгоритму роботи пошукової системи на всіх пристроях.

    Це означає, що не можна ігнорувати пошук природного мовлення тільки через те, що ви не зацікавлені в оптимізації під голосовий пошук. Прагнення Google обробляти запити природною мовою поступово перебудувало весь алгоритм роботи пошукової системи та впливає на весь органічний пошук.

    За останні кілька років ви напевно чули терміни RankBrain, BERT, GPT-3 та багато інших. Невже для того, щоб стати висококласними фахівцями з SEO, потрібні вчені ступені в галузі машинного навчання?

    Хоча ми вважаємо, що широке розуміння концепцій машинного навчання може бути дуже корисним, важливо розуміти, чого намагається досягти Google. Можна не знати, що таке BERT, але розуміти, що BERT допомагає Google краще інтерпретувати найважливіші слова у контексті довгих пошукових запитів.

    Як працює пошук природною мовою

    Допустимо, ваша компанія орієнтується на ключові слова "high-end vehicles" ("автомобілі преміум-класу"), і ви складаєте план дослідження ключових слів.

    Ви надсилаєте такий пошуковий запит до Google і виявляєте на другій позиції наступний результат:


    Зверніть увагу: на сторінці зустрічається словосполучення luxury car ("розкішний автомобіль"), але на цій сторінці взагалі немає фрази "high-end vehicles" або "high-end" у будь-якому контексті.

    Хоча облік синонімів у пошуку виник ще до появи BERT і, можливо, навіть до RankBrain, це демонструє вплив природної мови на пошукову видачу. Google шукає не тільки за заданим формулюванням, але й по синонімах.

    Плюс пошуку природною мовою

    Фахівцям з SEO більше не потрібно орієнтуватися на ключові фрази, що повністю збігаються, і спеціалізувати контент під одну фразу.

    Візьмемо керівництво Moz з SEO для новачків. За даними Keyword Explorer, ця сторінка ранжується майже по 2000 ключових фраз, включаючи:

    •     «beginners guide to SEO» («керівництво з SEO для початківців»);
    •     "SEO for beginners" ("SEO для початківців");
    •     "search engine optimization basics" ("ази пошукової оптимізації");
    •     "learning search engine optimization" ("вивчення пошукової оптимізації");
    •     "search engine optimization fundamentals" ("основні принципи пошукової оптимізації").

    Чи автори цієї статті орієнтувалися на всі ці 2 000 ключових фраз (або навіть на п'ять з них), коли писали її? Ні.

    Вони провели дослідження і знали про важливі варіанти фрази, наприклад, про те, що можна використовувати слова SEO і пошукову оптимізацію. Але потім вони писали статтю як звичайні люди - використовували природну мову, щоб розповісти про підхід до вивчення SEO, внаслідок чого сформувалася багата база синонімів та варіацій.

    Той вид «прицільного», вузькоспрямованого націлення, який фахівці з SEO могли використовувати на початку 2000-х років, в епоху обробки природної мови може зашкодити.

    Якщо уникати вільного використання природної мови та надмірно акцентувати увагу на конкретних ключових фразах, то ранжування відбуватиметься за меншою кількістю пошукових запитів.

    Мінус пошуку природною мовою

    У той же час поява обліку синонімів у результатах видачі призвела до посилення конкуренції за багатьма ключовими словами. Раніше контент конкурентів, орієнтований на "віп автомобілі", міг навіть не потрапити у поле зору під час створення статті про автомобілі преміум-класу.

    На щастя, є відмінний та завжди актуальний інструмент, завдяки якому можна зрозуміти, як Google обробляє природну мову та ключові ідеї, тобто зрозуміти самі результати пошуку. Повернімося до пошуку автомобілів преміум-класу. Зверніть увагу на пов'язані запити, що відображаються в нижній частині сторінки з результатами пошуку:


    Відразу ж можна помітити не тільки дуже близькі фрази, а й синоніми, такі як «luxury» (розкіш), «luxurious» (розкішний) та «expensive» (дорого), які можуть стати частиною вашої ключової ідеї або навіть більш вдалими цільовими ключовими словами. Ви можете вивчати сторінки пошукової видачі за потрібними запитами, щоб побачити, як Google зараз розуміє природну мову.

    Система пошуку відповідей

    Здається, що Google поступово перетворюється на систему пошуку відповідей, яка сама відповідає на запитання замість видачі результатів пошуку з можливими відповідями. Але насправді все залежить від самих пошукових запитів.

    На деякі запити, наприклад, «Скільки часу в Лондоні?» є лаконічні відповіді. Їх можна легко узагальнити:


    Така відповідь не дає великих можливостей для SEO. Тепер спробуємо питання "Як придумали часові пояси?" і подивимося відповідний виділений опис (Featured Snippet), який Google видає як відповідь:

    На подібний запит неможливо вичерпно відповісти двома пропозиціями — і тут можна знайти простір для SEO оптимізації.

    Важливо вивчати, які запитання запитують користувачі пошукової системи, і відмовлятися від мислення в рамках стислих пошукових фраз, що складаються з одного або двох слів. Пошукова система розвивається у бік пошуку відповідей на запитання, на кшталт:


    Так розмовляють люди, і професіонали в галузі SEO, щоб створювати контент, важливо розуміти, як і які питання частіше задають користувачі. Можливо, Google ніколи повністю не стане системою пошуку відповідей у ​​прямому значенні цього слова, але кожен пошук це питання.

    Поведінкові фактори


    Спеціаліст з SEO може вважати поліпшення ранжирування сайту самоціллю, але сенс SEO в кінцевому підсумку полягає в користувачі, який бачить ТОП результатів пошуку, натискає на заголовок і взаємодіє з вашим сайтом або брендом.

    З точки зору Google, підвищення якості пошуку в кінцевому підсумку призводить до повторного відвідування сайтів користувачами і до збільшення доходів від реклами.

    Є кілька специфічних методів, за допомогою яких Google враховує користувачів алгоритмічного рівняння. Розуміння логіки, що лежить в їхній основі, дуже важливі для підвищення ефективності SEO.

    CTR


    CTR (click-through rate) – це співвідношення кількості кліків по сайту до кількості показів сайту.

    Якщо ви давно займаєтеся SEO, то, напевно, чули суперечки про те, чи є показник CTR фактором ранжування. Google стверджує, що ні, у той час як SEO-фахівці вказують на дослідження на цю тему та експерименти, які свідчать про інше.

    Ми не можемо відповісти на це спірне питання у статті, але вважаємо, що сама тема питання важлива і є ключовим аспектом просунутого SEO.

    Незалежно від того, чи є CTR або інші показники залучення користувачів (показник відмов, час перебування на сайті тощо) ключовими факторами ранжирування, Google безперечно враховує їх.

    Ніхто не створює сайт і працює над ним тільки для того, щоб красуватися на першій сторінці Google. Розробники та SEO-фахівці мають певну мету щодо користувачів пошукової системи. Для цього потрібні кліки та конверсії.

    Сам по собі показник CTR, хоч і є лише одним з етапів цього шляху, допомагає зрозуміти, чи відповідають наші результати пошуку (заголовки, метадані та контент) очікуванням користувачів і де ми можемо щось поліпшити, особливо у разі небрендових пошукових запитів.

    Простіше кажучи, орієнтоване на людину SEO корисно для бізнесу, незалежно від того, які саме фактори Google використовує для вимірювання якості пошуку та чи використовуються ці фактори в алгоритмі Google.

    E-A-T


    E-A-T означає "Expertise, Authority and Trust" - експертність, авторитетність і достовірність. Ось офіційна заява Google на цю тему:



    Отже, фактори E-AT підвищують якість пошуку, і фахівцям з SEO необхідно брати їх до уваги. Але Google може використовувати їх, а може і не використовувати, а якщо і використовує, то не збирається розголошувати, яким саме чином.

    На тій же сторінці Google посилаються на низку статей на цю тему від шановних фахівців із SEO, але прямо повідомляють, що не підтверджують правдивість цих статей.

    Найкорисніша і водночас очевидна порада, яку можна дати фахівцям із SEO: висока експертність, авторитетність та достовірність сторінок сайту покращують SEO та корисні для бізнесу. Ці фактори особливо важливі в так званих галузях YMYL (Your Money or Your Life), включаючи охорону здоров'я та фінансові послуги, де високі споживчі ризики та довіра мають вирішальне значення.

    Швидкість роботи сайту та Core Web Vitals


    У червні 2021 року Google випустив Page Experience Update і спробував представити швидкість сайту у вигляді Core Web Vitals. В даний час набір показників CWV включає LCP, FID і CLS.

    LCP – основний контент сторінки

    LCP вимірює час, необхідний для відображення вашого основного, видимого на першому екрані, контенту. По суті? цей показник оцінює, наскільки швидко сприймається завантаження сторінки.

    FID — затримка першого введення

    FID вимірює час, який потрібний сайту, щоб відреагувати на першу взаємодію з користувачем. Термін «взаємодія» має широке визначення, включаючи натискання на посилання або кнопку. Чи потрібно користувачам вашого сайту чекати, щоб почати взаємодіяти з ним?

    CLS - сукупне зміщення макета

    CLS вимірює стабільність контенту. Наприклад, вміст сайтів з агресивною рекламою може зрушуватися в міру завантаження реклами. Подібне усунення контенту може дратувати користувачів, які переглядають сторінку.


    З одного боку, добре, що Google дає можливість виміряти показники Core Web Vitals, надаючи інструменти, такі як Lighthouse та Google Search Console. З іншого боку, буде неприємно, якщо у швидкого сайту будуть незадовільні результати вимірювань або оцінка, яка не зовсім відповідає дійсності.

    Головне, що роботи над CWV досі ведуться. І хоча корисно відстежувати ці показники та підвищувати їх, важливіше визнати прагнення Google до покращення пошуку з погляду користувачів та створення сайтів з урахуванням їх вражень.

    Як робити SEO з прицілом на майбутнє

    Якщо ви розумітимете, як «думає» Google, ви зможете побачити, куди тримає курс ця пошукова система, і зробити свою пошукову оптимізацію стійкою до майбутніх змін.

    Це не означає, що можна один раз повністю оптимізувати сайт та більше не займатися SEO. Навіть якби алгоритм Google не змінювався щодня і конкуренти перестали б щодня покращувати свої сайти, світ все одно змінюється.

    Наприклад, однією з найнегативніших подій в історії пошукових систем стала пандемія COVID-19, тому що вона докорінно змінила поведінку користувачів: люди почали шукати більш достовірну інформацію, стали по-іншому витрачати гроші, цікавитися локальним бізнесом і подорожами всередині країни.

    Захист SEO від майбутніх змін Google має на увазі, що ви можете передбачати тренди, робити припущення про майбутні оновлення Google і знизити ймовірність дорогих помилок.
    Слідкуйте за намірами Google та враховуйте їх

    Це не означає нервувати через кожну заяву компанії. Наприклад, у 2014 році Google публічно оголосив про рішення використовувати HTTPS як сигнал ранжирування, але зрештою це оновлення мало на що вплинуло, і зміни у пошуковій видачі, пов'язані із захищеними сайтами, виникли лише через кілька років.

    PR-кампанії Google можуть розповісти про наміри Google, але доведеться читати між рядками та розставляти пріоритети у своїй роботі над SEO.

    Пишіть тексти для людей, а не для ПС

    Останні досягнення в галузі машинного навчання (ML) та обробки природної мови (NLP) – гарна новина для SEO. Ці досягнення дають фахівцям з пошукового маркетингу та контент-маркетологам можливість писати природні тексти для аудиторії, знаючи, що з часом Google краще розумітиме те, яким чином люди спілкуються.

    Ваші шанси на успіх у SEO будуть зростати, якщо ви розбиратиметеся не тільки в тому, які слова використовують ваші клієнти, але й у питаннях, які вони ставлять, а також якщо ви пропонуватимете відповіді на них.

    SEO починається з використовуваних користувачами пошукових запитів, але закінчується на вашому сайті у вигляді активності користувача.