-->

Індексація посилань

У текстах веб-сторінок є багато посилань на інші сторінки Інтернету - гіпертекстових посилань. Для користувача вони виглядають як підкреслені або підсвічені особливим кольором слова, за якими можна клацнути мишею і перейти на іншу сторінку. Для пошукового робота виділити в тексті сторінки гіпертекстові посилання неважко, тому що вони завжди мають формальний вид, починаючись і закінчуючись спеціальними позначками мови HTML.

Але посилання - це не текст, не слова. Чи потрібно їх індексувати?

Так, безумовно. Індексуючи посилання, пошукові системи переслідують відразу кілька цілей.

Поповнення списку сторінок. За допомогою посилань пошуковики поповнюють свій список веб-сторінок для індексації.

Пошук посилань на заданий сайт. Більшість сучасних пошукових систем дозволяють шукати по посиланнях на заданий сайт або сторінку, як за звичайними словами.

Обчислення рангу авторитетності сторінки. За допомогою посилань пошукові машини аналізують структуру посилань сайтів один на одного, щоб визначити найбільш авторитетні в Інтернеті сторінки і сайти. Правило тут просте: на кого багато посилаються, той, очевидно, більш відомий і авторитетний, ніж той, на кого поставили мало посилань. Авторитетність сторінки, обчислена за кількістю посилань на неї з інших сторінок, називається посилальним рангом сторінки (по-англійськи PageRank).

Використання тексту посилання. За допомогою тексту посилань можна отримати тематичну класифікацію сторінок. Адже посилання зазвичай містить в собі не тільки адресу сторінки, але і текст посилання (анкор), тобто ті слова, які підкреслюються на веб-сторінці і за якими можна клацнути.

Цей текст пошуковики індексують спеціальним чином, так як він фактично є коротким смисловим описом тієї сторінки, на яку веде посилання. Це опис можна використовувати для пошуку веб-сторінок (зазвичай такі сторінки будуть позначені на результатах пошуку як «знайдено по посиланню»), а також для тематичного ранжирування веб-сторінок при видачі результатів пошуку.

Індекс посилань