link tag rel=canonical

  
  
 

Zduplikowana treść jak powszechnie wiadomo stanowi problem z jakim borykają się wyszukiwarki. Indeksowanie różnych stron www (urli) o identycznej zawartości nie jest pożądanym działaniem oraz wprawia w zakłopotanie wyszukiwarki, który adres jest właściwy. Ostatnimi czasy walka ze zduplikowaną treścią w internecie przybrała szybszego obrotu. Świadczyć o tym mogą nakładane kary, filtry przez wyszukiwarki (google) na serwisy zawierające kopie innych stron jak np.: pressel pages, kopie wiki itp. W ostatnim okresie większe wyszukiwarki jak google, yahoo oraz msn zaczęły respektować tag link rel=”canonical”, określający w skrócie preferowany adress www.

Przypadki, w których ta sama strona może wystąpić pod kilkoma adresami www to najczęściej:

  • example.com
  • www.example.com
  • example.com/
  • www.example.com/
  • example.com/index.php
  • www.example.com/index.php
  • example.com/index.html
  • www.example.com/index.html

Linki wskazujące na konkretną witrynę mogą odnosić się do kilku wyżej wymienionych urli, co jest pewną niekonsekwencją dla robota indeksującego strony. Wiele z tych problemów może być rozwiązane przy pomocy:

  • przekierowania 301,
  • konsekwentnego linkowania do właściwego adresu url wewnątrz serwisu,
  • dobrze utworzonej sitemapy dla google, zawierającą preferowane adresy url,
  • wybrania w google webmaster tools www vs non www,
  • cms’a, generującego pożądane adresy url tzw. “standaryzacja” lub “normalizacja” adresów url. Plugin do wordpressa można sciągnąć tutaj: http://yoast.com/wordpress/canonical/

Oczywiście nie wszystkiemu można zaradzić. Zdarzają się przypadki kiedy to wyżej wymienione metody nie mogą być zastosowane np.:

  • brak możliwości zastosowania przekierowania 301. Niektórzy dostawcy hostingu nie dają możliwości stosowania przekierowań,
  • linki zamieszczane przez użytkowników są poza Twoją kontrolą,
  • duże, małe litery w adresach url,
  • id sesji,
  • kody śledzące google analytics, tagowanie linków,
  • sortowanie list (rosnąco lub malejąco)
  • stronnicowanie np.: w przypadku dużej ilości ofert z danej kategorii,
  • link powrotu do strony poprzedniej, do listy ofert lub nawigacja breadcrumb,
  • w programach afilijacyjnych identyfikujących partnerów po zmiennej $_GET

Z pomocą przychodzi tutaj tag <link>. Tag ten umieszcza się w sekcji <head>

np.: na stronie http://www.example.com/?partner=test

zawrzeć można

<head>

<link rel=”canonical” href=”http://www.example.com/” />

</head>

oznaczać to będzie, że urlem preferowanym jest ten podany w tagu <link>.

Zastosowanie w domenach i subdomenach

Tag <link rel=”canonical” … /> nie ma zastosowania na różniących się domenach. Oznacza to, iż nie można wskazać preferowanej strony z domeny example.com na stronę w domenie test.com. Można natomiast stosować w/w tag na różnych subdomenach.

Zastosowanie w protokole http i https

Dopuszcza się zastosowanie tagu link rel=”canonical” z http na https i na odwrót

Różnica pomiędzy przekierowaniem stałym 301 a link rel=”canonical”

Działanie pomiędzy tymi dwoma akcjami można porównać za wyjątkiem tego, że redirect 301 ma zastosowanie na różnych domenach a rel=”canonical” tylko w obrębie jednej. Dodatkowo tag ten przenosi PageRank strony oraz inne podobne właściwości. Ma to więc wielkie znaczenie dla SEO.

Wytyczna czy nakaz ?

Tag ten traktowany jest przez google jako wytyczna a nie jako nakaz, także google rezerwuje sobie prawo do interpretacji według własnego uznania. Może bowiem wystąpić sytuacja kiedy to dwa lub kilka adresów url będzie wskazywać do siebie nawzajem jako preferowany adres. Wówczas mamy do czynienia z pętlą. W takich sytuacjach google sam będzie decydował o wyższości jednego urla nad drugim. Sytuacje kiedy to google bierze sprawy w swoje ręce mogą zaistnieć w przypadkach wskazywania preferowanego adresu na stronę 404, stron niezindeksowanych czy też konfliktu www vs non www.

Ścieżka relatywna czy absolutna ?

Google poleca wskazywać na ścieżkę absolutną. Spowodowane jest to zmniejszeniem ryzyka popełnienia błędu. W przypadku kiedy popełnimy błąd w ścieżce relatywnej istnieje większe prawdopodobieństwo, że błąd ten wystąpi na więcej niż jednej stronie.

ścieżka absolutna – http://www.example.com/test/page.html

ścieżka relatywna – /test/page.html

Strony identyczne a podobne

Rel canonical można użyć na stronach o podobnej treści. Niekoniecznie musi ona być identyczna. Zastosować moża to do stron gdzie korzystamy z sortowania lub stronnicowania, gdzie sama treść strony może się różnić ale sam cel i informacja niesiona przez daną stronę pozostaje ta sama.

Stosowanie łańcuchów preferowanych urli

Może zdarzyć się, że strona A wskazuje na stronę B, strona B na C. Jest to oczywiście dozwolone ale zaleca się ustawianie preferowanego urla docelowego, czyli w tym przypadku byłaby to strona C.

Więcej na dany temat można dowiedzieć się oglądając prezentację Mat’a Cutt’sa

Dodatkowe źródła informacji można przeczytać na

Tags: , , ,

2 Responses to “link tag rel=canonical”

  1. Michał Fikus Says:

    Hej,

    świetnie opisane i wyjaśnione, dzięki!

    Pozdrawiam!

  2. Długofalowe efekty SEO Says:

    [...] się czy nie występuje u nas na stronie zduplikowana treść, jeżeli tak to należy zastosować kanonikalizację (odsyłam do rzetelnego artykułu mojego kolegi na temat [...]

Dodaj odpowiedź