Tagul canonical: element SEO esential in optimizarea unui website

Introducerea tagului “canonical” a fost caracterizata de catre Rand Fishkin (Moz) drept cel mai important lucru care s-a intamplat pe zona de SEO tehnic de la standardul ce permite definirea fisierelor de tip sitemap. Din pacate nici astazi, la mai bine de 7 ani de la momentul la care Google si celelalte motoare de cautare au anuntat suportul pentru acest tag, foarte multe site-ul nu-l folosesc sau il au implementat in mod gresit.

In procesul de auditare SEO a magazinelor online participante la Gapa Premiilor eCommerce 2016, in care DWF a facut parte din juriu la categoria SEO, am identificat numeroase magazine online, unele dintre ele foarte cunoscute, care pierd puncte importante la acest criteriu. Dincolo insa de acest aspect, cel mai important este ca o implementare incorecta a tagului canonical in site genereaza progleme grave de continut duplicat sau crawl budget si nu permite o buna indexare in Google.

Ce inseamna canonical tag?

In esenta, prin definirea tagului canonical intr-o pagina, semnalam motorului de cautare care URL-ul “principal” la care este disponibil continutul din acea pagina.

Spre exemplu, daca la un link de categorie aplicam optiunea de afisare produse sub forma de lista sau sub forma de grid, este posibil ca URL-ul sa se modifice, dar in esenta avem acelasi continut in pagini, adica aceleasi produse. Intr-un astfel de caz, pentru ca Google sa nu identifice cele doua URL-uri rezultate drept duplicate, semnalam prin tagul canonical care este adresa “principala” sau adresa “de baza”. 

Un alt exemplu: la click pe linkul “Fuste” din meniul eMag, linkul pe care ajungem este primul din lista de mai jos. Aceasta pagina este disponibila insa si la adresele celelalte, in functie de modul in care utilizatorul (sau crawler-ul Google) navigheaza in site: 

http://www.emag.ro/bluze-dama/c?ref=hp_menu_link_1696_7&tree_ref=1706&type=menu_tree
http://www.emag.ro/bluze-dama/c?ref=hp_menu_link_1696_7&tree_ref=1706
http://www.emag.ro/bluze-dama/c?tree_ref=1706
etc.

Pe fiecare dintre aceste pagini este definit insa tagul canonical, cu valoarea “http:// www. emag.ro/ bluze-dama/c”, ceea ce inseamna ca motorului de cautare i se spune “continutul din toate aceste URL-uri este foarte similar sau chiar identic cu cel din pagin X, aceasta fiind cea care doresc sa apara in rezultatele Google”.

Google detaliaza modul de utilizare al tagului canonical in sectiunea oficiala de ajutor pentru webmasteri. In pagina sunt semnalate si cele mai frecvente probleme de implementare.

Diagnostic probleme de implementare canonical tag intr-un magazin online

In prima faza, cel mai simplu mod de verificare a implementarii tagului canonical este verificarea manuala a existentei acestuia, in diferitele tipuri de pagini din site: pagini de categorie, de subcategorie, filtre, detalii produs etc. Verificarea se poate face manual, prin cautarea cuvantului “canonical” in codul sursa al acestor pagini, sau prin instalarea in Chrome a unei extensii de browser.

Definirea corecta a tagului canonical pe paginile de tip categorie, subcategorie si produs se poate verifica manual si prin adaugarea unui parametru la finalul URL-ului (de exemplu: ?test=dwf). Se va cauta apoi tagul canonical in codul sursa al URL-ului nou creat, pentru a vedea daca acesta are valoarea corecta (fara parametrul de test adaugat). 

Procesul de auditare SEO pentru zona de canonicalizare continua apoi prin analiza site-ului cu un instrument de analiza SEO on-page de tipul Screaming Frog. In raportul “Directives” din Screaming Frog putem avea o astfel de situatie:

     screaming frog directives

Din datele de mai sus rezulta ca exista 90 de pagini (28,85% din cele indexate) care nu au definit tagul canonical. Putem vedea in raport care sunt aceste pagini si daca este necesara implementarea tagului canonical pe ele. De asemeena, putem vedea si paginile care sunt canonicalizate catre alte adrese, pentru a verifica daca acest lucru este conform strategiei de SEO.

O problema de canonicalizare des intalnita la magazinele online (in special pe platforma OpenCart) este cauzata de faptul ca un produs este accesibil la mai multe adrese, pe fondul apartenentei sale la mai multe categorii sau subcategorii. Spre exemplu, intr-o instalare standard de OpenCart, produsele sunt accesibile atat la adresa .ro/cat/subcat/produs cat si la .ro/subcat/produs, .ro/produs ori alte combinatii.

In cazul in care tagul canonical nu este definit corect (ex: catre pagina de produs “legata” direct de root), site-ul va avea probleme grave de continut duplicat, riscand o penalizare de tip Google Panda. De asemenea, chiar daca avem definit tagul canonical corect, de multe ori intr-o astfel de instalare URL-ul canonic nu este accesibil din navigatia site-ului.

Urmatorul element ce trebuie verificat la capitolul canonicalizare este prezenta URL-urilor necanonice in sitemap-ul siteului. Practic, in sitemap nu trebuie sa avem decat versiunile canonice ale paginilor din site. 

Canonicalizarea versiunii de mobil a unui site

In cazul in care site-ul are o versiune de mobil disponibila la URL-uri diferite (ex: m.site.ro sau site.ro/m), ne aflam practic in situatia de a livra acelasi continut (in mare parte) la cel putin doua URL-uri diferite (varianta pentru desktop si cea pentru mobil). Tratarea corecta a acestei situatii presupune doua actiuni:

  1. in paginile de mobil se va implementa tagul canonical cu trimitere spre pagina corespondenta/ canonica din versiunea de tip desktop
  2. in paginile de desktop se va implementa tagul rel alternate, cu trimitere spre varianta de mobil a acelei pagini.

Mai multe detalii despre tagul rel alternate sunt disponibile si in paginile Google cu documentatie pentru webmasteri. In aceeasi pagini gasiti mai multe informatii despre integrarea corecta a versiunii de mobil a unui site cu cea pentru desktop.

Concluzii

Tagul canonical este un element de SEO tehnic ce nu influenteaza in nici un fel experienta utilizatorului. Practic, atat o implementare corecta cat si una incorecta nu vor fi observate de persoanele care acceseaza site-ul in mod curent. Google si celelalte motoare de cautare identifica insa acest tag si il folosesc in prioritizarea diferitelor landing page-uri din site, pentru crawling, indexare si ranking.

Implementarea sa corecta este esentiala pentru preintampinarea unor probleme de continut duplicat, dar si pentru cresterea autoritatii anumitor pagini, astfel incat acestea sa apara in rezultatele Google.