Archivio per la categoria url

Canonizzare l’home page dei siti in ASP.NET con l’Isapi Rewrite

Ai fini SEO la canonizzazione degli URL è molto importante, vi sono diversi metodi per implementarla che vanno dal classico ed efficace Redirect 301 all’utilizzo del tag rel=”canonical”. Per chi sviluppa siti web utilizzando ASP.NET però canonizzare l’home page (solitamente la pagina default.aspx), può essere un’operazione non così banale.

Per i motori di ricerca le seguenti pagine sono due copie differenti della stessa pagina:

http://www.miosito.it

http://www.miosito.it/default.aspx

Ciò può causare problemi di contenuti duplicati, dispersione del PageRank ed altro…
A differenza del PHP in cui attraverso l’.htaccess risulta semplice canonizzare l’home page in ASP.NET è più difficile perche da codice o utilizzando regole di riscrittura inserite nel file web.config non si riesce a distinguere in quale delle due pagine ci si trova.

Una delle solizione per risolvere il problema e canonizzare l’home page default.aspx è quella di fare ricorso all’Isapi Rewrite. Utilizzando la seguente regola infatti riuscirete in maniera semplice ad effettuare questa importante operazione:

RewriteEngine on
RewriteRule ^/default\.aspx / [R=301,L]

Se inoltre volete che tutte le pagine del sito vengano redirette dalla versione senza www a quella con www ecco un’altra regola che potete applicare:

RewriteEngine on
RewriteCond %{HTTPS} (on)?
RewriteCond %{HTTP:Host} ^(?!www\.)(.+)$ [NC]
RewriteCond %{REQUEST_URI} (.+)
RewriteRule .? http(?%1s)://www.%2%3 [R=301,L]

Due semplici regole e poche operazioni possono consentirvi di ottimizzare ulteriormente i vostri siti!

2 Commenti

Canonizzazione degli URL: evitiamo i contenuti duplicati con il tag canonical

canonizzazione degli url

L’URL canonicalization o in italiano canonizzazione degli URL è il processo messo in atto da Google per scegliere quale è il migliore URL avendo a disposizione una serie di alternative, ad esempio su quale sia l’home page del sito web. Vediamo il problema nella pratica, in molti siti i seguenti URL

  • www.miosito.it
  • miosito.it/
  • www.miosito.it/index.html

corrispondono esattamente alla stessa pagina e sono raggiungibili digitando tutti e tre gli indirizzi. Dunque visualizziamo la stessa pagina con tre indirizzi che sono “tecnicamente” differenti agli occhi di Google che quindi dovrà scegliere quale di essi sia il più adatto per essere l’home page del vostro sito web.

Un altro problema (che affronterò nella seconda parte di questo articolo) riguarda le pagine interne del sito, capita spesso che un pagina con lo stesso contenuto sia raggiungibile da più URL differenti.

La mancata gestione della canonizzazione degli URL comporta dispersione del PageRank, maggior numero di pagine da indicizzare, sfruttamento non ottimale della link popularity con conseguente perdita di posizioni nelle SERP rispetto ad avere lo stesso sito ma con gli URL canonizzati.

Per aiutare Google nella capire quale è il vostro URL preferito la prima cosa che conviene fare è gestire correttamente i link (sia interni al sito, sia possibilmente i backlink) in modo che puntino correttamente all’URL nella forma da voi prescelta.

La soluzione migliora tuttavia per gestire in maniera corretta la canonizzazione degli URL, ovvero ricondurre tutte le possibili forme di URL verso quella prescelta è quella di farlo attraverso dei redirect di tipo 301.

Se ad esempio l’URL che preferite per l’home page del vostro sito è nella forma www.miosito.it allora dovrete fare in modo se un utente digita (o linka) URL quali http://miosito.it  o www.miosito.it/index.html attraverso un redirect 301 egli (o lo spider) venga rediretto a www.miosito.it.

Nel caso il vostro sito web sia raggiungibile ed indicizzato in entrambe le forme http://miosito.it e www.miosito.it non utilizzate i webmaster tools per rimuovere gli URL indicizzati nella forma non desiderata, lo stesso Matt Cutts sconsiglia questa pratica, gestire invece dei redirect 301 ed aspettate che Google lo indicizzi correttamente.

Un’altra cosa che si può fare per specificare nei Google webmaster tools sotto la voce Impostazioni quale è il vostro dominio preferito, nel casi di questo blog ad esempio:

dominio preferito

Canonizzazione di singole pagine con il nuovo tag rel=”canonical”

La situazione precedentemente esposta è abbastanza semplice da gestire (anche se molte volte questa problematica non viene presa in considerazione degli sviluppatori) ma vi sono tuttavia situazioni più complesse in cui si può avere che la stessa pagina di un sito web è raggiungibile tramite URL differenti (con parametri passati in querystring diversi). Agli occhi dei motori di ricerca quindi il nostro sito web potrebbe avere pagine identiche di contenuto ma raggiungibili da URL differenti.

Per ovviare a questo problema il 12 febbraio 2009 Google ha annunciato l’introduzione di un nuovo tag: rel=”canonical”. Questo tag consente di specificare la versione preferita dell’URL che Google dovrebbe indicizzare (e visualizzare nelle SERP).

Vediamo un esempio concreto per capire meglio, abbiamo un e-commerce in cui vendiamo un prodotto che ha codice 12345. La pagiana a cui l’utente visualizza il prodotto ha un URL così strutturato:

  • http://www.mioecommerce.it/prodotto.php?codice=12345

Fin qui tutto normale.

Il prodotto di cui parliamo potrebbe però appartenere ad una specifica categoria, e quindi essere linkato anche con la categoria passata in querystring:

  • http://www.mioecommerce.it/prodotto.php?codice=12345&categoria=nome-categoria

Il nostro e-commerce però ha anche uno o più affiliati che pubblicizzano il nostro prodotto sui loro siti web, per gestire le vendite realizzate tramite affiliazione viene fornito agli utenti un ID Affiliato (aid) con cui linkare la pagina del prodotto. Avremo quindi che l’affiliato 777 linkerà la pagina di quel prodotto in questo modo:

  • http://www.mioecommerce.it/prodotto.php?codice=12345&aid=777

Avremo quindi tre diversi URL che visualizzano la stessa pagina con lo stesso contenuto, tutte linkate da qualche altra pagina ed i link seguiti da Googlebot. Secondo voi se un utente cercherà su Google il nome di quel prodotto quale di queste pagine verrà visualizzata da Google nella SERP?. Difficile dirlo a priori in quanto possono rientrare in gioco diversi fattori.

Con il nuovo tag rel=”canonical” Google fornisce ai webmaster la soluzione a questo problema.

Poniamo il caso che il nostro URL preferito sia quello nella forma http://www.mioecommerce.it/prodotto.php?codice=12345, basterà semplicemente aggiungere il tag <link> per specificare la nostra versione preferita.

  • <link rel=”canonical” href=”http://www.mioecommerce.it/prodotto.php?codice=12345″ />

Tale tag va aggiunto nella sezione <head> delle pagine con il contenuto duplicato:

  • http://www.mioecommerce.it/prodotto.php?codice=12345&categoria=nome-categoria
  • http://www.mioecommerce.it/prodotto.php?codice=12345&aid=777

e Google capirà che tali pagine duplicate sono riferite all’URL canonico

  • http://www.mioecommerce.it/prodotto.php?codice=12345.

Le proprietà di queste pagine, quali il PageRank vengono trasferite dalle pagine duplicate all’URL originale che è stato specificato, consentendo di sfruttare al meglio la link popularity del sito web.

Alcune note:

Questa soluzione deve essere adottata solo per le pagine presenti su un unico dominio, se avete spostato delle pagine su un dominio differente Google consiglia di utilizzare sempre il redirect 301.

Per specificare l’URL canonico si può utilizzare anche il path relativo, ad esempio: <link rel=”canonical” href=”prodotto.php?codice=12345″ />. Yahoo! tuttavia consiglia di utilizzare path assoluti per evitare possibili errori.

Il tag rel=”canonical” può essere utilizzato anche se le pagine non sono esattamente identiche ma hanno delle lievi differenze, per esempio nell’ordinamento di una tabella di prodotti.

Il nuovo tag non funziona solo con Google ma ha lo stesso effetto anche per Yahoo! ed MSN.

Il tag gode della proprietà transitiva (almeno per Yahoo!). Se la pagina A afferma che B è il suo URL canonico e B afferca che C invece è il suo URL canonico quest’ultimo verrà considerato come la canonizzazione sia di A che di B.

Questo tag viene trattato da tutti i motori di ricerca come un “suggerimento” che potrebbero non seguire in particolari situazione (es. se provate ad utilizzarlo con pagine con contenuti differenti).

Considerazioni sull’introduzione del nuovo tag rel=”canonical” e questioni aperte

SEOmoz definisce l’introduzione del nuovo tag uno dei più importanti sviluppi nel mondo SEO dall’introduzione del protocollo sitemap.

Personalmente devo dire che nei progetti che ho seguito ho sempre cercato di evitare che una singola pagina possa essere raggiunta da più url differenti attraverso tecniche di URL rewriting e redirect 301, tuttavia vi possono essere alcune situazioni in cui queste soluzioni non sono applicabili quindi ben vengo l’introduzione di questo nuovo tag.

Questo nuovo tag infatti è meno impegnativo da implementare di un redirect 301 e la differenza è sostanziale, mentre il redirect reindirizza sia visitatori che spider il tag canonical serve unicamente per i motori di ricerca quindi si possono più facilmente tracciare i visitatori che giungono ai vari URL dello stesso prodotto.

Dal punto di vista del posizionamento la canonizzazione degli URL aiuta a concentrare il PageRank e gli altri fattori unicamente su di una pagina, consentendo di sfruttare al meglio la link popularity di cui gode un sito. Trovo questo nuovo tag molto utile soprattutto per i siti che devono gestire numerosi affiliati.

Nei prossimi mesi numerosi SEO inizieranno ad utilizzare questo nuovo tag e quindi potremo avere dei risultati su cui lavorare, tra le questioni che rimangono ancora aperte le più importanti riguardano il grado di tolleranza dei vari motori di ricerca per contenuti leggermente differenti e se questo nuovo tag avrà la stessa “forza” di un redirect 301 o sarà meno effettivo, servirà quindi del tempo e vari test per valutare questi aspetti.

Qualcuno di voi ha già condotto dei test? Con quali risutati?

Update: 16 febbraio 2009

Matt Cutts ha pubblicato alcune slide che ha utilizzato per presentare il nuovo tag insieme ad altre informazini: http://www.mattcutts.com/blog/canonical-link-tag/

fonte immagine

, ,

5 Commenti