Twitter pratique le cloacking ?

Tentative infructueuse d'explication du comportement de t.co

referencement, nofollow, dofollow, cloacking, twitter, seo, smoothie

Date de publication : 2011-08-25 19:13:05

Je ne sais pas si de quand date cette modification mais je viens de découvrir que tous les liens via twitter utilisaient le nouveau shortener de twitter t.co.

En y regardant de plus prêt j'ai découvert un comportement assimilable à du cloacking basé sur le user agent.

Requete avec le user agent Google Bot


http://t.co/uQBpBQ3
GET /uQBpBQ3 HTTP/1.1
Host: t.co
User-Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3
Accept-Encoding: gzip, deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Connection: keep-alive

HTTP/1.1 301 Moved Permanently
Date: Thu, 25 Aug 2011 17:16:47 GMT
Server: hi
Location: http://b1n.sp1n.me/seo/communique-valide-apres.121.html
Cache-Control: private,max-age=300
Expires: Thu, 25 Aug 2011 17:21:47 GMT
Content-Length: 0
Connection: close
Content-Type: text/html; charset=UTF-8

Avec le user agent de googlebot le status de la requête est 301 et que le Location permet de faire la redirection.

Requête avec le user agent de mon navigateur


http://t.co/uQBpBQ3
GET /uQBpBQ3 HTTP/1.1
Host: t.co
User-Agent: Mozilla/5.0 (X11; Linux i686; rv:6.0) Gecko/20100101 Firefox/6.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3
Accept-Encoding: gzip, deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Connection: keep-alive

HTTP/1.1 200 OK
Date: Thu, 25 Aug 2011 17:20:13 GMT
Server: hi
Content-Type: text/html; charset=utf-8
Cache-Control: private,max-age=300
Expires: Thu, 25 Aug 2011 17:25:13 GMT
Vary: Accept-Encoding
Content-Encoding: gzip
Content-Length: 161
Connection: close

Bizarre cette fois le status de la requête à changer par 200 et twitter nous redirige cette fois par une meta ou un javascript selon les navigateurs. Voici le code de la page :


<noscript><META http-equiv="refresh" content="0;URL=http://b1n.sp1n.me/seo/communique-valide-apres.121.html"></noscript><script>location.replace("http:\/\/b1n.sp1n.me\/seo\/communique-valide-apres.121.html")</script>

Cloacking or Not ?

Si on s'en remet à la définition de google :
"Le cloaking est la pratique qui consiste à présenter aux utilisateurs des URL ou un contenu différents de ceux destinés aux moteurs de recherche. En raison de la présentation de résultats différents selon le user-agent, votre site peut être considéré comme trompeur et être retiré de l'index Google." (Source). Twitter est bien coupable de cloacking car les urls ne répondent pas de la même manière en fonction du user agent.

Pourquoi twitter utilise le cloacking ?

J'ai cherché un peu et la seule réponse que j'ai trouvé est que le redirecteur t.co sert d'outil de statistiques à twitter pour connaitre le nombre de clics sur les urls.

Les navigateurs modernes mémorisent les 301 (je parle pour firefox, mais les proxy d'entreprise doivent faire de même) et appellent directement l'url finale. Si twitter veut compter le nombre exacte de clics sur une url il ne peut pas utiliser de 301.

D'un autre coté avec la sortie récente de heello qui est en dofollow, twitter ne peux pas se permettre d'énerver un peu plus sa communauté SEO/Webmaster. Twitter aurait donc choisi le cloacking car il a le cul entre deux chaises.

Ce raisonnement s'effondre lorsque l'on prend en compte le nofollow des liens twitter : ils n'ont donc, potentiellement, plus aucun intérêt pour le référencement.

Alors pourquoi ne pas utiliser un 302 tout simplement ... Je ne sais pas. Toutes propositions (sauf les indécentes) seront étudiées avec attention dans les commentaires ;)

Ce que je n'ai pas dit dans cet article

  • Que je doute de l’intérêt de cet article mais je compte sur les adeptes du content is king pour me comprendre.
  • Que le smoothie pastèque et pêche que j'ai dégusté en rédigeant cet article était délicieux.

 

Connaissez-vous Antoine Sentimancho ?

Non ? Honte à vous, Antoine c'est un drogué de la SERP, un dopé du Sentimancho, un vrai dingue qui te propose de mesurer la puissance de ton p*n*s site via le Virank™.

On échange ?

Il reste 6 places à prendre ici, donc si tu as un site de communiqué de presse : envoi un mail

 
 

b1n@sp1n