Forums de WDMédia-Hébergement

Bienvenue sur nos forums

Vous n'êtes pas identifié(e).

#1 13-11-2008 10:37:17

luce
Modérateur
Lieu : GrandesZoreillesLand
Inscription : 31-03-2007
Messages : 245
Site Web

[PHP] Espionner google sur votre site

Salut,

J'ai fait un petit code PHP pour connaitre le passage de google.
Je vous le donne si vous êtes curieux de savoir si google passe sur votre site :

<?php
if (eregi("Google",$_SERVER['HTTP_USER_AGENT']))
{
     $ip = $_SERVER['REMOTE_ADDR'];
     $nom = gethostbyaddr($ip);
     $iphost = gethostbyname($nom);

     if (eregi("Google",$nom))
     {
          if ($iphost == $ip)
          {
               if (eregi("Googlebot-Image",$_SERVER['HTTP_USER_AGENT']))
               {
                    $txt = 'Google IMAGE : '.date('d/m/Y H:i:s');
               } elseif (eregi("Mediapartners-Google",$_SERVER['HTTP_USER_AGENT'])) {
                    $txt = 'Google Adsense : '.date('d/m/Y H:i:s');
               } else {
                    $txt = 'GoogleBot : '.date('d/m/Y H:i:s');
               }
//CHANGER LE CHEMIN
               $chemin = '/home/hosted/usersSpace/UN_NUMERO/ftp/googlelog.txt';

               $fp = @fopen($chemin,'a+');
               if ($fp)
               {
                    $txtins = $txt."\n";
                    $txtins .= 'Page scanné : '.$_SERVER['REQUEST_URI']."\n";
                    $txtins .= 'IP : '.$ip."\n";
                    $txtins .= 'Nom de l'host : '.$_SERVER['HTTP_USER_AGENT']."\n";
                    $txtins .= '====='."\n"; 

                    fputs($fp,$txtins);
                    fclose($fp);
               }
          }
    }
}
?>

Pensez à changer $chemin comme il se doit.
Vous pouvez le mettre avant votre domaine (je sais pas si tous les clients le peuvent), afin qu'il soit innaccessible via le web.
Pensez à le vider de temps en temps, surtout si google passe souvent.

Il repaire les passages de tout ce qui contient Google dans un HTTP_USER_AGENT
Il spécifie si c'est google image ou adsense, sinon, il va le mettre en googlebot, par contre, dans les logs, je mets aussi le HTTP_USER_AGENT, au cas où google-video, ou google-tatawinlesbains passerait, vous pourrez facilement créer un elseif spécifique.

Edit :
Il est préférable d'ajouter ce code dans le bas de page de votre site.
Les fonctions du style FOPEN() sont assez lourde, mais elles ne sont pas utilisées pour vos membres/visiteurs, uniquement pour les bots, donc ça va, par contre, si vous vous ammusez à faire ça pour chaques visiteurs, j'ai bien peur que vous soyez contacter par WDMEDIA rapidement :-P
(un fopen pour chaque page visitée par chacun de vos visiteurs, ca fait mal !)

On peut aussi ajouter Yahoo, msnbot, ia_archiver, GameSpyHTTP et tout autres robots, j'essayerais de trouver les différents USER_AGENT des autres robots

Hors ligne

Pied de page des forums