Vous n'êtes pas identifié(e).
Pages : 1
Salut,
J'ai fait un petit code PHP pour connaitre le passage de google.
Je vous le donne si vous êtes curieux de savoir si google passe sur votre site :
<?php
if (eregi("Google",$_SERVER['HTTP_USER_AGENT']))
{
$ip = $_SERVER['REMOTE_ADDR'];
$nom = gethostbyaddr($ip);
$iphost = gethostbyname($nom);
if (eregi("Google",$nom))
{
if ($iphost == $ip)
{
if (eregi("Googlebot-Image",$_SERVER['HTTP_USER_AGENT']))
{
$txt = 'Google IMAGE : '.date('d/m/Y H:i:s');
} elseif (eregi("Mediapartners-Google",$_SERVER['HTTP_USER_AGENT'])) {
$txt = 'Google Adsense : '.date('d/m/Y H:i:s');
} else {
$txt = 'GoogleBot : '.date('d/m/Y H:i:s');
}
//CHANGER LE CHEMIN
$chemin = '/home/hosted/usersSpace/UN_NUMERO/ftp/googlelog.txt';
$fp = @fopen($chemin,'a+');
if ($fp)
{
$txtins = $txt."\n";
$txtins .= 'Page scanné : '.$_SERVER['REQUEST_URI']."\n";
$txtins .= 'IP : '.$ip."\n";
$txtins .= 'Nom de l'host : '.$_SERVER['HTTP_USER_AGENT']."\n";
$txtins .= '====='."\n";
fputs($fp,$txtins);
fclose($fp);
}
}
}
}
?>
Pensez à changer $chemin comme il se doit.
Vous pouvez le mettre avant votre domaine (je sais pas si tous les clients le peuvent), afin qu'il soit innaccessible via le web.
Pensez à le vider de temps en temps, surtout si google passe souvent.
Il repaire les passages de tout ce qui contient Google dans un HTTP_USER_AGENT
Il spécifie si c'est google image ou adsense, sinon, il va le mettre en googlebot, par contre, dans les logs, je mets aussi le HTTP_USER_AGENT, au cas où google-video, ou google-tatawinlesbains passerait, vous pourrez facilement créer un elseif spécifique.
Edit :
Il est préférable d'ajouter ce code dans le bas de page de votre site.
Les fonctions du style FOPEN() sont assez lourde, mais elles ne sont pas utilisées pour vos membres/visiteurs, uniquement pour les bots, donc ça va, par contre, si vous vous ammusez à faire ça pour chaques visiteurs, j'ai bien peur que vous soyez contacter par WDMEDIA rapidement :-P
(un fopen pour chaque page visitée par chacun de vos visiteurs, ca fait mal !)
On peut aussi ajouter Yahoo, msnbot, ia_archiver, GameSpyHTTP et tout autres robots, j'essayerais de trouver les différents USER_AGENT des autres robots
Hors ligne
Pages : 1