Dacht ik veel bezoekers te hebben.....

Ik krijg erg veel bezoek van deze webcrawler:

Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)

EDIT: en deze
ichiro/2.0 (http://help.goo.ne.jp/door/crawler.html)
msnbot/1.0 (+http://search.msn.com/msnbot.htm)

Is er een mogelijkheid om dit soort webcrawlers buiten je statieken te houden. Hij gebruikt steeds een ander ip-adres.
probeer het met robots, of htaccess

google is nog altijd je vriend elsy!
@Elsy

Die gegevens heb je natuurlijk in een variabele staan om weg te schrijven:

<?php
if ($var = "waarde" || $var=="andere waarde"){
// schrijf niet naar statistieken
}
?>

Wat wes zegt met die robots of je htaccess kan ook, maar dan blokkeer je de bots voor een sitebezoek, en niet alleen voor je statistieken.
@robert, je kan per map aangeven waar ze mogen komen of niet

Allow all
deny map map map map
@Wes
Weet ik, maar het statistieken script is geïnclude in de main pagina waar de bezoekers komen. Snap je? En ik weet niet hoe het dan precies gaat bij geïnclude bestanden, of dat er dan een error komt en dat de bot geen beschikking heeft over een deel van de informatie die op de website staat.
@robert

Oké, maar is dat te doen?
Hoeveel webcrawlers zijn er of valt dit mee?
@Elsy

Je kan ze toevoegen in een array bijvoorbeeld. Of je maakt een nieuwe tabel waar je de gegevens uit kan halen.
Ik heb geen idee of er veel webcrawlers zijn, aan het aantal zoekmachines te zien wel, maar hoeveel daarvan ook echt zoveel crawlen weet ik niet.

Je kan ook de bots wel blokkeren zoals wes zegt, dat is de snelste/ gemakkelijkste oplossing. Maar ik weet niet hoe er dan wordt omgesprongen met je website in zoekmachines.
@robert

Ik kijk af en toe wel in mijn statistieken of ik weer een nieuwe zie.
Ik ga liever geen robots blokkeren.

Bedankt voor de tips.
Er is op internet een lijst met alle ip adressen e.d. van webcrawlers. Ik kan je al zeggen, dat zijn er veel. Als je al die ip adressen in wil voeren dan kan ik die pagina wel voor je opzoeken.
@Rolf

Als je dat zou willen doen, graag.
Voila, op deze pagina vind je alle kenmerken die je nodig hebt om te achterhalen of je een crawler of een bezoeker op je site hebt.

Reageren