invoegen van externe URLs in bestaande webpagina's

Overzicht Reageren

Sponsored by: Vacatures door Monsterboard

Thomas van den Heuvel

Thomas van den Heuvel

18/11/2015 12:01:34
Quote Anchor link
Ik zie dit vaker maar weet niet precies wat ik hiervan moet denken, ook weet ik niet wat voor implicaties dit verder heeft. Ik zal de situatie proberen uit te leggen.

Stel je hebt een website http://www.whatever.nl/ met hierop enkele pagina's. Vervolgens zie je in je tracking software (denk Google Analytics of equivalent) dat deze of een andere bestaande URL is aangeroepen maar met een toevoeging die nergens op slaat met hierin een volledige URL van een externe website. Ik bedoel hierbij specifiek niet pogingen tot security-gerelateerde injecties zoals SQL injecties of voor het invoegen van externe code, maar misschien is dit een poging tot het meeliften op het "succes" van een site.

Een concreet voorbeeld, in mijn homepage zag ik een recente piek in het aantal bezoekers (van 4 naar 5 bezoekers, lol). Toen ik keek waar deze bezoekers dan specifiek naar keken zag ik het volgende in mijn overzicht:

/?from=http://snip.to/

Deze URL komt dus echt nergens vandaan, ik ken deze hele partij niet en doe hier geen in geen enkele vorm zaken mee.

Het vervelende is, volgens mij doe je hier niets tegen, iedere malloot kan besluiten een bestaande pagina zo aan te roepen want in wezen is dit een valide request. En Google Analytics pikt dit vervolgens op.

Ik ben alleen benieuwd wat de gevolgen hiervan zijn? Omdat ik dit vaker ben tegen gekomen vermoed ik dat dit op een of andere manier lucratief is maar ik kan mij niet voorstellen hoe. Heeft iemand een definitie voor dit fenomeen, of heeft dit zelf ook meegemaakt? Als ik hierop Google kom ik al snel in de injectie/security hoek terecht, maar daar is hier dus geen sprake van.

EDIT: wat mij hier vooral in dwars zit is dat er dus mogelijk een link/associatie gelegd wordt tussen jou en een compleet onbekende partij
Gewijzigd op 18/11/2015 12:06:44 door Thomas van den Heuvel
 
PHP hulp

PHP hulp

25/04/2024 10:33:47
 
Ozzie PHP

Ozzie PHP

18/11/2015 13:27:56
 
Thomas van den Heuvel

Thomas van den Heuvel

18/11/2015 13:36:54
Quote Anchor link
Dat was informatief, thanks.

Wat ik niet begrijp is dat dit blijkbaar mogelijk is by design:
Quote:
The spammer uses the Analytics Measurement Protocol to hit your reports directly without passing through your Site. In normal circumstances this protocol is intended to allow developers to send data directly to Google Analytics Servers.

Dussss, GA heeft een feature die spammers misbruiken, en vervolgens mogen we deze troep zelf opruimen? Nice.
Gewijzigd op 18/11/2015 13:37:54 door Thomas van den Heuvel
 
Ozzie PHP

Ozzie PHP

18/11/2015 13:44:26
Quote Anchor link
Tja ... blijkbaar. In principe pikt GA gewoon de URL op, dus heel verwonderlijk is het niet. Wat je zou kunnen doen (maar of je daar zin in hebt is een tweede) is alvorens de pagina te renderen eerst controleren of er een GET parameter is geset, en zo ja of het een geldige GET parameter is. Als dat laatste niet het geval is, dan een header/forward naar Google.com. Aangezien jouw eigen pagina dan niet wordt gerenderd (en dus je tracker ook niet) komt de info niet in jouw analytics data terecht.
 
Ward van der Put
Moderator

Ward van der Put

18/11/2015 14:05:43
Quote Anchor link
Die hack van GA werkt anders. Elke publisher heeft in zijn GA-JavaScript een unieke ID. Omdat referrers vaak niet worden meegegeven bij de aanroep van een externe site, gaat Google af op die ID. Elke aanroep van GA met die ID wordt geregistreerd als een hit op jouw server — en dan komt het: ook als die request heel ergens anders vandaan komt. Een spammer hoeft dus alleen je ID uit je webpagina te hengelen of die te raden. Daarna kan hij elders op internet daarmee allerlei nep-requests nabootsen.

De toevoeging van /?from=http://snip.to/ (klinkt als reclame voor een URL-shortener) zou ik anders oplossen: gebruik een permanente redirect naar de werkelijke URL. Zo voorkom je dat je bezoekers mist, heb je géén duplicate content op verschillende URL's en blijven je statistieken schoon.
 
Thomas van den Heuvel

Thomas van den Heuvel

18/11/2015 14:05:46
Quote Anchor link
@Ozzie Volgens mij raadt dat artikel dat juist af, daarbij wordt mijn site niet echt bezocht maar wordt GA rechtstreeks gemanipuleerd, de spammer komt niet eens op mijn site.

@Ward mja, maar dan is het einde ook een beetje zoek, als je er niet van uit kunt gaan dat bezoekers op de gebaande paden blijven :/.
Gewijzigd op 18/11/2015 14:07:56 door Thomas van den Heuvel
 
Ozzie PHP

Ozzie PHP

18/11/2015 14:09:08
Quote Anchor link
Als dat gemanipuleerd kan worden door de site niet eens te bezoeken, maar enkel met het ID van de tracker ... dan zou ik denken 'toedeledokie' Google Analytics. Dat zou namelijk wel héél kansloos zijn.
 
Ward van der Put
Moderator

Ward van der Put

18/11/2015 14:14:15
Quote Anchor link
Voor SEO zie ik hier toch wel een nadeel. Ingaande links zijn daarvoor belangrijk, maar juist de links die nieuwe bezoekers volgen, leiden nu naar een "andere" pagina. All things being equal is het gevolg daarvan dat je twee URL's hebt voor dezelfde content en dan kun je wel raden waaraan Google de voorkeur geeft: die met de meeste ingaande links.
 
Thomas van den Heuvel

Thomas van den Heuvel

18/11/2015 14:16:39
Quote Anchor link
Mja, maar de spamlinks bestaan alleen in GA, het zijn geen echte requests/bezoeken. Zou ik, omdat GA in de war raakt door de opzet van hun eigen functionaliteit, allerlei voorzieningen moeten aanleggen om dit te ondervangen?

Volgens mij is het ook heel makkelijk om dit soort praktijken tegen te gaan? Hanteer gewoon een soort van same-origin-policy (of is dat in dit geval heel makkelijk te vervalsen, wss wel... meh)? En als je dan toch om een of andere reden extern traffic wilt testen sta je dit alleen toe in combinatie met een extra (geheim) token met beperkte geldigheid? Probleem opgelost?

EDIT: daarmee heb je ook meteen alle "dummy bezoeken" geïdentificeerd. Alles wat niet van hetzelfde domein komt of zo'n token bevat hoef je niet mee te nemen in de normale statistieken (of indexeer je apart).
Gewijzigd op 18/11/2015 14:21:16 door Thomas van den Heuvel
 



Overzicht Reageren

 
 

Om de gebruiksvriendelijkheid van onze website en diensten te optimaliseren maken wij gebruik van cookies. Deze cookies gebruiken wij voor functionaliteiten, analytische gegevens en marketing doeleinden. U vindt meer informatie in onze privacy statement.