Stop Ghost Spam i Google Analytics med et filter

Den spam i Google Analytics (GA) er ved at blive et alvorligt problem. På grund af en syndflod af henvisning spam fra sociale knapper, voksne websteder, og mange, mange andre kilder, er folk begyndt at blive overvældet af alle filtrene, de opretter til at administrere de ubrugelige data, de modtager.

Den gode nyhed er, er der ingen grund til panik. I dette indlæg, vil jeg fokusere på de mest almindelige fejl folk gør, når bekæmpelse af spam i GA, og forklare en effektiv måde at forhindre det.

Men først, lad os sikre, at vi forstår, hvordan spam værker. Et par måneder siden, Jared Gardner skrev en glimrende artikel, der forklarer, hvad henvisning spam er, herunder dets formål. Han påpegede også nogle gode eksempler på henvisning spam.

Typer af spam

Den spam i Google Analytics kan kategoriseres af to typer: spøgelser og crawlere.

spøgelser

Langt størstedelen af ​​spam er denne type. De kaldes spøgelser, fordi de aldrig adgang til dit websted. Det er vigtigt at holde dette i tankerne, da det er nøglen til at skabe en mere effektiv løsning til styring af spam.

Så usædvanligt som det lyder, er denne form for spam ikke have nogen interaktion med dit websted på alle. Man kan undre sig, hvordan det er muligt, fordi et af de vigtigste formål GA er at spore besøg på vores hjemmesider.

De gør det ved hjælp af Measurement Protocol, som tillader folk at sende data direkte til Google Analytics 'servere. Ved hjælp af denne metode, og sandsynligvis tilfældigt genererede sporingskoder (UA-XXXXX-1) samt, spammerne efterlade et "besøg" med falske data, uden selv at vide, hvem de rammer.

Crawlers

Denne type spam, det modsatte af spøgelset spam, gør adgang til dit websted. Som navnet antyder, er disse spam bots gennemgå dine sider, ignorerer regler som dem der findes i robots.txt, som formodes at stoppe dem fra at læse dit websted. Når de forlader dit websted, de forlader en post på dine rapporter, der vises ligner en legitim besøg.

Crawlers er sværere at identificere, fordi de kender deres mål og bruge rigtige data. Men det er også sandt, at nye sjældent forekommer. Så hvis du opdager en henvisning i din analytics, der ser mistænkelige, forsker den på Google eller kontrollere den mod denne liste kan hjælpe dig med at besvare spørgsmålet om, hvorvidt det er spammy.

De fleste almindelige fejl foretages, når der beskæftiger sig med spam i GA

Jeg har fulgt denne sag nøje for de sidste par måneder. Ifølge bemærkningerne folk har foretaget på mine artikler og samtaler jeg har fundet i diskussionsfora, er der primært tre fejl folk gør når beskæftiger sig med spam i Google Analytics.

Mistake # 1. Blokering spøgelse spam fra .htaccess fil

En af de største fejltagelser, folk gør er at forsøge at blokere Ghost Spam fra .htaccess fil.

For dem, der ikke er bekendt med denne fil, en af ​​sine vigtigste funktioner er at tillade / blokere adgang til dit websted. Nu ved vi, at spøgelser aldrig nå dit websted, så tilføje dem her, vil ikke have nogen effekt, og vil kun tilføje ubrugelige linier til din .htaccess fil.

Ghost spam viser normalt op for et par dage og derefter forsvinder. Som et resultat, nogle gange folk tror, ​​at de med held blokeret fra her, når det er virkelig bare en tilfældighed for timing.

Så når spammere senere vender tilbage, de får bekymrede, fordi løsningen ikke fungerer længere, og de tror, ​​at spammer eller anden måde omgået de barrierer, de er oprettet.

Sandheden er, kan .htaccess filen kun effektivt blokerer crawlere såsom buttons-for-website.com og et par andre, da disse adgang til dit websted. Det meste af spam kan ikke blokeres ved hjælp af denne metode, så der er ingen anden mulighed end at bruge filtre til at udelukke dem.

Mistake # 2. Brug af listen henvisning udelukkelse for at stoppe spam

En anden fejl er at forsøge at bruge listen henvisning udelukkelse for at stoppe spam. Navnet kan forvirre dig, men denne liste er ikke beregnet til at udelukke henvisninger i den måde, vi ønsker at for spam. Det har andre formål.

For eksempel, når en kunde køber noget, nogle gange de bliver omdirigeret til en tredjepart side til betaling. Efter at en betaling, er de ført tilbage til din hjemmeside, og GA registrerer, at en ny henvisning. Det er hensigtsmæssigt at anvende henvisning liste udelukkelse for at forhindre dette i at ske.

Hvis du forsøger at bruge listen henvisning udelukkelse til at håndtere spam, men henvisningen del vil blive strippet da der ikke er allerede eksisterende rekord. Som et resultat, vil en direkte besøg registreres, og du vil have et større problem end den, du startede med siden. Du vil stadig have spam, og direkte besøg er sværere at spore.

Mistake # 3. Bekymrende, at ændringer afvisningsprocent vil påvirke rankings

Når folk ser, at bounce kursændringer drastisk på grund af spam, begynder de at bekymre sig om den indvirkning, det vil have på deres placeringer i SERPs.

Dette er en anden fejl almindeligvis lavet. Med eller uden spam, Google ikke tager hensyn Google Analytics målinger som en rangordning faktor. Her er en forklaring om dette fra Matt Cutts, den tidligere leder af Googles web spam team.

Og hvis du tænker over det, Cutts 'forklaring giver mening; fordi selv om mange mennesker har GA, ikke alle bruger det.

Antages dit websted er blevet hacket

En anden almindelig bekymring, når folk ser mærkelige destinationssider kommer fra spam på deres rapporter er, at de er blevet hacket.

Den side, der spam viser på rapporterne findes ikke, og hvis du forsøger at åbne det, vil du få en 404-side. Dit websted er ikke blevet kompromitteret.

Men du er nødt til at sørge for side findes ikke. Fordi der er tilfælde (ikke spam), hvor nogle steder har et sikkerhedsbrud og få injiceret med sider fyldt med dårlige søgeord til bagvaske hjemmesiden.

Hvad skal du bekymre dig om?

Nu da vi har kasseret sikkerhedsproblemer og deres virkninger på placeringer, der kun tilbage at bekymre sig om, er dine data. Den falske spor, at spam efterlader forurener dine rapporter.

Det kunne have større eller mindre indflydelse afhængigt af dit websted trafik, men alle er modtagelige for spam.

Små og mellemstore steder er det lettest påvirket - ikke kun fordi en stor del af deres trafik kan være spam, men også fordi normalt disse steder er selvforvaltende, og nogle gange ikke har støtte fra en analytiker eller en webmaster.

Store sites med en masse trafik, kan også blive påvirket af spam, og selvom effekten kan være ubetydelig, ugyldig trafik betyder unøjagtige rapporter Uanset størrelsen af ​​hjemmesiden. Som en analytiker, bør du være i stand til at forklare, hvad der foregår i selv i de mest detaljerede rapporter.

Du behøver kun ét filter til at beskæftige sig med spøgelse spam

Normalt anbefales det at tilføje henvisningen til en udelukkelse filter efter det er plettet. Selv om dette er nyttigt for en hurtig sag mod spam, det har tre store ulemper.

  • Gør filtre hver uge for hvert nyt spam opdaget er trættende og tidskrævende, især hvis du administrere mange steder. Plus, med den tid, du anvender filteret, og det begynder at arbejde, du allerede har nogle berørte data.
  • Nogle af spammere bruger direkte besøg sammen med henvisninger.
  • Disse direkte hits vil ikke blive stoppet af filteret, så selvom du er ekskl henvisningen du vil vindueskarm modtage ugyldig trafik, hvilket forklarer, hvorfor nogle mennesker har set en usædvanlig stigning i direkte trafik.

Heldigvis er der en god måde at forhindre alle disse problemer. Det meste af spam (spøgelse) virker ved at trykke GA s tilfældige sporing-id'er, hvilket betyder, at gerningsmanden ikke rigtig ved, hvem der er målet, og derfor enten værtsnavnet ikke er indstillet, eller det bruger en falsk. (Se nedenfor rapport)

Ghost-Spam.png

Du kan se, at de bruger nogle underlige navne eller ikke engang gider at sætte en. Selv om der er nogle kendte navne på listen, kan disse let tilføjet af spammer.

På den anden side, vil gyldige trafik altid bruge en rigtig værtsnavn. I de fleste tilfælde vil dette være domænet. Men det også kan også skyldes betalte tjenester, oversættelsesservice eller ethvert andet sted, hvor du har indsat GA sporingskode.


Indlæg tid: 2015/08/10