Smettere di fantasma Spam a Google Analytics con un filtro

Lo spam in Google Analytics (GA) sta diventando un problema serio. A causa di un diluvio di Spam rinvio da pulsanti sociali, siti per adulti, e molte, molte altre fonti, le persone stanno iniziando a diventare sopraffatti da tutti i filtri che si insediano per la gestione dei dati inutili che stanno ricevendo.

La buona notizia è, non vi è alcuna necessità di panico. In questo post, ho intenzione di concentrarsi su gli errori più comuni le persone fanno quando si combatte lo spam in GA, e spiegare un modo efficace per impedirlo.

Ma prima, facciamo in modo abbiamo capito come funziona lo spam. Un paio di mesi fa, Jared Gardner ha scritto un eccellente articolo che spiega che cosa lo spam rinvio è, tra cui la sua destinazione. Egli ha anche sottolineato alcuni grandi esempi di spam rinvio.

Tipi di spam

Lo spam di Google Analytics possono essere classificati da due tipi: fantasmi e crawler.

fantasmi

La maggior parte dello spam è questo tipo. Essi sono chiamati fantasmi perché non hanno mai accedere al sito. E 'importante tenere a mente, come è la chiave per creare una soluzione più efficiente per gestire lo spam.

Per quanto insolito possa sembrare, questo tipo di spam non ha alcuna interazione con il tuo sito a tutti. Ci si potrebbe chiedere come ciò sia possibile dal momento che uno degli scopi principali di GA è quello di monitorare le visite ai nostri siti.

Lo fanno utilizzando il protocollo di misurazione, che permette alle persone di inviare i dati direttamente ai server di Google Analytics '. Utilizzando questo metodo, e probabilmente generati casualmente codici di monitoraggio (UA-XXXXX-1), nonché, gli spammer lasciare una "visita" con i dati falsi, senza nemmeno sapere chi stanno colpendo.

Crawlers

Questo tipo di spam, l'opposto di fantasma di spam, non accedere al sito. Come suggerisce il nome, questi bots spam eseguire la scansione delle pagine, ignorando le regole come quelle che si trovano nel file robots.txt che dovrebbero impedire loro di leggere il vostro sito. Quando escono tuo sito, lasciano un record su rapporti che appare simile ad una visita legittima.

Crawler sono più difficili da individuare perché sanno che i loro obiettivi e utilizzare i dati reali. Ma è anche vero che appaiono raramente nuovi. Quindi, se si rileva un rinvio nella vostra analisi che sembra sospetto, la ricerca su Google o il controllo contro questa lista potrebbe aiutare a rispondere alla domanda di se o non si tratta di spam.

La maggior parte dei comuni errori commessi quando si tratta di spam GA

Ho seguito da vicino tale questione per gli ultimi mesi. Secondo i commenti persone hanno fatto i miei articoli e le conversazioni che ho trovato nel forum di discussione, ci sono principalmente tre errori persone fanno quando si tratta di spam di Google Analytics.

Errore # 1. Blocco fantasma lo spam dal file .htaccess

Uno dei più grandi errori persone fanno è cercare di bloccare fantasma spam dal file .htaccess.

Per coloro che non hanno familiarità con questo file, una delle sue funzioni principali è quello di consentire / bloccare l'accesso al tuo sito. Ora sappiamo che i fantasmi non raggiungono mai il vostro sito, in modo da aggiungere qui non avrà alcun effetto e solo aggiungere le linee inutili al file .htaccess.

Fantasma di spam di solito si presenta per un paio di giorni e poi scompare. Di conseguenza, a volte la gente pensa che hanno bloccato con successo da qui, quando in realtà si tratta solo di una coincidenza di tempi.

Poi, quando gli spammer poi ritornano, ottengono preoccupati perché la soluzione non funziona più, e pensano che lo spammer in qualche modo aggirato le barriere hanno istituito.

La verità è che il file .htaccess può bloccare efficacemente solo crawler quali buttons-for-website.com e pochi altri dal momento che questi accedono al vostro sito. La maggior parte dello spam non può essere bloccata con questo metodo, quindi non c'è altra scelta che usare filtri per escluderli.

Errore # 2. Utilizzando l'elenco di esclusione di riferimento per bloccare lo spam

Un altro errore sta cercando di utilizzare l'elenco di esclusione di riferimento per fermare lo spam. Il nome può confondere, ma l'elenco non è voluto escludere rinvii nel modo in cui vogliamo per lo spam. Esso ha altri scopi.

Ad esempio, quando un cliente acquista qualcosa, a volte ottengono reindirizzato a una pagina di terze parti per il pagamento. Dopo aver effettuato un pagamento, sono reindirizzati al vostro sito web, e GA record che come un nuovo riferimento. E 'opportuno utilizzare lista di esclusione di riferimento per evitare che ciò accada.

Se si tenta di utilizzare l'elenco di esclusione di riferimento per gestire lo spam, tuttavia, la parte di riferimento sarà spogliato in quanto non vi è alcuna traccia preesistente. Di conseguenza, una visita diretta verrà registrata, e si avrà un problema più grande di quello si è iniziato con da allora. Si avrà ancora lo spam, e visite dirette sono più difficili da monitorare.

Errore # 3. Preoccupante che le variazioni dei tassi di rimbalzo influenzerà classifiche

Quando la gente vede che le variazioni dei tassi di rimbalzo drasticamente a causa dello spam, cominciano a preoccuparsi per l'impatto che avrà sul loro posizionamento nella SERP.

Questo è un altro errore comunemente fatto. Con o senza lo spam, Google non prende in considerazione metriche di Google Analytics come un fattore di ranking. Ecco una spiegazione su questo da Matt Cutts, l'ex capo della squadra di web spam di Google.

E se ci pensate, la spiegazione Cutts 'ha un senso; perché anche se molte persone hanno GA, non tutti lo usa.

Assumendo che il sito è stato hackerato

Un'altra preoccupazione comune quando le persone vedono pagine di destinazione strani provenienti da spam per le loro relazioni è che essi sono stati attaccati.

La pagina che lo spam mostra sulle relazioni non esiste, e se si tenta di aprirlo, si otterrà una pagina 404. Il vostro sito non è stata compromessa.

Ma bisogna assicurarsi che la pagina non esiste. Perché ci sono casi (non spam) dove alcuni siti hanno una violazione della sicurezza e ottenere iniettati con pagine piene di parole chiave non pertinenti per diffamare il sito.

Che cosa si dovrebbe preoccupare?

Ora che abbiamo scartato i problemi di sicurezza e loro effetti sulla classifica, l'unica cosa che resta da preoccuparsi è tuoi dati. Il sentiero falso che lo spam inquina lascia dietro i report.

Si potrebbe avere maggiore o minore impatto a seconda del traffico del sito, ma ognuno è suscettibile di spam.

siti di piccole e medie dimensioni sono i più facilmente influenzato - non solo perché una grande parte del loro traffico può essere spam, ma anche perché di solito questi siti sono autogestite e, talvolta, non hanno il supporto di un analista o un webmaster.

Grandi siti con molto traffico possono anche essere influenzati dallo spam, e anche se l'impatto può essere insignificante, traffico non valido significa rapporti imprecisi non importa la dimensione del sito web. Come analista, si dovrebbe essere in grado di spiegare cosa sta succedendo in anche nelle relazioni più granulari.

Hai solo bisogno di un filtro a che fare con il fantasma di spam

Di solito si consiglia di aggiungere il rinvio ad un filtro di esclusione dopo che è stato macchiato. Anche se questo è utile per una rapida azione contro lo spam, ha tre grandi svantaggi.

  • Fare filtri ogni settimana per ogni nuovo spam rilevato è noioso e che richiede tempo, soprattutto se si riesce molti siti. Inoltre, nel momento in cui applicare il filtro, e si inizia a lavorare, si dispone già di alcuni dati interessati.
  • Alcuni degli spammer usano visite dirette insieme con i rinvii.
  • Questi colpi diretti non saranno fermati dal filtro quindi, anche se si è escluso il rinvio si davanzale riceverà traffico non valido, il che spiega perché alcune persone hanno visto un picco di insolito nel traffico diretto.

Per fortuna, c'è un buon modo per evitare tutti questi problemi. La maggior parte dello spam (fantasma) funziona colpendo casuali di monitoraggio-ID di GA, il che significa l'autore del reato in realtà non sapere chi è il bersaglio, e per questo motivo sia il nome host non è impostato o si utilizza un falso. (Vedi rapporto sottostante)

Ghost-Spam.png

Si può vedere che usano alcuni nomi strani o non si preoccupano neppure di impostare uno. Anche se ci sono alcuni nomi noti nella lista, questi possono essere facilmente aggiunti dal spammer.

D'altra parte, il traffico valida utilizzerà sempre il vero nome. Nella maggior parte dei casi, questo sarà il dominio. Ma anche può anche derivare da servizi a pagamento, servizi di traduzione o di qualsiasi altro luogo in cui è stata inserita GA codice di monitoraggio.


Ora di invio: 2015/08/10