Domande o Richieste ? al 3496993121 | Email | Preventivo
Scopri la nostra Assistenza Speciale per Wordpress

Eliminare referral spam statistiche google analytics

VISUALIZZA GLI AGGIORNAMENTI IMPORTANTI AGGIORNATI al 7/01/2016!

LEGGI L’ARTICOLO AGGIORNATO AL 12/1/2016, che vi permette di eliminare e distinguere i referral spam in modo definitivo !

Aggiornamento 26-03-2015

Come funzionano veramente questi referral spam?

Molte persone credono che dal momento che una sessione viene registrata in Google Analytics, questo dipenda dal fatto che qualcuno, una persona, od un robot, visiti il sito ed immediatamente la visita sia ripresa da Google Analytics. NON E PROPRIO COSI!.

Google Analytics si basa sul browser del client per inviare e eseguire una porzione di codice JavaScript che effettua una richiesta HTTP ai server di Google Analytics, che poi registrano una visita sul sito e impostano un cookie nel browser dell’utente.

Tuttavia, la richiesta HTTP può essere inviata da qualsiasi dispositivo connesso a Internet e se contiene tutti i requisiti necessari sarà in grado di registrare una visita con Google Analytics.

Poiché non vi è alcuna autenticazione in tutto questo processo, praticamente chiunque può inviare risultati per il tuo sito web, solo conoscendo la tua UA-ID (UA-XXXXXXX-XX). Questo è esattamente ciò che gli spammer utilizzano per inquinare i vostri dati.

Google-Analytics-referral-spam-funzionamento

Purtroppo tutto può essere falsificato durante queste interazioni.
Nome host ? Sì.
Dati Referrer ? Sì.
Dati di tracciamento campagna ? Sì.
Percorsi URL ? Sì. E così via…

Come si può vedere sullo schema sopra, uno spammer non ha nemmeno bisogno di connettersi al server, al fine di spingere il suo spam referral. Si collega direttamente ai server di Google Analytics, lasciando traccia delle sue attività.

Aggiornamento pratiche – metodi non funzionanti per risolvere l’attacco dei referrer spam

Vediamo diverse soluzioni che purtroppo non aiutano :

1. Applicare un filtro di visualizzazione Google Analytics per consentire solo il traffico che ha origine solo sul tuo hostname (iltuosito.com).
Questo può funzionare inizialmente, ma dato che possono facilmente impostare il nome host per il proprio potrebbero riuscire a bypassare questa sicurezza.

2. Qualsiasi tipo di monitoraggio del traffico server e tentativi di escludere il traffico a livello di server (htaccess, firewall, etc.): da user-agent, da referrer, per IP …
Dal momento che non c’è nessuna interazione con il server purchè lo spam si verifichi, questi sono tutti tentativi inutili.

3. Utilizzare la funzione di filtraggio dei bot in Google Analytics
Provato: non aiuta per niente per i referral e sinceramente non credo che sia stato creato con queste intenzioni in mente.

4. Escludere intere aree geografiche che sono ritenuti responsabili del traffico di spam
Una soluzione drastica, ma purtroppo è probabile che non funzionerà, dato che i dati geografici possono essere contraffatti tramite il protocollo di misura. Inoltre, tale opzione non è disponibile per tutti i proprietari di siti web.

Attualmente , la soluzione migliore è quella di applicare filtri di livello al fine di escludere questi referrer di spam utilizzando però come campo filtro Sorgente campagna.

È possibile utilizzare questa espressione regolare per bloccare alcuni dei spammer più fastidiosi al momento( praticamente ogni sito è affetto da almeno due di questi ) :
darodar\.|semalt\.|buttons-for-website|blackhatworth|ilovevitaly|prodvigator|cenokos\.|ranksonic\.|adcash\.|simple-share-buttons\.|social-buttons\.

Od, in alternativa , è possibile costruire una regola personalizzata utilizzando la stessa espressione .

Se si individua un nuovo dominio di spam è necessario aggiungere una linea verticale (“|”), e poi il nome del dominio . E necessario aggiungere un backslash (“\”) prima di loro.

escludere-referral-spam

Purtroppo, come probabilmente si capisce, questa non è una soluzione permanente, dal momento che i referral spam si espandono troppo velocemente e sono troppi; ci vogliono centinaia di migliaia di analisti / specialisti di marketing / webmaster, tempo significativo per rintracciarli attraverso le statistiche, per identificare il traffico sospetto e per aggiornare i filtri di conseguenza … Ecco perché questa è solo una soluzione a breve termine.

Ce da dire che Google conosce la questione già a partire dal 2013 (probabilmente molto prima), come confermato da una replica Nick Michailovski – una delle persone chiave nel team di Google Analytics, in un thread Google Gruppi. La sua citazione esatta :

Abbiamo esaminato questo. Se stai facendo una implementazione basata su client, fino a quando si può ottenere la richiesta http dal client, quindi è possibile falsificare la richiesta.
Quindi a meno che Google decide di cambiare radicalmente il cuore della parte tracciamento di GA, ci ritroviamo ad affrontare la questione del referrer spamming noi stessi. E c’è ben poco che possiamo realmente fare …

Web Hosting

Aggiornamento 20-03-2015

Basta teoria ! Passiamo alla pratica.

in questo articolo voglio mostrarvi come eliminare dalle statistiche di Google Analytics quelle fastidiose visite dei referral spam. Esitono varie tipologie di referral; in questo caso parliamo di un referral spam che si sta diffondendo al momento e si tratta di darodar.com.

Per avere maggiori info su questo referral visualizza questo articolo : come-bloccare-darodar-referral-spam-sul-tuo-sito-web.

Quello che dovete fare e collegarvi al vostro account di Google Analytics e seguire i passi qui di seguito :

Una volta effettuato l’accesso, cliccate su amministrazione e successivamente su Filtri;

amministrazione-google-analytics

Poi clicchiamo sulla voce in alto Nuovo filtro, che ci permetterà di configurare il blocco verso il referral spam;

nuovo-filtro-google-analytics

In quest’ultima schermata compileremo in questo modo :

  • Lasciamo impostato su “Crea nuovo filtro”;
  • In nome filtro inseriremo un nome a piacere, che ci permetta di capire di quale filtro si tratta; io ho messo darodar.com;
  • In “Tipo Filtro”, selezioneremo personalizzato;
  • Si aprirà a comparsa una nuova scheda, in cui selezioneremo Escludi, in “Campo filtro” sceglieremo referral e infine in “Pattern Fitro” digiteremo darodar.com;
  • Cliccare su Salva alla fine.
[/custom list] bloccare-darodar.com-filtro-google-analytics

Ho testato in più siti web e applicando questo filtro non visualizzo più nelle statistiche questo referral spam.

Un’ altra soluzione è quella di creare sempre un filtro, ma un metodo che richiede molto meno sforzo è quello di creare un filtro basato su nomi host validi. Dal momento che i referral spam non conoscono l’ID di tracciamento del sito web (dato che stanno raccogliendo i numeri a caso), mandano il “rinvio” utilizzando un nome host che non appartiene a uno dei tuoi.

È possibile creare un filtro “include” che mantiene solo ciò che è stato registrato da uno dei vostri nomi host validi, e si può smettere di preoccuparsi di darodar.com / econom.co / ilovevitaly.co / e qualunque cosa arrivi dopo.

COME CREARE UN FILTRO BASATO SU NOMI HOST VALIDI (Funzionante solo inzialmente!)

Per implementare questa soluzione, è opportuno fare attenzione per non eliminare il traffico valido! È necessario identificare tutti gli hostname validi che possono utilizzare il tuo ID di monitoraggio del sito web.

Per assicurarsi di ciò basta andare su panoramica,tecnologia,rete e selezionare nome host nel menu a tendina al di sopra!

filtro-host-name-include

Nel mio caso www.emprsitiweb.com è un host name valido!(in quanto è il mio sito e so che la fonte ovviamente è attendibile) Se non siete sicuri leggete questo articolo! Verrà spiegato come creare un segmento, cosi potrete identificare meglio se si tratta di un traffico valido oppure no.

Una volta esaminati gli host, e individuati quelli validi bisognerà creare un filtro basato su di essi. Per creare tale filtro è necessario includere un’espressione regolare;
Molte persone hanno dei problemi che comporre l’espressione regolare per il filtro perché utilizza il metodo Regex. Un modo semplice per includere i nostri nomi host validi è quello di inserire il dominio separato da barre verticali (|) come in questo esempio :

www.emprsitiweb.com|emprsitiweb.com

ovviamente questo è il mio caso, ma se avete più host validi bastera aggiungere un | e inserire il dominio dopo.

é possibile utilizzare un altro sistema di espressione regolare utilizzando un periodo :

www\.emprsitiweb\.com|emprsitiweb\.com

Poi vi basterà recarvi come spiegato all’inizio dell’articolo nella sezione filtri per creare un nuovo filtro.

Ci sarà una differenza fondamentale; al posto di escludere, includeremo il nostro sito web come nome host valido. Nel pattern filtro inseriremo l’espressione regolare come spiegato sopra. Eccovi un’immagine per farvi capire meglio :

filtro-nome-host-valido-google-analytics

Un altro modo per cercare di contrastare questi bot è data da una funzionalità implementata di recente da Google Analytics. Questa nuova funzionalità permette di escludere il traffico dai bot presenti su “IAB/ABC International Spiders & Bots List”; Lo svantaggio è che il servizio è a pagamento bisognerebbe pagare un fior di quattrini, all’incirca 14.000 $ all’anno per accedere a questa lista.

Quello che dovete fare è recarvi in amministrazione, selezionare Impostazioni vista in Tutti i dati del sito web. Ora mettere la spunta sulla casella Escludi tutti gli hit da bot e spider noti.

eliminare-referral-spam-statistiche-google-analytics-procedura

In questo modo si otterranno dei benefici, e potrete registrare un calo parziale delle visite; non totale perchè potrebbe succedere che alcuni bot sfuggano dai classici controlli manuali.

Se volte avere informazioni più dettagliate su come capire i referral spam leggete questo articolo.

Vi consiglio di dare uno sguardo a questa nuova soluzione per filtrare i referral spam; è importante capire prima di bloccare questi referral, la mole di traffico che hanno sul vostro sito web.

LEGGI L’ARTICOLO AGGIORNATO AL 12/1/2016, che vi permette di eliminare e distinguere i referral spam in modo definitivo !

Qualche dubbio o suggerimento? Lascia un commento e parliamone.

About Emiliano

Mi chiamo Emiliano Prelle, web designer freelance, con la passione per il web e la tecnologia e tutto quello che le ronza intorno.
Mi occupo di sviluppo, progettazione e realizzazione siti internet ( sviluppati in particolare con WordPress ), grafica e SEO.

14 Commenti
  1. Nell’articolo scrivi che nel “Pattern Fitro” va digitato “darodar.com”, mentre nell’immagine si vede il campo compilato con http://www.darodar.com.
    Quale dei due è il pattern corretto ?

    • Ciao Markdvl,
      intanto ti ringrazio per aver commentato!
      Hai ragione errore mio. Provvedo a correggere l’immagine.
      Nel campo “Pattern Fitro” va inserito “darodar.com”. Però credo che inserendo l’indirizzo web completo lo blocchi comunque.

  2. Grazie mille, in rete si trovano tante chiacchiere, meno male qualcuno va dritto al punto!
    grazie ancora
    Gianmaria

  3. Ciao, complimenti per l’utilissimo blog.
    Ultimamente ho trovato un accesso sul mio sito con queste caratteristiche:
    LINGUA: zh-cn
    PERCORSO REFERREAL: /l.php
    SORGENTE: m.facebook.com
    NUOVE SESSIONI: 0,00%
    FREQUENZA RIMBALZO: 0,00%
    DURATA MEDIA: più di 8 minuti
    Sto cercando di capire se è un nuovo spam-bot oppure no. Per caso qualcuno ha avuto visite con statistiche simili a questa?
    Grazie

    • Ciao Jack,
      ti ringrazio per il feedback positivo 🙂 .
      Non ti preoccupare; /l.php è solo un modo che facebook utilizza per monitorare i clic dai link nei messaggi , status , commenti , ecc..; ad esempio, se si sta chattando con qualcuno su Facebook per la ricetta di una torta di mele e ti mandano il link a una buona ricetta online, vedrai su GA il reindirizzamento /l.php . Un altro esempio potrebbe essere se avete un blog e si dispone di un pulsante “share” su un articolo Facebook oppure “Mi piace”.Quando un visitatore clicca su questo pulsante, i loro amici vedranno il link sul loro news feed e facendo clic sul collegamento da lì innescherai il redirect verso quella pagina.
      Quindi tranquillo non è uno spam, ma solo un modo che facebook utilizza per monitorare i clic dai link.

  4. Ciao un grazie immenso per questo articolo. Ma posso fare lo stesso passaggio con questi siti?
    humanorightswatch.org / referral
    o-o-6-o-o.com / referral

  5. Ciao,
    mille mila grazie.

    Un’ottima guida e un’ottima soluzione.
    Finalmente le mie statistiche sono un poco più vicine alla realtà.
    Ti ho citato nel mio post come rimando alla procedura per la “Creazione del filtro” (http://blogramma.it/web-2/aumentare-durata-media-visite).

    Thx!

    • Ciao Paolo!
      Grazie a te per il commento positivo a riguardo 🙂
      Mi fa piacere ti sia stato utile.
      E grazie della citazione. Sicuramente andrò a visitare il tuo blog! 🙂
      Alla prossima

  6. Sei bravissimo! Ho salvato la tua pagina tra i preferiti

  7. Ciao, una cosa non ho capito. Perchè consigli di usare la versione Personalizzata del filtro? Ad esempio se voglio includere come host “miosito.it” potrei usare solo il filtro predefinito.

    • Ciao Alessandro. Grazie per il tuo commento.
      Utilizzo il filtro personalizzato, perche è piu versatile e permette di eseguire operazioni personalizzate in base alle esigente di cio che vuoi fare.
      in questo caso, voglio filtrare tutto per nome host, e tramite il filtro personalizzato posso farlo. Ma come vedi puoi filtrare il tutto per molte altre cose.

      In sostanza ho utilizzato questo filtro perche mi permette di fare un filtro che viene incluso solo per il nome dell’host (è non in via generale, la quale puo portare incomprensioni da parte di Google),
      e nel pattern filtro ho specificato l’url del sito con www e senza www per fare una ricerca piu accurata.

Lascia un commento

Contatti

Loranzè, via Fiorano n 83
10010 ( TO )
Cell: 3496993121
Email: Scrivimi via email
P.IVA: 11315150018
Operiamo nel rispetto della tua Privacy

desclaimer

Il sito www.emprsitiweb.com è di proprietà di Prelle Emiliano e da esso gestito. La veste grafica, le immagini ed i testi presenti nel sito sono soggetti a copyright da Prelle Emiliano e/o dei rispettivi proprietari e non possono essere riprodotti o trasmessi con nessun mezzo, né essere utilizzati in ambito professionale o commerciale senza autorizzazione scritta da Prelle Emiliano o dei legittimi proprietari.

Ultima dal Blog

Social

Resta aggiornato su WordPress !

Guide/Tutorials per WordPress

Suggerimenti e trucchi per WordPress

Un Report 100% gratuito che ti aiuta ad evitare gli errori più comuni per il tuo sito WordPress

Se ti iscrivi, riceverai periodicamente : 

Rispettiamo la privacy. La tua Email verrà solo utilizzata per questa newsletter, e non sarà ceduti a terzi.

Grazie per la tua iscrizione !

Miraccomando : Clicca sul seguente LINK, per visionare tutte le informazioni ed i dettagli relativi alla tua iscrizione !

Ti anticipo, che devi cliccare sul link di conferma che ti ho appena inviato al tuo indirizzo email per poter essere iscritto correttamente alla newsletter. Questo ti permetterà di ricevere tutti gli aggiornamenti ed il report free, sui 25 errori più comuni di WordPress, che ho preparato per te !

Nella mail troverai tutte le informazioni del caso.

Nb: Se la mail non arriva subito, non preoccuparti; causa ritardi del server può impiegarci anche fino a 2 ore.

I 25 Errori WordPress più comuni da evitare 

Iscrivendoti al blog ricevi gratuitamente una report in cui ti mostro i 25 errori più comuni che commettono i principianti in WordPress in fase di realizzazione di un Sito Web. 

Iscriviti ed ottieni il report gratuito !

*Lo scarichi in 5 secondi. 100% Gratis

Rispettiamo la privacy. La tua Email verrà solo utilizzata per questa newsletter.

Grazie per la tua iscrizione

Miraccomando : Clicca sul seguente LINK, per visionare tutte le informazioni ed i dettagli relativi alla tua iscrizione !

Ti anticipo, che devi cliccare sul link di conferma che ti ho appena inviato al tuo indirizzo email per poter essere iscritto correttamente alla newsletter. Questo ti permetterà di ricevere tutti gli aggiornamenti ed il report free, sui 25 errori più comuni di WordPress, che ho preparato per te !

Nella mail troverai tutte le informazioni del caso.

Nb: Se la mail non arriva subito, non preoccuparti; causa ritardi del server può impiegarci anche fino a 2 ore.