Domande o Richieste ? al 3496993121 | Email | Preventivo
Scopri la nostra Assistenza Speciale per Wordpress

Bloccare e capire referral spam individuati dalle statistiche di Google Analytics

LEGGI L’ARTICOLO AGGIORNATO AL 12/1/2016, che vi permette di eliminare e distinguere i referral spam in modo definitivo !

VISUALIZZA GLI AGGIORNAMENTI DELLA LISTA AGGIORNATA DEI REFERRAL al 7/01/2016!

Ho già scritto un articolo nel quale spiego come aggirare i referral spam.

Tuttavia in questo articolo cercherò di spiegare come si comportano i referral spam e in che modo e possibile prevenire il loro attacco, o almeno cercare di contrastarlo.

INANZITUTTO : COSA E UN BOT ?

Il bot (abbreviazione di robot) è un programma che accede alla rete, e generalmente (nella maggior parte dei casi) vengono utilizzati per l’ indicizzazione dei contenuti delle pagine web.

Il problema è che i bot possono avere molteplici sfumature ed è possibile andare incontro a “bot cattivi”.

Questi vengono utilizzati per scopi dannosi come per esempio inviare messaggi di spam, diffusione di malware, gonfiare artificialmente il traffico sito web, copiare contenuti del sito e memorizzare email presenti nel sito web.

FARE CHIAREZZA : BOT BUONI E CATTIVI

Un esempio di “bot buono” è Googlebot che viene utilizzato da Google per eseguire la scansione e indicizzare le pagine web su Internet.

La maggior parte dei bot (se buono o cattivo) non esegue JavaScript, ma alcuni lo fanno. I bot che eseguono javascript (per esempio Google Analytics con l’inserimento del codice di monitoraggio) appaiono nei rapporti di GA per permetteere di visualizzare i dati del traffico e tutte le metriche basate su sessioni come frequenza di rimbalzo, il tasso di conversione e cosi via.

Un’altra caratteristica fondamentale e che i “bots buoni” obbediscono alle direttive del file robots.txt, mentre i “bots cattivi” non lo fanno. Essi possono creare account utenti falsi, inviare e-mail di spam, e possono in molti casi bypassare il CAPTCHA. Utilizzano vari metodi per mascherare se stessi, in modo che non possano essere facilmente rilevati da qualsiasi misura di sicurezza.

Possono fingere di essere un browser web (come Chrome, Internet Explorer, ecc..). Possono addirittura fingere di essere il traffico proveniente da un sito web legittimo.

Insomma nessuno può dire con certezza quali siano i bot che possono incrinare i rapporti nel vosto GA.

COME COMBATTERLI ? FACCIAMO PREVENZIONE, E MEGLIO CHE CURARE!

    • Se il vostro sito è spesso attaccato da cattivi bot, il tutto potrebbe essere dovuto anche a un basso livello di sicurezza del vostro hosting; quindi cambiare il vostro host web potrebbe aiutarvi.

    • Normalmente se avete visite su GA, le quali presentano frequenza di rimbalzo pari al 100% e durata sessione media pari a 0, la probabilità che sia un referral spam è alta.

    • Ultimamente c’è una lista chiara di referral spam e se uno dei vostri sospetti referrer appartengono alla lista dei siti web elencati di seguito , allora è un referrer spam e non è necessario assicurarsene :

      – semalt.com
      – semalt.semalt.com
      – buttons-for-website.com
      – blackhatworth.com
      – makemoneyonline.com
      – ilovevitaly.com
      – priceg.com

      ecco il link della link della lista.

    • Se non è possibile confermare l’identità del vostro sospetto referrer, allora avete bisogno di prendere qualche rischio e visitare il sito web per assicurarsi che sia un sito web legittimo.
      E necessario assicurarsi però di avere anti virus / software anti malware installato sul vostro sito web prima di visitare tali siti perché possono infettare il vostro computer, non appena li si visita.

    • Un buon modo per cercare di evitare il loro accesso è sicuramente quello di creare un filtro.
      In questo articolo spiego come creare un filtro verso i referral spam in Google Analytics.

Tuttavia abbiamo dei pro e dei contro :

  • Dato che i referral spam sono centinaia, se non migliaia e migliaia, non è possibile creare un milione di filtri per tutti; quindi certamente può essere una soluzione per tamponare, ma non per risolvere il problema alla radice.

  • Più filtri si applicano al tuo sito web, più problemi di campionamento dei dati si ottengono nei rapporti di GA.

  • Bloccando tramite il filtro il referral spam in questione, si bloccheremo il loro accesso (è quindi un fatto positivo), ma non potremo analizzarlo vedendo realmente come si comporta.

COME COMPORTARSI QUINDI?

1 – Una soluzione affidabile è quella di bloccare il referral attraverso il file .htaccess

RewriteEngine On
Options +FollowSymlinks
RewriteCond %{HTTP_REFERER} ^https?://([^.]+\.)*semalt\.com\ [NC,OR]
RewriteRule .* – [F]

Vi suggerisco questo sito fantastico che vi crea automaticamente la regola da inserire.

In questo caso blocchimo semalt.com e i suoi sottodomini.

2 – Bloccare il referral spam tramite l’indirizzo ip .htaccess

## USER IP BANNING

 order allow,deny
 deny from 217.23.11.15
 allow from all

Un ottimo modo per individuare l’indirizzo ip è quello di inserire il sito su Domaintools, verso il quale possiamo analizzare il referral e vedere gli indirizzi ip e i server a cui appartiene.

Questo è solamente un esempio di indirizzo ip. Come potete vedere su domaintools indica precisamente l’indirizzo ip;
indirizzo-ip-domain-tools-referral-spam

3 – Bloccare lo user agent

RewriteEngine On
Options +FollowSymlinks
RewriteCond %{HTTP_USER_AGENT} Baiduspider [NC]
RewriteRule .* – [F,L]

4 – Bloccare i server associati

SetEnvIfNoCase Referer  POVI283876.MARS.ORDERBOX-DNS.COM spam=yes
Order allow,deny
Allow from all
Deny from env=spam
 
SetEnvIfNoCase Referer  POVI283876.EARTH.ORDERBOX-DNS.COM spam=yes
Order allow,deny
Allow from all
Deny from env=spam
 
SetEnvIfNoCase Referer  POVI283876.VENUS.ORDERBOX-DNS.COM spam=yes
Order allow,deny
Allow from all
Deny from env=spam
 
SetEnvIfNoCase Referer  POVI283876.MERCURY.ORDERBOX-DNS.COM
spam=yes
Order allow,deny
Allow from all
Deny from env=spam

Sempre da Domaintools è possibile vedere i server relativi al referral spam

server-domain-tools-referral-spam

5 – Avere sempre attivo il Firewall nel vostro hosting

6 –  Bloccare i bot con la nuova funzione di GA

escludere-bot-google-analytics

Qualche dubbio o suggerimento? Lascia un commento e parliamone.

About Emiliano

Mi chiamo Emiliano Prelle, web designer freelance, con la passione per il web e la tecnologia e tutto quello che le ronza intorno.
Mi occupo di sviluppo, progettazione e realizzazione siti internet ( sviluppati in particolare con WordPress ), grafica e SEO.

15 Commenti
  1. Ciao, ti ringrazio tantissimo per questi articoli sui referral spam.

    Ho individuato dal mio analytics darodar e sto cercando di eliminarlo come consigli tu qui: http://www.emprsitiweb.com/come-bloccare-darodar-referral-spam-sul-tuo-sito-web/

    Sto usando il “metodo per wordpress”. Ho modificato il file .htaccess ma quando vado a modificare functions.php inserendo lo snipshot che consigli mi compare un avviso con scritto che in questa riga c’è un errore:

    if ( isset($_SERVER[‘HTTP_REFERER’]) && contains(strtolower($_SERVER[‘HTTP_REFERER’]), $known_spambots) ) {

    Sapresti aiutarmi? 🙁

    Grazie mille ancora,

    Valentina

    P.S. sei la prima persona che trovo in rete con il mio stesso tema grafico (U-Design) 😀

    • Ho ripristinato il file functions.php cancellando la parte di codice che avevo aggiunto, dato che mi dava errore…ma adesso non è più visibile il mio sito! Cos’ho combinato? 🙁

    • Ciao Valentina,
      grazie per aver preso spunto dal mio articolo! Mi dispiace per la problematica del sito; vediamo di risolvere tutto. Segui i miei passi:
      1) hai un backup del file functions.php? sovrascrivilo al precedente cosi rispristini il sito.
      2) Successivamente il codice da inserire all’interno è :

      add_action(‘init’, ‘nebula_spambot_prevention’);
      function nebula_spambot_prevention(){
      //List of known spambots. The dots allow for any TLD to trigger with fewer false-positives.
      $known_spambots = array(‘semalt.’, ‘ilovevitaly.’, ‘darodar.’, ‘econom.’, ‘makemoneyonline.’, ‘buttons-for-website.’, ‘myftpupload.’, ‘co.lumb’, ‘iskalko.’, ‘o-o-8-o-o.’, ‘o-o-6-o-o.’, ‘cenoval.’, ‘priceg.’, ‘cenokos.’, ‘seoexperimenty.’, ‘gobongo.’, ‘vodkoved.’, ‘adcash.’, ‘websocial.’, ‘cityadspix.’, ‘luxup.’, ‘ykecwqlixx.’, ‘superiends.’, ‘slftsdybbg.’, ‘edakgfvwql.’, ‘socialseet.’, ‘screentoolkit.’, ‘savetubevideo.’);

      if ( isset($_SERVER[‘HTTP_REFERER’]) && contains(strtolower($_SERVER[‘HTTP_REFERER’]), $known_spambots) ) {
      header(‘HTTP/1.1 403 Forbidden’);
      die;
      }

      if ( isset($_SERVER[‘REMOTE_HOST’]) && contains(strtolower($_SERVER[‘REMOTE_HOST’]), $known_spambots) ) {
      header(‘HTTP/1.1 403 Forbidden’);
      die;
      }
      }

      function contains($str, array $arr) {
      foreach( $arr as $a ) {
      if ( stripos($str, $a) !== false ) {
      return true;
      }
      }
      return false;
      }

      Fai attenzione a dove lo inserisci, perchè è facile sbagliare e creare problemi sul codice.
      Fammi sapere come va.

      • Rispondo a Vale, il problema era anche mio, il sito si bloccava copiando il suddetto codice. Il problema credo stia negli apostrofi. Li ho cambiati e sembra funzionare.

        P.S: Grazie Emiliano

        • Ciao Alessandro,
          grazie a te per aver condiviso. 🙂
          Se vuoi pota il codice, cosi può essere utile a tutti.

          Grazie
          Emiliano

  2. Ho seguito il commento di VALE.
    Mi sono accorto ed ho aperto gli occhi oggi che dalla russia e precisamente da SAMARA mi entrava nelle statistiche GA un referral “molto insistente” DARODAR (forum.topic58850689.darodar.com) Mi sono informato in rete ed ho trovato le risposte qui nel tuo sito.

    Trovo interessante l’intervento consigliato sul file functions, solo che son incorso nell’errore di VALE ed ho poi corretto.. bene!

    La domanda ora è: ma dove inserire di preciso il codice che hai postato?
    Il file functions lo apro con il Blocco Note… ma, in effetti.. dove metto il codice….? Inizio.. fine…metà.

    Se puoi essere così gentile da dare una risposta definitiva.
    A me verrebbe da metterlo alla fine… ma dimmi tu. Grazie

    • Ciao Francesco,
      il codice lo puoi inserire dove ti piace di più, non c’è una regola precisa.
      Io ti consiglio di metterlo al fondo al fine di evitare problemi con il codice. Basta poco per rovinare il codice.
      Mi raccomando fai prima un backup del file, cosi se succedesse qualcosa basta sovrascriverlo e ritorni a posto.

      grazie a te per aver commentato

  3. Ciao Emiliano,
    il mio problema: ho un sito su host Aruba con CMS WordPress. Da Analytics il sito è spammato da decine di siti. Li ho bloccati su ANalytics ma non riesco a modificare il file htaccess. Da Aruba non mi dà la possibilità di editare il file htaccess. Cosa fare?
    Grazie 🙂

    • Ciao Federica.
      Molto probabilmente è solo un problema di permessi.
      ti linko un’immagine. Guarda se riesci a capire :
      htaccess-permessi-hosting-aruba
      Devi andare nel file manager, cliccare sul file .htaccess, cliccare su cambia permessi o change permission e spuntare scrittura.
      Prova e fammi sapere
      Grazie a te del commento

      Emiliano

  4. Buongiorno, il sito è realizzato con il CMS wordpress.
    All’inizio del mio htaccess ho inserito questo:

    RewriteEngine on
    RewriteCond %{HTTP_REFERER} event\-tracking\.com [NC,OR]
    …. altri RewriteCond ….
    RewriteCond %{HTTP_REFERER} floating\-share\-buttons\.com [NC]
    RewriteRule ^.* – [F,L]

    In GA continuo a vedere le statistiche “inquinate”?
    Mi sapete dire dove sbaglio?
    Grazie

    • Buonasera Stefano,
      Purtroppo è perchè questi referral spam riescono a bypassare le regole nel file .htaccess.
      Quante visite hai in generale da parte di questi referral ?
      Ti consiglio di creare dei segmenti per poter filtrare le visite buone da quelle cattive.

  5. Ciao, se si volessero bloccare i referral spam di un sito realizzato su bigcartel come si procede?

    • Ciao Luana…. non lo conosco bigcartel, ma puoi utilizzare tranquillamente il file .htaccess per cercare di bloccare i referral spam

  6. Ottimo articolo, segnalo Pubblicità e Web MARKETING Milano

Lascia un commento

Contatti

Loranzè, via Fiorano n 83
10010 ( TO )
Cell: 3496993121
Email: Scrivimi via email
P.IVA: 11315150018
Operiamo nel rispetto della tua Privacy

desclaimer

Il sito www.emprsitiweb.com è di proprietà di Prelle Emiliano e da esso gestito. La veste grafica, le immagini ed i testi presenti nel sito sono soggetti a copyright da Prelle Emiliano e/o dei rispettivi proprietari e non possono essere riprodotti o trasmessi con nessun mezzo, né essere utilizzati in ambito professionale o commerciale senza autorizzazione scritta da Prelle Emiliano o dei legittimi proprietari.

Ultima dal Blog

Social

Resta aggiornato su WordPress !

Guide/Tutorials per WordPress

Suggerimenti e trucchi per WordPress

Un Report 100% gratuito che ti aiuta ad evitare gli errori più comuni per il tuo sito WordPress

Se ti iscrivi, riceverai periodicamente : 

Rispettiamo la privacy. La tua Email verrà solo utilizzata per questa newsletter, e non sarà ceduti a terzi.

Grazie per la tua iscrizione !

Miraccomando : Clicca sul seguente LINK, per visionare tutte le informazioni ed i dettagli relativi alla tua iscrizione !

Ti anticipo, che devi cliccare sul link di conferma che ti ho appena inviato al tuo indirizzo email per poter essere iscritto correttamente alla newsletter. Questo ti permetterà di ricevere tutti gli aggiornamenti ed il report free, sui 25 errori più comuni di WordPress, che ho preparato per te !

Nella mail troverai tutte le informazioni del caso.

Nb: Se la mail non arriva subito, non preoccuparti; causa ritardi del server può impiegarci anche fino a 2 ore.

I 25 Errori WordPress più comuni da evitare 

Iscrivendoti al blog ricevi gratuitamente una report in cui ti mostro i 25 errori più comuni che commettono i principianti in WordPress in fase di realizzazione di un Sito Web. 

Iscriviti ed ottieni il report gratuito !

*Lo scarichi in 5 secondi. 100% Gratis

Rispettiamo la privacy. La tua Email verrà solo utilizzata per questa newsletter.

Grazie per la tua iscrizione

Miraccomando : Clicca sul seguente LINK, per visionare tutte le informazioni ed i dettagli relativi alla tua iscrizione !

Ti anticipo, che devi cliccare sul link di conferma che ti ho appena inviato al tuo indirizzo email per poter essere iscritto correttamente alla newsletter. Questo ti permetterà di ricevere tutti gli aggiornamenti ed il report free, sui 25 errori più comuni di WordPress, che ho preparato per te !

Nella mail troverai tutte le informazioni del caso.

Nb: Se la mail non arriva subito, non preoccuparti; causa ritardi del server può impiegarci anche fino a 2 ore.