I
C
T
2
Condividiamo la conoscenza
www.e2ict.it
Lo trovi su:
GUIDA how to:
STOP SPAM IN
GOOGLE ANALYTICS
I
C
T
2
In questa guida spieghiamo come gestire un recente fenomeno legato a degli SPAMBOT nei risultati statistici dei
Referrer su sistemi di monitoraggio come Piwik o Google Analytics. Questo nuovo tipo di spam provoca un falso
valore totale delle visite sul vostro sito web oppure dei valori di permanenza sulle pagine, rendendo di fatto non
completamente affidabili i valori totali.
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
INDICE:
1) Panoramica su Piwik e Google Analytics
2) Pillole di SPAM e Referrer Spam
3) Soluzione con impiego di un file .htaccess
4) Soluzione con utilizzo dei Filtri in Google Analytics

5) Soluzione con implementazione di regole in Piwik
Share your know
I
C
T
2
Piwik, è un'applicazione Open Source sviluppata in PHP e MySQL che implementa un sistema di analisi e
monitoraggio per le statistiche delle pagine web,rivelandosi un'ottima alternativa al più noto strumento di casa
Google.
Alcuni dei dati che Piwik è in grado di visualizzare in real time, sono:
- il numero dei visitatori in un certo periodo (ora, giorno, settimana, mese o anno);
- la frequenza dei visitatori (nuovi utenti e visitatori abituali);
- le pagine d’entrata e quelle trascurate;
- la ripartizione geografica degli utenti presentata su una mappa del mondo interattiva;
- la configurazione tecnica dei visitatori (sistema operativo, browser, risoluzione dello schermo, ecc.);
- l'origine del traffico (motori di ricerca, accesso diretto, siti web di riferimento, newsletter);
- la durata della visita, le pagine visitate, le parole chiave, ecc.
L'installazione di Piwik è piuttosto semplice: basta caricare i file sul server utilizzando un client FTP e completare la
procedura guidata del programma. Sulle pagine del sito che si vuole monitorare, è necessario inserire il codice
javascript che si occuperà di registrare le varie misurazioni statistiche.
Maggiori informazioni sul sito web ufficiale di Piwik: http://piwik.org
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
1) Panoramica su Piwik e Google Analytics
I
C
T
2
Google Analytics è un servizio di Web analytics gratuito di Google che consente di analizzare delle dettagliate
statistiche sui visitatori di un sito web.
Recentemente Google ha potenziato il suo strumento di analisi mediante Google Universal Analytics che offre tutta
la potenza e la semplicità di Google Analytics aggiungendoci nuove funzioni.
Universal Analytics è caratterizzato da 3 colonne portanti:


La reportistica per il web: questa funzione, migliorata aggiunge nuove funzioni e

la possibilità di avere dimensioni e metriche personalizzate.
SDK per smartphone: La versione 3 delle SDK per Apple iOS e Google Android

hanno portato in dote la compatibilità con Universal Analytics.
Il Measurement protocol: questa è la vera novità di Universal Analytics. Google Analytics può essere implementato
esclusivamente sulle piattaforme che Google supporta (web, iOS ed Android) measurement protocol elimina questo
limite rendendo disponibile un protocollo che permette attraverso chiamate HTTP di inviare dati ai server di Google
da qualunque supporto si desidera, l’unico limite è la vostra fantasia. Measurement protocol è stato utilizzato per
misurare l’utilizzo della macchina per caffè e per “misurare” il ballo.
Altro elemento importante di Universal Analytics è il tracciamento multidevice:
impostando manualmente l’id dell’utente nel cookie di Universal Analytics è possibile capire come gli utenti del
nostro sito interagiscono usando diversi device sul nostro sito: ad esempio potremo analizzare se leggono le nostre
newsletter sullo smartphone, ma poi acquistano attraverso un tablet od un computer desktop.
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
1) Panoramica su Piwik e Google Analytics
I
C
T
2
Lo spamming, detto anche fare SPAM o spammare, è l’invio di messaggi indesiderati. Spam è proprio una
comunicazione commerciale non desiderata dall’utente. Questa comunicazione avviene soprattutto tramite mail,
ma anche tramite social media , forum e chat.
L’unica questione divertente che riguarda questo tema è da dove ha origine il termine. Il termine trae origine da uno
sketch comico del Monty Python’s Flying Circus ambientato in un locale nel quale ogni pietanza proposta dalla
cameriera era a base di Spam, cioè un tipo di carne in scatola diffuso all’epoca. Man mano che lo sketch avanza,
l’insistenza della cameriera nel proporre piatti a base di Spam («uova e Spam, uova pancetta e Spam, salsicce e Spam»
e così via) si contrappone alla riluttanza del cliente per questo alimento, il tutto in un crescendo di un coro
inneggiante allo Spam da parte di alcuni Vichinghi seduti nel locale.
Alcune aziende, a torto, ritengono utili queste attività di promozione, senza comprendere che, in realtà queste
infastidiscono l’utente, rendendo molto remota la possibilità che abbia successivamente a che fare con l’azienda in
questione.
Rientrano nella categoria “spam”: messaggi privati a sfondo commerciale (Direct Message nei social network), tag su
foto promozionali a cui l’utente non è interessato, mail pubblicitarie inviate senza il consenso esplicito del
destinatario.
Una curiosità: si ritiene che il primo messaggio di spam inviato via email della storia sia stato inviato il 1 maggio
1978 dalla DEC per pubblicizzare un nuovo prodotto a tutti i destinatari ARPAnet della costa ovest degli Stati Uniti.
Decisamente datato, non credete?
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
2) Pillole di SPAM e Referrer Spam
I
C
T
2
Esempi SPAM:
Imprese sconosciute vi hanno inviato messaggi SMS, telefax o e-mail che vantano prodotti o servizi?
Una sconosciuta vi dichiara il suo amore per SMS e vi prega di richiamarla su un numero 090x.
Sconosciuti vorrebbero trasferire capitali fuori dal Paese con l'ausilio dei dati d'accesso al vostro conto in banca?
Un messaggio firmato attribuito falsamente alla vostra banca vi chiede la vostra parola chiave o il vostro numero di
conto (questa pratica fraudolenta viene anche chiamata phishing).
In italia lo spamming è vietato dal Codice Privacy e dal d.lgs. 9 aprile 2003, n.70. Questo vale per tutti i mezzi di
telecomunicazione, ossia e-mail, fax, SMS e telefono (dispositivi automatici di chiamata).
Conseguenze nefaste dello spamming:
• Satura le caselle postali o le memorie dei cellulari degli utenti privati.
• La cernita dei messaggi "buoni" è faticosa e richiede molto tempo.
• Il contenuto dei messaggi costituisce spesso un intervento indesiderato 

nella sfera privata e le offerte erotiche mettono in pericolo soprattutto i giovani.
• Sovraccarica l'infrastruttura di rete (ad es. mail server dei provider).
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
2) Pillole di SPAM e Referrer Spam
I
C
T
2
Il REFERRER SPAM:
è un fenomeno di recente sviluppo in forma massiva che genera un fenomeno definito come “negative seo”, ossia
una serie di tecniche non corrette che vengono utilizzate per falsare, manipolare oppure danneggiare il
posizionamento e la reputation di un sito web nel mondo del www.
Il Referrer Spam ha origine per mezzo di crawler o più comunemente definiti come spam bot; in altre parole sono dei
sistemi software che in maniera automatica scandagliano il web e quindi i domini che lo compongono generando
delle visite fantasma e in alcuni casi hanno anche funzione di “vulnerability dectection”, ossia la ricerca e
l’individuazione di vulnerabilità presenti dei siti web, al fine di inoculare codice malevolo per la diffusione di malware
etc…
Cos’è il Referrer Spam?

La parola dice tutto riferendosi appunto a spam, a visitatori fantasma che non sono altro che indirizzi web (Es.
semalt.com) che spesso fanno ad un altro sito etc.… Gli spambot spesso falsano il loro User-agent in modo tale da
non essere riconosciuti come script ma risultare come utenti che stanno visitando il sito eludendo così il codice di
Analytics e facendo registrare la “visita”.

Il problema della finta visita sta nell’incremento dei valori nei sistemi di monitoraggio come Piwk e Google Analytics,
che registreranno l’azione come se realmente compiuta da un umano.
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
2) Pillole di SPAM e Referrer Spam
I
C
T
2
Individuare i Referrer Spam:
Accedendo al vostro strumento di analisi dei dati web, Google Analytics oppure Piwik potrete facilmente verificare
se il numero delle visite al vostro bel sito è tutto frutto di un buon lavoro oppure se vi sono dei siti che linkano al
vostro sito oppure l’origine geografica degli utenti proviene da un continente in cui il vostro sito web non
apparirebbe in nessun criterio di ricerca.
I punti cardine sui quali eseguire un’ispezione preventiva sulla presenza di spam sono i seguenti:

• Valori sulla frequenza di rimbalzo: la percentuale di visite verso una pagina singola ossia la pagina in cui un
utente accede al vostro sito e allo stesso modo lo abbandona, questo valore è solitamente del 100%
• I valori sul rapporto pagina/sessione: il numero medio di pagine che un utente visualizza durante una sessione,
in questo caso il valore sarà 1,00
• Durata sessione media: rappresenta il valore di tempo in cui un utente permane nel vostro sito web prima che
esca dal vostro dominio. Questo valore solitamente è tendente allo 0 o addirittura di 00:00:00 ma negli ultimi
giorni i signori spam stanno manipolando questo valore creando delle permanenze fantasma con valori
addirittura di svariati minuti.
• I nomi a dominio nei Referral: nella lista dei referral troverete sicuramente l’elenco dei domini che appunto fanno
riferimento al vostro sito web, quindi una base dalla quale un’utente è rimbalzato verso il vostro dominio, solo che
anche in questo caso potreste scovare dei nomi a dominio che potrebbero regalarvi un po’ di stupore come ad
esempio: i love Italy, Darodar, Cenoval, Semalt, free-social-buttons, youporn-forum, theguardlan, trafficmonetize etc…
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
2) Pillole di SPAM e Referrer Spam
I
C
T
2
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
2) Pillole di SPAM e Referrer Spam
I Referrer Spam
E’ possibile visualizzare un
pallido elenco di indirizzi
appartenenti alla classe
Spam che, come detto
precedentemente, non
s e m p r e h a n n o u n a
permanenza di 00:00:00 ma
come visibile alla riga 6
a b b i a m o u n a fi n t a
permanenza di 00:07:47.
Questo altalenante flusso di
valori non è controllabile in
modo definitivo poiché i
d o m i n i m u t a n o c o n
frequenze elevate ma
p o s s i a m o i m p a r a r e a
contrastare il fenomeno e
riottenere delle statistiche
utili alla loro stessa natura.
I
C
T
2
Individuare i Referrer Spam:
Il modo migliore per bloccare i Referrer Spam nell'accesso al tuo sito è utilizzare un file denominato ".htaccess" da
collocarsi nella directory principale del proprio dominio se non presente, oppure integrare quello esistente con il
codice sotto.
Il metodo è consigliato poiché il server che ospita il vostro sito web respingerà automaticamente gli spambot senza
che vi sia elaborazione alcuna, è noto che i file .htaccess dispongano di privilegi in grado di anteporsi ai normali file
presenti sul FTP. Il secondo motivo per cui è preferibile questa soluzione è semplice e propedeutico al primo punto,
in quanto se non avremo visite in ingresso, non avremo statistiche falsate negli strumenti di analisi.
È possibile copiare e incollare il seguente codice nel file .htaccess , supponendo che si disponga di un server
Apache. Se si vuole essere creativi , è possibile reindirizzare il traffico al loro sito .
# Bloccare i Referrer Spam di origine Russa (Le righe con # sono un commento nel codice)
RewriteEngine on
RewriteCond %{HTTP_REFERER} ^http://.*ilovevitaly.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*ilovevitaly..ru/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*ilovevitaly.org/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*ilovevitaly.info/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*iloveitaly.ru/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*econom.co/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*savetubevideo.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*kambasoft.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*buttons-for-website.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*semalt.com/ [NC,OR]
RewriteCond %{HTTP_REFERER} ^http://.*darodar.com/ [NC]
RewriteRule ^(.*)$ – [F,L]
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
3) Soluzione con impiego di un file .htaccess
NB: il codice sopra è solo un esempio e potete completarlo con tutti gli indirizzi visibili nei vostri sistemi di analisi seguendone la sintassi.
I
C
T
2
Attenzione:
gli .htaccess sono file molto potenti, che determinano come il server si deve comportare quando interpellato. Se si
carica un file .htaccess con codice errato, sarà molto probabile che il vostro sito non funzionerà a dovere. Prima di
caricare il vostro .htaccess oppure apportare modifiche ad un file pre-esistente, vi suggeriamo di eseguire una copia
di backup del file originale . Se questa soluzione non è alla portata delle vostre competenze tecniche o avete dei
dubbi potete utilizzare la procedura seguente o richiedere consulenza su impresattiva.it oppure su e2ict.it
Di seguito due appendici addizionali per la gestione del referrer spam utilizzando codice per Ngix oppure per PhP
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
3) Soluzione con impiego di un file .htaccess
if ($http_referer ~* (semalt.semalt.com) ) {
return 405;
}
# en bloquer plusieurs d'un coup :
if ($http_referer ~* (spammer1|spammer2|spammer3) )
{
return 405;
}
$spammers = ['semalt.semalt.com', 'spammer2',
'spammer3'];
if (isset($_SERVER['HTTP_REFERER']) && !
empty($_SERVER['HTTP_REFERER'])) {
$ref = $_SERVER['HTTP_REFERER'];
foreach($spammers as $spammer) {
if (strpos($ref, $spammer) !== false) {
header("HTTP/1.0 405 Method Not
Allowed");
die();
}
}
}
Esempio Codice Ngix Esempio Codice PHP
I
C
T
2
Ripulire i risultati in Google Analytics:
Questo metodo risulta abbastanza intelligente ed efficace per bypassare il costante aggiornamento delle blacklist
con metodi precedentemente esposti agendo direttamente sullo strumento di casa Google mediante l’attivazione di
filtri che con l’ausilio delle regular expression attiveranno una pulizia nei nostri risultati di analisi.
E’ giusto considerare che il presente metodo di fatto non esclude il reale flusso di spam verso il vostro sito, bensì lo
ignora semplicemente nei report statistici di Analytics.
Di seguito vedremo step by step come abilitare ed impostare i filtri su Google Analytics
• Nel pannello “Amministrazione” (in alto), andate alla sezione Vista (a destra) > Filtri.
• Creando un nuovo filtro potrete scegliere fra un tipo di filtro predefinito o personalizzato

(nella guida utilizziamo la personalizzata).
• Adesso, selezionate la casella “Escludi” e nel menù a tendina di “Campo Filtro” scegliete “Referral”;
• Nello spazio “Pattern Filtro” inserite i nomi dei vostri referrer spam, separati da una pipe (pipe = simbolo " | ").
• Salvare.
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
4) Soluzione con utilizzo dei Filtri in Google Analytics
NB: nei filtri di Analytics vi è un limite a 255 caratteri, se si terminano i caratteri a disposizione procedere con la reazione di ulteriori filtri.
I
C
T
2
Step 1: accedete al vostro profilo in Google Analytics e selezionate il vostro sito web;

successivamente cliccate sulla voce Amministrazione e poi su 



Vi ritroverete nella schermata come quella sotto
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
4) Soluzione con utilizzo dei Filtri in Google Analytics
I
C
T
2
Step 2: Selezionate il pulsante di
colore rosso denominato “nuovo
filtro”
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
4) Soluzione con utilizzo dei Filtri in Google Analytics
I
C
T
2
Step3: inserite le informazioni
seguendo l’esempio alla vostra
destra.



NOTE:

le espressioni nel campo Pattern
filtro possono essere inserite nel
seguente formato:
www.analyticsedge.com	
  	
  


OPPURE	
  


www.analyticsedge.com|help.analyticsedge.com	
  


OPPURE	
  


.*analyticsedge.com|.*buttons-­‐for-­‐
website.com|.*googleusercontent.com	
  


OPPURE	
  


analyticsedge.|semalt.
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
4) Soluzione con utilizzo dei Filtri in Google Analytics
NB: non inserire il carattere “ | ” come finale
I
C
T
2
Ripulire i risultati in Google Analytics:
E’ possibile creare infiniti filtri personalizzati, agendo anche sugli host oltre che ai referral, oppure creare viste
personalizzate così da poter avere i dati di cui necessitate.
Come detto precedentemente, questa soluzione non ha un effetto immediato e non vi è la possibilità di rimuovere i
dati storici in Google Analytics.
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
4) Soluzione con utilizzo dei Filtri in Google Analytics
NB: nei filtri di Analytics vi è un limite a 255 caratteri, se si terminano i caratteri a disposizione procedere con la reazione di ulteriori filtri.
I
C
T
2
Ripulire i risultati in Piwik:
Vista la disponibilità nell’accedere al codice sorgente del sistema di monitoraggio, l’applicazione risulta molto più
rapida rispetto agli step da seguire con lo strumento di casa Google.
Per implementare la lista degli indirizzi di spam la soluzione è molto semplice
Nella folder di Piwik troverete il file global.ini.php, che contiene tutte le informazioni di default e può essere
sovrascritto nel tempo, quindi non inserite le informazioni in questo file.
La giusta scelta è modificareil file denominato config.ini.php.
Al suo interno sotto la sezione chiamata [Tracker] è possibile aggiungere i referrer spam seguendo la sintassi
nell’esempio sotto:
[Tracker]	
  
referrer_urls_spam	
  =	
  "semalt.com,savetubevideo.com,kambasoft.com"	
  
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
5) Soluzione con implementazione di regole in Piwik
I
C
T
2
La presente guida è stata redatta al fine di agevolare quanti quotidianamente devono impiegare un maggior
quantitativo di tempo per ricavare dei dati statistici sui siti web.
GUIDA how to:
STOP SPAM IN GOOGLE ANALYTICS
www.e2ict.it
LINK utili:
1) Blog Piwik, articolo Stop Referrer Spam

http://piwik.org/blog/2015/05/stopping-referrer-spam/

2) Progetto su GitHub per recuperare una lista sempre aggiornata di referrer spam

https://github.com/piwik/referrer-spam-blacklist/blob/master/spammers.txt

Share your know© 2015 e2ict.it
I
C
T
2
Grazie!
www.e2ict.it
Share your know
Lo trovi su:

More Related Content

PPT
Il tuo sito? Il mio spam relay!
PPTX
Instagram per valorizzare la città, i prodotti e le aziende #StanzoniDigitali
PDF
Privacy e social network: il bug di facebook che apre le porte agli spioni
PPT
Internet e sicurezza
PPT
4 Cose Che Non Sai Di Google Analytics
PDF
Google Analytics - creazione di Viste/Profili e Filtri
PDF
Google Analytics - Segmenti personalizzati
PDF
Google Analytics 2014 updated
Il tuo sito? Il mio spam relay!
Instagram per valorizzare la città, i prodotti e le aziende #StanzoniDigitali
Privacy e social network: il bug di facebook che apre le porte agli spioni
Internet e sicurezza
4 Cose Che Non Sai Di Google Analytics
Google Analytics - creazione di Viste/Profili e Filtri
Google Analytics - Segmenti personalizzati
Google Analytics 2014 updated

Viewers also liked (15)

PDF
Corso Google Analytics - Introduzione e teoria di analytics
PPTX
Corso di Google Analytics - Livello Intermedio
PDF
Google Analytics - i primi passi
PDF
Audience Profiling con Google Analytics
PDF
Creare Obiettivi con Google Analytics
PPTX
Restyling Sito: Cosa Monitorare su Google Analytics
PPT
Google Analytics per esperti
PDF
Web-content-optimization-google-analytics
PDF
Web Analytics - WHR 2012 - Guida pratica Google Analytics
PDF
Google Analytics- Cos'è e come funziona?
PDF
Corso di Google Analytics base - Marketing freaks
PPT
Google Analytics ABC
PPT
Google Analytics 2013
PPTX
Google Analytics Ppt Final
PDF
Google analytics
Corso Google Analytics - Introduzione e teoria di analytics
Corso di Google Analytics - Livello Intermedio
Google Analytics - i primi passi
Audience Profiling con Google Analytics
Creare Obiettivi con Google Analytics
Restyling Sito: Cosa Monitorare su Google Analytics
Google Analytics per esperti
Web-content-optimization-google-analytics
Web Analytics - WHR 2012 - Guida pratica Google Analytics
Google Analytics- Cos'è e come funziona?
Corso di Google Analytics base - Marketing freaks
Google Analytics ABC
Google Analytics 2013
Google Analytics Ppt Final
Google analytics
Ad

Similar to Stop Spam in google analytics report (20)

PDF
Salvo
PPT
Lezione 9 strumenti SEM: Affiliate marketing, Google e Facebook
PPTX
Web marketing - parte 3
PDF
Rendere visibile la nostra azienda sul Web. Local search, google my business,...
PPTX
Google Analytics - intruduzione
PPT
Come essere trovati sui motori di ricerca. Prima edizione
PDF
SEO (Search Engine Optimization) Indicizzazione nei motori di ricerca
PPT
Iab Forum 2007 - Web Analytics 2.0
PDF
Promuovere il proprio business on-line
PPTX
Rilanciare il business attraverso il web - II appuntamento - MC
PPTX
Introduzione Alla Web Analytics
PPTX
Introduzione Alla Web Analytics
PPTX
Lezione2 Analytics, google analytics
PPTX
Lezione8 seo-confartigianato
PDF
SEO con Lungimiranza - VI Convegno GT 2011
PPTX
Come fare SEO nel 2014
PDF
Seo e Web Marketing - 1 | WebMaster & WebDesigner
PDF
IISS "Andrea Fantoni" di Clusone | Il mio lavoro sul web
PDF
Galdus WR 2014 lezione 1
PDF
Cali imprevisti di traffico, di posizionamento e di conversioni: è sempre col...
Salvo
Lezione 9 strumenti SEM: Affiliate marketing, Google e Facebook
Web marketing - parte 3
Rendere visibile la nostra azienda sul Web. Local search, google my business,...
Google Analytics - intruduzione
Come essere trovati sui motori di ricerca. Prima edizione
SEO (Search Engine Optimization) Indicizzazione nei motori di ricerca
Iab Forum 2007 - Web Analytics 2.0
Promuovere il proprio business on-line
Rilanciare il business attraverso il web - II appuntamento - MC
Introduzione Alla Web Analytics
Introduzione Alla Web Analytics
Lezione2 Analytics, google analytics
Lezione8 seo-confartigianato
SEO con Lungimiranza - VI Convegno GT 2011
Come fare SEO nel 2014
Seo e Web Marketing - 1 | WebMaster & WebDesigner
IISS "Andrea Fantoni" di Clusone | Il mio lavoro sul web
Galdus WR 2014 lezione 1
Cali imprevisti di traffico, di posizionamento e di conversioni: è sempre col...
Ad

Stop Spam in google analytics report

  • 1. I C T 2 Condividiamo la conoscenza www.e2ict.it Lo trovi su: GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS
  • 2. I C T 2 In questa guida spieghiamo come gestire un recente fenomeno legato a degli SPAMBOT nei risultati statistici dei Referrer su sistemi di monitoraggio come Piwik o Google Analytics. Questo nuovo tipo di spam provoca un falso valore totale delle visite sul vostro sito web oppure dei valori di permanenza sulle pagine, rendendo di fatto non completamente affidabili i valori totali. GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it INDICE: 1) Panoramica su Piwik e Google Analytics 2) Pillole di SPAM e Referrer Spam 3) Soluzione con impiego di un file .htaccess 4) Soluzione con utilizzo dei Filtri in Google Analytics
 5) Soluzione con implementazione di regole in Piwik Share your know
  • 3. I C T 2 Piwik, è un'applicazione Open Source sviluppata in PHP e MySQL che implementa un sistema di analisi e monitoraggio per le statistiche delle pagine web,rivelandosi un'ottima alternativa al più noto strumento di casa Google. Alcuni dei dati che Piwik è in grado di visualizzare in real time, sono: - il numero dei visitatori in un certo periodo (ora, giorno, settimana, mese o anno); - la frequenza dei visitatori (nuovi utenti e visitatori abituali); - le pagine d’entrata e quelle trascurate; - la ripartizione geografica degli utenti presentata su una mappa del mondo interattiva; - la configurazione tecnica dei visitatori (sistema operativo, browser, risoluzione dello schermo, ecc.); - l'origine del traffico (motori di ricerca, accesso diretto, siti web di riferimento, newsletter); - la durata della visita, le pagine visitate, le parole chiave, ecc. L'installazione di Piwik è piuttosto semplice: basta caricare i file sul server utilizzando un client FTP e completare la procedura guidata del programma. Sulle pagine del sito che si vuole monitorare, è necessario inserire il codice javascript che si occuperà di registrare le varie misurazioni statistiche. Maggiori informazioni sul sito web ufficiale di Piwik: http://piwik.org GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it 1) Panoramica su Piwik e Google Analytics
  • 4. I C T 2 Google Analytics è un servizio di Web analytics gratuito di Google che consente di analizzare delle dettagliate statistiche sui visitatori di un sito web. Recentemente Google ha potenziato il suo strumento di analisi mediante Google Universal Analytics che offre tutta la potenza e la semplicità di Google Analytics aggiungendoci nuove funzioni. Universal Analytics è caratterizzato da 3 colonne portanti: 
 La reportistica per il web: questa funzione, migliorata aggiunge nuove funzioni e
 la possibilità di avere dimensioni e metriche personalizzate. SDK per smartphone: La versione 3 delle SDK per Apple iOS e Google Android
 hanno portato in dote la compatibilità con Universal Analytics. Il Measurement protocol: questa è la vera novità di Universal Analytics. Google Analytics può essere implementato esclusivamente sulle piattaforme che Google supporta (web, iOS ed Android) measurement protocol elimina questo limite rendendo disponibile un protocollo che permette attraverso chiamate HTTP di inviare dati ai server di Google da qualunque supporto si desidera, l’unico limite è la vostra fantasia. Measurement protocol è stato utilizzato per misurare l’utilizzo della macchina per caffè e per “misurare” il ballo. Altro elemento importante di Universal Analytics è il tracciamento multidevice: impostando manualmente l’id dell’utente nel cookie di Universal Analytics è possibile capire come gli utenti del nostro sito interagiscono usando diversi device sul nostro sito: ad esempio potremo analizzare se leggono le nostre newsletter sullo smartphone, ma poi acquistano attraverso un tablet od un computer desktop. GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it 1) Panoramica su Piwik e Google Analytics
  • 5. I C T 2 Lo spamming, detto anche fare SPAM o spammare, è l’invio di messaggi indesiderati. Spam è proprio una comunicazione commerciale non desiderata dall’utente. Questa comunicazione avviene soprattutto tramite mail, ma anche tramite social media , forum e chat. L’unica questione divertente che riguarda questo tema è da dove ha origine il termine. Il termine trae origine da uno sketch comico del Monty Python’s Flying Circus ambientato in un locale nel quale ogni pietanza proposta dalla cameriera era a base di Spam, cioè un tipo di carne in scatola diffuso all’epoca. Man mano che lo sketch avanza, l’insistenza della cameriera nel proporre piatti a base di Spam («uova e Spam, uova pancetta e Spam, salsicce e Spam» e così via) si contrappone alla riluttanza del cliente per questo alimento, il tutto in un crescendo di un coro inneggiante allo Spam da parte di alcuni Vichinghi seduti nel locale. Alcune aziende, a torto, ritengono utili queste attività di promozione, senza comprendere che, in realtà queste infastidiscono l’utente, rendendo molto remota la possibilità che abbia successivamente a che fare con l’azienda in questione. Rientrano nella categoria “spam”: messaggi privati a sfondo commerciale (Direct Message nei social network), tag su foto promozionali a cui l’utente non è interessato, mail pubblicitarie inviate senza il consenso esplicito del destinatario. Una curiosità: si ritiene che il primo messaggio di spam inviato via email della storia sia stato inviato il 1 maggio 1978 dalla DEC per pubblicizzare un nuovo prodotto a tutti i destinatari ARPAnet della costa ovest degli Stati Uniti. Decisamente datato, non credete? GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it 2) Pillole di SPAM e Referrer Spam
  • 6. I C T 2 Esempi SPAM: Imprese sconosciute vi hanno inviato messaggi SMS, telefax o e-mail che vantano prodotti o servizi? Una sconosciuta vi dichiara il suo amore per SMS e vi prega di richiamarla su un numero 090x. Sconosciuti vorrebbero trasferire capitali fuori dal Paese con l'ausilio dei dati d'accesso al vostro conto in banca? Un messaggio firmato attribuito falsamente alla vostra banca vi chiede la vostra parola chiave o il vostro numero di conto (questa pratica fraudolenta viene anche chiamata phishing). In italia lo spamming è vietato dal Codice Privacy e dal d.lgs. 9 aprile 2003, n.70. Questo vale per tutti i mezzi di telecomunicazione, ossia e-mail, fax, SMS e telefono (dispositivi automatici di chiamata). Conseguenze nefaste dello spamming: • Satura le caselle postali o le memorie dei cellulari degli utenti privati. • La cernita dei messaggi "buoni" è faticosa e richiede molto tempo. • Il contenuto dei messaggi costituisce spesso un intervento indesiderato 
 nella sfera privata e le offerte erotiche mettono in pericolo soprattutto i giovani. • Sovraccarica l'infrastruttura di rete (ad es. mail server dei provider). GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it 2) Pillole di SPAM e Referrer Spam
  • 7. I C T 2 Il REFERRER SPAM: è un fenomeno di recente sviluppo in forma massiva che genera un fenomeno definito come “negative seo”, ossia una serie di tecniche non corrette che vengono utilizzate per falsare, manipolare oppure danneggiare il posizionamento e la reputation di un sito web nel mondo del www. Il Referrer Spam ha origine per mezzo di crawler o più comunemente definiti come spam bot; in altre parole sono dei sistemi software che in maniera automatica scandagliano il web e quindi i domini che lo compongono generando delle visite fantasma e in alcuni casi hanno anche funzione di “vulnerability dectection”, ossia la ricerca e l’individuazione di vulnerabilità presenti dei siti web, al fine di inoculare codice malevolo per la diffusione di malware etc… Cos’è il Referrer Spam?
 La parola dice tutto riferendosi appunto a spam, a visitatori fantasma che non sono altro che indirizzi web (Es. semalt.com) che spesso fanno ad un altro sito etc.… Gli spambot spesso falsano il loro User-agent in modo tale da non essere riconosciuti come script ma risultare come utenti che stanno visitando il sito eludendo così il codice di Analytics e facendo registrare la “visita”.
 Il problema della finta visita sta nell’incremento dei valori nei sistemi di monitoraggio come Piwk e Google Analytics, che registreranno l’azione come se realmente compiuta da un umano. GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it 2) Pillole di SPAM e Referrer Spam
  • 8. I C T 2 Individuare i Referrer Spam: Accedendo al vostro strumento di analisi dei dati web, Google Analytics oppure Piwik potrete facilmente verificare se il numero delle visite al vostro bel sito è tutto frutto di un buon lavoro oppure se vi sono dei siti che linkano al vostro sito oppure l’origine geografica degli utenti proviene da un continente in cui il vostro sito web non apparirebbe in nessun criterio di ricerca. I punti cardine sui quali eseguire un’ispezione preventiva sulla presenza di spam sono i seguenti:
 • Valori sulla frequenza di rimbalzo: la percentuale di visite verso una pagina singola ossia la pagina in cui un utente accede al vostro sito e allo stesso modo lo abbandona, questo valore è solitamente del 100% • I valori sul rapporto pagina/sessione: il numero medio di pagine che un utente visualizza durante una sessione, in questo caso il valore sarà 1,00 • Durata sessione media: rappresenta il valore di tempo in cui un utente permane nel vostro sito web prima che esca dal vostro dominio. Questo valore solitamente è tendente allo 0 o addirittura di 00:00:00 ma negli ultimi giorni i signori spam stanno manipolando questo valore creando delle permanenze fantasma con valori addirittura di svariati minuti. • I nomi a dominio nei Referral: nella lista dei referral troverete sicuramente l’elenco dei domini che appunto fanno riferimento al vostro sito web, quindi una base dalla quale un’utente è rimbalzato verso il vostro dominio, solo che anche in questo caso potreste scovare dei nomi a dominio che potrebbero regalarvi un po’ di stupore come ad esempio: i love Italy, Darodar, Cenoval, Semalt, free-social-buttons, youporn-forum, theguardlan, trafficmonetize etc… GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it 2) Pillole di SPAM e Referrer Spam
  • 9. I C T 2 GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it 2) Pillole di SPAM e Referrer Spam I Referrer Spam E’ possibile visualizzare un pallido elenco di indirizzi appartenenti alla classe Spam che, come detto precedentemente, non s e m p r e h a n n o u n a permanenza di 00:00:00 ma come visibile alla riga 6 a b b i a m o u n a fi n t a permanenza di 00:07:47. Questo altalenante flusso di valori non è controllabile in modo definitivo poiché i d o m i n i m u t a n o c o n frequenze elevate ma p o s s i a m o i m p a r a r e a contrastare il fenomeno e riottenere delle statistiche utili alla loro stessa natura.
  • 10. I C T 2 Individuare i Referrer Spam: Il modo migliore per bloccare i Referrer Spam nell'accesso al tuo sito è utilizzare un file denominato ".htaccess" da collocarsi nella directory principale del proprio dominio se non presente, oppure integrare quello esistente con il codice sotto. Il metodo è consigliato poiché il server che ospita il vostro sito web respingerà automaticamente gli spambot senza che vi sia elaborazione alcuna, è noto che i file .htaccess dispongano di privilegi in grado di anteporsi ai normali file presenti sul FTP. Il secondo motivo per cui è preferibile questa soluzione è semplice e propedeutico al primo punto, in quanto se non avremo visite in ingresso, non avremo statistiche falsate negli strumenti di analisi. È possibile copiare e incollare il seguente codice nel file .htaccess , supponendo che si disponga di un server Apache. Se si vuole essere creativi , è possibile reindirizzare il traffico al loro sito . # Bloccare i Referrer Spam di origine Russa (Le righe con # sono un commento nel codice) RewriteEngine on RewriteCond %{HTTP_REFERER} ^http://.*ilovevitaly.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*ilovevitaly..ru/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*ilovevitaly.org/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*ilovevitaly.info/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*iloveitaly.ru/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*econom.co/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*savetubevideo.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*kambasoft.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*buttons-for-website.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*semalt.com/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*darodar.com/ [NC] RewriteRule ^(.*)$ – [F,L] GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it 3) Soluzione con impiego di un file .htaccess NB: il codice sopra è solo un esempio e potete completarlo con tutti gli indirizzi visibili nei vostri sistemi di analisi seguendone la sintassi.
  • 11. I C T 2 Attenzione: gli .htaccess sono file molto potenti, che determinano come il server si deve comportare quando interpellato. Se si carica un file .htaccess con codice errato, sarà molto probabile che il vostro sito non funzionerà a dovere. Prima di caricare il vostro .htaccess oppure apportare modifiche ad un file pre-esistente, vi suggeriamo di eseguire una copia di backup del file originale . Se questa soluzione non è alla portata delle vostre competenze tecniche o avete dei dubbi potete utilizzare la procedura seguente o richiedere consulenza su impresattiva.it oppure su e2ict.it Di seguito due appendici addizionali per la gestione del referrer spam utilizzando codice per Ngix oppure per PhP GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it 3) Soluzione con impiego di un file .htaccess if ($http_referer ~* (semalt.semalt.com) ) { return 405; } # en bloquer plusieurs d'un coup : if ($http_referer ~* (spammer1|spammer2|spammer3) ) { return 405; } $spammers = ['semalt.semalt.com', 'spammer2', 'spammer3']; if (isset($_SERVER['HTTP_REFERER']) && ! empty($_SERVER['HTTP_REFERER'])) { $ref = $_SERVER['HTTP_REFERER']; foreach($spammers as $spammer) { if (strpos($ref, $spammer) !== false) { header("HTTP/1.0 405 Method Not Allowed"); die(); } } } Esempio Codice Ngix Esempio Codice PHP
  • 12. I C T 2 Ripulire i risultati in Google Analytics: Questo metodo risulta abbastanza intelligente ed efficace per bypassare il costante aggiornamento delle blacklist con metodi precedentemente esposti agendo direttamente sullo strumento di casa Google mediante l’attivazione di filtri che con l’ausilio delle regular expression attiveranno una pulizia nei nostri risultati di analisi. E’ giusto considerare che il presente metodo di fatto non esclude il reale flusso di spam verso il vostro sito, bensì lo ignora semplicemente nei report statistici di Analytics. Di seguito vedremo step by step come abilitare ed impostare i filtri su Google Analytics • Nel pannello “Amministrazione” (in alto), andate alla sezione Vista (a destra) > Filtri. • Creando un nuovo filtro potrete scegliere fra un tipo di filtro predefinito o personalizzato
 (nella guida utilizziamo la personalizzata). • Adesso, selezionate la casella “Escludi” e nel menù a tendina di “Campo Filtro” scegliete “Referral”; • Nello spazio “Pattern Filtro” inserite i nomi dei vostri referrer spam, separati da una pipe (pipe = simbolo " | "). • Salvare. GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it 4) Soluzione con utilizzo dei Filtri in Google Analytics NB: nei filtri di Analytics vi è un limite a 255 caratteri, se si terminano i caratteri a disposizione procedere con la reazione di ulteriori filtri.
  • 13. I C T 2 Step 1: accedete al vostro profilo in Google Analytics e selezionate il vostro sito web;
 successivamente cliccate sulla voce Amministrazione e poi su 
 
 Vi ritroverete nella schermata come quella sotto GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it 4) Soluzione con utilizzo dei Filtri in Google Analytics
  • 14. I C T 2 Step 2: Selezionate il pulsante di colore rosso denominato “nuovo filtro” GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it 4) Soluzione con utilizzo dei Filtri in Google Analytics
  • 15. I C T 2 Step3: inserite le informazioni seguendo l’esempio alla vostra destra.
 
 NOTE:
 le espressioni nel campo Pattern filtro possono essere inserite nel seguente formato: www.analyticsedge.com     
 OPPURE   
 www.analyticsedge.com|help.analyticsedge.com   
 OPPURE   
 .*analyticsedge.com|.*buttons-­‐for-­‐ website.com|.*googleusercontent.com   
 OPPURE   
 analyticsedge.|semalt. GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it 4) Soluzione con utilizzo dei Filtri in Google Analytics NB: non inserire il carattere “ | ” come finale
  • 16. I C T 2 Ripulire i risultati in Google Analytics: E’ possibile creare infiniti filtri personalizzati, agendo anche sugli host oltre che ai referral, oppure creare viste personalizzate così da poter avere i dati di cui necessitate. Come detto precedentemente, questa soluzione non ha un effetto immediato e non vi è la possibilità di rimuovere i dati storici in Google Analytics. GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it 4) Soluzione con utilizzo dei Filtri in Google Analytics NB: nei filtri di Analytics vi è un limite a 255 caratteri, se si terminano i caratteri a disposizione procedere con la reazione di ulteriori filtri.
  • 17. I C T 2 Ripulire i risultati in Piwik: Vista la disponibilità nell’accedere al codice sorgente del sistema di monitoraggio, l’applicazione risulta molto più rapida rispetto agli step da seguire con lo strumento di casa Google. Per implementare la lista degli indirizzi di spam la soluzione è molto semplice Nella folder di Piwik troverete il file global.ini.php, che contiene tutte le informazioni di default e può essere sovrascritto nel tempo, quindi non inserite le informazioni in questo file. La giusta scelta è modificareil file denominato config.ini.php. Al suo interno sotto la sezione chiamata [Tracker] è possibile aggiungere i referrer spam seguendo la sintassi nell’esempio sotto: [Tracker]   referrer_urls_spam  =  "semalt.com,savetubevideo.com,kambasoft.com"   GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it 5) Soluzione con implementazione di regole in Piwik
  • 18. I C T 2 La presente guida è stata redatta al fine di agevolare quanti quotidianamente devono impiegare un maggior quantitativo di tempo per ricavare dei dati statistici sui siti web. GUIDA how to: STOP SPAM IN GOOGLE ANALYTICS www.e2ict.it LINK utili: 1) Blog Piwik, articolo Stop Referrer Spam
 http://piwik.org/blog/2015/05/stopping-referrer-spam/
 2) Progetto su GitHub per recuperare una lista sempre aggiornata di referrer spam
 https://github.com/piwik/referrer-spam-blacklist/blob/master/spammers.txt
 Share your know© 2015 e2ict.it