Unormalt høy trafikk i Google Analytics?

I det siste året har vi i Make, og også en del av våre kunder, merket en markant økning i trafikken på nettsidene. Ved første øyekast så er jo dette gledelige nyheter, men hvis man tar en nærmere kikk, så ser man relativt fort av denne trafikken har noe robotaktig over seg. Hvordan ser man det? Se på lengden på sessions, fluktfrekvens og trafikkildene. Denne trafikken forstyrrer dataene og er noe vi ønsker å filtrere bort.

Så hvor kommer denne trafikken fra? Da kan jeg svare på spørsmålet ved å stille deg et spørsmål tilbake. Sender du ut nyhetsbrev? Hvis svaret er ja, så har du sannsynligvis samme utfordring som oss, og en del andre. Og det kan vi gjøre noe med…

Ok, hva har endret seg?

Den store forskjellen er at mange spamfiltre har implementert linksjekkere. Dvs at før e-posten eventuelt slipper igjennom filteret, så klikker roboten seg gjennom alle linkene i e-posten, på jakt etter destinasjoner med skadelige hensikter. Under skadelige hensikterfaller alt fra uønsket programvare til omdirigeringer og phishing forsøk. Sender du ut ukentlige e-poster til titusenvis eller flere hundre tusen mottakere, vil det generere en ikke ubetydelig mengde med trafikk. Denne trafikken er dog ikke reell, og vil bare lage forstyrrelser i statistikken.

Hvordan filtrerer jeg dette ut?

Siden du leser dette så tipper jeg du allerede har filtrert ut trafikk fra egen ip, både på jobb og hjemme. Det er jo en helt vanlig sak man foretar seg når GA kontoen settes opp. Vi skal nå egentlig gjøre akkurat det samme, men også se litt på en mer elegant måte å gjøre det på. Det betyr at vi igjen skal besøke vår nye bestevenn Regular Expressions. Hvis du ikke har fått med deg forrige besøk, kan du lese det her. Jeg skjønner at det kan være litt vondt å se på, men det er en helt klar logikk bak det hele.

Hvis du kun har én rapportvisning (view) så anbefaler jeg på det sterkeste at du oppretter et nytt. Filtreringen er ikke reverserbar 😵. Ha alltid et master view som inneholder all trafikk.

For å filtrere ut trafikken fra rapportvisningen kan du gjøre følgende:

  1. Gå til Administrator
  2. Velg riktig område
  3. Velg riktig rapportvisning eller definer en ny.
  4. Trykk på Filter > +Legg til Filter
  5. Gi filteret et navn, velg tilpasset, utelat filterfelt “ip-adresse”

Da gjenstår det kun å definere filtermønsteret. GA er fullt av små skjulte detaljer og dette feltet er intet unntak. Du har sikkert allerede gjettet det? Jo, det er et regex felt. Da er det bare å boote opp RegEx Pal og legge inn 54.70.53.60 52.34.76.65 54.71.187.124 i “Test string”-feltet slik:

No alt text provided for this image

Hvorfor akkurat disse ip-adressene? Dette er velkjente spamfilter-ip’er som du også bør filtrere bort. Siden dette ikke er en tutorial i regex, kan du bare lime inn 54\.70\.53\.60|52\.34\.76\.65|54\.71\.187\.124 i Regular Expressions feltet. Det som er viktig her er at alle ip-adressene omfattes av reglen som er definert. Hvis ip-adressen omfattes vil den bli markert med en blåfarge.

No alt text provided for this image

Da kan vi enten implementere det i GA, eller så kan vi se på mulige forbedringer. Det er forøvrig ikke noe i veien med å stoppe her, og bare bruke regelen vi nå har definert.

No alt text provided for this image

Så, hvordan kan dette gjøre mer elegant?

Jeg er glad du stilte nettopp det spørsmålet 😅. I mange tilfeller så vil trafikken komme fra en ip innenfor samme range. Det betyr egentlig at den siste delen av ip-adressen endrer seg, men requesten kommer fortsatt fra samme spamfilter. I stedet for å legge inn hver enkelt ip i rangen, dvs alle kombinasjoner fra 54.70.53.1 – 54.70.53.255, kan vi heller ekskludere hele eller deler av ip-rangen.

Så hvordan kan vi lage dette 👇 mer elegant?

54\.70\.53\.198|54\.70\.53\.60|54\.70\.53\.61|54\.70\.53\.122|54\.70\.53\.134|54\.70\.53\.1|54\.70\.53\.55|54\.70\.53\.56|54\.70\.53\.200|54\.70\.53\.233|54\.70\.53\.198

No alt text provided for this image

Jo, det får man til ved å modifisere regelen på følgende måte:

54\.70\.53\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)

No alt text provided for this image

Uttrykket (25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?) er et uttrykk for alle tall mellom 1 og 255. I stedet for å lage 255 «eller»-regler som symboliseres med «|», så legger vi til et utrykk som omfatter alle disse forskjellige kombinasjonene.

Her har vi en mye mer elegant løsning der alle ip-adressene omfattes av en kort og enkel regel. Alternativet er mye mindre fleksibelt og mye vanskeligere å lese.

⚠️ Pass på at du ikke ekskluderer for mye. Det er alltid en god ide å la en annen ta en titt før det eventuelt implementeres.

Interessert i å lære mer om Regular Expressions? Les mer om de her.

About the author

Related Posts