📈 Instalátor filtrů proti referrer spamu v Google Analytics – Aktualizace 19.11.2016

Vypadají vaše Google Analytics takhle?

Nástroj pro automatickou tvorbu Spam filtrů do Google Analytics vám s tím pomůže.

Co udělá? Vytvoří (nebo pokud jste ho již aplikovali aktualizuje) filtry v Google Analytics, a ty odstraní referrer spam z budoucích měřených dat.

Poslední aktualizace 19.11.2016 , celkem 502 referrer spam domén.
Update „oživení“: Jelikož Google spam nevyřešil, obnovuji pravidelné měsíční aktualizace

Předělal jsem kompletně filtry včetně ručních úprav pro domény co jen pokračují řadách čísel a písmenkách. Protože vznikali kolize mezi názvy filtru dalších tvůrců spamfiltrů, rozhodl jsem se přejmenovat filtry na „MarekLecian_cz_Spam_filter_“. Staré filtry (sa_Spam_filter_)můžete nechat nebo je smazat na funkci to nemá vliv.

Použití

Stačí kliknout na modré tlačítko "Start" a přihlásit se.
A následovně si vybrat VÝBĚRY DAT (VIEWS) GA, na které spam filtry aplikovat.

Tohle je GA API 1

Dostali jste hlášku?
„Quota Error: You have exceeded the maximum number of writes/day for this project.“ ?
Nevadí, jen moc lidí (což mě těší) rádo používá tento nástroj a proto byl vyčerpán limit toho GA API,
přejděte prosím na Záložní api:API2 API3 API4 API5

Nejčastější otázky:

  1. Mohu filtry aktualizovat? Ano, stačí je použít znova, filtry se automaticky aktualizují.
  2. Opraví mi tento filtry historické data? Ne, protože je to filtr, takže působí od chvíle nasazení. Staré data se neopraví.
  3. Uvidím vaše data? Odpověď NE, protože se přihlašujete pomocí Google authorization a změnu provádí javascript s vašimi daty u vás a já vaše data nikdy vidět nemohu.
  4. Mohu tomu věřit? Ano je to nástroj od světové kapacity online marketingu Simo Ahava.
  5. Mohu se podívat na zdroják? Ano, můžete si to prohlédnout, jestli to je v pořádku. Ano je.
  6. Limit 500zápisů/den je vyčerpán, co mám dělat? Stavte se prosím další den a zkuste to znova.
  7. Mate tip na další spam domény? Stačí mi napsat.
  8. Chcete pomoci s analytikou vašeho webu? Stačí mě kontaktovat přes formulář napravo „napište mi“.

Podrobný návod aplikace filtrů:

1. Stačí kliknout na modré tlačítko „Start“ (To co je nad tímto návodem)
2. Přihlásit se.
3. Vybrat účet.
Návod antispam aplikace 1
4. Zvolit výběr dat , počet 1-n a potvrdit. Nejlépe mít výběru dat a více. Doporučuji zachovat jeden nefiltrovaný (best practice).
Návod antispam aplikace 2
5. Bude nasledovat info o průběhu instalace filtrů a informace, že je vše hotovo.

Co mě k tomu vedlo?
1. Jsem lenivý na 100+ GA účtech se mi nechce dělat takovou činnost ručně.
2. Když jsem to měl už hotové tak mi to bylo škoda mít jen pro sebe.
3. A proto jsem to nabídnul svým kamarádům a pak to pro velký zájem dal i veřejně :)
4. Tento nástroj dál Simo Ahava veřejně, aby i ostatní hostovali tento skvělý nástroj.
5. Bohužel Simo Ahava měl již plný denní limit 500 zápisů/den a proto jsem ho již nemohl použít.
6. A proto jsem ho začal hostovat u sebe.
7. Aktualizoval jsme seznam referrer spam domén nástroje (Poslední aktualizace 15.6.2015).
8. Přidal jsem lokalizaci do češtiny.
9. Prostě pokud se vám nechce se mi celý den aktualizovat filtry, mám pro vás řešení

 
Používání nástroje na na vlastní nebezpečí. Vždy v Google analytics mějte záložní nefiltrovaný profil.
 

 

Zadej svůj email a získej informace o aktualizacích Spam domén

Co budete dostávat? Vždy když já aktualizuji nástroj dostanete email.
A budete vědět, že si můžete aktualizovat GA filtry. Nic více, nic méně.


 

>>>Seznam referrer SPAM domén<<<

>>>Čištění historický dat v GA od referrer spamu<<<

 

  • Díky za tento nástroj, ušetřil mi spousty času, doporučuji dále…

  • Petra

    Quota Error: You have exceeded the maximum number of writes/day for this project. :(

    • mareklecian

      Vím o tom a snažím se tomu předejít. Díky oblíbenosti nástroje s tím občas bývá problém. Raději jsem první den informoval lidi přes e-mailing, další den twitter a poslední facebook a i tak se stane že narazím na stroj free GA api. Doručuji se stavit v nový den a zkusit to znova. Opakovaně prosím, aby agentury tento nástroj používali s rozumem a nebo mi napsali a já jím pomohu s nasazení interního klonu a nechali volné kapacity pro normální uživatele.

      • Petra

        Dobry den, dekuji mockrat za odpoved a ochotu. Omlouvam se, ze jsem tak stroze vlozila komentar, ale uz jsem nemela silu. Vyborny nastroj. Dekuji! Pekny den.

    • mareklecian

      Přidal jsem další 2 instance nástroje, doufám že to už už budu stačit.

  • Martin

    Skvělé to je!!!!

  • Jakub Hořák

    Marku, díky za nástroj. Jestli mohu zažádat, ale i doporučit, bylo by možné, až příště budete dělat aktualizaci SPAMU, přidat do segmentu (historická data), tak i do filtrů vyloučení přímé návštěvnosti, kde je jazyk návštěvy (not set)? V některých případech mám u menších webů i 40 % přímé návštěvnosti, kde je jazyk (not set) a bounce rate je ve většině případů 100 %, tudíž absolutně nerelevantní data, která přímou návštěvnost absolutně zkreslují. Nevím do jaké míry se to projevuje u vás, ale já to mám u většiny menších webů.

    Nastavení obojího je velmi snadné, tak mě napadlo, jestli to nejde vložit do vašeho API.
    Díky za feedback, Jakub

    • mareklecian

      Díky za velmi dobrý tip, třeba udělám i verzi segmentu s i bez jazyky v (not set).
      Již delší dobu to sleduji direct trafik a různé not set verze návštěvnosti jejichž kvalita se blíží nule, ale i přesto je nemohu s klidným srdcem filtrovat.Obecně s tím však mám problém, protože u spam domén mám jasno, že to je na 100% spam.
      U jazyku (not set) a dalšího takových návštěvností, to není dokonale jasné. Sám občas používám služby co skryjí mou identitu na internetu.
      V tento nástroj má sloužit k tomu, že pravidelně bude moci analytik aktualizovat spam filtry.
      Pokud udělám nástroj na takovou filtraci bude zvlášť a s velkým nápisem na vlastní nebezpečí.
      Nebělám si iluze, že lidé používají více jak jeden výběr dat (view), takže nemají zálohu a to je problém. Nejraději bych takové věci směřoval právě do pokročilých segmentů, kde si s tím mohu hrát opravdu lépe než u filtrů.

      • Já bych dokonce volil filtr, kde Hostname=(not set). Co jsem kouknul na pár webů (kde má být klasicky kód jen na stránce webu), tak Full referrer byl:
        – evidentně spamový NEBO
        – (direct) …což je IMHO taky robot

        Marku, jakou s tím máš zkušenost?

        • mareklecian

          Většinou si vystačím s jazyk (not set) a ono „Název hostitele“ (not set) je prakticky to samé z 98% je to robot.Tak se jde zbavit dost velké části direct spamu.
          Prakticky „Název hostitele“ však používám často pro odfiltrování develeperského trafiku.
          Problém 1 nastává však ve chvíli kdy u klienta využívám measurement protocol, pak je nutné správně nastavit aplikaci, aby nespadla do toho spamfiltru.
          Problém 2 nastává když zjistíš, že umíš vytvořit návštěvu s těmito parametry u sebe na PC. Z directu jsou to občas jen 1-2%, ale i tak se mi nelíbí házet do spamu lidi.

    • mareklecian

      Přiznávám se, že jsem moc direct trafik nikdy neřešil. Referrer spam mi otravoval reporting u linkbuildingu a jeho vyhodnocovaní. Organiku, reklamy a sociální sítě řeším zvlášť. Reálně s klienty řeším splnění cílů a navyšování zisků a tam mě direct co nemá konverze nezajímá, ano budu mít pak pěknější průměrná čísla návštěvníka :) celého webu . Dneska jsem si prošel čísla na cca 20 webech a musím potvrdit, že tvůj nápad s vyloučit jazyk (not set) se tam ukazuje jako velmi dobrý nápad, prakticky všude to je čistý spam. Ukázka dat z jednoho blogu, začalo to 17.3.2015. Docela dlouho jsem si typoval, že to budou přístupy z aplikací atd., ale podle kvality nejsou. Přiznávám se, že automatizaci si na to asi dělat nebudu, je to jednorázovka. Při prvním nastavení webu stejně filtrů dělám +-6, tak hold to bude o jeden více. Ale jistě to přidám do článku o filtrech co se pozvolna rýsuje.

      • Jakub Hořák

        Marku, tady jde spíše o interpretaci dat klientovi. Klient vidí jen to číslo u direct trafficu, ale absolutně si to nedá do kontextu s tím, co by ten direct traffic mohl být. On jen ví, že je to přímá návštěvnost, v lepším případě, že to lidé mají v oblíbených položkách nebo, že to lidé dají do adresní řádky. Ale zapomínají na roboty (ani nevědí, že existují), zapomínají na zdroje, které Google neumí identifikovat (Odkaz v e-mailu v Outlooku bez UTM parametrů) atd…Tohle je jen další díl skládačky.

        Každá data v Google Analytics jsou k ničemu, když k nim nemáš kontext.

        A když chce klient vyhodnocení televizní kampaně, do které narval 15 milionů, tak ho zajímá, jaký to mělo dopad v online prostředí a direct je součástí této analýzy, protože se sleduje trend. Když tam pak má nerelevantní data, tak si řekne…hezký, ono to funguje, ale pak se zjistí, že 20 % nárůstu je robot a 70 % je neoznačená newsletterová kampaň, která běžela ve spojení s televizí.

        Pro nás je toto přidaná hodnota, že to klientovi můžeme sdělit, můžeme mu to pomoci nastavit, vysvětlit a měřit trochu reálnější data.

        A na závěr. Vyhodnocuje se i ROI z direct trafficu a pokud budu mít 20 % trafficu zkreslených, budu mít horší ukazatele (bounce, konverzní poměr,…)

        • mareklecian

          Já vím, tak trochu je to boj, často se mi tyto čísla na velkých webech prostě ztratila ve velkém přirozeném direct trafiku. Teď to budu řešit více. Do teď jsem řešil spíše jiné spamy které měli větší prioritu(ddos atd.). On čistit direct trafik je docela mazec, jen ukázka co jsem našel na toto téma… . Velkou část takového trafiku však většinou odřízneme na firewallu serveru a do Analytics se už moc toho nedostane. A emailing mám prostě otagovaný.

  • Tomas Bartek

    Čau Marku, díky za super nástroj. Momentálně to zkouším na dvou našich zemích a budu to šířit dále.

  • David Řezáč

    Perfektní, moc díky za nástroj! :-) Článek sdílím dále v seznamu českých článků o Analytice :-) http://www.affilo.cz/clanek/zobrazit/26/

    • mareklecian

      Velké díky :) .
      Ještě tak den a budu slavit jubileum 2000 použití :) .

  • Tomáš Lípa

    Prošel jsem a vyzkoušel jsem mnoho řešení jak se zbavit refferer spamu a toto jsem vyhodnotil jako nejjednodušší a nejrychlejší způsob. Autorovi Markovi děkuji za super funkční nástroj a také jsem rád toto řešení zmínil ve svém článku na blogu zde http://www.servistl.cz/blog/zbavte-se-referrer-spamu-v-google-analytics/

  • Jana Rutrlová

    Zdravím, filtry mi to v pořádku stáhlo, ale v tu chvíli nevím proč zmizela veškerá data z analytics od začátku roku do 17.8. Nějaký nápad jak to s tím může souviset? Díky.

    • Vše zdárně vyřešeno.
      Problém byl jinde, data nezmizela, spamfiltr má stále čistý štít. :)

  • Petr Havel

    Zdravím, kdy můžeme očekávat aktualizaci filtrů v tomto dokonalém nástroji? Díky

    • Dobrý den, vzhledem k tomu, že google zapracoval a eliminoval spam v GA v základu, tak už neaktualizuji.

      • Petr Havel

        A kde se dá tato funkce v nastavení zapnout?

        Předem moc děkuji za info

        • Mělo byt to být zapnuté u každého profilu, ani to ani nejde vypnout. Kolik máte spamu měsičně? Pokud moc, tak udělám další aktualizace. Na svých webech a webech klientů to je v pohodě.

          • Petr Havel

            Spam stále máme, když porovnám nefiltrovaná a filtrovaná data (web neziskovky má měsíčně 800 návštěv a asi 100 z toho spam).
            V nastavení jsem však našel nezaškrtnutou volbu „Filtrování robotů: Vyloučí všechny požadavky na server od známých robotů nebo prohledávačů.“ – není to právě ta možnost filtrovat spam? Nebo je to něco jiného?

          • „vyloučí všechny požadavky na server od známých robotů nebo prohledávačů.“ není antispam. Google se snaží filtrovat spam na všech účtech a profilech automaticky, nejde to ani zapnout ani vypnout. V blízké době udělám raději ještě další aktualizaci, třeba vám to pomůže.

          • Petr Havel

            Děkuji

  • Ahoj Marku, díky za nástroj. Používám obdobný. Historicky mám u klienta zaspanovaný účet a je obtížné meziroční srovnání.
    Mám otázku. Řešil jsi odstranění Spamu přes Segmenty? Při tvorbě Segmentu přes filtry jsem narazil na omezení 20ti Podmínek (filtrů). Musel by jsi pak tvořit více segmentů https://uploads.disquscdn.com/images/29294fc1455c78f9932a1bf5d25079252a25fa7e631a6b64d27591d397abfafd.jpg

    • Vidí, že tady v diskusi jsou zajímavé typy, jak odfiltrovat Spam jinými způsoby přes Segmenty (lang not set, Název hostitele…). Díky za náměty.