Rubriky
Blog o webové analytice

Souhrn Google analytics 4 / Google analytics web & apps beta

Komu je tento článek určen?

Specialisté online marketingu se zájmem o webovou analytiku a analytikům. Článek budu průběžně měnit, beru to jako takový přehled pro mě, urovnání v moji hlavě. Budu tam dávat i datumi, kdy co přibylo. Článek ještě neprošel korekcí, bude ještě ve vývoji.

Co jsou to Google analytics 4?

Je to moderní analytický nástroj od Google co spojuje analytiku pro mobilní aplikace s webovou analytikou a umožňuje s tím pracovat jako jedním celkem.

Tato analytika je založená na událostech. Tedy už Google z odesílání dat neřeší rozdíl mezi pageview, event, sociální interakcí, měřením času, či ecommerce. Vše je událost, která se stala konkrétnímu uživateli. V nástroji už nejsou napevno zakotveny pevné vazby mezi návštěvou / stránkou / událostí, proto už se data nerozpadají pokud nějaká část z těchto data chybí.

Z principu už tak moc nezáleží na návštěvě i když ta je stále měřena, i když je důležitý už jen její začátek. Více se analytika zaměřuje na jednotlivé událostí a uživatele. Což umožňuje s dívat po uživatelích i do historie, což předešlé verze Google analytics uměli velmi špatně.

Díky zrušení těchto vazeb v datech a i tomu, že se uživatelé jsou již dostat k plným datům, co se detailně změřili o každém uživateli a to bez omezení. To umožňuje na tyto data použít strojové učení a posunout analytiku na nový level.

Historie GA4

Základ je z Google analytics Firebase z 2016, což byl analytika pro mobilní aplikace. Na tom postavili verzi Google analytics web & apps Beta (2019), která umožňovala do toho napojit i  web a spojit je do jednoho. Velký hype se spuštěním Google analytics 4 reálně vzniklo přejmenování Google analytics web & apps a udělání velké aktualizace. Dost lidi je stále nazývá betou, protože i když je přejmenovali, spousty věci tam ještě není doděláno.

Proč číslovka 4 u Google analytics? Vysvětlila Krista Seiden:

https://www.linkedin.com/posts/kristaseiden_measure-googleanalytics-activity-6722219581764710400-aLUV
Myslí to Google s GA4 vážně?

Ano, tlačí je i když ještě nejsou plně hotové, aby co nejvíce urychlil jejich nástoj. A proto jsou nastavené jako defaultní typ. A pokud chcete klasické Google analytics, musíte si je povolit v rozšířeném nastavení.

Zdroj: GA4 admin > new property (2020-11-01)

Přejít teď hned na plně Google analytics 4?

Ne, shoda je v tom a to i na straně Google, že se má měřit paralelně. Cílem ani není tam získat dokonalé data, jako se začít učit pracovat novým style.

Zdroj https://www.youtube.com/watch?v=S708NFbvTXI

U super velkých webu se dokonce může záměrně samplovat, třeba to zkoušet na 1% uživatelů či třeba na 0.1% a testovat si nastavení a ladit to na omezeném vzorku dat a tím ušetřit.
Naopak pokud máte opravdu velký web, tak naopak může být velmi výhodné přejít na Google analytics 4, protože pak získáte v Google Big Query nesamplované data, jelikož klasické Universal analytics prostě tak moc samplují, že přestávají být použitelné. U super velkých webu se pak můžeme bavit i tom, že zatím(než ohlásí GA4 360)  GA4 zvládne počet hitů ve vyšší desítkách i stovkách miliónů hitů. Třeba hard limit UA360 byli 2 miliardy hitů.

Nový projekt

Doporučuji založit Universal analytics (Dále jen zkratkou „UA“) i GA4 a měřit vše paralelně než se neučíte Google analytics 4 dobře a budou mít všechny slibované funkce.

E-shop

Mám super jednoduchý eshop. Asi bych stále volil jako hlavní universal analytics, ale jde použít i GA4.
U velkých eshopů je problém, že zatím nejsou podporované custom parametry / dimenze / metriky u produktů. Takže tam jen testovat a čekat až to kromě podpory v odesílaní dat proteče i do Google big query (Dále jen „BQ“).

A aktuální stav(2020-11-02) ecommerce reportů je následující:

Základní report ecommerce report v GA4 nejde zaměřit na uživatele a vědět jeho „konverzní poměr“ jde čistě o produktovou na analytiku. Tohle je potřeba asi dělat přes data studio nebo jiné externí nástroje přes BQ.

GA > Monetization > Ecommerce purchases

V analytics hubu je to ještě horší, sice si tam člověk může postavit vlastní report, ale chybí mu tam metriky co jsou v základním GUI GA4.

Podle posledních zpráv z by měli do Google Data studio přibýt chybějící proměnné (2020-11-06)

GA > analytics hub > custom report. Chybí tam poměrové metriky. Kolik % dokončí nákup etc.

Aktuální stav ecommerce asi velké časti uživatelů stačit nebude. Lze to použít, ale pokud si nenaprogramujete vlastní reporting přes BQ, tak vám bude dost věci chybět a to není levné a už to vůbec není pro každého.

Obsahový web / informační web.

Není problém, je to změna, ale většinou nic nebrání pozvolnému přejití. Stále je ideální třeba rok dva měřit data paralelně a pak v jednu chvíli přejít na nové GA4 s již historií dat a staré UA zaříznout.

GA > Engagment > Pages and screens

Zde je v reportu vidět čas engagment time. Co je zajímavé, tak je tak opravdu velmi malý čas. Reálně vím, že lidi čtou obsah několikanásobně delší dobu. Ale zbytek vypadá uvěřitelně.

Projekt s webem i mobilní aplikací.

Zde je to jednoznačně ano, rovnou měřit vše do GA4. Jediné co je sporné, tak u webu si můžete měřit paralelně UA.

Google analytics mi nabídli migraci.

Co se stane, když budu migrovat? Nic, žádné data se nepřenesou, takže to nemá smysl. Prostě si založte další GA property a tam to nastavte.

O co jsem přišli?

Fráze „Všechno bude event base“ a proto jsme přišli o návštěvy!  Ne vůbec. Návštěvy tam stále jsou. To o co jsem přišli jsou konce návštěv a s tím související metriky jako je bounce a bounce rate. Ty byli nahrazené za metriky „Engagment rate“, „Engaged sessions“ nebo třeba „User stickiness“ etc. Jelikož metrika Bounce rate byla často docela sporná a někdy dost zavádějící, tak mi chybět vůbec nebude.
Reálně jsem přišli o spousty předpřipravených standardních reportů v GUI GA, ale spousty z nich lze vytvořit v náhradě custom reportingu.

Ten má data vždy 24hod zpět. Už obsahuje i gallerii předpřipravených reportů a i sdílení již hotových reportů, což vyřeší dost problémů. Jen bacha, že ještě je vše ve vývoji, takže ne všechny dimenze a metriky narazíte v GA4, tak ještě nejsou v tomto nástroj pro tvorbu reportů.

Už spustili i konektor do Google data studia, jen bacha pořád tam pořádně nejde filtrovat přes parametry etc., ale na základní věci to stačí.

Co jsme získali?

Napojení do Big query pro všechny. Co to znamená? Že jde mít přímo k tzv. RAW datům, tedy kompletním záznamům i s Id uživatele. Tedy jde najít každý analytický hit, které GA4 přijali.

Ukázka RAW dat z Google big query

Tohle napojení je zatím „zdarma“. Prakticky se jedná o freemium model, kdy pro malé weby, to je opravdu zdarma, ale pro větší s více nároky na data a složitější analytikou se po určité době dostanou projekty do stavu kdy opravdu budou muset platit. Nejvíce se zapotí ti, kdo plně využijí možností machine learningu. Pak bude nasledovat otázka, kolik mě stojí tento report měsíčně a jestli ho opravdu využijí a nebo ho smažu a ušetřím. Kromě klasického napojení po dnech tam je i realtime napojení do BQ, což umožní realtime doporučování obsahu. Což samozřejmě bude super a zároveň to nebude levné.

API

Kromě napojení na Google big query už tu máme API.. datové (veřejná beta), pro vytáhnutí dat napřímo. API na správu a nastavení samotných GA4 i když tam zatím moc možností není. A nově i realtime API (Aplha 2020-11-03). Nic v těchto API není pevně dané a mohou přijít ještě změny.

Vnitřní změny

Je tu nový transportní protokol Google analytics measurement procotol v2 , který umí spojovat více odesílaní dat do větších kusů. Což snižuje počet odesílaní dat a zavadí ještě další asynchronost odesílaní. Pro příklad, stránka se načte, ale pak trvá třeba 5sec než se odešlou data, protože se čeká na všech měření od startu stránky. Což může ovlivnit kvalitu dat. Díky tomu že samotné odesílaní už nemá dané typy jako „zobrazení stránky“ tak vše odesílano jako stejná událost a jen s jinými parametry. To umožňuje velkou flexibilitu nastavení, což je super, ale zároveň to dává velký tlak na to jak vše postavit. Musí už v tom být strategie a jasný vize jak to má vypadat. Což je výhoda pro specialisty co tomu rozumí a past na nováčky a proto věřím, že ještě dlouho bude spousta lidí preferovat staré Google universal analytics.

Jaké jsou další plány s GA4?

Zdroj: https://twitter.com/CardinalPath/status/1316419174281940996/photo/1

V blízké době by měl jít offline data import, který bude měnit live data. Atribuce a verze pro GA360.

Co mi zatím chybí?

  • Atribuce, ta by mělo přijít asi do konce roku.
  • Produktové dimenze a metriky.
  • GA 360 verze GA4, zde asi přijde omezení velikost exportu data u verze zdarma do BQ.
  • Propojení na search consoli.
  • Filtry měnící obsah.
  • Zatím Google sheet Google analytics addon neumí s GA4 pracovat.
  • Propojení s Google data studio není dokonalé, nejde tam ještě plně pracovat s parametry událostí.

Co mi chybělo a už to jde řešit?

Referral exclusion

V GTM nastavení GA4 configu použijeme parametr „page_referrer“ a přidáme hodnotu dle návodu od Sima a přidáme tam i svou doménu, protože to občas GA4 nedává. To samé můžete udělat i přes lookup tabulku s referral hostname či regex etc. , důležitá informace však je že referral se neruší přes js undefined, ale přes hodnotu js null.

Cross domain tracking

Jde nastavit v GA Admin GUI a jde to udělat i přes GTM, což je můj hack.

A to pak nastavíte v GA4 konfiguraci parametr „linker“. Tím jde nastavit cross domain měření i bez nastavení v GUI a tím třeba vyřešit to, když máte stovky klientských GA a nechcete to všude jim nastavovat a nebo je nutit je to nastavit. Je zde možnost i si hrát s proměnou „accept_incoming“ a tu dle potřeby zapínat a vypínat dle referralu, aby se přijímalo GA client ID jen od webu, které jsou opravdu vaše a ne od každého. Ale platí, že většině lidí bude stačit verze kdy to nastaví v GA adminu, toto je edge řešení, pro specifické případy.

Jako bonus přidávám info, že pokud máte na webu i starý nezabezpečený protokol HTTP, tak použitím parametru nastavení „cookie_flags“ a s hodnotou třeba „SameSite=None;Secure“ kompletně setřelíte analytiku GA4. Takže je potřeba tohle nastavení bloknout pro HTTP verzi a zapnout na HTTPS verzi.

Metody implementace

ID pro měření GA4, pak vypadá jako velké G s pomlčkou a sadou čísel a základních znaků abecedy, třeba „G-AB123AB12“.

Gtag

Základní implementace je pomoci Gtagu přímo do stránky. To je vhodně pro jednoduché implementace a platformy. V GA4 adminu GUI lze pak nastavit věci jako rozšířené eventy měření.

Zdroj více informací: https://support.google.com/analytics/answer/9216061?hl=cs Najdete v GA4 admin > property > Data streams > pick one (2020-11-01)

Jsou zde i další nastavení co lze nastavit přímo v GA adminu a rovnou se projeví u vás na webu. Reálně to funguje tak, že Gtag je prakticky ořezaná standardizované verze Google tag manageru a pokaždé když něco změníte v těchto nastaveních, tak se tahle minimální verze GTM aktualizuje. Pro měření e-shopu je potřeba implementovat nové měřící eventy. Viz dokumentace pro GA4 enhanced ecommerce.

Google tag manager

Implementace pomocí Google tag manageru. Zde se implementuje první GA4 config značka, která v základu měří i pageviews a pak se spouštění následovně měřené události. Známá chyba v GTM je u debugu, kdy je nutné poprvé GTM publikovat, tedy ideálně hned to prázdné po založení. Jinak se nedostanete do debug módu GTM, který je nový a dost zabugovaný. Od dneška (2020-11-03) by tam měla být znova funkce sdílení preview modů.

Z GA4 GUI se propíši nastavení značek jako je crossdomain tagging a není ho tedy potřeba nastavovat v GTM. Vybrané automatické události se načtou do GTM taky, není potřeba je nastavovat, pokud si je nechcete udělat samy.

Pro ecommerce existují skripty, co převedou GTM datalayer pro Universal analytics enhanced ecommerce na nový, co je potřeba pro GA4 ecommerce. Já jsem ze začátku využíval tento z jara od David Vallejo  a pak jsem si to napsal sám na míru.  Nově o tom napsal článek i Simo a udělal proto GTM template, co to převádí.

Klasické GTM + server side Google tag manager

Implementace přes vlastní endpoint na server side GTM. Implementace je prakticky stejná na straně webu, změní se jen místo kde se data odesílají a je nutné nastavit server side GTM. Jde tak obejít několik omezení, lze získat plnou anonymizaci IP adress, mít jen cookies prvních stran a nedávat moc dat navíc. Samozřejmě to není zadarmo. Platí se od objemu protečených analytický dat / spuštěné servery.

Measurement protocol v2

Implementace přes Measurement protocol V2, už existuje dokumentace, ale ještě není vše plně oficiální a mohou v něm být změny. Ale bezpečné už by to mělo být. Výhoda je, že stejně jako u GTM server side, jde použít tajný klíč, pro odesílání dat do GA a tak se kompletně odříznout od spamu.

GA4 vs AMP

Zatím nulová podpora, AMP nejde měřit přes Google analytics 4.

Koho sledovat?

Sledujete Krista Seiden, která Google analytics 4 / web & apps vytvořila https://www.kristaseiden.com/hello-to-google-analytics-4/
a plánuje o nich pak udělat kurz a ten by se mohl objevit zde : https://ksdigital-academy.thinkific.com/collections

Samozřejmě jinak jsou to klasicky jako mě na Twitteru nebo Simo Ahava.

Dokumentace

Základní dokumentace: https://developers.google.com/analytics/devguides/collection/ga4
GTM implementace: https://developers.google.com/tag-manager/ecommerce-ga4
Dokumentace, co často funguje a jde využít při nastavení GTM configu a není oficiálně pro GA4: https://developers.google.com/analytics/devguides/collection/gtagjs
Dokumentace k novému Google analytics measurement protokolu V2: https://developers.google.com/analytics/devguides/collection/protocol/ga4

Je na to už nějaký kurz?

Ne jen, jen promo kecy kurz od Google, kde se nic nedozvíte: https://skillshop.exceedlms.com/student/path/66729-discover-the-next-generation-of-google-analytics  V plánu je několik kurzů, ale zatím se čeká až se trochu ustálí novinky / funkce GA4.

Články o GA4, co se mi o tom líbí

Pohled na aktuální stav GA4: https://iihnordic.com/blog/google-analytics-4-are-you-ready-to-implement-it/
Průběžné aktualizovaný článek: https://www.bounteous.com/insights/2019/12/12/unified-data-google-analytics-4-properties/
Event base analytika: https://snowplowanalytics.com/blog/2020/01/24/re-thinking-the-structure-of-event-data/

(Update 2020-11-18)
Jak na migraci na Google analytics 4, od Ken Williams a Tim Willson:
https://ken-williams.com/guide/overview/3-tips-for-planning-your-migration-to-google-analytics-4/

Můj názor

Za mě to je jistě krok v před. Přepínat bude plošně třeba za rok až dva, následující roky budu sbírat data, abych pak měl historii. Je zde hodně potenciálu pro strojové učení i reporting na míru, což bude výzva. Začínal jsem na začátku měřit vše, ale pozvolna jsem v GA4 přešel na to měřit vždy opravdu jen to nejnutnější, ne všude potřebujete scroll etc. jen na obsahu co má smysl takto měřit atd.

Chcete vědět něco dalšího o GA4 a není to v článku? Napište mi osobní zprávu na FB.

.