Aktuální struktura z Google analytics:
Uživatel > Návštěvy > Zobrazení stránek > Události na stránce
Celé to začíná vytvářet čísla více a více vzdálená realitě. A proto jsem si udělal myšlenkové cvičení na téma, kterým z těchto metrik jako moc jde věřit.
Ono to historicky docela fungovalo než se na světě objevili mobilní aplikace, single page aplikace, PWA, služby. Další hřebíček do rakve jsou ITP/ETP a jiné verze ochrany soukromí uživatelů. Které křiví metriky na kterých staví spousty lidí analytiku a i přes triky, jak si držet GA cookie o kousek déle než je normál.
Co nám říká počet uživatelů v Google analytics (*nepřihlášených)?
To je počet prohlížečů s unikátní cookie… rozhodně to už není reálný unikátní uživatel. Zkoušel jsem děla analýzu kolik GA cookie je na reálného uživatele a je to u velké služby cca 2 cookie na měsíc. Ano, bavím se tu samozřejmě o spoustě lidí, co mají stálé dlouhodobé cookies, ale je hromada lidí, co se jsou schopni podívat na webu 10x za den a pokaždé mají jinou cookie. Dokonce jsou i takový speciální uživatelé, co prostě mažou cookie po každém jejím vytvoření. Ono je docela těžké takového uživatele na webu identifikovat a pracovat s ním jinak. Reálný počet uživatelů je násobně menší. Světlo do těchto vod přinášejí přihlášené uživatelé s povolenou analytikou, kde mě vlastně cookies nezajímají, protože znám jejich uživatelské ID. Pak jde říci, mám X přihlášených uživatelů a Y nekvalitních uživatelů, co si mohu +- podělit dvěma a dostanu se blíže k realitě.
Reálně se tento poměr mezi realitou a počtem cookies na uživatele bude čím dál více zvětšovat. Služby bez trvalého přihlášení prakticky budou pracovat na slepo a metrika počet uživatelů bude mít menší hodnotu z pohledu business klienta.
Jako další bonus jsou tu pak ještě stahovače obsahu webů, co zobrazí stránku jako by to byl reálný uživatel a tím uměle vytváří super nekvalitní návštěvnost / uživatele.
Dalším dopad je do moderního „data driven“ přístupu s hromadou strojového učení. „Garbage in, garbage out“ kdy pokud nejsem schopní držet identitu uživatele, tak nám do atribučních modelů vstupuje nepořádek na vstupu a výsledek tím pádem bude také nepouživatelný bordel. Obecně skoro celá atribuce půjde do háje, pokud uživatelé nebudou chtít být od prvního okamžiku měření. Protože to zlato v atribučních modelech je mít kompletní cestu uživatele s co nejméně chybami.
Samozřejmě to trochu přeháním stále jsou data docela použitelná, ale za mě je důležité se připravovat na nejhorší a pak může být jen analytik příjemně překvapen. Stále budou GA docela dobrý ukazatel trendů 😉 . Jistě se bude používat i Privacy sandbox API. Nevěřím, že přijdeme o všechny data, ale budeme se muset naučit pracovat s daty po kouskách, s těmi co jsou kvalitní i těmi, co jsou nasekané. Důležité bude poznat, které jsou které.
Google analytics návštěva
To není o moc lepší klasické Google analytics byli dobré, dokud webu fungoval na tom, že se načetla pokaždé nová stránka a moc se neměřilo. Pokud do toho paradigmatu přidáme SPA, PWA a mobilní aplikace etc. opět to začíná skřípat. Mám klienty, co mají služby. Výsledek je že se uživatel ráno přihlásí do systému a pracuje v něm s půlhodinovým přestávkami od rána do večera. Jak to vypadá z pohledu návštěvy? 13 návštěv za den? Každá návštěva začíná prokliknutím z existující stránky. Prakticky 80% návštěv je přímá návštěva, bez zdroje a media, klasicky nemá ani vstupní stránku, protože začíná měřeným kliknutím. Prakticky chování jako když si na mobilu otevřu mobilní aplikaci, vím že aplikace byla otevřena, ale až na vyjimky neznám důvod otevření. Už jsme začali nahrazovat návštěvy počtem uživatelů za den a začali u částečně až na akvizici nových klientů pozorovat návštěvnost, protože ve výsledku jsou důležité metriky samotné používaní webu/aplikace a ne jako ji uživatel spustil, zvláště když v ní pracuje 5 dní v týdnu od rána do večera. To, co mě vlastně zajímá je, jestli uživatel je nový, jaký je jeho status z pohledu business a kam ho chci dostat. Pak mě může zajímat odkud přišel ke mě, ale ne přerušená návštěva. Stačí mi event s externími zdroji, ale spíše mě zajímá uživatel, ale ani ten nestojí za nic, pokud se nepřihlásí. Co je sranda, že i když dělají single page aplikace různé problémy, tak tím že uživatel reálně nenačte znova stránku, jdou i dělat kouzla typu, označím si přerušené návštěvy na webu a ty pak mohou vyloučit či spojit při práci s atribučními modely.
Co ty slavné zobrazení stránek?
Už je mrtvé? Paradoxně si myslím, že právě klasické zobrazení stránek přežije nejdéle. Ano i ne. Tím, že se ještě výší bezpečnost a omezení na straně analytiky. Tak by to mohlo dopadnout, že bychom mohli uvažovat na „analytiku používání stránek“. Z user-centric analytiky se může vrátit na začátek, prakticky na analýzu server logů. Nevyužijeme žádné úložiště informace u daného uživatele. Tím zmizí jako klasické cookies/uživatelé, tak návštěvy. Už z pricipu, ve chvíli, kdy nefungovali návštěvy, tak už i metrika unikátní zobrazení stránky neplatí, protože má jednoduše vazbu na návštěvu.
Tím se dostane do místa kde budeme řešit tok uživatelů přes stránky, jak se dostal na návštěvník webu na tuto stránku a kam z této stránky šel. Takové separátní pohledy na věc, co nejsou slepené pomocí cookies. Tento krok by měl paradoxně vést ke zvýšení měření. Ve chvíli kdy se nemohu opírat o dlouhou návštěvu, tak pokaždé budu chtít dokonale vědět co člověk, který si zobrazil stránku dokonale viděl a co je důležité co následně udělal. Šel dal? Dal mi indicii, co bude jeho další krok?
Výsledný report bude pak vypadat asi takto:
- Vstupy, externí/interní,
- Co se odehrálo na stránce? Byli splněny cíle stránky?
- Výstupní akce.
Měření bez cookies a jiných úložišť je sice super drsné a nejspíše nás hned tak nečeká, ale zároveň věřím, že se některé firmy i velcí publišeři na něj překlopí, aby unikli problémům z bezpečností. Paradoxně to Google ani Facebooku vadit nebude, reklama bude stále fungovat, ale bude se měřit hůře. Sice horší měření nabourá kvalitu cílení reklam, ale i omezí i data pro inzerenty, kteří nebudou mít možnost moc věci kontrolovat a budou ještě více závislý na reklamní platformě.