W rozbudowanych serwisach posiadających dużą ilość zaindeksowanych stron można napotkać problem z poprawnym zliczaniem statystyk. Statystyki te klasyfikowane są jako “inne” lub “other”. Przeglądając dla przykładu statystyki odsłon na serwisach, na których pracuję okazało się, że duża ich część (bo aż około 64%) zliczana jest jako odsłony “other” w GA. Wynika z tego, że dużo, bo ponad połowa odsłon nie jest poprawnie przydzielana do odpowiednich im kategorii.

Od razu zrodziło się pytanie co powoduje, że te statystyki nie są zliczanie poprawnie ? Mianowicie Google Analytics ograniczony jest dziennym limitem bazy danych. Każdy wpis w raporcie Analytics jest przechowywany w bazie danych o ustalonej wielkości. Po osiągnięciu tego limitu Google Analytics uwzględnia dodatkowe wpisy w pozycji “inne” lub “other”. Analytics nadal śledzi dane ale nie potrafi wyświetlić ich jako niepowtarzalnych pozycji, czyli nie klasyfikuje tych danych. Pełniejsze wyjaśnienie można znaleźć na stronie pomocy Google Analytics Dlaczego w raportach jest wyświetlanych tak wiele pozycji Inne. Trzymając się przykładu z odsłonami Mariusz Gąsiewski z google tłumacz, że
ograniczenie te tak naprawdę jest na wielkość tabeli w GA, a nie na adresy url, więc o tym, czy dan url się załapie powinna decydować wielkość jego wyświetleń. Wyjątkiem mogą być bardzo skomplikowane adresy, z którymi GA sobie nieraz nie radzi. W takich przypadkach dane dla takich adresów mogą być agregowane
Drugim pytaniem było jak wielkie są te ograniczenia ? Tu pomocne było forum a konkretnie temat “Lots of (other) in Content Drilldown“. Tutaj Andre Scholten pisze, że google oficjalnie śledzi tylko i aż 50 000 unikatowych “obiektów” na stronie. W tym przypadku chodzi mi oczywiście o np adresy url. Gdy przekroczymy tą ilość wówczas nasze dane będą wrzucone do woreczka “inne”.
W jaki sposób możemy polepszyć wiarygodność naszych statystyk ?
Wiele adresów url zawiera sesje, różnego rodzaju parametry (zmienne GET np ?a=b), które powodują, iż tworzy się niepotrzebnie mnóstwo adresów url pomimo, że chodzi nam o jedną stronę. Przykładem mogą być tu różnego rodzaju programy partnerskie, identyfikujące partnera po zmiennej GET np.: ?pp=nickname. Zapychamy sobie tym samym tę bazę google, która ma swój limit. Można te parametry w łatwy sposób usunąć wchodząc w ustawienia profilu i klikając edit w górnym prawym rogu. W polu wyklucz parametry zapytania do adresu URL wpisujemy te parametry, które nie chcemy, aby były zliczane przez Analytics jako odrębne strony url. Dzięki temu możemy poprawić nasze statystyki w Analytics.

Jeden wniosek jaki mi się tu nasuwa to, że Google Analytics dla wielkich serwisów może nie być wystarczającym narzędziem analitycznym. Dane, jak choćby liczba odsłon, są podstawą do chociażby wyceny reklam. Pytanie czy Google dla większych klientów zniesie ten limit czy może zrobi to dla wszystkich. W końcu w Gmail ilość Kb ciągle wzrasta
.