Precisão estatística dos dados
O Metrica fornece vários números a respeito do funcionamento do seu site, em todos os aspectos possíveis, e esses números são todos calculados de forma precisa. Mas isso nem sempre é verdade no que tange à análise do site. Por exemplo, se um único usuário visitou o site e visualizou uma página por 20 minutos, é tecnicamente verdadeiro dizer que o tamanho médio das sessões é de 20 minutos. Porém, o bom senso nos diz algo diferente: não podemos tirar conclusões sobre um site com base em uma única sessão.
Outro exemplo: você precisa determinar quais páginas do site são, com maior frequência, a página de entrada para sessões que resultam em conversões. Parece uma tarefa fácil. Você abre o relatório de Páginas de entrada, seleciona o objetivo desejado e ordena o relatório por conversões.
O relatório contém diversas páginas que contaram com apenas um usuário, mas em que o objetivo ainda foi alcançado. A taxa de conversão das sessões que começaram nessas páginas é de pelo menos 58%. No entanto, é óbvio que essas páginas não possuem valor para análise. Você pode tentar definir um valor mínimo para a profundidade de página, digamos, pelo menos 100 visualizações de página.
Mas você pode constatar que 100 não bastam — há páginas que foram visualizadas mais de 100 vezes, mas tudo dentro de uma única sessão (e durante uma sessão em que o objetivo foi concluído). Pode se tratar, nesse caso, de páginas com atualização automática, ou então de web crawlers. Qualquer que seja o caso, essas linhas do relatório impedem que você veja dados interessantes, portanto é melhor se livrar delas. Você pode estipular 1.000 visualizações de página.
Isso removeria as informações irrelevantes do relatório. No entanto, o limite para o número de sessões depende do período selecionado para o relatório: será preciso redefinir a restrição novamente para cada período.
Este exemplo mostra que o importante na análise de um site não é a taxa de conversão calculada, e sim a taxa verdadeira — aquela que você veria se houvesse muitas sessões. Para 1000 sessões, a diferença entre a taxa de conversão calculada e a genuína será pequena. Mas para uma única sessão, a taxa de conversão efetiva pode variar desde um número muito pequeno até 100%.
Os métodos estatísticos permitem-nos calcular quantas sessões são necessárias para que possamos dizer com confiança (com 95% de probabilidade, por exemplo) que o valor calculado de conversão não diverge consideravelmente do valor verdadeiro (há um desvio de menos de 5%, por exemplo).
O Yandex Metrica calcula isso automaticamente e oculta as linhas de relatório cujo desvio em relação ao valor genuíno teórico não possamos afirmar com segurança que seja insignificante. Para isso, use a opção Ocultar dados estatisticamente insignificantes.
A filtragem é aplicada à coluna que estiver servindo para ordenar os dados no momento. Também é possível alterar o limiar de filtragem — a probabilidade de 95% e o desvio de 5% que mencionamos.