Como escrever e testar filtros Regex para o Google Analytics (com exemplos)

Filtros Regex do Google Analytics de expressões regulares

Como acontece com muitos dos meus artigos aqui, faço pesquisas para um cliente e escrevo sobre isso aqui. Para ser honesto, existem algumas razões pelas quais ... primeiro é que eu tenho uma memória terrível e muitas vezes pesquiso meu próprio site para obter informações. O segundo é ajudar outras pessoas que também possam estar procurando informações.

O que é uma expressão regular (Regex)?

Regex é um método de desenvolvimento para pesquisar e identificar um padrão de caracteres dentro do texto para corresponder ou substituir o texto. Todas as linguagens de programação modernas oferecem suporte a expressões regulares.

Eu amo expressões regulares (regex), mas podem ser um pouco frustrantes ou irritantes de aprender e testar. O Google Analytics tem alguns recursos incríveis ... onde você pode criar visualizações com expressões regulares ou filtrar seus dados dentro de expressões regulares.

Por exemplo, se eu quisesse ver apenas o tráfego em minhas páginas de tag, poderia filtrar por / tag / em minha estrutura de permalink usando:

/tag\/

A sintaxe é crítica aqui. Se eu apenas usasse “tag”, obteria todas as páginas com o termo tag nelas. Se eu usasse “/ tag”, qualquer URL que comece com tag seria incluído, como / tag-management porque o padrão do Google Analytics inclui qualquer caractere após a expressão regular. Portanto, preciso garantir que inclua a seguinte barra ... mas ela deve ter um caractere de escape nela.

regex de filtro de página

Regex Syntax Basics

Sintaxe Descrição
^ Começa com
$ Termina com
. Um curinga para qualquer caractere
* Zero ou mais do item anterior
.* Corresponde a qualquer caractere em
? Zero ou uma vez do item anterior
+ Uma ou mais vezes do item anterior
| O operador OR
[abc] A ou b ou c (pode ser qualquer número de caracteres)
[az] Intervalo de a a z (pode ser qualquer número de caracteres)
[AZ] Faixa de A a Z (letras maiúsculas)
[0-9] Faixa de 0 a 9 (pode ser qualquer número)
[a-zA-Z] Faixa de a a Z ou A a Z
[a-zA-Z0-9] Todos os caracteres alfanuméricos
1 {} Exatamente 1 instância (pode ser qualquer número)
{1-4} Intervalo de 1 a 4 instâncias (pode ser qualquer número)
{1,} 1 ou mais instâncias (pode ser qualquer número)
() Agrupe suas regras
\ Caracteres especiais de escape
\d Caráter de dígito
\D Carácter não digitado
\s Espaço em branco
\S Espaço não branco
\w Word
\W Não palavra (pontuação)

Exemplos Regex para Google Analytics

Então, vamos colocar alguns exemplos para alguns Filtros personalizados. Um de meus colegas me pediu ajuda para identificar uma página interna com o caminho de /índice além de todas as postagens de blog que foram escritas com o ano no link permanente:

Meu padrão de filtro personalizado para o campo de filtro Solicitar URL:

^/(index|[0-9]{4}\/)

Isso basicamente indica procurar / indexar OU qualquer caminho numérico de 4 dígitos terminando com uma barra final. Eu criei uma vista da propriedade no Analytics e adicionei como filtro:

Filtro de vista do Google Analytics

Aqui estão mais alguns exemplos:

  • Você tem um blog com o ano no caminho do link permanente da URL e deseja filtrar a lista para qualquer ano. Portanto, quero quaisquer 4 dígitos numéricos seguidos por uma barra final. Solicitar padrão de filtro URl:

^/[0-9]{4}\/

  • Você deseja comparar todas as suas páginas onde o título tem certificado or certificado na mesma. Padrão de filtro de título de página:

(.*)certificat(.*)

  • Você deseja comparar duas páginas de destino com base na mídia da campanha transmitida no URL da campanha do Google Analytics como utm_medium = mala direta or pesquisa paga.

(direct\smail|paid\ssearch)

  • Você deseja comparar todos os produtos que são camisas masculinas com base no caminho do URL. Solicitar padrão de filtro URl:

^/mens/shirt/(.*)

  • Você deseja comparar todas as páginas numeradas do caminho de URL que termina com o número. Solicitar padrão de filtro URl:

^/page/[1-9]*/$

  • Você deseja excluir um intervalo de endereços IP. Excluir padrão de filtro de endereço IP:

123\.456\.789\.[0-9]

  • Você deseja incluir uma página thankyou.html em que o envio foi bem-sucedido com base na querystring success = true. Solicitar padrão de filtro URl:

thankyou\.html\?success=true

Como testar suas expressões Regex

Em vez de tentativa e erro no Google Analytics, geralmente pulo para regex101, uma ferramenta fantástica para testar suas expressões regulares. Ele até quebra sua sintaxe para você e fornece os detalhes de sua expressão regular:

expressões regulares regex101

Compilar, testar e depurar Regex

O que você acha?

Este site usa o Akismet para reduzir o spam. Saiba como seus dados de comentário são processados.