Regex-suodattimien kirjoittaminen ja testaaminen Google Analyticsille (esimerkkien avulla)
Kuten monissa täällä olevissa artikkeleissani, teen myös tutkimusta asiakkaalle ja kirjoitan sitten tästä. Ollakseni rehellinen, on olemassa pari syytä, miksi… ensinnäkin se, että minulla on kauhea muisti ja tutkin usein tietoa omasta verkkosivustostani. Toinen on auttaa muita, jotka saattavat myös etsiä tietoa.
Mikä on säännöllinen lauseke (Regex)?
Regex on kehitystapa, jolla etsitään ja tunnistetaan tekstikuvio merkkejä joko vastaamaan tai korvaamaan tekstiä. Kaikki nykyaikaiset ohjelmointikielet tukevat säännöllisiä lausekkeita.
Rakastan säännöllisiä lausekkeita (regex), mutta ne voivat olla hieman turhauttavia tai raivostuttavia oppia ja testata. Google-analytiikassa on hämmästyttäviä ominaisuuksia ... jossa voit luoda näkymiä säännöllisin lausekkein tai suodattaa tietoja säännöllisten lausekkeiden sisällä.
Esimerkiksi, jos halusin nähdä vain liikenteen tagisivuillani, voisin suodattaa / tag / pysyvän linkin rakenteessani käyttämällä:
/tag\/
Syntaksi on kriittinen siellä. Jos käyttäisin vain “tagia”, saisin kaikki sivut, joissa oli termi tag. Jos käytän ”/ tag”, kaikki URL-osoitteet, jotka alkavat tagilla, sisällytetään, kuten / tag-hallinta koska Google Analytics sisältää oletusarvoisesti minkä tahansa merkin säännöllisen lausekkeen jälkeen. Joten minun on varmistettava, että minulla on seuraava kauttaviiva ... mutta siinä on oltava pakomerkki.
Regex-syntaksin perusteet
Syntaksi | Kuvaus |
^ | Alkaa jollakin |
$ | Loppuu |
. | Jokerimerkki kaikille hahmoille |
* | Nolla tai enemmän edellisestä tuotteesta |
.* | Vastaa kaikkia merkkejä |
? | Edellisen kohteen nolla tai yksi kerta |
+ | Yksi tai useampi kerta edellisestä kohteesta |
| | TAI-operaattori |
[Abc] | A, b tai c (voi olla mikä tahansa määrä merkkejä) |
[Az] | Alue a - z (voi olla mikä tahansa määrä merkkejä) |
[AZ] | Alue A - Z (isot kirjaimet) |
[0-9] | Alue 0-9 (voi olla mikä tahansa numero) |
[a-zA-Z] | Alue a - Z tai A - Z |
[a-zA-Z0-9] | Kaikki aakkosnumeeriset merkit |
1 {} | Aivan yksi esiintymä (voi olla mikä tahansa numero) |
{1-4} | Alue 1-4 esiintymää (voi olla mikä tahansa numero) |
{1,} | 1 tai useampi esiintymä (voi olla mikä tahansa numero) |
() | Ryhmittele säännöt |
\ | Pakene erikoismerkkejä |
\d | Numeerinen merkki |
\D | Ei-numeroinen merkki |
\s | Valkoinen tila |
\S | Muu kuin valkoinen tila |
\w | sana |
\W | Ei-sana (välimerkit) |
Regex-esimerkkejä Google Analyticsista
Joten laitetaan joitain esimerkkejä joillekin Muokatut suodattimet. Yksi kollegoistani pyysi minulta apua sisäisen sivun löytämisessä polun kanssa /indeksi kaikkien pysyvässä linkissä olevan vuoden kanssa kirjoitettujen blogiviestien lisäksi:
Oma suodatinkenttä suodatinkentälle Pyydä URL-osoitetta:
^/(index|[0-9]{4}\/)
Siinä todetaan periaatteessa etsivän / indeksoimaan TAI mitä tahansa 4-numeroista numeerista polkua, joka päättyy jälkiviivalla. Loin näkymän Analyticsissa ja lisäsin tämän suodattimeksi:
Tässä on muutama esimerkki:
- Sinulla on blogi, jonka URL-osoite on pysyvän linkin polussa ja haluat suodattaa luettelon mihin tahansa vuoteen. Joten haluan 4 numeroa, jota seuraa peräviiva. Pyydä URl-suodatinkuviota:
^/[0-9]{4}\/
- Haluat verrata kaikkia sivujasi, joissa otsikko on todistus or sertifiointi sen sisällä. Sivun otsikon suodatinkuvio:
(.*)certificat(.*)
- Haluat verrata kahta laskeutumissivua niiden kampanjatiedon perusteella Google Analytics -kampanjan URL-osoite kuten utm_medium = suoramainonta or maksettujen hakujen.
(direct\smail|paid\ssearch)
- Haluat verrata kaikkia tuotteita, jotka ovat miesten paitoja URL-polun perusteella. Pyydä URl-suodatinkuviota:
^/mens/shirt/(.*)
- Haluat vertailla kaikkia sivuja, jotka on numeroitu URL-polku, joka päättyy numeroon. Pyydä URl-suodatinkuviota:
^/page/[1-9]*/$
- Haluat sulkea pois IP-osoitealueen. Sulje pois IP-osoitesuodatinkuvio:
123\.456\.789\.[0-9]
- Haluat sisällyttää kiitos.html -sivun, jossa lähetys onnistui kyselymerkkijonon menestys = tosi perusteella. Pyydä URl-suodatinkuviota:
thankyou\.html\?success=true
Kuinka testata Regex-lausekkeita
Google Analyticsin kokeilun ja virheen sijaan siirryn usein vain kohtaan säännönmukaisuus101, upea työkalu säännöllisten lausekkeiden testaamiseen. Se jopa hajottaa syntaksisi puolestasi ja antaa säännöllisen lausekkeen yksityiskohdat: