Kuinka indeksoida suuri sivusto ja poimia tietoja käyttämällä Screaming Frog's SEO Spider -ohjelmaa

Huutava sammakko SEO Spider
Lukuaika: 3 pöytäkirja

Autamme useita asiakkaita juuri nyt Marketo-siirtymät. Koska suuret yritykset käyttävät tällaisia ​​yritysratkaisuja, se on kuin hämähäkinverkko, joka kutoo itsensä prosesseiksi ja alustoiksi vuosien varrella ... siihen pisteeseen asti, että yritykset eivät edes ole tietoisia kaikista kosketuspisteistä.

Marketon kaltaisen yritysmarkkinoinnin automaatioalustan avulla lomakkeet ovat tietojen syöttöpiste sivustoissa ja aloitussivuilla. Yrityksillä on sivustoissaan usein tuhansia sivuja ja satoja lomakkeita, jotka on tunnistettava päivitystä varten.

Hyvä työkalu tähän on Huutavan sammakon SEO-hämähäkki… Ehkä markkinoiden suosituin foorumi indeksoinnille, tarkastukselle ja tietojen keräämiselle sivustolta. Alusta on monipuolinen ja tarjoaa satoja vaihtoehtoja melkein jokaiseen tarvitsemasi tehtävään.

Huutava sammakko SEO Spider: Indeksoi ja poimi

Screaming Frog SEO Spiderin keskeinen piirre on, että voit suorittaa mukautettuja uutteita sen perusteella regex, XPathtai CSSPath yksityiskohdat. Tämä on erittäin hyödyllistä, koska haluamme indeksoida asiakkaan sivustot ja tarkastaa ja siepata MunchkinID- ja FormId-arvot sivuilta.

Avaa työkalu Kokoonpano> Mukautettu> Pura tunnistaa elementit, jotka haluat purkaa.

screamingfrog mukautettu poiminta

Puraamisnäyttö mahdollistaa käytännössä rajoittamattoman tiedonkeruun:

Huutavan sammakon SEO Spider Extraction -säännöt

Regex-, XPath- ja CSSPath-purku

MunchkinID: n tunniste sijaitsee lomakkeen komentosarjassa, joka on sivulla:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Sitten käytämme a Regex-sääntö kaapata tunnus sivulle lisätyn komentotunnisteen sisällä:

Regex: ["']id["']: *["'](.*?)["']

Lomaketunnuksen tiedot ovat Marketo-lomakkeen syöttötunnisteessa:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Käytämme XPath-sääntö siepata tunnus sivulle lisättyyn lomakkeeseen. XPath-kysely etsii lomaketta, jonka nimi on pelokas, sitten uuttaminen tallentaa arvo:

XPath: //form/input[@name="formid"]/@value

Screaming Frog SEO Spider Javascript-renderointi

Toinen hieno vaihtoehto Screaming Frog on, että et ole rajoittunut sivun HTML-koodiin, voit renderoida minkä tahansa JavaScriptin, joka lisää lomakkeita sivustoosi. Sisällä Kokoonpano> Hämähäkki, voit siirtyä Renderointi-välilehdelle ja ottaa tämän käyttöön.

Screaming Frog SEO Spider Javascript-renderointi

Tämä vie tietysti hieman kauemmin sivuston indeksoinnin, mutta saat lomakkeita, jotka JavaScript tekee asiakkaan puolelta, sekä palvelinpuoleisia lisättyjä lomakkeita.

Vaikka tämä on hyvin erityinen sovellus, se on uskomattoman hyödyllinen, kun työskentelet suurten sivustojen kanssa. Haluat ehdottomasti tarkastaa, missä lomakkeet on upotettu koko sivustoon.

Lataa Screaming Frog SEO Spider

Mitä mieltä olet?

Tämä sivusto käyttää Akismetiä roskapostin vähentämiseksi. Lue, miten kommenttitietosi käsitellään.