TAB SITEMAP

0
389
estrazione dati da sitemap xml con Screaming Frog

La scheda raccoglie tutti i dati più significativi estrapolati dalla scansione di una Sitemap XML.

Per ottenere i dati devi abilitare “Crawl Linked XML Sitemaps” in “Configurazione > Spider” , avviare la scansione ed eseguire una “Crawl Analysis” successiva.

Le colonne a disposizione nella tab includono informazioni generali sugli Url e sulla loro indicizzabilità. 

Molto più interessanti e specifici i filtri dedicati:

  • URLs in Sitemap: vengono visualizzati gli URL che sono presenti in una Sitemap XML. A livello Seo questi elementi dovrebbero contenere solamente versioni indicizzabili e canoniche evitando pagine con status code diverso da 200, bloccate da robots.txt o canonicalizzate.
  • URLs Not In Sitemap: identifica tutti gli URLs che sono stati trovati durante la scansione ma non appartengono alla Sitemap XML. In questo caso consiglio sempre un controllo per constatare se questi URL sono stati tralasciati in modo voluto o sono delle proprie mancanze ed andrebbero aggiunti. Questo filtro non considera gli URL non indicizzabili, assumendoli come scelte consapevoli, e quindi non li segnala.
  • Orphan URLs: visualizza gli URL che sono presenti nella Sitemap XML, ma non sono stati scoperti durante la scansione evidenziando un potenziale problema di link interno.
  • Non. Indexable URLs in Sitemap: URL che sono in una Sitemap XML, ma per qualche ragione non sono indicizzabili. In questo caso le ottimizzazioni possono essere essenzialmente due: la prima rimuovere dalla Sitemap le pagine o, se lo “status” “non-indexable” rappresenta un errore andare a sistemarlo.
  • URLs in Multiple Sitemaps: URL che sono in più di una Sitemap XML.
    Potrebbe essere il caso di creare una sitemap index.
  • XML Sitemap with Over 50k URLs: identifica le XML Sitemap che hanno più di 50k URLs in contraddizione con i limiti imposti dal Motore di Ricerca. La soluzione è quella di creare una “sitemap index” da inviare tramite Search Console a Google.
  • XML Sitemap with Over 50mb: identifica ogni Sitemap XML che presenti una dimensione del file superiore a 50 Mb.