Compresa l’importanza di individuare le pagine Orfane vediamo la procedura da seguire con il Seo Spider:
- 1. Impostazione della scansione della Sitemap XML
Preliminarmente devi abilitare l’opzione “Crawl Linked XML Sitemaps” per scansionare la Sitemap del tuo sito web.
Config > Spider > Crawl > Crawl Linked XML Sitemaps

- 2. Connessione alle API di Google Analytics
Configura la connessione alle API di Google Analytics, per trovare le Orphan Pages dalla ricerca organica di uno specifico Account, Proprietà o Vista.
Ricordati di scegliere il segmento “Traffico organico”, impostare e personalizzare l’intervallo di date da analizzare (Data Range) che di default è di un mese e definire le metriche e le dimensioni di tuo interesse.

Ricordati di abilitare l’opzione “Crawl New URLs Discovered in Google Analytics”. Se questa opzione è disabilitata, gli URL scoperti tramite Google Analytics sono disponibili solo nel rapporto “Pagine orfane”. Non saranno aggiunti alla coda di scansione, visualizzabili all’interno dell’interfaccia utente e appariranno sotto le rispettive schede e filtri.
- 3. Connessione alle API di Search Console
Potrai inoltre connetterti all’API di Google Search Console per trovare tutte le pagine che nonostante non abbiano alcun collegamento interno al sito web stanno ricevendo Impressions e Click in un certo intervallo di tempo.

Anche in questo caso è possibile modificare la data di riferimento su cui collezionare i dati. Allo stesso modo di Google Analytics, se questa opzione non è attivata, i nuovi URL scoperti tramite Google Search Console saranno disponibili solo nel rapporto “Orphan Pages”. Non saranno aggiunti alla coda di scansione, visualizzabili all’interno dell’interfaccia utente e appariranno sotto le rispettive schede e filtri.
- 4. Avvia la scansione e popola i dati con la Crawl Analysis
Conclusa la fase di configurazione non ti resta che eseguire la scansione e attivare la “Crawl Analysis” (se non l’hai già automatizzata precedentemente dalle configurazioni).

Completate queste attività sarai in grado di sfogliare ogni scheda e il rispettivo filtro ‘Orphan URLs’ per visualizzare tutte le pagine orfane scoperte.
Mettiamo in pratica quanto abbiamo appena descritto scansionando il sito di Screaming Frog.
Lo andiamo ad impostare per la scansione della Sitemap XML e lo connettiamo alle API di Google Search Console.
Sitemap XML

Dall’esempio qui sopra puoi notare come il sito di Screaming Frog presenti alcune pagine orfane (Tab Sitemap) che sono state scoperte dal crawl della Sitemap XML.
In questo caso le pagine presentano uno status code 404 e 301 e potrebbero rappresentare delle vecchie pagine che non sono state rimosse dalla Sitemap XML dopo la pubblicazione del nuovo portale.
API SEARCH CONSOLE
Connettendo il sito di Screaming Frog alle API di Search Console (figura in basso) puoi notare che, a differenza del caso precedente (analisi con sitemap.xml), le pagine orfane sono ancora presenti nel sito web (status code 200) e ricevono Impressions da Google nonostante non presentano alcun link interno.

Ricorda Bene: entrambi i connettori di Google permettono di esportare singolarmente i risultati semplicemente con il pulsante “Export” presente nella finestra superiore del Seo Spider.
Se preferisci avere una panoramica di tutte le Orphan Pages scoperte da Google Analytics, Search Console e Sitemap.xml puoi utilizzare il report “Orphan pages”, documento che trovi nel menu principale.

Scoprire Orphan Pages attraverso il CRAWL DEPTH
L’ultima strategia possibile per scovare la presenza di Orphan pages (dopo la configurazione della Sitemap XML, API Google Analytics e Search Console API) è quella di utilizzare la scheda ‘Internal’ la quale include ogni URL trovato durante il crawl e “Crawl Analysis”.
Le pagine non trovate attraverso la scansione dei link interni avranno sempre un “Crawl depth” vuoto.
