COME FARE UNA MIGRAZIONE CON IL SCREAMING FROG

0
173

Questo articolo ti indica quale sia la migliore soluzione per scoprire e risolvere le più comuni criticità durante la fase delicata della migrazione. 

Ogni migrazione è sempre un’impresa epica per non impattare negativamente sul posizionamento organico del sito web che si sta per migrare. 

PREMIGRAZIONE

Prima di addentrarsi in questo processo ci sono degli step essenziali da mettere in campo nella fase di pre-migrazione in cui un crawler può aiutarti e che non dovrebbero essere trascurati.

  • 1. Eseguire un Crawl del sito attuale

In primo luogo, è consigliata una scansione completa del sito web per:

poterlo confrontare con il sito di staging;

Controllare se i vecchi URL sono stati correttamente indirizzati alle nuove risorse.

Avere un backup da cui partire nel caso vada qualcosa storto durante la migrazione.

In sintesi prima della migrazione devi preparare il terreno per un backup completo che includa tutti gli elementi più importanti del sito attuale.

Per sfruttare Screaming Frog in questa fase devi abilitare alla scansione tutte le risorse a cui potresti aver bisogno di fare riferimento in futuro come le versioni AMP, gli Hreflang, i dati strutturati etc. 

In questa lista della spesa non scordarti se ci sono dipendenze Javascript lato client che richiedono un rendering Javascript ed includi qualsiasi altro dominio, sottodominio o variante di sito mobile e desktop.

Integra sempre nella scansione la Sitemap XML e connettiti tramite API a Google Analytics e Search Console per scovare eventuali pagine orfane (abilita “Crawl New URLs Discovered GA/GSC).

Raccogli inoltre i dati relativi ai link da Ahrefs, Majestic, Moz e le performance sulle prestazioni delle query con GSC per tenere d’occhio le pagine importanti in base a entrate, conversioni, traffico, impressioni, clic che ti permettono di non disperdere il ranking conquistato.

  • 2. Esportare gli URL da reindirizzare

Molto spesso durante le migrazioni gli elementi che variano con maggior frequenza sono gli slug, per questo motivo è necessario raccogliere una lista completa degli URL per reindirizzare in modo permanente le vecchie pagine a quelle equivalenti del nuovo sito web. 

Questa fase può essere relativamente semplice se si tratta di una migrazione di dominio e il percorso dell’URL rimane invariato ma diventa complessa e rischiosa se l’intera struttura dell’URL del sito web sta cambiando o semplicemente alcune aree strategiche sono state ripensate in base a nuovi Search Intent.

Per ottenere un elenco completo degli URL esistenti è sufficiente esportarli dal crawl eseguito del sito live cliccando su “Esporta” nella scheda “Internal”.

Questa attività di mappatura è una delle fasi cruciali della tua migrazione per reindirizzare ogni elemento nel modo più appropriato. 

Se una mappatura completa non è possibile, è buona norma dare una scala di priorità alle pagine top-performing in base alle conversioni, l’utente e link raccolti nella fase 1.

  • 3. Fase di test pre-migrazione

Quando il nuovo sito web è in “Staging” è giunta l’ora di iniziare i controlli prima della messa online definitiva e anche in questo caso il crawler ti viene in aiuto:

La prima attività è quella di fare un crawl sul sito in staging per identificare differenze, problemi e opportunità. 

Normalmente i siti in questa fase sono inibiti alle scansioni dal file robots.txt o da password per non essere considerati dallo Spider dei Motori di Ricerca. Grazie a Screaming Frog puoi forzare l’autenticazione, ignorare il file robots.txt o, cambiando le configurazioni, gestire la scansione di risorse lasciate in “noindex” o “nofollow” perché ancora in fase di sviluppo (vedi sezione dedicata “How to: Scansionare un sito protetto da password”). 

Una volta completata la scansione del sito in produzione puoi iniziare l’analisi utilizzando inizialmente la scheda “Overview” della sidebar laterale.

  • 4. Confronto fra sito in staging e sito Live (URL MAPPING)

Adesso sei in possesso di tutti i dati che ti servono: da un lato hai scansionato il sito attualmente online e dall’altro il sito in staging, non ti resta che comparare le due versioni per scoprire eventuali incongruenze.


Questa attività la puoi fare semplicemente con il Seo Spider utilizzando “URL Mapping” della modalità “Compare” e definendo dalla barra in alto le due versioni di scansione da confrontare.

Questa opportunità introdotta con gli ultimi aggiornamenti del Seo Spider, ti consente di confrontare diverse strutture di URL, come diversi nomi di host o directory utilizzando le regole RegEX.

Per utilizzarla è sufficiente cambiare la modalità di scansione su “Compare”, scegliere i due crawl salvati e cliccare sull’icona con ”l’ingranaggio” della barra in alto. 

Sul popup “Crawl Comparison Configuration” non devi far altro che cliccare su “URL Mapping” e definire il vecchio dominio con quello nuovo tramite regole RegEX.

Nell’esempio di seguito il sito esistente è stato mappato con la versione di “Staging” solamente per l’hostname considerando che condividono gli stessi percorsi URL.

Grazie alla mappatura gli URL equivalenti vengono confrontati tra loro per ottenere i dati della scheda panoramica, i problemi e le opportunità, la scheda della struttura del sito e il rilevamento dei cambiamenti.

Terminato il confronto è possibile cliccare sulle colonne per vedere quali URL sono cambiati e usare il filtro sulla finestra principale per alternare tra le scansioni attuali e precedenti, così come per verificare URL aggiunti, mancanti o con elementi nuovi o rimossi.

Il Seo Spider comprende quattro colonne che aiutano a segmentare gli URL modificati secondo questi filtri:

Added: identifica gli URL che sono presenti nel sito esistente e contestualmente in quello di staging ma che differiscono a livello di filtro.
Ad esempio considerando il sito live come “Current” e quello di Staging come “Previous” e met tendo il focus sugli heading “h1” questo filtro ti indica tutti gli URL che presentano solamente nel sito “Live” un heading ottimizzato.

New:  visualizza tutti gli URL che non sono presenti nel sito web esistente, ma sono stati introdotti nel nuovo sito web.

Removed: mostra tutti gli URL che sono presenti nel filtro della scansione del sito attuale ma non nel filtro nel nuovo sito in staging.

Missing: URL che esistono in entrambe le scansioni ma che differiscono a livello di filtro.
Ad esempio considera il sito live come “Current” nel quale non è presente il “meta Title” di uno specifico URL mentre nel sito di staging (considerato nell’esempio come “Previous”) questo elemento era stato ottimizzato.

  • 5. Identificare  le differenze tra i siti tramite il “Change Detection”

Quando si esegue una migrazione è buona norma ridurre al minimo il numero di cambiamenti che potrebbero avere un impatto sulla visibilità di un sito. 

Per tenere sotto controllo questi cambiamenti puoi usare la funzione “Change Detection” in modalità “Compare” che ti permette di visualizzare tutti  degli elementi che sono stati modificato fra il sito attuale e quello di “staging”.

Per attivare la “Change Detection” clicca sulla configurazione di confronto “Config > Compare” (o l’icona “ingranaggio” in alto) e seleziona gli elementi e le metriche in cui vuoi esaminare i cambiamenti.

Successivamente, è sufficiente fare clic su “Compare” per eseguire la scansione. La scheda ‘Change Detection’, non presente di default, apparirà come ultima scheda nella sidebar laterale e nella vista principale del Seo Spider.

Nell’esempio qui sopra, 2 URL hanno cambiato il titolo della pagina, 250 sono cambiati nel numero di parole mentre le meta description e gli Inlinks sono rimasti invariati etc.

In questa schermata sei in grado di cliccare su ogni elemento elencato per isolarlo e vedere i relativi cambiamenti. Nell’esempio qui sotto sono stati isolati i “Meta Title” per analizzare la validità semantica del meta title.

Se la struttura del sito e i collegamenti interni stanno cambiando considerevolmente nella migrazione del tuo sito, allora è davvero importante capire quali pagine hanno perso (o guadagnato link), e cambiato la profondità di scansione.

  • 6. Redirect Mapping (Bonus)

Anche se non è stato costruito per questo scopo, la funzione di “near duplicates – quasi duplicati” la puoi utilizzare per fare la mappatura dei redirect dai vecchi URL ai nuovi URL se il contenuto è simile tra loro.

Per poterne beneficiare è sufficiente passare alla modalità “List -elenco” (‘Mode-Modalità > List-Elenco’), abilitare la funzione ‘Near Duplicates’ e disabilitare ‘Only Check Indexable Pages For Duplicates’.

Config > Content > Duplicates

Successivamente, puoi affinare la scansione configurando l’area di contenuto utilizzata per l’analisi di similarità tra i vecchi e i nuovi URL. 

Config > Content > Area

Per esempio, puoi “includere” le classi delle categorie e delle descrizioni dei prodotti del vecchio e del nuovo sito se sono cambiate. Se i modelli sono gli stessi, allora è improbabile che tu abbia bisogno di regolare l’area di contenuto.

Per utilizzare la modalità List per la mappatura puoi caricare sia i nuovi che i vecchi URL in modalità elenco e scansionarli, ricordandoti di rimuovere la profondità di scansione in ‘Config > Spider > Limits’ e inserire sia il sito esistente che le homepage del sito di staging.

Conclusa la scansione ti manca solamente di attivare la “Crawl Analysis” e navigare alla scheda “Content” per visualizzare i dettagli dei quasi duplicati e l’indice di similarità.

Se il contenuto ha una corrispondenza perfetta, ogni URL avrà 1 quasi duplicato, con una somiglianza vicina al 100%. 

Se il contenuto è cambiato significativamente, i punteggi di similarità e il numero di quasi duplicati saranno diversi. La corrispondenza fra gli URL sarà visualizzabile nella finestra inferiore del Seo Spider.

A questo punto è sufficiente esportare i “Near Duplicates” da Bulk Export>Content>Near Duplicates per ottenere una buona base di partenza per impostare correttamente i redirect e salvare il sito dai potenziali danni organici della migrazione.

  • 7. Post Migrazione: la scansione del nuovo sito

Al momento della pubblicazione non ti resta che eseguire un crawl del sito web per controllare che tutte le pagine del sito siano “crawlabili” e indicizzabili e che non presenti risorse importanti bloccate dal robots.txt (Response Codes > Blocked by Robots.txt).

Assicurati che non siano presenti direttive indesiderate noindex, nofollow o none nei meta tag o nell’intestazione HTTP (Direttive > Noindex).

Verifica che ogni URL che vuoi posizionare sia indicizzabile.

Una volta conclusa questa fase di controllo ti consiglio di fare un ulteriore step confrontando il vecchio sito e quello “Live” per verificare se tutto quanto avevi ottimizzato sul sito di staging è stato riportato nella versione attuale.

  • 8. Verificare i reindirizzamenti

Se gli URL sono cambiati, è fondamentale controllare tutti i reindirizzamenti 301 verso le nuove destinazioni per evitare errori, salti, loop, reindirizzamenti temporanei o verso pagine non indicizzabili. 

Passa alla modalità elenco (‘Mode > List’) e attiva ‘Always Follow Redirects’ in ‘Config > Spider > Advanced’.

Aggiungi i vecchi URL scoperti con la prima scansione del vecchio sito (step 1 articolo) e avvia la scansione.

Alla fine del crawl esporta il rapporto “All Redirects – Tutti i reindirizzamenti”.

Attraverso questo rapporto potrai valutare i seguenti indici:

  • Chain Type: specifica la tipologia del “redirect” ( es. Http/Javascript/Meta Refresh)
  • Number of Redirects: il numero di nodi presenti nella catena.
  • Redirect Loop: la presenza o meno di redirect circolari. Questo campo viene esplicitato con True/False secondo regole booleane.
  • Temp redirect in Chain: se esiste un reindirizzamento temporaneo nella catena (es. 302).
  • Address: l’indirizzo dell’URL di partenza.
  • Final Address: la destinazione finale del collegamento.
  • Indexability: identifica se la destinazione (Final Address) è indicizzabile o non indicizzabile. Questo campo è molto utile per comprendere se durante la migrazione hai linkato un vecchio URL verso una destinazione preclusa all’indicizzazione. Ovviamente se una risorsa l’hai gestita con un reindirizzamento è perché volevi passare il trust verso una nuova destinazione ma se questa presenta l’attributo “Non Indexable” il lavoro precedente non porterebbe alcun effetto.
  • Indexability Status: identifica la ragione per cui l’indirizzo di destinazione non è indicizzabile, per esempio la presenza del tag “Noindex”.
  • Final Content: la tipologia del contenuto di destinazione (esempio: html).
  • Final Status Code: identifica lo Status Code della destinazione finale e può essere 200, 4xx, 1xx,5xx o no response. Anche questo campo è molto importante da valutare per evitare di sprecare il trust del reindirizzamento verso una risorsa che presenta errori di server, pagina non trovata o altro. In sintesi se non vedi lo status code 200 devi fermarti ed intervenire.
  • 9. Controllare il tracciamento Google Analytics e GTM

Al momento della pubblicazione del nuovo sito web molte volte capita di dimenticare l’inserimento degli script di tracciamento come GA o GTM. 

Per un’analisi immediata che tutto sia stato implementato puoi utilizzare la ricerca personalizzata (‘Config > Custom > Search’), con un filtro ‘non contiene’ per cercare il tag di tracciamento completo all’interno dell’Head HTML di ogni pagina del sito.

In questo modo puoi verificare per quali URL non è presente il tracciamento (scheda Custom Search) della finestra principale del Seo Spider.