REWRITE URL

0
261
report All Cookies con Screaming Frog

La funzione “Rewrite URL”  ti permette di riscrivere gli URL in pochi secondi ed è estremamente utile per la “rimozione dei parametri” e ID di sessione. 

Questa funzione viene applicata a tutti gli URL scoperti durante il crawl tranne l’URL inserito come pagina di “inizio scansione” nella modalità “Spider” o all’elenco di URL aggiunti dall’utente nella modalità “List”.

Ad esempio se un sito web presenta ID di sessione che fanno apparire gli URL come questo “example.com/?sid=6578” è sufficiente aggiungere ‘sid’ (senza gli apostrofi) all’interno del campo “Remove Parameters” della funzione “URL Rewriting”.

Un altro caso molto comune per siti che utilizzano campagne a pagamento PPC, newsletter o altro è rappresentato dall’utilizzo di parametri per il tracciamento come:

utm_source
utm_medium
utm_campaign

Anche in questo caso è sufficiente inserirli nel popup “URL Rewriting” per ottenere gli URL puliti dai parametri.

Identificati i parametri da rimuovere ti consiglio, prima di avviare la scansione, di utilizzare l’opzione “test” per verificare che tutto funzioni correttamente in base all’input inserito.

Oltre alla funzione sopra citata puoi optare per la funzione avanzata “Regex Replace”. 

Questa funzione avanzata viene eseguita su ogni URL trovato durante un crawl o in modalità elenco. In modo molto semplice attraverso la sintassi RegEX sei in grado di sostituire ogni sottostringa di un URL che corrisponde all’input con la stringa prescelta. Anche questa opzione può essere testata nella scheda “Test” della finestra di configurazione “URL Rewriting”.

Attraverso la funzione Regex i campi di Applicazione sono infiniti, vediamone alcuni:

Cambiare il protocollo degli URL da HTTP a HTTPS

Regex: http
Replace: https

Modificare tutti gli URL da dominio.com in dominio.it

Regex: .com
Replace: .it

Uniformare tutti i link contenenti page=number ad un numero fisso predefinito, ad esempio

  • www.example.com/page.php?page=1
  • www.example.com/page.php?page=2
  • www.example.com/page.php?page=3
  • www.example.com/page.php?page=4
Regex: page=\d+
Replace: page=1

Rimuovere il dominio www. da qualsiasi URL usando un ‘Replace’ vuoto. 

Regex: www.
Replace:

Eliminare tutti i parametri

Regex: \?.*
Replace:

Cambiare i link solo per i sottodomini di example.com da HTTP a HTTPS

Regex: http://(.*example.com)
Replace: https://$1

Rimuovere qualsiasi elemento presente  in modalità di rendering JavaScript

Regex: #.*
Replace:

Aggiungere alcuni parametri agli URL

Regex: $
Replace: ?parameter=value

Questo aggiungerà ‘?parameter=value’ alla fine di qualsiasi URL incontrato

Nelle situazioni in cui il sito ha già dei parametri, questo richiede espressioni più complicate perché il parametro sia aggiunto correttamente:

Regex: (.*?\?.*)
Replace: $1&parametro=valore
Regex: (^((?!\?).)*$)
Replace: $1?parametro=valore

Un ultima opportunità di “Url Rewriting” è la possibilità di rimuovere dalla scansione tutti gli URL duplicati da caratteri maiuscoli utilizzando “Lowercase discovered URLs” dalla tab Opzioni.