Seo Spider: TAB INTERNAL

0
314

SCHEDA INTERNAL

Sulla console del Seo Spider la prima scheda a tua disposizione è “Internal” e combina tutti gli URL che sono presenti sullo stesso sottodominio della pagina iniziale di scansione. Questa scheda comprende tutte le metriche del Seo Spider, fatta eccezione per i dati collezionati dalle schede “external”, “hreflang” e “dati strutturati” (data structured). 

Eventuali sottodomini possono essere resi come Interni (e non considerati altrimenti come referral esterni) se utilizzi la configurazione “crawl all subdomains”, la modalità “list” o la funzione CDNs. 

In questa tab puoi consultare i seguenti dati:

  • Address: identifica l’indirizzo (URL) della risorsa scansionata (html, Javascript, Css, Immagini, Pdf, Flash, altro).
  • Content: in corrispondenza dello specifico “URL” esaminato restituisce la tipologia dell’elemento:
    • Html;
    • Javascript;
    • Css;
    • Immagini (Images);
    • Pdf;
    • Flash;
    • Altro.
  • Status Code: identifica la risposta Http del server:
    • code 200;
    • code 301;
    • code 302;
    • code 404;
    • code 500;
  • Status: identifica la risposta Http dell’header quando uno specifico URL viene richiamato:
    • code 200: OK;
    • code 301: Moved Permanently (redirect definitivo);
    • code 302: Moved Temporarily (redirect temporaneo);
    • code 404: Not Found (Non Trovato);
    • code 500: Server Error (Problema legato al Server).,
    • Connection Timeout
  • Indexability: indica se un URL è “Indexable” (indicizzabile da parte del Motore di Ricerca) o “Non-Indexable” (non indicizzabile).
  • Indexability Status: specifica il motivo per il quale un URL non può essere indicizzato. Ad esempio perché “Canonicalised” verso un’altra risorsa, status code diverso da 200 etc, presenta “Connection Timeout” nello status e quindi viene considerato “No Response” etc.
  • Title 1: identifica il “Meta Title” (Page Title)  che viene utilizzato da Google nella sua Serp di risultati. Il Seo Spider colleziona il testo presente nel codice html:
<title> Il titolo della pagina </title>
  • Title 1 Lenght: lunghezza del “Title 1” in termini di numero di caratteri. E’ consigliato un titolo compreso tra i 30 e 55 caratteri per non incorrere in troncature dello snippet in Serp.
  • Title 1 Pixel Width: larghezza del “Title 1 “ in termini di pixel.
    Corrisponde come funzionalità al precedente ma ti consiglio di ragionare sempre in pixel perché la diversità dello spazio occupato dai caratteri potrebbe ingannarti. 

ESEMPIO:

Se utilizzi una lettera “M” oppure una “i” con il primo indicatore otterrai sempre 1 ma i pixel utilizzati dalle due lettere saranno diversi con un incidenza maggiore della “M” maiuscola in termini di spazio nello Snippet. 

  • Meta Description 1: identifica la “Description” utilizzata nello snippet di Google.
  • Meta Description Length : numero di caratteri utilizzati per la “Meta Description”. E’ consigliato un testo compreso tra 70 e 155 caratteri.
  • Meta Description Pixel Width: larghezza in pixel della Meta Description. Si consiglia di rimanere nel range 400 – 1011 pixels.
<meta name=”description” content=”Le funzioni base di Screaming Frog.” />
  • Meta Keyword 1: parole chiavi utilizzate per il singolo URL. L’inserimento delle Meta Keyword é opzionale, Google ha dichiarato di non considerare nella valutazione dei contenuti e relativo ranking.
  • Meta Keywords Length: numero di caratteri utilizzati per le meta keyword.
  • H1- 1: identifica il primo heading “H1” dell’URL (titolo principale della pagina).
  • H1 Length-1: lunghezza in caratteri del primo heading “H1”.
  • H2-1: identifica il primo heading “H2” (sottotitolo).
  • H2-Length-1: identifica la lunghezza in caratteri del primo heading “H2”.

Codice Html per gli headings H1 e H2

<H1>Titolo principale della pagina</H1>
<H2>Sottotitolo</H2>

Il Seo Spider raccoglie solamente i primi due heading H2 che incontra nel codice sorgente. Per estrarre i dati relativi agli altri headings (h3,h4 etc) ti consiglio di utilizzare la funzione “Custom Extraction”.

  • Meta Robots 1: identifica le direttive del meta robots (es. max-image-preview:large)
  • X-Robots-Tag 1 – X-Robots-tag HTTP: direttive dell’header per l’URL (es. noindex).
  • Meta Refresh 1: ricerca se nel codice di uno specifico URL c’è la stringa “refresh” dei dati.
<meta http-equiv=”refresh” content=”5”>
  • Canonical Link Element: identifica i dati dell’elemento di collegamento “canonical”.
<link rel=”canonical” href=”https://www.nostrodominio.com/servizi” />
  • rel=”next” 1: il Seo Spider raccoglie questi elementi di collegamento HTML progettati per indicare la relazione tra gli URL in una serie paginata, in particolare indica la relazione con la pagina successiva. Questo elemento e il successivo sono spesso presenti nei blog, forum e e-commerce. Nonostante Google abbia dichiarato di essere in grado di scansionare completamente un sito web senza queste indicazioni ritengo debbano essere ancora considerate per gli altri Bot . Il “next” indica la relazione con la pagina successiva.
  • rel=”prev” 1: il Seo Spider raccoglie questi elementi di collegamento HTML progettati per indicare la relazione tra gli URL in una serie paginata. Il “prev” indica la relazione con la pagina precedente.
  • Size: questa dimensione viene definita in kilobyte. Il valore è impostato dall’intestazione Content-Length se fornito, se non è fornito, è impostato a zero. Per le pagine HTML il valore considera la dimensione dell’HTML (non compresso) in KB. All’esportazione, la dimensione viene servita in byte Equivalenza → Kilobyte = 1.024 byte
  • Word Count: questo indice identifica la somma di  tutte le “parole” scansionate all’interno del tag body, escluso il markup HTML. Il conteggio si basa sull’area del contenuto escludendo gli elementi nav e footer. Questa metrica la puoi anche personalizzare definendo un’area di analisi diversa. Per una diagnosi più granulare puoi includere o escludere elementi HTML, classi e ID. Ricorda che, nonostante il Seo Spider sia molto preciso ci possono essere delle divergenze fra i valori riportati rispetto ad un calcolo manuale. Queste incongruenze sono dovute al fatto che il parser esegue alcune correzioni quando si imbatte sull’HTML non valido. Da non sottovalutare inoltre eventuali impostazioni personali di rendering che potrebbero influenzare anche quale HTML venga esaminato. Screaming Frog conteggia una parola prendendo il testo e dividendolo per spazi senza alcuna considerazione in base alla visibilità del contenuto (come il testo all’interno di un div impostato come nascosto).

Config > Content > Area

  • Text Ratio: per restituire questo valore il Seo Spider considera il testo come numero di caratteri non-HTML contenuti nel tag “<body>…</body>” di una pagina diviso per il totale dei caratteri totali di cui è composta la pagina html (testo + elementi html) e presenta il dato in forma percentuale.
  • Crawl Depth: rappresenta la profondità di un URL rispetto alla pagina iniziale di scansione (normalmente l’homepage) intesa come numero di click necessari per raggiungerla. Ricordati che anche i reindirizzamenti sono contati come un livello di profondità.
  • Link Score: una metrica compresa tra 0-100, che calcola il valore relativo di una pagina in base ai suoi link interni, simile al PageRank di Google. Per ottenere i dati relativi è necessario utilizzare la “Crawl Analysis” alla fine della scansione.
  • InLinks:  identifica il numero di collegamenti interni ricevuti da un URL da parte di altri URL dello stesso sottodominio.
  • Unique InLinks: corrisponde al numero di Internal Links ‘unici’ con destinazione l’URL in analisi. 

ESEMPIO:


Se ‘pagina A’ si collega a ‘pagina B’ 3 volte, ci sarà un solo “Unique InLinks” (e 3 InLinks). 

  • % del totale: rappresenta la percentuale di inlink interni unici (considera solo le pagine Html con status code 200) all’URL. 
  • Outlinks: numero di collegamenti interni verso altri URL dello stesso sottodominio.

Unique External Outlinks: numero di link unici presenti in elementi di ancoraggio da un dato URL ad un altro sottodominio. 

ESEMPIO:


Se la ‘pagina A’ si collega alla ‘pagina B’ su un sottodominio diverso 3 volte, questo verrebbe contato come 3 outlink esterni e 1 outlink esterno unico alla ‘pagina B’.

External Outlinks: numero di link dell’Url esaminato verso sottodomini esterni (diversi di quello scansionato).

  • Closest Similarity Match:  attraverso questa funzionalità puoi vedere l’indice di similarità fra più pagine ed evitare situazioni di duplicazione. Utilizzando le soglie di default del Seo Spider le pagine sono identificate come “quasi duplicati” se presentano una corrispondenza pari o superiore al 90%. Anche questa funzionalità la puoi personalizzare definendo delle soglie ad hoc.
    Per popolare questa colonna dovrai abilitare la “Crawl Analysis” al termine della scansione. Solo gli URL con contenuto superiore alla soglia di somiglianza selezionata conterranno dati, gli altri rimarranno vuoti. Quindi, per impostazione predefinita, questa colonna conterrà solo dati per gli URL con il 90% o più di similarità.

Config > Content > Duplicates > Enable Near Duplicates > Near Duplicate Similarity Threshold 

  • Hash: il Seo Spider considera il valore “hash” attraverso algoritmo MD5 dell’URL. Nel caso di due valori identici i contenuti sono considerati duplicati e possono essere penalizzati dal Motore di Ricerca. Questo indice, a differenza della scheda “Closest Similarity Match”, è un controllo dei contenuti duplicati esatti. 
    Nota bene: se due valori di hash corrispondono, le pagine sono esattamente uguali nel contenuto. Se c’è la differenza anche di un solo carattere, avranno valori di hash unici e non saranno rilevati come contenuti duplicati. 

URL > Duplicate

  • No. Near Duplicates: identifica il numero di URL quasi duplicati scoperti durante la scansione che soddisfano o superano la soglia impostata nella ‘Near Duplicate Similarity Threshold’ (di default è del 90%). Questa impostazione può essere anche modificata.

Config > Content > Duplicates

Per popolare questa colonna devi aver precedentemente selezionato l’opzione “Abilita i quasi duplicati” e avviare la “Crawl Analysis”.

Config > Content > Duplicates 

  • Spelling Errors: il numero totale di errori ortografici scoperti per un URL. Affinché questa colonna sia popolata, deve essere selezionato ‘Enable Spell Check’ (Abilita controllo ortografico).

Config > Content > Spelling & Grammar

  • Grammar Errors: il numero totale di errori di grammatica scoperti per ogni singolo URL. Affinché questa colonna sia popolata è necessario selezionare “Abilita controllo grammaticale”. Nelle impostazioni è possibile definire la lingua di controllo, definire le regole grammaticali e il dizionario di riferimento.

Per consultare i dati relativi agli errori grammaticali e di “Spelling” è sufficiente consultare le colonne dedicate nella scheda “Internal” selezionare gli URLs che presentano gli errori e vederli in dettaglio nella scheda “Spelling & Grammar Details” della finestra in basso del Seo Spider. Ottima funzionalità per il copywriter nello scovare eventuali errori di battitura o utilizzo improprio di regole grammaticali. Oltre alla lista di errori sono presenti suggerimenti per la correzione e la sezione dove sono stati riscontrati con relativa anteprima . Per la lingua italiana è ancora poco affidabile nei suggerimenti ma molto utile in termini di errori di battitura.

Config > Contenuto > Ortografia e grammatica 

  • Response Time: tempo impiegato in secondi per scaricare l’URL. Viene calcolato in base al tempo necessario per emettere una richiesta HTTP e ottenere la risposta HTTP completa dal server. Questo parametro non include il tempo per scaricare risorse aggiuntive con “modalità di rendering JavaScript”.
  • Last Modified: indice letto dall’intestazione “Last-Modified” nella risposta HTTP del server. Se il server non lo fornisce, il valore sarà vuoto.
  • Redirect Url: se l’URL presenta un reindirizzamento questa colonna includerà la destinazione dell’URL.
  • Redirect Type: lo Spider Seo identifica:
  • HTTP Redirect: attivato da un’intestazione HTTP.
  • HSTS Policy: reindirizzamento da intestazione HSTS.
  • JavaScript Redirect: reindirizzamento innescato dall’esecuzione di JavaScript (può essere presente solo quando usi la modalità “rendering JavaScript).
  • MetaRefresh Redirect: innescato da un tag meta refresh nell’HTML.
  • HTTP Version: questa colonna mostra la versione HTTP con cui il crawl è stato effettuato. Il Seo Spider attualmente effettua la scansione solo utilizzando HTTP/1.1, ma questa colonna è stata rilasciata in preparazione del supporto di HTTP/2 in un futuro aggiornamento.