SPIDER TOOL: TAB AMP

0
233

AMP è l’acronimo di Accelerated Mobile Pages e corrisponde ad una tecnologia (Web Component Framework) nata dalla collaborazione fra Google e Twitter per consentire di velocizzare il caricamento delle pagine web sui dispositivi mobili. Questo progetto, assieme all’orientamento “Mobile First Indexing” mostra quanto il Motore di Ricerca sia indirizzato verso il mercato “Mobile”. 

AMP permette di ridurre in modo drastico i tempi di caricamento rispetto alle pagine tradizionali per un’esperienza utente completamente rivoluzionata che può trasformarsi nella riduzione dell’abbandono della pagina, maggiori conversioni, leads etc. oltre a migliorare le performance che sono uno dei più significativi segnali di ranking.

Al momento AMP include principalmente siti di news ma si crede che il bacino di applicazione nel tempo possa aumentare. 

Le pagine AMP sono alternative alle pagine tradizionali ma seguono delle regole sintattiche e di markup specifiche che le differiscono dalle pagine canoniche.

Per comunicare al Motore di Ricerca l’esistenza di queste pagine AMP si utilizzano dei link tag di corrispondenza fra la pagina canonica e la versione AMP:

<link rel=”amphtml” href=”https://www.dominio.com/amp/page.html”> 

Tag Link inserito nella pagina canonica che identifica la versione AMP

<link rel=”canonical” href=”https://www.dominio.com/page.html”>

Tag Link inserito nella pagina AMP che identifica la versione canonica

In questo modo quando Google scansiona la pagina canonica (nell’esempio: https://www.dominio.com/page.html) scopre anche la verisone AMP (https://www.dominio.com/amp/page.html) e, se la considera valida la inserisce nella sua CDN. 

Molto importante ricordare che la versione semplificata non impatta negativamente sul Crawling Budget del sito web dato che Google ne dedica uno per l’AMP.

La Tab AMP include tutte le “Accelerated Mobile Pages (AMP)” scoperte durante il crawl. Queste sono identificate tramite il tag HTML AMP e gli inlink rel=”amphtml”. 

Per popolare questa tab devi abilitare entrambe le opzioni “Store” e “Crawl” AMP ( “Config > Spider”).

  • Address: identifica l’URL scansionato.
  • Occurrences: il numero di tag link canonici scoperti (sia tramite l’elemento link che HTTP).
  • Indexability: identifica se l’URL è indicizzabile o non indicizzabile.
  • Indexability Status: identifica il motivo per cui un URL non può essere indicizzato.
  • Title 1: corrisponde al primo titolo titolo della pagina.
  • Title 1 Length: visualizza la lunghezza del titolo in base al numero di caratteri.
  • Title 1 Pixel Width: visualizza la larghezza del titolo della pagina misurato in pixel.
  • h1 – 1: corrisponde al primo heading H1 della pagina.
  • h1 – Len: visualizza il numero di caratteri della heading H1.
  • Size: definisce la dimensione in byte della pagina AMP.
  • Word Count: determina il numero complessivo di parole all’interno del tag body escludendo il markup HTML.
  • Text Ratio: corrisponde al rapporto fra il numero di caratteri del testo (“non-HTML”) trovati nel tag HTML body di una pagina e il numero totale di caratteri di cui è composta la pagina HTML visualizzando il dato in percentuale.
  • Crawl Depth: identifica la distanza della pagina AMP rispetto alla pagina iniziale di scansione in base al numero di click. Nel Seo Spider i reindirizzamenti sono contati come un livello supplementare.
  • Response Time: visualizza il tempo necessario per scaricare l’Url. L’unità di misura è il secondo.
  • La Tab AMP include due tipologie di filtri: la prima tipologia relativa a controlli puramente Seo, la seconda per specifiche peculiari delle pagine AMP.
  • Non-200 Response: identifica quali URL in versione AMP non rispondono con un codice di stato 200 “OK”. Le potenziali cause potrebbero essere: bloccati da robots.txt, nessuna risposta, reindirizzamenti, errori del client e del server.
  • Missing Non-AMP Return Link: identifica gli URL che hanno una versione AMP ma non prevedono il Tag Link rel=”amphtml” di ritorno all’URL AMP.
  • Missing Canonical to Non-AMP: visualizza gli URL AMP a cui manca il Tag Link verso URL canonical o che hanno un Tag Link verso un’altra risorsa AMP.
  • Non-Indexable Canonical: vengono mostrati gli URL AMP che hanno come canonical URL non indicizzabili. Normalmente i link canonical dovrebbero essere indicizzabili.
  • Non Indexable: identifica gli “Url AMP” che non sono indicizzabili perché correttamente canonicalizzati verso la versione desktop (canonical).
  • Indexable: visualizza gli “URL AMP” che sono indicizzabili. Gli URL AMP che hanno un equivalente desktop dovrebbero sempre essere non indicizzabili perchè canonicalizzati verso l’equivalente desktop. Solamente gli URL AMP che non hanno una versione equivalente desktop dovrebbero essere indicizzabili.

Vediamo un esempio di una pagina base AMP:

<!doctype html>
<html amp lang=”en”>
<head>
<meta charset=”utf-8”>
<script async src=”https://cdn.ampproject.org/v0.js”></script>
<title>Hello, AMPs</title>
<link rel=”canonical” href=”https://amp.dev/documentation/guides-and-tutorials/start/create/basic_markup/”>
<meta name=”viewport” content=”width=device-width,minimum-scale=1,initial-scale=1”>
<style amp-boilerplate>body{-webkit-animation:-amp-start 8s steps(1,end) 0s 1 normal both;-moz-animation:-amp-start 8s steps(1,end) 0s 1 normal both;-ms-animation:-amp-start 8s steps(1,end) 0s 1 normal both;animation:-amp-start 8s steps(1,end) 0s 1 normal both}@-webkit-keyframes -amp-start{from{visibility:hidden}to{visibility:visible}}@-moz-keyframes -amp-start{from{visibility:hidden}to{visibility:visible}}@-ms-keyframes -amp-start{from{visibility:hidden}to{visibility:visible}}@-o-keyframes -amp-start{from{visibility:hidden}to{visibility:visible}}@keyframes -amp-start{from{visibility:hidden}to{visibility:visible}}</style><noscript><style amp-boilerplate>body{-webkit-animation:none;-moz-animation:none;-ms-animation:none;animation:none}</style></noscript>
</head>
<body>
<h1 id=”hello”>Hello AMPHTML World!</h1>
</body>
</html>
  • Missing HTML AMP Tag: le pagine AMP HTML devono contenere un tag HTML o HTML AMP di primo livello.
<html amp lang=”en”>
  • Missing/Invalid HTML Doctype HTML Tag: le pagine AMP HTML devono iniziare con il doctype, doctype HTML tipico di Html5 e attraverso questo filtro ti vengono segnalate le pagine che non lo prevedono o lo hanno impostato in modo errato.
<!doctype html>
  • Missing Head Tag: le pagine AMP HTML devono contenere il tag head che invece è considerato opzionale in HTML.
<head>...</head>
  • Missing Tag Body: i documenti AMP HTML devono contenere il tag <body>. Questo filtro visualizza le pagine in cui il tag è mancante.
  • Missing Canonical: gli URL AMP devono contenere un tag canonical all’interno dell’Head che punta alla versione HTML regolare (non AMP) del documento HTML AMP, o a se stesso se non esiste tale versione HTML.
  • Missing/Invalid Meta Charset Tag: le pagine AMP HTML devono contenere un tag meta charset=”utf-8″ subito dopo il tag <head> che serve per codificare la pagina.
  • Missing/Invalid Meta Viewport Tag: le pagine AMP HTML devono contenere il meta name=”viewport” content=”width=device-width,minimum-scale=1″ tag all’interno del loro tag head. Si raccomanda anche di includere initial-scale=1 per ottenere una viewport responsive.
  • Missing/Invalid AMP Script: il Seo Spider controlla che le pagine AMP HTML contengano un tag script async src=”https://cdn.ampproject.org/v0.js” all’interno del loro tag head.
  • Missing/Invalid AMP Boilerplate: identifica le pagine AMP HTML che non contengono il codice boilerplate AMP nel loro tag head oppure lo stesso è invalido. Il codice AMP-boilerplate <style amp-boilerplate>…</style> nasconde il contenuto della pagina impostando l’opacità della sezione body a 0. Dopo aver caricato l’AMP il sistema calcola il layout della pagina e il sistema AMP imposta l’opacità della sezione body a 1 permettendo di vedere il contenuto.
  • Contains Disallowed HTML: identifica ogni URL AMP con HTML non consentito per AMP.