XPath, también conocido como XML Path, es uno de los localizadores más utilizados que puede ayudarnos a navegar a través de la estructura HTML de una página. Se puede usar para documentos HTML y XML para ubicar cualquier elemento en una página web usando la estructura HTML DOM.
Contenidos de la página
Formato básico de XPath:
//nombreDeLaEtiqueta[@Atributo='valor']
// | Buscar nodo actual |
nombreDeLaEtiqueta | El nombre de la etiqueta del nodo actual |
@ | Seleccionar el atributo |
Atributo | El nombre del atributo que estamos buscando |
Valor | El valor que tiene que encontrar |
Utilizando XPath desde Google Chrome
El XPath al ser el lenguaje utilizado para seleccionar elementos en una página HTML, nos permite ubicar cualquier elemento en una página según su nombre de etiqueta, ID, clase CSS, etc.
Utilizando XPath desde el inspector de elementos de Google Chrome:
*Nota: Para acceder al inspector de elementos de Google Chrome, es necesario hacer Clic derecho sobre la página que nos encontramos y seleccionar la opción de «Inspeccionar».
Automatización y extracción de datos con XPath desde Google Sheet
Usando XPath para SEO
Algunos de los usos más comunes en SEO, a la hora de realizar una revisión de un sitio web pueden ser los siguiente:
Encontrar Title con XPath
//title
Encontrar Description con XPath
//meta[@name="description"]/@content
Encontrar H1 con XPath
//h1
Encontrar URL Canonical con XPath
//link[@rel="canonical"]/@href
Documentación de referencia: