Guía XPath: Qué es y cómo utilizarlo?

XPath, también conocido como XML Path, es uno de los localizadores más utilizados que puede ayudarnos a navegar a través de la estructura HTML de una página. Se puede usar para documentos HTML y XML para ubicar cualquier elemento en una página web usando la estructura HTML DOM.

Formato básico de XPath:

//nombreDeLaEtiqueta[@Atributo='valor']
Explicación del código anterior:

// Buscar nodo actual
nombreDeLaEtiqueta El nombre de la etiqueta del nodo actual
@ Seleccionar el atributo
Atributo El nombre del atributo que estamos buscando
Valor El valor que tiene que encontrar

Utilizando XPath desde Google Chrome

El XPath al ser el lenguaje utilizado para seleccionar elementos en una página HTML, nos permite ubicar cualquier elemento en una página según su nombre de etiqueta, ID, clase CSS, etc.

Utilizando XPath desde el inspector de elementos de Google Chrome:

*Nota: Para acceder al inspector de elementos de Google Chrome, es necesario hacer Clic derecho sobre la página que nos encontramos y seleccionar la opción de «Inspeccionar».

Automatización y extracción de datos con XPath desde Google Sheet

Usando XPath para SEO

Algunos de los usos más comunes en SEO, a la hora de realizar una revisión de un sitio web pueden ser los siguiente:

Encontrar Title con XPath

//title

Encontrar Description con XPath

//meta[@name="description"]/@content

Encontrar H1 con XPath

//h1

Encontrar URL Canonical con XPath

//link[@rel="canonical"]/@href

Documentación de referencia:


Artículos relacionados