¿Cómo encontrar enlaces rotos (broken links) – Errores 404?

Enlaces muertos pueden afectar negativamente el SEO de tu sitio web y también son malos para la usabilidad. Entonces es importante encontrar y arreglarlos.

Enlaces rotos

Enlaces rotos -también conocidos como enlaces muertos (broken links o dead links)- son links a páginas (u otros contenidos web como pdf o imágenes) que no existen.Página no encontrada.

Cómo surgen enlaces rotos?

  • Se comete un error al  escribir un enlace.
  • Se borra una página o cambia el url de una página sin borrar/actualizar los enlaces internos a esa página.
  • Se añade un enlace con un url relativo (por ejemplo “home.html”) en una página que está ubicada en una carpeta dentro del servidor y no en la raíz del servidor.  Mejor es utilizar url absolutos (“http://www.dominio….”).
  • Mala configuración de las redirecciones en el archivo .htaccess.
  • Especialmente luego de un relanzamiento de un sitio web aparecen los broken links.

¿Por qué los enlaces muertos causan problemas?

Enlaces que van a una página que no existe pueden causar problemas con la usabilidad y el SEO.

Usabilidad

A nadie le gusta hacer clic en un enlace y llegar a una página que muestra un mensaje de error.

Esto significa que el usuario tiene que buscar otra vez y de otra forma. Por ejemplo, si el link que no funciona bien se encuentra en la navegación el usuario tiene que utilizar la búsqueda interna.
Esto cuesta tiempo. Muchos internautas tampoco no tienen ganas de hacerlo y se van a otro sitio web (o Google por ejemplo).

SEO

Enlaces internos ayudan a Google encontrar todos los contenidos de un sitio web. Links muertos pueden causar que Google no encuentre una página. Una página que no fue encontrada por Google tampoco sale en los resultados de búsqueda.

En este sentido también interesante es el “crawl budget” que Google da a un sitio. Principalmente es el número de páginas de un sitio que Google rastrear. Si el bot de Google pierde mucho tiempo y entonces recursos en seguir vínculos que no existen tal vez no se quede suficiente crawl budget para rastrear otras páginas.

Enlaces internos son un factor del posicionamiento web. Con cada link una paǵina web recibe link juice.

En todo caso, broken links y errores 404 no provocan que Google penalice un sitio web (https://www.seroundtable.com/google-404-penalty-20720.html)

Errores 404

Cuando haces clic en un enlace roto el servidor devuelve una página de error 404. Este es un código de estado  HTTP. Significa que el servidor responde correctamente pero la página/el contenido no existe (o no existe en este lugar).

El primer “4” del error 404 significa que el error es causado por el cliente, entonces la persona que maneja un sitio web. Existen varios errores de “4”. También hay varios tipos de errores 404: 404.1, 404.2, etc.

Principalmente podemos distinguir entre dos errores 404 distintos:

  • 404 “normal”
  • 404 leve

El error 404 “normal”: los servidores muestran una página con el error 404. En muchos casos se puede configurar esta pagina manualmente para que contenga un diseño como las otras páginas de un sitio y enlaces a páginas importantes del sitio y/o un buscador interno.

404 leve significa que el servidor no muestra la página de error 404 al usuario sino una página web que muestra el código HTTP 200 (“todo bien”).  Esto pasa por ejemplo, por una mala configuración de la página 404 en el archivo .htaccess (la página de error tiene una dirección absoluta -http:www://example.com/xzy en vez de una relativa /xzy.

Error 404 leve
Error 404 leve – encontrado a través de Search Console.
En el código PHP hay un error, por eso sale solo una línea de texto con un mensaje de error.

Errores 404 leves también pueden aparecer cuando el código de http revuelve 200 pero al mismo tiempo el contenido de la página está totalmente destruido.

Herramientas, programas y extensiones para encontrar enlaces rotos

Es posible revisar una página web manualmente por enlaces que llevan a una página 404. Pero especialmente en el caso de páginas que contienen muchos links y sitios grandes con muchas páginas es mejor utilizar alguna herramienta.

Google Search Console

Google rastrea tu sitio web frecuentemente y encuentra enlaces muertos. Estos enlaces salen en Search Console en «Errores de Rastreo».

Search Console te muestra enlaces rotos a páginas 404 («No se encuentran») y también errores 404 leves.

Páginas en «no se encuentran» son páginas que no existen, pero existen links a estas páginas desde otras páginas de tu sitio, desde el mapa del sitio pero también desde otros sitios web/redes sociales.

La ventaja de Search Console es que te muestra la página que contiene el vínculo roto a la página que no existe. Por eso -si el error está dentro de tu sitio- es faćil arreglarlo.También encuentra errores 404 leves.

La desventaja es que Google normalmente no rastrear todo el sitio, sino solo partes. Entonces normalmente no encuentra todos los errores en los links inmediatamente.

Herramientas online para encontrar errores 404

Dead Link Checker

Dead Link Checker - herramienta para encontrar enlaces rotos.

Dead Link Checker es una herramienta online. La herramienta hace lo que dice en su nombre: revisar sitios web por vínculos muertos. La herramienta no solo revisar enlaces a otras páginas sino también los enlaces a imágenes (img src) o códigos de javascript.

Enlaces a páginas con un url que comienza con https pero sin certificado SSL o con un certificado no válido/con errores también como links muertos.

En la versión gratuita solo puedes revisar un dominio al mismo tiempo. Si quieres revisar varios dominios con sitios grandes al mismo tiempo tienes que pagar para el uso de la herramienta.

Puedes revisar un sitio completo o una sola página web.

Dead Link Checker trabaja rápidamente. Sin embargo en el caso de sitios grandes el análisis puede demorar.

deadlinkchecker
Reporte de DeadLinkChecker

Cuando la herramienta termina su trabajo puedes hacer clic en «full report». Te sale una lista con todos los enlaces rotos, el tipo de enlace -a una página web, una imagen, etc.- y donde está ubicado el enlace roto. Además, muestra el código de respuesta del servidor (por ejemplo 404) y también el texto del anclaje del link (si existe).

Ventaja: no solo encuentran enlaces que no funcionan a otras páginas, sino también a imágenes, códigos de javascript y a urls que utilizan https pero no tienen un certificado válido.

Desventaja: en la versión gratuita puedes revisar un máximo de 2000 url por dominio.

Online Broken Link Checker

Broken Link Checker

Con Online Broken Link Checker puedes revisar un sitio con un máximo de 3000 páginas al tiempo (el programa termina su trabajo luego de haber revisado 3000 páginas, no importa si tu sitio tiene más páginas). Si quieres revisar sitios más grande tienes que pagar por el servicio.

Hay dos opciones que puedes escoger: «Report distinct broken links only» y «Report all occurrences of each dead link».

Si escoges la primera opción te sale cada enlace roto una sola vez, también si realmente existe en varias páginas. Si escoges la segunda opción te salen todos los links muertos en todas las páginas.

Si escoges «Report distinct broken links only» te sale una lista con el link que no funciona, el lugar donde se encuentra este link y el tipo de respuesta del servidor (en general 404).

La herramienta muestra el error 404 en el código fuente.
A través del código fuente es muy fácil encontrar los errores.

Ventajas: Si haces clic en el «src» del reporte te sale una página donde la herramienta te muestra la parte del código fuente de la página que revisaste con el link roto marcado. De esta manera es muy fácil encontrar y arreglar el problema.

Desventaja: Trabaja lentamente si revisas un sitio grande que contiene muchos vínculos internos (también si solo escoges «Report distinct broken links only» que supuestamente trabaja más rápido que la otra opción). Solo comprueba enlaces a páginas web. Para revisar otros archivos (pdf, imágenes, etc.) tienes que pagar.

W3C Link Checker

W3C Link Checker

El Link Checker del World Wide Web Consortium sirve para revisar los enlaces de páginas web y también de sitios.

Puedes escoger la “profundidad” del análisis: hasta qué nivel de un sitio la herramienta sigue a los links/cuántas enlaces sigue la herramienta hasta que termine su trabajo. Por ejemplo, puedes escoger que la herramienta solo revisa una página, o que la herramienta sigue todos los enlaces de una paǵina y revisa los enlaces de las páginas vinculadas, etc.

En las pruebas que hice nunca logré comprobar un sitio de 144 páginas completamente. La herramienta solo revisó como 50 páginas.

Ventaja: Los resultados son muy detallados. La herramienta te informa dónde (qué línea del código) ocurrió un error en el código. Además, se revisa redirecciones 301.

Desventaja: trabaja lentamente y no sirve para revisar sitios grandes completamente.

Dr. Link Check

Dr. Link Check
El link al perfil de LinkedIn es antiguo. Pero funciona como redirección. Entonces realmente no es un dead link.

Otra herramienta web que sirve para revisar los vínculos de un sitio web. Dr. Link Check te muestra cuáles son los links internos, externos, cuáles son redirecciones, cuáles van a una página que sale en una lista negra por contener spam o algún tipo de malware y cuáles no funcionan,

Ventaja: analiza los sitios rápidamente.

Desventaja: Revisa un máximo de 1000 urls por sitio.

Page Image and Link Analysis

Herramienta de WebmasterWorld para encontrar errores 404 en un sitio web.

Es una herramienta de WebmasterWorld. Puedes utilizarla para analizar los enlaces de una página y para obtener información sobre las imágenes dentro de la página (tamaño, peso, texto alternativo).

Ventaja: Te muestra una lista con todos los links de la página analizada con información sobre redirecciones, broken links, código del servidor, etc.

Desventaja: solo puedes analizar una página al tiempo.

Dr. Watson

Dr. Watson

Con Dr. Watson puedes revisar los urls de una página web a otras páginas y también las imágenes vinculadas.

Ventaja: trabaja rápidamente. No solo busca por errores 404 sino también puede revisar el código html, cuenta las palabras, busca por backlinks, etc.

Desventaja: solo revisa una página, no sirve para comprobar los urls de un sitio completo.

Extensiones para navegadores

Check my links

Check my links - herramienta para el navegador Chorme.

Check my links es una extensión para Chrome. Con un clic puedes revisar los enlaces de una página web a otras páginas.

La extensión te muestra links que no funcionan, los que funcionan y también “warnings”. “Warnings” pueden ser por ejemplo enlaces vacíos (href=””). Puedes configurar cuáles enlaces salen como “warnings”. También puedes configurar los enlaces que la extensión no debe revisar, por ejemplo: “googleleads.g.doubleclick.net”.

En su configuración estándar Check my links no revisa enlaces nofollow.

Ventaja: puedes revisar rápidamente una página web.

Desventaja: no sirve para revisar sitios grandes porque solo puedes revisar página por página. Hay una opción de exportar los resultados en formato csv. Pero no me funciona. Leí en un foro de GitHub que otros usuarios tienen el mismo problema.

Broken Link Checker – Atomseo

Broken Link Checker

Es otra extensión de Chrome. Puedes revisar una sola página o un sitio completo.

Si escoges revisar un sitio completo la extensión abre la página web de Atomseo. Atomseo ofrece una herramienta para buscar por errores 404 en un sitio web.

Herramienta online Atomseo

La herramienta revisa el sitio completo, pero solo muestra los primeros 5 resultados (primeros 5 errores) para enlaces internos rotos, enlaces externos rotos y enlaces de ancla.

Si quieres ver todos los errores tienes que abrir una cuenta en Atomseo. Puedes escoger un plan gratuito. Pero con este plan solo puedes revisar un máximo de 3000 páginas por sitio y un máximo de 5 sitios al día. Si quieres comprobar sitios más grandes tienes que pagar por la herramienta.

Ventaja: es rápido y fácil revisar una sola página a través de la extensión. Atomseo también trabaja rápidamente. No solo revisa vínculos internos, sino también externos y links de anclas.

Desventaja: para ver todos los resultados tienes que abrir una cuenta y para revisar sitios grandes tienes que pagar por el servicio.

LinkChecker (ya no existe)

Linkchecker - Extensión para Firefox

Es un complemento para FireFox que trabaja de forma como Check my links para Chrome. Enlaces que funcionan salen en verde, los que tienen errores aparecen  en rojo.

Ventaja: con un clic puedes revisar rápidamente una página web.

Desventaja: no vale para revisar sitios completos.

Pinger (ya no existe)

Pinger - Extensión para Firefox

Otra extensión para Firefox que sirve para buscar por errores 404. Puedes revisar una página completa. También puedes comprobar una sola parte de una página. Para esto tienes que marcar la parte que quieres comprobar con tu mouse.

Ventaja: también revisa imágenes (img src) y links de anclaje.

Desventaja: Solo sirve para revisar páginas, pero no un sitio completo.

Plugins de WordPress para encontrar errores 404

Existen algunos plugins para revisar tu sitio o blog de WordPress como Link Checker y WP Broken Link Status Checker.

Link Checker utilizar un crawler exterior para analizar tu sitio mientras el WP Broken Link Status Checker trabaja dentro de tu instalación de WordPress.

La ventaja de Link Checker es que no ocupa tantos recursos del servidor donde WordPress está instalado que WP Broken Link Status Checker mientras está trabajando.

Pero Link Checker en su versión gratuita solo revisa un máximo de 500 enlaces. El otro plugin no tiene esta restricción.

Un plugin interesante parece que es Google Analytics de MonsterInsights (antes Yoast Google Analytics).

Según la descripción en la web puedes revisar las páginas 404. Te sale el url que resultó en un error 404. También puedes ver donde sale el url mal escrito o el url que ya no existe.

Esto es especialmente práctico si quieres ver si hay urls en página externas (de otros sitios) que no funcionan. Es más difícil arreglar estos errores si no tienes acceso al sitio. Pero puedes pedirlo al webmaster del sitio donde sale el url con error.

El plugin no es gratuito.

Programas para encontrar broken links

Xenu’s Link Sleuth

Reporte de Xenu
Reporte de Xenu’s Link Sleuth.

Es un programa para PC (Windows). Puedes revisar sitios completos para encontrar errores 404. Xenu’s Link Sleuth analiza links a otros páginas internas, páginas externas, imágenes, archivos de css, archivos de javascript,

Revisa tu servidor por archivos no vinculados.
Revisa tu servidor por archivos no vinculados.

También es posible revisar su servidor/alojamiento web por archivos/imágenes que no están vinculados por ningún lado/otro archivo.

Al terminar un análisis el programa te da un reporte detallado sobre los resultados.

Ventaja: sin costo, puedes revisar sitios gigantes (se dice con más que un million de urls), trabaja rápidamente. No solo revisa links a páginas web, sino a muchos tipos de archivos.

Desventaja: solo funciona con Windows. Sin embargo, hay maneras de instalarlo en Linux o Mac.

Screaming Frog SEO Spider

screaming-frog

Screaming Frog es una una programa que puedes instalar en tu computadora. Revisa en la versión gratuita hasta 500 urls.

Muestra errores 404 de páginas web, imágenes y otros archivos.

Ventaja: los resultados son muy detallados. Es realmente una herramienta SEO onpage. No solo ofrece información sobre errores 404 sino también sobre muchos aspectos de las páginas revisadas, por ejemplo sobre el título, la descripción meta, etc.

Desventaja: Solo comprueba hasta 500 enlaces en la versión gratuita.

Otros programas

RankTank Bulk Domain Status Tool

RankTank Bulk Domain Status Tool

RankTank Bulk Domain Status Tool puedes utilizar a través de hojas de cálculo de Google. Tienes que copiar los urls y pegarlos en el archivo. Te sale el código http de cada url (200, 301, 404, 500).

Ventaja: es práctico si quieres revisar por ejemplo todos los urls de un mapa de sitio. Puedes copiarlos al archivo (un máximo de 6.000 urls) y revisarlos. Puedes ver para cuáles sale un error 404 y luego arreglar el mapa del sitio.

Desventaja: Solo revisar el código http de los urls, no es realmente una herramienta para enlaces muertos en una página web.

Resumen

Existen extensiones para navegadores, herramientas en línea y programas para buscar por errores 404 en sitios web. Para revisar una sola página o algunas pocas páginas con extensión para Firefox o Chrome seguramente es suficiente.

Para revisar sitios web pequeños/medianos una herramienta web en su forma gratuita puede ser suficiente. Pero si quieres comprobar los urls de uns sitio web grande necesitas una herramienta pagada o un programa como Xenu’s Link Sleuth o Screaming Frog.

Otras herramientas de SEO como MOZ también buscan y muestran enlaces rotos. Pero para usar estas herramientas tienes que pagar.

En todo caso comprobar lo que sale en Search Console sobre errores 404 siempre es recomendado.