Inicio/Blog/Robots.txt explicado para principiantes

10 min de lectura

Robots.txt explicado para principiantes

Entiende que hace un archivo robots.txt, que no hace y como crear una version limpia para un sitio pequeno sin bloquear las paginas equivocadas.

Publicado 2026-04-07Actualizado 2026-04-07By Badr.A
Ilustracion de reglas para crawlers y el esquema de un archivo robots.txt
La narración natural solo está disponible actualmente para artículos del blog en inglés.
Mapa del artículo

Tabla de contenido

Ve directamente a la sección que quieres sin desplazarte por todo el artículo.

05
Secciones

Que hace realmente un archivo robots.txt

Un archivo robots.txt ofrece instrucciones de rastreo a los bots de los motores de busqueda. Indica a los crawlers compatibles que partes del sitio pueden o no solicitar. Eso es util para evitar gasto de rastreo en paginas o rutas que no quieres destacar.

Lo que no hace es ocultar contenido privado de forma segura. Si algo no debe ser publico, robots.txt no es el metodo de proteccion. Es un archivo de instrucciones para crawlers, no un sistema de control de acceso.

Por que los principiantes suelen complicarlo demasiado

Muchos sitios pequenos no necesitan un archivo robots.txt complejo. Los problemas suelen aparecer cuando alguien copia una plantilla enorme de otro sitio sin entender que hace cada regla.

Eso puede bloquear por accidente paginas importantes, recursos o directorios. Un archivo mas simple suele ser mas seguro porque refleja la estructura real del sitio y no una lista generica.

Lo que suele necesitar un sitio pequeno

La mayoria de los sitios pequenos solo necesitan un conjunto pequeno de instrucciones. Si quieres que los buscadores rastreen el contenido principal y ya tienes un sitemap, el archivo puede ser muy corto.

En muchos casos, la referencia al sitemap es la parte mas util. Facilita el descubrimiento y mantiene el archivo practico en lugar de decorativo.

  • Permite el acceso a las paginas publicas normales
  • Bloquea solo rutas de bajo valor o puramente operativas cuando haga falta
  • Incluye la ubicacion del sitemap
  • Mantén reglas faciles de entender y mantener

Errores que generan confusion de indexacion

Un error comun es usar robots.txt para intentar eliminar contenido de Google. Otro es bloquear JavaScript, CSS o recursos esenciales que ayudan a los motores de busqueda a entender bien la pagina.

Un tercer error es dejar reglas antiguas despues de cambios en el sitio. Cuando la web evoluciona, el archivo de rastreo tambien debe revisarse. Si no, las instrucciones antiguas pueden entrar en conflicto con la estructura actual.

Una forma mas segura de crear el archivo

Escribe el archivo alrededor del sitio que realmente tienes. Parte de las reglas minimas necesarias y amplia solo cuando exista una razon clara. Si necesitas una base limpia, usa un generador de robots.txt y verifica que cada directiva coincida con una ruta o un objetivo real.

Para sitios pequenos, la claridad importa mas que la complejidad. Un archivo corto y correcto es mejor que uno largo copiado desde otra parte.

Preguntas frecuentes

Respuestas útiles

Robots.txt puede impedir por completo que una pagina aparezca en Google?

No de forma fiable. Robots.txt controla el acceso del crawler, pero no equivale a una gestion correcta de noindex ni a un control de acceso privado.

Todas las webs necesitan un archivo robots.txt?

No siempre, pero muchos sitios se benefician de uno sencillo, sobre todo cuando tambien quieren indicar a los crawlers donde esta el sitemap.

Debo bloquear rutas de administracion en robots.txt?

Puede ser razonable desalentar el rastreo de rutas puramente administrativas, pero esas zonas igualmente deben protegerse bien y no depender de robots.txt para su seguridad.