Contenidos
Ver sitemap de una web
generador de mapas del sitio web
Robots.txt es un archivo especial que contiene directivas para los robots de los motores de búsqueda. También es el lugar para incluir el enlace al mapa del sitio para facilitar que los motores de búsqueda detecten el mapa del sitio y rastreen el sitio web.
También puede limitar la búsqueda un poco y probar algo como site:moz.com filetype:xml inurl:sitemap o site:moz.com ext:xml inurl:sitemap que buscará archivos XML que tengan la palabra “sitemap” dentro del dominio moz.com.
Para ello, puedes utilizar el comando site:moz.com filetype:txt inurl:sitemap o site:moz.com ext:txt inurl:sitemap que buscará los archivos de texto que contengan la palabra “sitemap” dentro del dominio moz.com
XML es el formato de mapa de sitio más común que se utiliza para informar a los robots sobre las páginas web de un sitio. Sin embargo, también existen otros posibles formatos de sitemaps que los robots de los motores de búsqueda reconocen y respetan:
plantilla del mapa del sitio web
Es la hora en que la URL fue modificada por última vez. Esta información permite a los rastreadores evitar volver a rastrear documentos que no han cambiado. Nuestro generador establecerá este campo a partir de las cabeceras de respuesta “Last-modified” de su servidor cuando estén disponibles.
La prioridad de una URL particular es relativa a otras páginas del mismo sitio web. El valor de este atributo es un número entre 0,0 (el más bajo) y 1,0 (el más alto). Nuestro generador disminuirá gradualmente la prioridad en función de la “profundidad de la página”, es decir, a cuántos clics de distancia se encuentra de la página principal.
url del mapa del sitio
Robots.txt es un archivo especial que contiene directivas para los robots de los motores de búsqueda. También es el lugar donde se incluye el enlace al mapa del sitio para facilitar que los motores de búsqueda lo detecten y rastreen el sitio web.
También puede limitar la búsqueda un poco y probar algo como site:moz.com filetype:xml inurl:sitemap o site:moz.com ext:xml inurl:sitemap que buscará archivos XML que tengan la palabra “sitemap” dentro del dominio moz.com.
Para ello, puedes utilizar el comando site:moz.com filetype:txt inurl:sitemap o site:moz.com ext:txt inurl:sitemap que buscará los archivos de texto que contengan la palabra “sitemap” dentro del dominio moz.com
XML es el formato de mapa de sitio más común que se utiliza para informar a los robots sobre las páginas web de un sitio. Sin embargo, también existen otros posibles formatos de sitemaps que los robots de los motores de búsqueda reconocen y respetan:
ejemplo de mapa del sitio
El mapa del sitio debería procesarse inmediatamente. Sin embargo, puede llevar algún tiempo rastrear las URLs listadas en un mapa del sitio, y es posible que no se rastreen todas las URLs de un mapa del sitio, dependiendo del tamaño del sitio, la actividad, el tráfico, etc.
Dominio diferente: Compruebe que todas las URL comienzan con el mismo dominio que la ubicación de su mapa del sitio. Por ejemplo, si su mapa del sitio está en http://www.example.com/sitemap.xml, las siguientes URL no son válidas para ese mapa del sitio:
Su mapa del sitio tiene más de 50 MB sin comprimir. Si su mapa del sitio supera el límite, divídalo en varios mapas del sitio más pequeños y escríbalos en un archivo de índice del mapa del sitio y envíe los archivos de índice del mapa del sitio.
Ha asignado un valor no válido a un atributo de etiqueta XML. Compruebe sus mapas del sitio para asegurarse de que sólo están presentes los atributos permitidos y de que sólo asigna valores permitidos de acuerdo con las especificaciones del mapa del sitio. Compruebe que los atributos y los valores no estén mal escritos.
Su mapa del sitio contiene una o varias fechas no válidas. Este error puede deberse a que una fecha tiene un formato incorrecto o a que la propia fecha no es válida. Las fechas deben utilizar la codificación W3C Datetime, aunque puede omitir la parte de la hora. Asegúrese de que sus fechas coinciden con uno de los siguientes formatos W3C Datetime: