{"id":48571,"date":"2022-10-26T14:46:39","date_gmt":"2022-10-26T14:46:39","guid":{"rendered":"https:\/\/wpstaging.mailrelay.com\/glossary\/robots-txt\/"},"modified":"2022-10-26T14:46:48","modified_gmt":"2022-10-26T14:46:48","slug":"robots-txt","status":"publish","type":"glossary","link":"https:\/\/wpstaging.mailrelay.com\/es\/glossary\/robots-txt\/","title":{"rendered":"Robots.txt"},"content":{"rendered":"<p><html><body><\/p>\n<p>El archivo robots.txt es un documento donde se indica, a las ara&ntilde;as de indexaci&oacute;n de los motores de b&uacute;squedas, qu&eacute; partes de un sitio web pueden se indexadas y proporciona un enlace al XML-sitemap.<\/p>\n<p>Dicho de forma mas sencilla, un archivo robots.txt indica a los rastreadores de los buscadores a qu&eacute; URLs de un sitio pueden acceder, pero en ninguna caso es un mecanismo que impida que la p&aacute;gina sea indexada, pues muchos rastreadores hacen caso omiso a las instrucciones del robots.txt.<\/p>\n<p>Cuando los rastreadores o ara&ntilde;as no hacen caso de la negaci&oacute;n de indexaci&oacute;n que se les coloca en el robots.txt (que no es otra que noindex), ser&aacute; necesario proteger la p&aacute;gina web contrase&ntilde;a que impedir que indexen la web en cuesti&oacute;n.<\/p>\n<h2>1. &iquest;Para qu&eacute; se usa el archivo robots.txt?<\/h2>\n<p>De forma general, el archivo robots.txt es utilizado para dar ordenes concreta y especificas a los rastreadores de los distintos motores de b&uacute;squeda. Pero vamos a mostrar algunas funciones m&aacute;s espec&iacute;ficas.<\/p>\n<ul>\n<li><strong>Controla el acceso a los recursos gr&aacute;ficos.<\/strong> Permiten indicar si se desea impedir que los archivos de imagen de nuestra web aparezcan en los resultados de b&uacute;squeda. Siendo de vital importancia, para intentar tomar el control sobre la infogr&aacute;ficas e im&aacute;genes con informaci&oacute;n t&eacute;cnica de productos que tengamos. De tal forma que los interesados en dicha informaci&oacute;n, en primera instancia, solo pueden acceder a ella visitando nuestra web.<\/li>\n<li><strong>Restringe el acceso a ciertas p&aacute;ginas web<\/strong>. Los sitios web est&aacute;n formados por m&uacute;ltiples p&aacute;ginas, resultando interesante poder restringir la indexaci&oacute;n de p&aacute;ginas que no son interesantes que aparezcan en los resultados de b&uacute;squeda. Existen muchos motivos para ello, generalmente es para que las visitas del los rastreadores no influyan negativamente en el rendimiento de nuestro servidor web y para trabajar el posicionamiento SEO (evitando posicionar contenido que no interesa y centrar los esfuerzos en dar relevancia al que si interesa posicionar).<\/li>\n<li><strong>Bloquear el acceso a los archivos y directorios.<\/strong> Es de gran utilidad para evita que los rastreadores metan la nariz en los directorios y archivos que solo son recursos para el correcto funcionamiento del sitio web, contienen informaci&oacute;n que es exclusiva para ciertos usuarios o simplemente es contenido duplicado.<\/li>\n<\/ul>\n<h2>2. &iquest;C&oacute;mo crear un archivo robots.txt?<\/h2>\n<p>Si bien, cualquier instalaci&oacute;n por defecto de un CMS, como <a href=\"https:\/\/mailrelay.com\/es\/blog\/2019\/04\/16\/formulario-de-suscripcion-mailrelay-en-wordpress\/\" title=\"C&oacute;mo a&ntilde;adir un formulario de suscripci&oacute;n Mailrelay en WordPress\">WordPress<\/a> crea por defecto un archivo robots.txt, pueden crearse f&aacute;cilmente para ello haciendo uso de un editor de text plano se debe de crear un archivo de texto plano en formato ASCII o UTF-8, para colocar en su interior las instrucciones de indexaci&oacute;n deseadas.<\/p>\n<p>Justo a continuaci&oacute;n vamos a mostrar algunas de los comandos o instrucciones de uso mas com&uacute;n en los robots.txt.<\/p>\n<h2>3. Comando de robots.txt<\/h2>\n<p>Los comandos que m&aacute;s asiduidad se utilizan en el documento robots.txt son:<\/p>\n<p><strong>User-agent:<\/strong>, tambi&eacute;n llamado agente de usuario, se usa para indicar a cada robots o ara&ntilde;as de los motores de b&uacute;squeda, lo que se desea de ellos. Es importante destacar que las instrucciones para cada uno de los rastreadores se realizan juntas, es decir se usa una sola instancia para Googlebot (Google search engine) para indicarle lo que se le permite o no hacer.<\/p>\n<p>Su sintaxis b&aacute;sica es:<\/p>\n<ul>\n<li><strong>User-agent:<\/strong> [robot concreto al que indicare las reglas]<\/li>\n<li><strong>Disallow:<\/strong> indica al robot que no debe acceder, ni indexar una URL, subdirectorio o directorio en concreto.<\/li>\n<li><strong>Disallow:<\/strong> [directorio que se desea bloquear]<\/li>\n<li><strong>Allow:<\/strong> justo lo contrario a Disallow:, en este caso se indicas al user-agente una URL, subdirectorio o directorio al que si debe acceder e indexar.<\/li>\n<\/ul>\n<h2>4. Ejemplos para robots.txt<\/h2>\n<p>Aqu&iacute; tienes algunos ejemplos de los bots o agentes de los principales buscadores:<\/p>\n<ul>\n<li>Googlebot (Google search engine)<\/li>\n<li>Googlebot-Image (Google-image search)<\/li>\n<li>Adsbot-Google (Google AdWords)<\/li>\n<li>Slurp (Yahoo)<\/li>\n<li>bingbot (Bing)<\/li>\n<\/ul>\n<p>Con ello vamos a poner algunos ejemplos de l&iacute;neas que podemos colocar en robots.txt y la utilidad de cada una:<\/p>\n<ul>\n<li>Todos los agentes tienen prohibido acceder a esos directorios\/archivos:<\/li>\n<\/ul>\n<p><code>User-agent: \\\\\\*<\/code><\/p>\n<p><code>Disallow: \/wp-admin\/<\/code><\/p>\n<p><code>Disallow: \/temp\/<\/code><\/p>\n<p><code>Disallow: \/precios.shtml<\/code><\/p>\n<ul>\n<li>Bloquear todas las im&aacute;genes del sitio web a Googlebot-Image :<\/li>\n<\/ul>\n<p><code>User Agent: Googlebot-Image<\/code><\/p>\n<p><code>Disallow: \/<\/code><\/p>\n<ul>\n<li>Bloquear todos los archivos PDF a Googlebot:<\/li>\n<\/ul>\n<p><code>User-agent: Googlebot<\/code><\/p>\n<p><code>Disallow: \/\\\\\\*.pdf$<\/code><\/p>\n<p><\/body><\/html><\/p>\n","protected":false},"template":"","class_list":["post-48571","glossary","type-glossary","status-publish","hentry"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.7 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Robots.txt - Mailrelay<\/title>\n<meta name=\"robots\" content=\"noindex, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Robots.txt - Mailrelay\" \/>\n<meta property=\"og:description\" content=\"El archivo robots.txt es un documento donde se indica, a las ara&ntilde;as de indexaci&oacute;n de los motores de b&uacute;squedas, qu&eacute; partes de un sitio web pueden se indexadas y proporciona un enlace al XML-sitemap. Dicho de forma mas sencilla, un archivo robots.txt indica a los rastreadores de los buscadores a qu&eacute; URLs de un sitio [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/wpstaging.mailrelay.com\/es\/glossary\/robots-txt\/\" \/>\n<meta property=\"og:site_name\" content=\"Mailrelay\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/Mailrelay\/\" \/>\n<meta property=\"article:modified_time\" content=\"2022-10-26T14:46:48+00:00\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:site\" content=\"@mailrelay\" \/>\n<meta name=\"twitter:label1\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data1\" content=\"4 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/glossary\\\/robots-txt\\\/\",\"url\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/glossary\\\/robots-txt\\\/\",\"name\":\"Robots.txt - Mailrelay\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/#website\"},\"datePublished\":\"2022-10-26T14:46:39+00:00\",\"dateModified\":\"2022-10-26T14:46:48+00:00\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/glossary\\\/robots-txt\\\/#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/glossary\\\/robots-txt\\\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/glossary\\\/robots-txt\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Robots.txt\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/#website\",\"url\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/\",\"name\":\"Mailrelay\",\"description\":\"Mailrelay.com\",\"publisher\":{\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"es\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/#organization\",\"name\":\"Mailrelay\",\"url\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/wp-content\\\/uploads\\\/2021\\\/12\\\/logo.png\",\"contentUrl\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/wp-content\\\/uploads\\\/2021\\\/12\\\/logo.png\",\"width\":190,\"height\":49,\"caption\":\"Mailrelay\"},\"image\":{\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/www.facebook.com\\\/Mailrelay\\\/\",\"https:\\\/\\\/x.com\\\/mailrelay\",\"https:\\\/\\\/www.youtube.com\\\/mailrelay-email-marketing\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Robots.txt - Mailrelay","robots":{"index":"noindex","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"og_locale":"es_ES","og_type":"article","og_title":"Robots.txt - Mailrelay","og_description":"El archivo robots.txt es un documento donde se indica, a las ara&ntilde;as de indexaci&oacute;n de los motores de b&uacute;squedas, qu&eacute; partes de un sitio web pueden se indexadas y proporciona un enlace al XML-sitemap. Dicho de forma mas sencilla, un archivo robots.txt indica a los rastreadores de los buscadores a qu&eacute; URLs de un sitio [&hellip;]","og_url":"https:\/\/wpstaging.mailrelay.com\/es\/glossary\/robots-txt\/","og_site_name":"Mailrelay","article_publisher":"https:\/\/www.facebook.com\/Mailrelay\/","article_modified_time":"2022-10-26T14:46:48+00:00","twitter_card":"summary_large_image","twitter_site":"@mailrelay","twitter_misc":{"Tiempo de lectura":"4 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/wpstaging.mailrelay.com\/es\/glossary\/robots-txt\/","url":"https:\/\/wpstaging.mailrelay.com\/es\/glossary\/robots-txt\/","name":"Robots.txt - Mailrelay","isPartOf":{"@id":"https:\/\/wpstaging.mailrelay.com\/es\/#website"},"datePublished":"2022-10-26T14:46:39+00:00","dateModified":"2022-10-26T14:46:48+00:00","breadcrumb":{"@id":"https:\/\/wpstaging.mailrelay.com\/es\/glossary\/robots-txt\/#breadcrumb"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/wpstaging.mailrelay.com\/es\/glossary\/robots-txt\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/wpstaging.mailrelay.com\/es\/glossary\/robots-txt\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/wpstaging.mailrelay.com\/es\/"},{"@type":"ListItem","position":2,"name":"Robots.txt"}]},{"@type":"WebSite","@id":"https:\/\/wpstaging.mailrelay.com\/es\/#website","url":"https:\/\/wpstaging.mailrelay.com\/es\/","name":"Mailrelay","description":"Mailrelay.com","publisher":{"@id":"https:\/\/wpstaging.mailrelay.com\/es\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/wpstaging.mailrelay.com\/es\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"es"},{"@type":"Organization","@id":"https:\/\/wpstaging.mailrelay.com\/es\/#organization","name":"Mailrelay","url":"https:\/\/wpstaging.mailrelay.com\/es\/","logo":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/wpstaging.mailrelay.com\/es\/#\/schema\/logo\/image\/","url":"https:\/\/wpstaging.mailrelay.com\/wp-content\/uploads\/2021\/12\/logo.png","contentUrl":"https:\/\/wpstaging.mailrelay.com\/wp-content\/uploads\/2021\/12\/logo.png","width":190,"height":49,"caption":"Mailrelay"},"image":{"@id":"https:\/\/wpstaging.mailrelay.com\/es\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/Mailrelay\/","https:\/\/x.com\/mailrelay","https:\/\/www.youtube.com\/mailrelay-email-marketing"]}]}},"uagb_featured_image_src":[],"uagb_author_info":{"display_name":"mailrelay","author_link":"https:\/\/wpstaging.mailrelay.com\/es\/blog\/author\/"},"uagb_comment_info":0,"uagb_excerpt":"El archivo robots.txt es un documento donde se indica, a las ara&ntilde;as de indexaci&oacute;n de los motores de b&uacute;squedas, qu&eacute; partes de un sitio web pueden se indexadas y proporciona un enlace al XML-sitemap. Dicho de forma mas sencilla, un archivo robots.txt indica a los rastreadores de los buscadores a qu&eacute; URLs de un sitio&hellip;","_links":{"self":[{"href":"https:\/\/wpstaging.mailrelay.com\/es\/wp-json\/wp\/v2\/glossary\/48571","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wpstaging.mailrelay.com\/es\/wp-json\/wp\/v2\/glossary"}],"about":[{"href":"https:\/\/wpstaging.mailrelay.com\/es\/wp-json\/wp\/v2\/types\/glossary"}],"version-history":[{"count":1,"href":"https:\/\/wpstaging.mailrelay.com\/es\/wp-json\/wp\/v2\/glossary\/48571\/revisions"}],"predecessor-version":[{"id":48747,"href":"https:\/\/wpstaging.mailrelay.com\/es\/wp-json\/wp\/v2\/glossary\/48571\/revisions\/48747"}],"wp:attachment":[{"href":"https:\/\/wpstaging.mailrelay.com\/es\/wp-json\/wp\/v2\/media?parent=48571"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}