{"id":48481,"date":"2022-10-26T14:41:44","date_gmt":"2022-10-26T14:41:44","guid":{"rendered":"https:\/\/wpstaging.mailrelay.com\/glossary\/data-lake\/"},"modified":"2022-10-26T14:42:24","modified_gmt":"2022-10-26T14:42:24","slug":"data-lake","status":"publish","type":"glossary","link":"https:\/\/wpstaging.mailrelay.com\/es\/glossary\/data-lake\/","title":{"rendered":"Data Lake"},"content":{"rendered":"<p><html><body><\/p>\n<p>Un data lake o lago de datos es un repositorio centralizado para todos nuestros datos, donde se pueden almacenar tanto datos estructurados como no estructurados, con sus correspondientes metadatos y que son disponibles bajo demanda en todo momento.<\/p>\n<p>Dentro del data Lake tienen cabida todo tipo de ficheros, independientemente de su fuente, escala o el formato que tengan y con todo ello se pueden ejecutar an&aacute;lisis, visualizaciones y procesos seg&uacute;n las necesidades puntuales que tenga la empresa.<\/p>\n<h2>1. &iquest;C&oacute;mo crear un data lake?<\/h2>\n<p>A pesar de que no existe una metodolog&iacute;a est&aacute;ndar para crear un data lake, en su proceso se deben tener en consideraci&oacute;n los siguientes pasos:<\/p>\n<p><strong>&#8211; Adquisici&oacute;n de datos a tratar.<\/strong> Como punto de inicio se han de obtener de datos y los metadatos, y prepararlos para la incorporaci&oacute;n al data lake. Identificando las fuentes y datos de m&aacute;s valor para las tareas a la que pueden ser aplicados.<\/p>\n<p><strong>&#8211; Data curation &oacute; grooming data.<\/strong> Tras ello entran en acci&oacute;n el conjunto de procesos que llevan a los datos crudos a datos consumibles por las aplicaciones anal&iacute;ticas. As&iacute; los datos pasan a tener formatos interpretables y reconocibles.<\/p>\n<p><strong>&#8211; Proveer los datos.<\/strong> En base a metainformaci&oacute;n de los datos, se ejecutan los procesos que permiten acceder a los datos contenidos en el data lake en base a las pol&iacute;ticas establecidas. Con ello se impide el acceso a datos inapropiados y est&aacute;n en disposici&oacute;n de ser utilizarlos de forma adecuada.<\/p>\n<p><strong>&#8211; Preservar de los datos<\/strong>. Finalmente entran en juego los procesos y pol&iacute;ticas que determinan los datos a conservarse y hasta cu&aacute;ndo. Del mismo modo sirve para garantizar la disponibilidad de los mismos y que el rendimiento\/recursos necesarios para acceder a los datos sea sostenible.<\/p>\n<h2>2. Ventajas de usar un data lake<\/h2>\n<p>Los principales beneficios del uso de un data lake pasan por ser los siguientes:<\/p>\n<ul>\n<li>A pesar de que la fuente original del dato est&eacute; obsoleta, su contenido puede seguir siendo de utilidad para su an&aacute;lisis.<\/li>\n<li>Centralizan todos los datos en un mismo lugar, sin importar el origen de los mismos.<\/li>\n<li>Con el permiso correcto, cualquier usuario relevante puede acceder y enriquecer la informaci&oacute;n para mejorar la toma de decisiones.<\/li>\n<li>Los datos procesados son susceptibles de ser procesados por herramientas de Big Data.<\/li>\n<li>La totalidad de los datos introducidos pueden ser normalizados y tratados.<\/li>\n<li>Se toman solo los datos seg&uacute;n las necesidades puntuales, reduciendo los costes y tiempos.<\/li>\n<\/ul>\n<h2>3. Data lake vs. Data warehouse<\/h2>\n<p>Cuando se trata de almacenar una cantidad ingente de datos, es com&uacute;n que al concepto de data lake se asocie el de data warehouse o almac&eacute;n de datos. El data warehouse, b&aacute;sicamente, son los distintos componentes del data lake que tienen como misi&oacute;n tratar datos estructurados.<\/p>\n<p>Ambos se centran en el almacenamiento de datos, existiendo diferencias como son:<\/p>\n<p><strong>&#8211; Accesibilidad.<\/strong> Un data lake ofrece una accesibilidad muy simple, por contra en un data warehouse este asunto es m&aacute;s complejo.<\/p>\n<p><strong>&#8211; Almacenamiento.<\/strong> El data lake cuenta con un coste limitado y es ampliable en la nube, mientras que un data warehouse es generalmente m&aacute;s caro.<\/p>\n<p><strong>&#8211; Esquema.<\/strong> Los data lakes se basan en esquemas On Read y los data warehouses en esquemas on write.<\/p>\n<p><strong>&#8211; Estructura de los datos.<\/strong> Data warehouse solo recoge datos ya estructurados, y data Lake toma datos tanto estructurados como no estructurados.<\/p>\n<p><strong>&#8211; Finalidad de los datos.<\/strong> El uso de los datos siempre estar definido en un data warehouse, mientras que en un data lake no siempre es as&iacute;.<\/p>\n<p><strong>&#8211; Flexibilidad.<\/strong> En un data lake es m&aacute;s f&aacute;cil hacer modificaciones por la ausencia de estructura, por contra es un data warehouse es mucho m&aacute;s complicado.<\/p>\n<p><strong>&#8211; Usuarios.<\/strong> Los datos en un data lake son manejados por analistas, en un data warehouse cualquier usuario autorizado a ello puede manejar los datos.<\/p>\n<p><\/body><\/html><\/p>\n","protected":false},"template":"","class_list":["post-48481","glossary","type-glossary","status-publish","hentry"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.7 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Data Lake - Mailrelay<\/title>\n<meta name=\"robots\" content=\"noindex, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Data Lake - Mailrelay\" \/>\n<meta property=\"og:description\" content=\"Un data lake o lago de datos es un repositorio centralizado para todos nuestros datos, donde se pueden almacenar tanto datos estructurados como no estructurados, con sus correspondientes metadatos y que son disponibles bajo demanda en todo momento. Dentro del data Lake tienen cabida todo tipo de ficheros, independientemente de su fuente, escala o el [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/wpstaging.mailrelay.com\/es\/glossary\/data-lake\/\" \/>\n<meta property=\"og:site_name\" content=\"Mailrelay\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/Mailrelay\/\" \/>\n<meta property=\"article:modified_time\" content=\"2022-10-26T14:42:24+00:00\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:site\" content=\"@mailrelay\" \/>\n<meta name=\"twitter:label1\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data1\" content=\"3 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/glossary\\\/data-lake\\\/\",\"url\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/glossary\\\/data-lake\\\/\",\"name\":\"Data Lake - Mailrelay\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/#website\"},\"datePublished\":\"2022-10-26T14:41:44+00:00\",\"dateModified\":\"2022-10-26T14:42:24+00:00\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/glossary\\\/data-lake\\\/#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/glossary\\\/data-lake\\\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/glossary\\\/data-lake\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Data Lake\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/#website\",\"url\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/\",\"name\":\"Mailrelay\",\"description\":\"Mailrelay.com\",\"publisher\":{\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"es\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/#organization\",\"name\":\"Mailrelay\",\"url\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/wp-content\\\/uploads\\\/2021\\\/12\\\/logo.png\",\"contentUrl\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/wp-content\\\/uploads\\\/2021\\\/12\\\/logo.png\",\"width\":190,\"height\":49,\"caption\":\"Mailrelay\"},\"image\":{\"@id\":\"https:\\\/\\\/wpstaging.mailrelay.com\\\/es\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/www.facebook.com\\\/Mailrelay\\\/\",\"https:\\\/\\\/x.com\\\/mailrelay\",\"https:\\\/\\\/www.youtube.com\\\/mailrelay-email-marketing\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Data Lake - Mailrelay","robots":{"index":"noindex","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"og_locale":"es_ES","og_type":"article","og_title":"Data Lake - Mailrelay","og_description":"Un data lake o lago de datos es un repositorio centralizado para todos nuestros datos, donde se pueden almacenar tanto datos estructurados como no estructurados, con sus correspondientes metadatos y que son disponibles bajo demanda en todo momento. Dentro del data Lake tienen cabida todo tipo de ficheros, independientemente de su fuente, escala o el [&hellip;]","og_url":"https:\/\/wpstaging.mailrelay.com\/es\/glossary\/data-lake\/","og_site_name":"Mailrelay","article_publisher":"https:\/\/www.facebook.com\/Mailrelay\/","article_modified_time":"2022-10-26T14:42:24+00:00","twitter_card":"summary_large_image","twitter_site":"@mailrelay","twitter_misc":{"Tiempo de lectura":"3 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/wpstaging.mailrelay.com\/es\/glossary\/data-lake\/","url":"https:\/\/wpstaging.mailrelay.com\/es\/glossary\/data-lake\/","name":"Data Lake - Mailrelay","isPartOf":{"@id":"https:\/\/wpstaging.mailrelay.com\/es\/#website"},"datePublished":"2022-10-26T14:41:44+00:00","dateModified":"2022-10-26T14:42:24+00:00","breadcrumb":{"@id":"https:\/\/wpstaging.mailrelay.com\/es\/glossary\/data-lake\/#breadcrumb"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/wpstaging.mailrelay.com\/es\/glossary\/data-lake\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/wpstaging.mailrelay.com\/es\/glossary\/data-lake\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/wpstaging.mailrelay.com\/es\/"},{"@type":"ListItem","position":2,"name":"Data Lake"}]},{"@type":"WebSite","@id":"https:\/\/wpstaging.mailrelay.com\/es\/#website","url":"https:\/\/wpstaging.mailrelay.com\/es\/","name":"Mailrelay","description":"Mailrelay.com","publisher":{"@id":"https:\/\/wpstaging.mailrelay.com\/es\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/wpstaging.mailrelay.com\/es\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"es"},{"@type":"Organization","@id":"https:\/\/wpstaging.mailrelay.com\/es\/#organization","name":"Mailrelay","url":"https:\/\/wpstaging.mailrelay.com\/es\/","logo":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/wpstaging.mailrelay.com\/es\/#\/schema\/logo\/image\/","url":"https:\/\/wpstaging.mailrelay.com\/wp-content\/uploads\/2021\/12\/logo.png","contentUrl":"https:\/\/wpstaging.mailrelay.com\/wp-content\/uploads\/2021\/12\/logo.png","width":190,"height":49,"caption":"Mailrelay"},"image":{"@id":"https:\/\/wpstaging.mailrelay.com\/es\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/Mailrelay\/","https:\/\/x.com\/mailrelay","https:\/\/www.youtube.com\/mailrelay-email-marketing"]}]}},"uagb_featured_image_src":[],"uagb_author_info":{"display_name":"mailrelay","author_link":"https:\/\/wpstaging.mailrelay.com\/es\/blog\/author\/"},"uagb_comment_info":0,"uagb_excerpt":"Un data lake o lago de datos es un repositorio centralizado para todos nuestros datos, donde se pueden almacenar tanto datos estructurados como no estructurados, con sus correspondientes metadatos y que son disponibles bajo demanda en todo momento. Dentro del data Lake tienen cabida todo tipo de ficheros, independientemente de su fuente, escala o el&hellip;","_links":{"self":[{"href":"https:\/\/wpstaging.mailrelay.com\/es\/wp-json\/wp\/v2\/glossary\/48481","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wpstaging.mailrelay.com\/es\/wp-json\/wp\/v2\/glossary"}],"about":[{"href":"https:\/\/wpstaging.mailrelay.com\/es\/wp-json\/wp\/v2\/types\/glossary"}],"version-history":[{"count":1,"href":"https:\/\/wpstaging.mailrelay.com\/es\/wp-json\/wp\/v2\/glossary\/48481\/revisions"}],"predecessor-version":[{"id":48657,"href":"https:\/\/wpstaging.mailrelay.com\/es\/wp-json\/wp\/v2\/glossary\/48481\/revisions\/48657"}],"wp:attachment":[{"href":"https:\/\/wpstaging.mailrelay.com\/es\/wp-json\/wp\/v2\/media?parent=48481"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}