¿Qué es una data warehouse?
La data warehouse nace a inicios de la década de los ochenta de la mano de Bill Inmon que fue quien acuñó este concepto. Surgió como respuesta a la necesidad de contar con una herramienta de almacenaje de datos fluida y metódica.
En resumen, la data warehouse es un gran almacén de datos que guarda los datos mediante archivos históricos.
Además tiene una cualidad muy importante: es capaz de analizar y clasificar la información destacando aquella que tiene una importancia sustancial.
La data warehouse también tiene aplicaciones dentro del mundo del marketing. Funciona como un almacén capaz de compilar toda la información de los clientes, sea externo o interno. Eso sustenta todas las actividades publicitarias a desarrollar.
En todo caso, dicho almacén de datos es utilizado por las corporaciones para agilizar su gran volumen de información y orientarla al Business Intelligence (BI). De esa forma es posible lograr una estrategia fluida que ayuda en la toma de decisiones.
Si aún tienes la duda de para qué sirve data warehouse, la respuesta es muy simple: para recopilar y clasificar los datos filtrando aquellos que tienen cierta relevancia corporativa.
Características que definen una data warehouse
Si hay una característica por la cual destaca la data warehouse es por ser un repositorio de datos empresariales. Esa es su principal cualidad y ventaja competitiva.
Pero, más allá de eso, existen otras características de la data warehouse que vale la pena repasar. A continuación te las mencionamos:
- Se orienta a un tema específico: centra una gran colección de información al respecto de un tópico central. Todo girará en torno a ese tema.
- Conforma un sistema integrado: toda la información recopilada se trata de forma íntegra y estable a pesar de que provenga de diferentes fuentes.
- No es volátil: la información solo se presenta cuando se comprueba su utilidad para los usuarios. Además, se muestra en modo de lectura, por lo que es inalterable.
- Histórico: concibe que toda información será solicitada en algún momento por lo que mantiene un fichero fiel de datos antiguos.
Tipos de data warehouse
Otra de las características a tener en cuenta es que existen distintos tipos de data warehouse por lo que a continuación entramos en detalle sobre cada uno de ellos…
- En tiempo real: se actualiza en todo momento para siempre disponer de la última versión de la información. Cada vez que ingresen nuevos datos habrá una nueva recopilación.
- Integrada: actúa de forma colaborativa con otros sistemas de información. De esa forma puede ampliar su abanico de fuentes de datos.
- Offline : este tipo de almacenamiento se actualiza cada cierto periodo de tiempo según su programación. Esta puede ser diaria o semanal y mensual.
Ventajas y desventajas que ofrece una data warehouse
Es momento de hablar sobre las ventajas y desventajas del data warehouse porque, a pesar de ser una herramienta de gran utilidad empresarial, es preciso usarla con cuidado.
Pero mejor comencemos por los puntos positivos de esta herramienta:
- Es un sistema de fácil establecimiento siempre y cuando los datos sean precisos.
- Guarda la información de manera segura.
- Convierte la información en conocimiento.
- Facilita la toma de decisiones.
- Permite conocer el estatus actual de la empresa en cuanto a operaciones y riesgos.
- Es de fácil comprensión para los empleados.
- Aumenta la productividad.
Sin embargo, también presenta lo que para algunos pueden ser desventajas, pero no son gran cosa al compararlas con los beneficios antes mencionados:
- Su implementación representa un alto coste operativo.
- Puede ser compleja de utilizar por lo que suelen surgir ciertas inconsistencias en las bases de datos a manipular.
- Requiere un mantenimiento constante para evitar irregularidades en los datos.
¿En qué se diferencia una data warehouse y una data mart?
Para entender este punto es preciso hablar sobre la data mart para entrar en contexto. Se trata de una ramificación o subsistema de la data warehouse cuya función es consultar la información. Almacena pequeñas cantidades de información que suelen ser de importancia para un grupo reducido o un departamento concreto dentro de la corporación.
Una vez explicado eso es momento de comentar las diferencias. Sin duda alguna la más importante recae en el tipo de almacenaje que precisa cada una de ellas.
- La data warehouse demanda un tamaño de almacenamiento de al menos 100 gigabytes hasta 1 terabyte, mientras que data mart se limita a 100 gigabytes.
- Eso se debe a que la data warehouse recopila grandes masas de datos a diferencia de la data mart que solo contiene datos que con anterioridad fueron configurados para ser concretos.
- La data warehouse utiliza información de toda la empresa mientras que la data mart se enfoca en una pequeña porción de ella.
Más sobre data warehouse
Qué es Docker y para qué sirve
Docker está transformando la forma en que se desarrolla, distribuye y ejecuta el software. La ventaja: podemos encapsular todo el entorno para pasarlo a producción con las mismas características.
7 plataformas para brindar soporte web al usuario
Te describimos una lista de plataformas que ofrecen software de atención particular para el usuario.