ESG Análisis Técnico:
InterSystems IRIS: Software de gestión de datos de alto rendimiento para ingesta de datos y consultas simultáneas en tiempo real
Fecha: junio de 2020
Autor: Kerry Dolan, analista senior de validación informática
Resumen
Este informe documenta la validación de ESG respecto a la prueba de rendimiento de la ingesta y consulta simultáneas de datos en tiempo real de diversos productos de software de gestión de bases de datos que demuestran la capacidad de InterSystems IRIS Data Platform para ingerir cientos de millones de registros y ejecutar simultáneamente millones de consultas con un rendimiento de microsegundos, superior al de otros productos tradicionales y en memoria.
Los desafíos
Para muchas organizaciones, la capacidad de recopilar datos y analizarlos en tiempo real es una tarea esencial que impulsa los ingresos, mejora la visibilidad, informa la estrategia y ayuda en la toma de decisiones. Por ejemplo, las aplicaciones enfocadas en transacciones financieras, Internet de las Cosas (IoT), detección de fraudes y personalización en tiempo real deben ingerir grandes cantidades de datos y analizarlos inmediatamente. El desafío es encontrar una plataforma de base de datos con suficiente potencia para manejar de forma simultánea la ingesta y consulta a gran escala sin obstaculizar el rendimiento. Cuando ESG preguntó a los profesionales de bases de datos y analítica sobre las tecnologías que son la base para el análisis de datos, el rendimiento estaba entre las funcionalidades más importantes.1
Al buscar adoptar nuevas tecnologías para apoyar las iniciativas de análisis de datos en su organización, ¿cuáles son las funcionalidades / atributos más importantes? (porcentaje de encuestados, N=310, cinco respuestas aceptadas)
Las bases de datos en memoria ofrecen alto rendimiento, sin embargo, es costoso escalarlas y tienen límites inflexibles de memoria que pueden afectar la confiabilidad y provocar retrasos en el reinicio. Las bases de datos tradicionales ofrecen persistencia y confiabilidad, pero les falta el alto rendimiento de las bases de datos en memoria. InterSystems IRIS puede procesar cargas de trabajo de ingesta y consulta de manera simultánea, con un rendimiento igual o superior al de las bases de datos solo en memoria y sin sus limitaciones. InterSystems ha publicado una prueba de fuente abierta para demostrar esta afirmación, la que ha sido validada por ESG en este informe.
La solución: InterSystems IRIS
InterSystems IRIS es una plataforma de software de gestión de datos construida para el procesamiento de cargas de trabajo múltiple de alto rendimiento y a escala. Como DBMS multimodelo, proporciona soporte nativo para objetos de datos relacionales, orientados a objeto, documentos, clave-valor y jerárquicos; adicionalmente, ofrece un alto rendimiento consistente para cargas de trabajo transaccionales y analíticas simultáneamente. A continuación, se describen algunas funcionalidades clave, aunque una descripción completa del producto va más allá del alcance de este informe.
- Una característica importante que proporciona un rendimiento de ingesta superior es el motor de datos multidimensionales en InterSystems IRIS que permite un almacenamiento eficiente y compacto con una estructura de datos rica, que acelera la ingesta de datos, el acceso y las actualizaciones a la vez que reduce el uso de recursos y de disco.
- El rendimiento de análisis en tiempo real se logra usando una estructura de indexación de mapa de bits transaccional que permite a InterSystems IRIS procesar rápidamente consultas complejas, incluyendo datos en tiempo real, sin buscar en toda la base de datos.
- InterSystems IRIS Enterprise Cache Protocol es un mecanismo de almacenamiento inteligente por caché distribuido en memoria que le permite ejecutar consultas sofisticadas en conjuntos de datos muy grandes con alto rendimiento y confiabilidad, incluyendo la realización de joins con acceso a datos distribuidos sin realizar múltiples copias de datos.
Otras características incluyen:
- Rendimiento en memoria con persistencia embebida de datos en un formato optimizado para acceso rápido a datos.
- Capa integrada de almacenamiento por caché distribuido con consistencia automática y garantizada.
- Soporte SQL completo.
- Implantación on-premise, en todas las principales nubes públicas y en ambientes híbridos, con solo una API.
Probado por ESG
ESG validó los beneficios de rendimiento de InterSystems IRIS utilizando el kit de Prueba de velocidad comparativa de la empresa, que está disponible de manera pública, personalizable y de fuente abierta.2 La comparación se diseñó para medir el rendimiento de ingesta y consulta simultáneas en tiempo real. Este es un caso de uso común al que se enfrentan las áreas de servicios financieros, de detección de fraudes, Internet de las Cosas (IoT) y otras aplicaciones. Por ejemplo, mientas las empresas de servicios financieros ejecutan miles de transacciones, miles de usuarios están consultado el estado de las órdenes, la gestión de riesgos, etc. Asimismo, los datos de los sensores en terreno del Internet de las Cosas llegan rápido y las aplicaciones deben detectar inmediatamente anomalías y realizar otros cálculos, y deben hacerlo en tiempo real. Cuando una base de datos se estresa de esta manera, tener que ingerir datos y ejecutar consultas analíticas de forma simultánea puede disminuir el rendimiento.2
--continúa--
Descargar el PDF ESG Análisis Técnico: InterSystems IRIS Data Platform
1 Fuente: Resultados de Encuesta Maestra ESG, El estado del análisis de datos, agosto de 2019. 2 - https://github.com/intersystems-community/irisdemo-demo-htap.