¿Qué Son los Datos Persistentes y Por Qué son Importantes?

Lo siguiente apareció originalmente i.

Hay una definición coherente de datos persistentes como datos que no cambian a lo largo del tiempo, los sistemas y la memoria.

Para recopilar información para la Guía de Investigación de Persistencia de datos de DZone, cuya publicación está prevista para marzo de 2016, hablamos con 16 ejecutivos de 13 empresas que desarrollan bases de datos y gestionan datos persistentes en su propia empresa o ayudan a los clientes a hacerlo.

Aquí está con quién hablamos:

Satyen Sangani, CEO, Alation | Sam Rehman, CTO, Arxan | Andy Warfield, Cofundador/CTO, Coho Data | Rami Chahine, Vicepresidente de Gestión de Productos y Dan Potter, CMO, Datawatch | Eric Frenkiel, Cofundador/CEO, MemSQL | Will Shulman, CEO, MongoLab | Philip Rathle, Vicepresidente de Producto, Neo Technology | Paul Nashawaty, Marketing y Estrategia de Productos, Progress | Joan Wrabetz, CTO, Qualisystems | Yiftach Shoolman, Cofundador y CTO y Leena Joshi, V. P. Marketing de Productos, Redis Labs | Partha Seetala, CTO, Robin Systems / Dale Lutz, Cofundador, y Paul Nalos, Jefe de Equipo de Base de datos, Safe Software / Jon Bock, Vicepresidente de Producto y Marketing, Snowflake Computing

Los datos persistentes son datos que se consideran duraderos en reposo con el ir y venir de software y dispositivos. Datos maestros estables, configurables y recuperables, ya sea en flash o en memoria.

Esto es lo que escuchamos cuando preguntamos: «¿Cómo se definen los datos persistentes?»:

  • Lo contrario de dinámico: no cambia y no se accede con mucha frecuencia.
  • Información básica, también conocida como información dimensional en almacenamiento de datos. Demografía de las entidades: clientes, proveedores, pedidos.
  • Datos maestros estables.
  • Datos que existen de una instancia a otra. Datos que existen a lo largo del tiempo independientemente de los sistemas que los crearon. Ahora siempre hay un uso secundario para los datos, por lo que hay datos más persistentes. Se puede hacer una copia persistente o se puede agregar. La idea de persistencia es cada vez más fluida.
  • Almacenado en formato real y permanece allí en lugar de en memoria donde lo tiene una vez, cierre el archivo y desaparecerá. Puede recuperar datos persistentes una y otra vez. Datos que se escriben en el disco; sin embargo, la velocidad de los discos es un cuello de botella para la base de datos. Tratando de pasar a la memoria porque es 16 veces más rápido.
  • Cada cliente tiene su propio umbral de criticidad (por ejemplo, los servicios financieros no quieren perder ningún cargo o crédito). Ahora, con muchos más datos de máquinas y sensores, hay una mayor transaccionalidad. Los metadatos son tan importantes como los propios datos. Los metadatos deben ser transaccionales.
  • No-volátil. Persiste ante un corte de energía.
  • Cualquier dato almacenado de forma que permanezca almacenado durante un período prolongado en comparación con los datos en memoria. Almacenado en el sistema modelado y estructurado para soportar cortes de energía. Los datos no cambian en absoluto.
  • Los datos se consideran duraderos en reposo con el ir y venir de hardware y dispositivos. Hay una capa de persistencia en la que tienes tus datos en riesgo.
  • Datos configurados y recuperables, ya sea en flash o con respaldo de memoria.
  • Con datos persistentes, existe una confianza razonable de que los cambios no se perderán y los datos estarán disponibles más adelante. Dependiendo de los requisitos, los sistemas en la nube o en memoria pueden cumplir los requisitos. Nos importa más la parte de los «datos». Si se trata de datos, queremos permitir a los clientes leer, consultar, transformar, escribir, agregar valor, etc.
  • Una forma de conservar los datos en disco o almacenamiento. Múltiples opciones para hacerlo con una réplica en centros de datos en cualquier combinación con y sin persistencia. Cambios de datos de instantáneas en disco o instantáneas. Escribir en disco cada segundo o cada escritura. Los usuarios pueden elegir entre todas las opciones. La persistencia forma parte de una suite de alta disponibilidad que proporciona replicación y conmutación por error instantánea. Registrado sobre múltiples nubes. Aloje miles de instancias en varios centros de datos con solo dos fallos de nodo por día. Los usuarios pueden elegir entre varios centros de datos y varias geografías. Somos la compañía detrás de Redis. Otros lo tratan como una caché y no como una base de datos. Nodos múltiples: datos escritos en discos. No puedes hacer eso con código abierto normal. Si no haces alta disponibilidad, como se recomienda, puedes perder tus datos.
  • Cualquier cosa que vaya a una base de datos relacional o NoSQL en el medio.

Entonces, ¿cómo se definen los datos persistentes?

Ver más artículos que Tom ha escrito para DZone sobre Big Data, IoT, el Ecosistema Java, Integración Empresarial, Seguridad de Aplicaciones, Desarrollo de Aplicaciones Móviles Nativas, Aplicaciones Basadas en la Nube, DevOps y Entrega Continua (https://dzone.com/users/1450207/ctsmithiii.html?sort=articles)