Qu’est-ce que les Données Persistantes et Pourquoi sont-elles importantes ?

Ce qui suit est apparu à l’origine i.

Il existe une définition cohérente des données persistantes en tant que données qui ne changent pas dans le temps, les systèmes et la mémoire.

Pour recueillir des informations sur le Guide de recherche sur la persistance des données de DZone, dont la sortie est prévue pour mars 2016, nous avons parlé à 16 dirigeants de 13 entreprises qui développent des bases de données et gèrent les données persistantes dans leur propre entreprise ou aident les clients à le faire.

Voici à qui nous avons parlé:

Satyen Sangani, PDG, Alation | Sam Rehman, Directeur technique, Arxan | Andy Warfield, Co-Fondateur/ Directeur technique, Coho Data | Rami Chahine, Vice-Président de la Gestion des produits et Dan Potter, Directeur technique, Datawatch | Eric Frenkiel, Co-Fondateur / PDG, MemSQL | Will Shulman, PDG, MongoLab | Philip Rathle, Vice-président du Produit, Neo Technology | Paul Nashawaty, Marketing et Stratégie des produits, Progress | Joan Wrabetz, Directeur technique, Qualisystems | Yiftach Shoolman, Co-fondateur et directeur technique et Leena Joshi, Vice-présidente Marketing produit, Redis Labs | Partha Seetala, Directeur technique, Robin Systems | Dale Lutz, Co-fondateur, et Paul Nalos, Chef d’équipe de base de données, Safe Software | Jon Bock, vice-président des produits et du marketing, Snowflake Computing

Les données persistantes sont des données considérées comme durables au repos avec les allées et venues des logiciels et des appareils. Des données de base stables – qui sont définies et récupérables, que ce soit en flash ou en mémoire.

Voici ce que nous avons entendu lorsque nous avons demandé : « Comment définissez-vous les données persistantes? »:

  • Le contraire de la dynamique — elle ne change pas et n’est pas consultée très fréquemment.
  • Informations de base, également appelées informations dimensionnelles dans l’entreposage de données. Données démographiques des entités – clients, fournisseurs, commandes.
  • Données de base stables.
  • Données qui existent d’une instance à une autre. Des données qui existent dans le temps indépendamment des systèmes qui les ont créées. Maintenant, il y a toujours une utilisation secondaire pour les données, donc il y a plus de données persistantes. Une copie persistante peut être faite ou elle peut être agrégée. L’idée de persistance devient de plus en plus fluide.
  • Stocké au format réel et y reste par rapport à en mémoire où vous l’avez une fois, fermez le fichier et il est parti. Vous pouvez récupérer des données persistantes encore et encore. Données écrites sur le disque; cependant, la vitesse des disques est un goulot d’étranglement pour la base de données. Essayer de se déplacer en mémoire car c’est 16 fois plus rapide.
  • Chaque client a son propre seuil de criticité (par exemple, les services financiers ne veulent pas perdre de débit ou de crédit). Maintenant, avec beaucoup plus de données provenant de machines et de capteurs, il y a une plus grande transactionnalité. Les méta-données sont aussi importantes que les données elles-mêmes. Les méta-données doivent être transactionnelles.
  • Non volatile. Persiste en cas de panne de courant.
  • Toutes les données stockées de manière à rester stockées pendant une période prolongée par rapport aux données en mémoire. Stocké dans le système modélisé et structuré pour supporter les pannes de courant. Les données ne changent pas du tout.
  • Données considérées comme durables au repos avec le va-et-vient du matériel et des périphériques. Il existe une couche de persistance à laquelle vous tenez vos données à risque.
  • Données définies et récupérables en mémoire flash ou en mémoire.
  • Avec des données persistantes, il y a une confiance raisonnable que les changements ne seront pas perdus et les données seront disponibles plus tard. Selon les exigences, les systèmes en nuage ou en mémoire peuvent être admissibles. Nous nous soucions le plus de la partie « données ». S’il s’agit de données, nous voulons permettre aux clients de lire, d’interroger, de transformer, d’écrire, d’ajouter de la valeur, etc.
  • Un moyen de conserver les données sur le disque ou le stockage. Plusieurs options pour le faire avec un seul réplica dans tous les centres de données, quelle que soit la combinaison avec et sans persistance. Données d’instantané sur le disque ou modifications d’instantané. Écrivez sur le disque toutes les secondes ou toutes les écritures. Les utilisateurs peuvent choisir entre toutes les options. La persistance fait partie d’une suite haute disponibilité qui fournit la réplication et le basculement instantané. Enregistré sur plusieurs nuages. Hébergez des milliers d’instances sur plusieurs centres de données avec seulement deux défaillances de nœuds par jour. Les utilisateurs peuvent choisir entre plusieurs centres de données et plusieurs zones géographiques. Nous sommes l’entreprise derrière Redis. D’autres traitent comme un cache et non une base de données. Nœuds multiples – données écrites sur des disques. Vous ne pouvez pas le faire avec une source ouverte régulière. Si vous ne faites pas de haute disponibilité, comme recommandé, vous pouvez perdre vos données.
  • Tout ce qui va à une base de données relationnelle ou NoSQL entre les deux.

Alors, comment définissez-vous les données persistantes?

Voir d’autres articles que Tom a écrits pour DZone sur le Big Data, l’IoT, l’Écosystème Java, l’Intégration d’Entreprise, la Sécurité des Applications, le Développement d’Applications Mobiles Natives, les Applications Basées sur le Cloud, DevOps et la Livraison Continue (https://dzone.com/users/1450207/ctsmithiii.html?sort=articles)