Was sind persistente Daten und warum sind sie wichtig?

Das Folgende erschien ursprünglich i.

Es gibt eine konsistente Definition von persistenten Daten als Daten, die sich über Zeit, Systeme und Speicher nicht ändern.

Um Erkenntnisse für den Data Persistence Research Guide von DZone zu sammeln, der im März 2016 veröffentlicht werden soll, haben wir mit 16 Führungskräften aus 13 Unternehmen gesprochen, die Datenbanken entwickeln und persistente Daten in ihrem eigenen Unternehmen verwalten oder Kunden dabei helfen.

Mit wem wir gesprochen haben:

Satyen Sangani, CEO, Alation | Sam Rehman, CTO, Arxan | Andy Warfield, Mitbegründer / CTO, Coho Data | Rami Chahine, V.P. Produktmanagement und Dan Potter, CMO, Datawatch | Eric Frenkiel, Mitbegründer / CEO, MemSQL | Will Shulman, CEO, MongoLab | Philip Rathle, V.P. Produkt, Neo Technology | Paul Nashawaty, Produktmarketing und Strategie, Fortschritt | Joan Wrabetz , CTO, Qualisystems | Yiftach Shoolman, Mitbegründer und CTO und Leena Joshi, V.P. Produktmarketing, Redis Labs / Partha Seetala, CTO, Robin Systems / Dale Lutz, Mitbegründer und Paul Nalos, Datenbankteamleiter, Safe Software | Jon Bock, VP für Produkt und Marketing, Snowflake Computing

Persistente Daten sind Daten, die als dauerhaft angesehen werden, wenn sie mit dem Kommen und Gehen von Software und Geräten in Ruhe bleiben. Stammdaten, die stabil sind – die gesetzt und wiederherstellbar sind, ob im Flash oder im Speicher.

Folgendes haben wir gehört, als wir gefragt haben: „Wie definieren Sie persistente Daten?“:

  • Das Gegenteil von dynamisch – es ändert sich nicht und wird nicht sehr häufig aufgerufen.
  • Kerninformationen, auch bekannt als dimensionale Informationen im Data Warehousing. Demografie von Unternehmen – Kunden, Lieferanten, Bestellungen.
  • Stammdaten, die stabil sind.
  • Daten, die von einer Instanz zur anderen vorhanden sind. Daten, die über die Zeit hinweg existieren, unabhängig von den Systemen, die sie erstellt haben. Jetzt gibt es immer eine sekundäre Verwendung für Daten, sodass persistentere Daten vorhanden sind. Eine persistente Kopie kann erstellt oder aggregiert werden. Die Idee der Beharrlichkeit wird fließender.
  • Im aktuellen Format gespeichert und bleibt dort im Vergleich zu In-Memory, wo Sie es einmal haben, schließen Sie die Datei und es ist weg. Sie können persistente Daten immer wieder abrufen. Daten, die auf die Disc geschrieben werden; Die Geschwindigkeit der Discs ist jedoch ein Engpass für die Datenbank. Ich versuche, in den Speicher zu wechseln, weil es 16X schneller ist.
  • Jeder Kunde hat seine eigene Schwelle für Kritikalität (z. B. Finanzdienstleister möchten keine Belastungen oder Gutschriften verlieren). Jetzt, mit viel mehr Daten von Maschinen und Sensoren, gibt es eine größere Transaktionalität. Die Meta-Daten sind genauso wichtig wie die Daten selbst. Metadaten müssen transaktional sein.
  • Nichtflüchtig. Bleibt angesichts eines Stromausfalls bestehen.
  • Alle Daten, die so gespeichert sind, dass sie im Vergleich zu In-Memory-Daten über einen längeren Zeitraum gespeichert bleiben. Gespeichert im System modelliert und strukturiert, um Stromausfälle zu ertragen. Daten ändern sich überhaupt nicht.
  • Daten, die mit dem Kommen und Gehen von Hardware und Geräten als dauerhaft angesehen werden. Es gibt eine Persistenzschicht, auf der Sie Ihre Daten gefährden.
  • Daten, die festgelegt und wiederherstellbar sind, unabhängig davon, ob sie im Flash-Speicher oder im Speicher gesichert sind.
  • Bei persistenten Daten besteht hinreichende Sicherheit, dass Änderungen nicht verloren gehen und die Daten später verfügbar sind. Je nach Anforderung können sich In-Cloud- oder In-Memory-Systeme qualifizieren. Wir kümmern uns am meisten um den „Daten“ -Teil. Wenn es sich um Daten handelt, möchten wir es den Kunden ermöglichen, zu lesen, abzufragen, zu transformieren, zu schreiben, einen Mehrwert zu schaffen usw.
  • Eine Möglichkeit, Daten auf Festplatte oder Speicher zu speichern. Mehrere Optionen, um dies mit einem Replikat über Rechenzentren hinweg in beliebiger Kombination mit und ohne Persistenz zu tun. Snapshot-Daten auf der Festplatte oder Snapshot-Änderungen. Schreiben Sie jede Sekunde oder jeden Schreibvorgang auf die Festplatte. Benutzer können zwischen allen Optionen wählen. Persistenz ist Teil einer Hochverfügbarkeitssuite, die Replikation und sofortiges Failover bietet. Registriert über mehrere Wolken. Hosten Sie Tausende von Instanzen über mehrere Rechenzentren mit nur zwei Knotenausfällen pro Tag. Benutzer können zwischen mehreren Rechenzentren und mehreren Regionen wählen. Wir sind das Unternehmen hinter Redis. Andere behandeln als Cache und nicht als Datenbank. Mehrere Knoten – Daten auf Festplatten geschrieben. Das kann man mit normaler Open Source nicht machen. Wenn Sie keine hohe Verfügbarkeit wie empfohlen durchführen, können Sie Ihre Daten verlieren.
  • Alles, was dazwischen in eine relationale oder NoSQL-Datenbank geht.

Wie definieren Sie persistente Daten?

Weitere Artikel, die Tom für DZone über Big Data, IoT, das Java-Ökosystem, Unternehmensintegration, Anwendungssicherheit, native mobile Anwendungsentwicklung, Cloud-basierte Apps, DevOps und Continuous Delivery geschrieben hat (https://dzone.com/users/1450207/ctsmithiii.html?sort=articles)