Che cosa sono i dati persistenti e perché è importante?

Il seguente è originariamente apparso i.

Esiste una definizione coerente di dati persistenti come dati che non cambiano nel tempo, nei sistemi e nella memoria.

Per raccogliere informazioni sulla guida alla ricerca sulla persistenza dei dati di DZone, prevista per marzo 2016, abbiamo parlato con 16 dirigenti, di 13 aziende, che sviluppano database e gestiscono dati persistenti nella propria azienda o aiutano i clienti a farlo.

Ecco con chi abbiamo parlato:

Satyen Sangani, CEO, Alation | Sam Rehman, CTO, Arxan | Andy Warfield, Co-Fondatore e CTO, Coho Dati | Rami Chahine, V. P. di Gestione del Prodotto e Dan Potter, CMO, Datawatch | Eric Frenkiel, Co-Fondatore/CEO, MemSQL | Sarà Shulman, CEO, MongoLab | Filippo Rathle, V. P. di Prodotto, Neo Technology | Paolo Nashawaty, Marketing di Prodotto e di Strategia, il Progresso | Joan Wrabetz, CTO, Qualisystems | Yiftach Shoolman, Co-Fondatore e CTO e Leena Joshi, V. P. Product Marketing, Redis Labs / Partha Seetala, CTO, Robin Systems | Dale Lutz, co-fondatore e Paul Nalos, responsabile del team di database, Safe Software / Jon Bock, VP of Product and Marketing, Snowflake Computing

I dati persistenti sono dati considerati durevoli a riposo con l’andare e venire di software e dispositivi. Master data che è stabile-che è impostato e recuperabile sia in flash o in memoria.

Ecco cosa abbiamo sentito quando abbiamo chiesto: “Come definisci i dati persistenti?”:

  • L’opposto di dynamic—non cambia e non si accede molto frequentemente.
  • Informazioni di base, note anche come informazioni dimensionali nel data warehousing. Demografia delle entità-clienti, fornitori, ordini.
  • Dati master stabili.
  • Dati esistenti da un’istanza all’altra. Dati che esistono nel tempo indipendentemente dai sistemi che li hanno creati. Ora c’è sempre un uso secondario per i dati, quindi ci sono dati più persistenti. Una copia persistente può essere fatta o può essere aggregata. L’idea della persistenza sta diventando più fluida.
  • Memorizzato nel formato effettivo e rimane lì rispetto alla memoria in cui lo hai una volta, chiudi il file e non c’è più. È possibile recuperare i dati persistenti ancora e ancora. Dati scritti sul disco; tuttavia, la velocità dei dischi è un collo di bottiglia per il database. Cercando di passare alla memoria perché è 16 volte più veloce.
  • Ogni cliente ha la propria soglia di criticità (ad esempio, i servizi finanziari non vogliono perdere alcun addebito o credito). Ora, con molti più dati da macchine e sensori, c’è una maggiore transazionalità. I meta-dati sono importanti quanto i dati stessi. I metadati devono essere transazionali.
  • Non volatile. Persiste di fronte a un’interruzione di corrente.
  • Tutti i dati memorizzati in modo che rimangano memorizzati per un periodo prolungato rispetto ai dati in memoria. Memorizzati nel sistema modellato e strutturato per sopportare interruzioni di corrente. I dati non cambiano affatto.
  • Dati considerati durevoli a riposo con l’andare e venire di hardware e dispositivi. C’è un livello di persistenza in cui si tengono i dati a rischio.
  • Dati impostati e recuperabili sia in flash che in memoria supportata.
  • Con i dati persistenti, vi è ragionevole certezza che le modifiche non verranno perdutee i dati saranno disponibili in seguito. A seconda dei requisiti, i sistemi in-cloud o in-memory possono qualificarsi. Ci preoccupiamo di più per la parte “dati”. Se si tratta di dati, vogliamo consentire ai clienti di leggere, interrogare, trasformare, scrivere, aggiungere valore, ecc.
  • Un modo per mantenere i dati su disco o archiviazione. Opzioni multiple per farlo con una replica tra i data center in qualsiasi combinazione con e senza persistenza. Snapshot dati su disco o modifiche snapshot. Scrivi su disco ogni secondo o ogni scrittura. Gli utenti possono scegliere tra tutte le opzioni. La persistenza fa parte di una suite ad alta disponibilità che fornisce replica e failover istantaneo. Registrato su più nuvole. Ospita migliaia di istanze su più data center con solo due errori di nodo al giorno. Gli utenti possono scegliere tra più data center e più aree geografiche. Siamo la società dietro Redis. Altri trattano come una cache e non un database. Nodi multipli – dati scritti su dischi. Non puoi farlo con il normale open source. Se non si esegue l’alta disponibilità, come raccomandato, è possibile perdere i dati.
  • Tutto ciò che va in un database relazionale o NoSQL in mezzo.

Quindi, come definisci i dati persistenti?

Vedi altri articoli Tom ha scritto per DZone su Big Data, IoT, ecosistema Java, integrazione aziendale, sicurezza delle applicazioni, sviluppo di applicazioni mobili native, app basate su cloud, DevOps e Continuous Delivery (https://dzone.com/users/1450207/ctsmithiii.html?sort=articles)