Wat zijn persistente gegevens en waarom is het belangrijk?

het volgende verscheen oorspronkelijk i.

er is een consistente definitie van permanente gegevens als gegevens die niet veranderen in tijd, systemen en geheugen.

om inzichten te verzamelen voor DZone ‘ s Data Persistence Research Guide, gepland voor maart 2016, spraken we met 16 executives, van 13 bedrijven, die databases ontwikkelen en persistente gegevens beheren in hun eigen bedrijf of klanten Helpen dit te doen.

hier is met wie we gesproken hebben:

Satyen Sangani, CEO, Alation | Sam Rehman, CTO, Arxan | Andy Warfield, Mede-Oprichter/CTO, Coho Data | Rami Chahine, V. P. Product Management en Dan Potter, CMO, Datawatch | Eric Frenkiel, Co-Founder/CEO, MemSQL | Zal Shulman, CEO, MongoLab | Philip Rathle, V. P. van Product, Neo-Technologie | Paul Nashawaty, Product Marketing en Strategie, Voortgang | Joan Wrabetz, CTO, Qualisystems | Yiftach Shoolman, Mede-Oprichter en CTO en Leena Joshi, V. P. Product Marketing, Redis Labs | Partha Seetala, CTO, Robin Systems | Dale Lutz, medeoprichter, en Paul Nalos, Database Team Lead, Safe Software / Jon Bock, VP of Product and Marketing, Snowflake Computing

Persistent data is data die beschouwd wordt als duurzaam in rust met het komen en gaan van software en apparaten. Stamgegevens die stabiel zijn – die zijn ingesteld en herstelbaar, zowel in flash als in het geheugen.

hier is wat we hoorden toen we vroegen: “hoe definieer je permanente gegevens?”:

  • het tegenovergestelde van dynamisch-het verandert niet en wordt niet vaak benaderd.
  • kerninformatie, ook bekend als dimensionale informatie in datawarehousing. Demografie van entiteiten-klanten, leveranciers, bestellingen.
  • stamgegevens die stabiel zijn.
  • gegevens die van de ene instantie naar de andere bestaan. Gegevens die in de loop van de tijd bestaan, onafhankelijk van de systemen die het hebben gemaakt. Er is altijd een secundair gebruik voor data, dus er zijn meer persistente data. Er kan een permanente kopie worden gemaakt of deze kan worden samengevoegd. Het idee van persistentie wordt steeds vloeiender.
  • opgeslagen in werkelijke formaat en blijft daar versus in-memory waar je het eenmaal hebt, sluit het bestand en het is weg. U kunt permanente gegevens opnieuw en opnieuw op te halen. Gegevens die naar de schijf zijn geschreven; De snelheid van de schijven is echter een knelpunt voor de database. Ik probeer naar het geheugen te gaan omdat het 16X sneller is.
  • elke cliënt heeft zijn eigen drempel voor kriticiteit (financiële diensten willen bijvoorbeeld geen afschrijvingen of kredieten verliezen). Nu, met veel meer gegevens van machines en sensoren, is er een grotere transactionaliteit. De metagegevens zijn net zo belangrijk als de gegevens zelf. Metagegevens moeten transactioneel zijn.
  • niet-vluchtig. Blijft bestaan bij een stroomstoring.
  • alle gegevens opgeslagen op een manier dat het opgeslagen blijft voor een langere periode ten opzichte van in-memory data. Opgeslagen in het systeem gemodelleerd en gestructureerd om stroomuitval te doorstaan. Data verandert helemaal niet.
  • gegevens worden beschouwd als duurzaam in rust bij het komen en gaan van hardware en apparaten. Er is een persistentielaag waarbij je je gegevens in gevaar houdt.
  • gegevens die ingesteld en herstelbaar zijn in flash-of geheugensteun.
  • bij aanhoudende gegevens is er een redelijk vertrouwen dat wijzigingen niet verloren zullen gaan en dat de gegevens later beschikbaar zullen zijn. Afhankelijk van de vereisten kunnen in-cloud-of in-memory-systemen in aanmerking komen. We geven het meeste om het “data” gedeelte. Als het gegevens zijn, willen we klanten in staat stellen om te lezen, query, transformeren, schrijven, toegevoegde waarde, enz.
  • een manier om gegevens naar schijf of opslag te bewaren. Meerdere opties om dit te doen met één replica over datacenters in elke combinatie met en zonder persistentie. Snapshotgegevens naar schijf of snapshotwijzigingen. Schrijf elke seconde naar schijf of elk schrijven. Gebruikers kunnen kiezen tussen alle opties. Persistence maakt deel uit van een suite met hoge beschikbaarheid die replicatie en directe failover biedt. Geregistreerd over meerdere wolken. Host duizenden exemplaren via meerdere datacenters met slechts twee knooppuntfouten per dag. Gebruikers kunnen kiezen tussen meerdere datacenters en meerdere regio ‘ s. Wij zijn het bedrijf achter Redis. Anderen behandelen als een cache en niet als een database. Meerdere knooppunten – gegevens geschreven naar schijven. Dat kun je niet doen met gewone open source. Als u geen hoge beschikbaarheid doet, zoals aanbevolen, kunt u uw gegevens verliezen.
  • alles dat naar een relationele of NoSQL-database daartussen gaat.

dus, hoe definieer je permanente gegevens?

Bekijk meer artikelen die Tom voor DZone heeft geschreven over Big Data, IoT, het Java-ecosysteem, Enterprise-integratie, applicatiebeveiliging, Native mobiele applicatie-ontwikkeling, cloudgebaseerde Apps, DevOps en continue levering (https://dzone.com/users/1450207/ctsmithiii.html?sort=articles)