永続的なデータとは何か、なぜそれが重要なのか?

以下はもともと登場しました。

永続データは、時間、システム、およびメモリ間で変化しないデータとして一貫した定義があります。

2016年にリリース予定のDZoneのData Persistence Research Guideの洞察を収集するために、データベースを開発し、自社で永続データを管理したり、クライアントがそうするのを助けたりする16社の幹部13人に話を聞いた。

私たちが話した人はここにいます:

Satyen Sangani,Ceo,Alation|Sam Rehman,CTO,Arxan|Andy Warfield,Co-Founder/CTO,Coho Data|Rami Chahine,V.P.Product Management and Dan Potter,CMO,Datawatch|Eric Frenkiel,Co-Founder/CEO,Memsql|Will Shulman,Ceo,MongoLab|Philip Rathle,V.P.of Product,Neo Technology|Paul Nashawaty,Product Marketing and Strategy,Progress|Joan wrabetz,cto,qualisystems|Yiftach SHOOLMAN,Co-Founder And cto AND leena Joshi,V.P. 製品マーケティング、Redis Labs/Partha Seetala、CTO、Robin Systems|Dale Lutz、共同創設者、Paul Nalos、Safe Software、データベースチームリード|Snowflake Computing

永続的なデータは、ソフトウェアやデバイスの出入りに伴って永続的であると考 安定したマスターデータ—フラッシュまたはメモリのいずれかで設定され、回復可能です。

“永続的なデータをどのように定義しますか?”:

  • 動的の反対—それは変更されず、非常に頻繁にアクセスされません。
  • データウェアハウスにおける次元情報とも呼ばれるコア情報。 エンティティの人口統計-顧客、サプライヤー、注文。
  • マスターデータは安定しています。
  • あるインスタンスから別のインスタンスに存在するデータ。 それを作成したシステムとは無関係に、時間を超えて存在するデータ。 今では常にデータの二次的な使用があるので、より永続的なデータがあります。 永続的なコピーが作成されたり、集約されたりすることがあります。 永続性のアイデアは、より流動的になってきています。
  • 実際の形式で保存され、一度持っているメモリ内に対してそこにとどまり、ファイルを閉じると消えてしまいます。 永続データは、何度も何度も取得することができます。 ディスクに書き込まれるデータですが、ディスクの速度はデータベースのボトルネックになります。 それは16倍高速ですので、メモリに移動しようとしています。
  • すべてのクライアントは、重要性のための独自のしきい値を持っています(例えば、金融サービスは、任意の借方やクレジットを失いたくありません)。 今では、機械やセンサーからのデータがはるかに多くなると、より大きな取引性があります。 メタデータは、データ自体と同じくらい重要です。 メタデータはトランザクションである必要があります。
  • 停電に直面して持続します。
  • メモリ内のデータに対して、長期間保存されたままの方法で保存されたデータ。 停電に耐えるようにモデル化され、構造化されたシステムに格納されます。 データはまったく変わりません。
  • データは、ハードウェアとデバイスの行き来に伴い、安静時に耐久性があると考えられています。 データを危険にさらす永続層があります。
  • フラッシュまたはメモリにバックアップされているかどうかにかかわらず、設定され、回復可能なデータ。
  • 永続的なデータでは、変更が失われず、データが後で利用可能になるという合理的な自信があります。 要件に応じて、インクラウドシステムまたはインメモリシステムを適格にすることができます。 私たちは”データ”の部分を最も気にしています。 データの場合は、お客様が読み取り、クエリ、変換、書き込み、付加価値などを可能にしたいと考えています。
  • ディスクまたはストレージにデータを永続化する方法。 永続性の有無にかかわらず、任意の組み合わせで、データセンター間の一つのレプリカでこれを行うための複数のオプ スナップショットデータをディスクまたはスナップショットに変更します。 ディスクへの書き込み毎秒またはすべての書き込み。 ユーザーはすべてのオプションから選択できます。 永続化は、レプリケーションとインスタントフェイルオーバーを提供する高可用性スイートの一部です。 複数のクラウド上に登録されています。 複数のデータセンターで数千のインスタンスをホストし、1日に2つのノード障害のみを発生させます。 ユーザーは、複数のデータセンターと複数の地域を選択できます。 私たちはRedisの背後にある会社です。 他の人は、データベースではなくキャッシュとして扱います。 複数のノード-ディスクに書き込まれたデータ。 あなたは通常のオープンソースでそれを行うことはできません。 Recommendedのように高可用性を実行しないと、データが失われる可能性があります。
  • その間にリレーショナルデータベースまたはNoSQLデータベースに行くもの。

では、永続データをどのように定義しますか?

ビッグデータ、IoT、Javaエコシステム、エンタープライズ統合、アプリケーションセキュリティ、ネイティブモバイルアプリケーション開発、クラウドベースのアプリ、DevOps、継続的な配信(https://dzone.com/users/1450207/ctsmithiii.html?sort=articles)