データ グラビティは、リポジトリ内のデータの量が増加し、使用回数が増加すると発生します。データグラビティとは、データ本体がアプリケーション、サービス、その他のデータを引き寄せる能力を指します。 データの質と量は時間の経過とともに増加し、このデータに接続するアプリケーションやサービスがさらに増えます。データが豊富なシステムがより多くのデータを引き寄せ、その結果、より多くのデータに依存するアプリケーションが引き寄せられ、結果としてより多くのデータが生成されるという証拠が増えています。
この文脈では、重力は、ソフトウェア、サービス、ビジネス ロジックがデータの品質 (データ量) に関連してデータに引き寄せられる方法と考えることができます。データの量が多いほど、より多くのアプリケーション、サービス、その他のデータが引き寄せられ、より速く引き寄せられます。
実際には、データをさらに遠くに移動するとワークロードのパフォーマンスに影響を与えることが多くなるため、データを蓄積し、関連するアプリケーションやサービスを近くに配置することが合理的です。これが、モノのインターネット (IoT) アプリケーションを、使用するデータのできるだけ近くで生成および保存する必要がある理由の 1 つです。
ハイパーコンバージェンスは、データ グラビティの概念を説明するためによく使用される用語です。ハイパーコンバージド インフラストラクチャでは、コンピューティング、ネットワーク、および仮想化リソースが、汎用ハードウェア ボックス内のデータ ストレージと緊密に統合されています。データ量が大きくなればなるほど、より多くの他のデータが結びつき、データの分析価値が高まります。
2010年に提案されました。同氏は、組織がデータを 1 か所に収集するとデータが「蓄積」されると考えています。マクローリー氏は、データの重要性がクラウドに移りつつあると述べた。社内外のビジネス データがクラウドに移行またはクラウド内で生成されることが増えるにつれ、データ分析ツールのクラウドベース化が進んでいます。同氏のこの用語の説明では、自然に発生するデータ グラビティと、法律、規制、操作された価格などの外力によって引き起こされる同様の変化とを区別しており、マクロリー氏はこれを人工データ グラビティと呼んでいます。
【1】https://www.techtarget.com/whatis/definition/data-gravity
【2】https://www.computerweekly.com/feature/Data-gravity-What-is-it-and-how-to-manage-it