数据引力 Data Gravity

当存储库中的数据量增加并且使用次数也增加时,就会出现数据引力。数据引力 (Data Gravity) 是指数据体吸引应用程序、服务和其他数据的能力。 数据的质量和数量会随着时间的推移而增加,从而吸引更多的应用程序和服务连接到这些数据上。越来越多的证据表明,数据丰富的系统会吸引更多数据,这反过来又吸引了更多依赖数据的应用程序,从而带来更多数据。

在这种情况下,引力可以被认为是软件、服务和业务逻辑被吸引到相对于其质量(数据量)的数据的方式。数据量越大,就会吸引越多的应用程序、服务和其他数据,并且被吸引的速度就越快。 

实际上,更远、更频繁地移动数据会影响工作负载性能,因此积累数据以及将相关应用程序和服务放置在附近是有意义的。这就是物联网 (IoT) 应用程序需要尽可能靠近其使用的数据生成和存储位置的原因之一。

超融合是一个经常用来说明数据引力概念的术语。在超融合基础设施中,计算、网络和虚拟化资源与商用硬件盒内的数据存储紧密集成。数据量越大,与其连接的其他数据就越多,数据的分析价值就越大。

数据引力的历史

于 2010 年提出。他认为,当组织将数据收集到一个地方时,数据就会「积累」。麦克罗里表示,数据引力正在向云端转移。随着越来越多的内部和外部业务数据转移到云端或在云端生成, 数据分析工具也越来越基于云。他对该术语的解释区分了自然发生的数据引力和通过立法、限制和操纵定价等外部力量造成的类似变化,麦克罗里将其称为人工数据引力。 

参考来源

【1】https://www.techtarget.com/whatis/definition/data-gravity

【2】https://www.computerweekly.com/feature/Data-gravity-What-is-it-and-how-to-manage-it