HyperAI

Lac De Données

Un lac de données est un emplacement central dans une architecture cloud qui peut stocker de grandes quantités de données brutes dans leur format natif. Contrairement aux entrepôts de données ou aux silos, les lacs de données utilisent une architecture plate avec stockage d'objets pour conserver les métadonnées des fichiers.

Le terme « lac de données » a été inventé en 2015, mais le concept est utilisé dans la pratique depuis plus de 10 ans. Les lacs de données répondent au besoin d’un référentiel de données évolutif capable de stocker de grands volumes de fichiers de différents types et sources pour une analyse ultérieure.

Un lac de données peut être considéré comme un emplacement centralisé qui contient des pétaoctets de données dans leur format natif d'origine. Par rapport aux entrepôts de données hiérarchiques qui stockent les données dans des fichiers et des dossiers, les lacs de données utilisent une architecture plate avec un stockage basé sur des objets. Les opérations Big Data peuvent utiliser des balises et des identifiants de métadonnées pour faciliter la recherche et la récupération de données dans différentes régions et avec de meilleures performances. De plus, plusieurs applications sont prises en charge pour utiliser leurs propres formats de données.

Références

【1】https://www.hpe.com/cn/zh/what-is/data-lake.html