HyperAI초신경

데이터 레이크

데이터 레이크는 원시 데이터를 원래 형식으로 대량으로 저장할 수 있는 클라우드 아키텍처의 중앙 위치입니다. 데이터웨어하우스나 사일로와 달리 데이터 레이크는 객체 스토리지를 갖춘 플랫 아키텍처를 사용하여 파일의 메타데이터를 유지합니다.

"데이터 레이크"라는 용어는 2015년에 만들어졌지만, 이 개념은 10년 이상 실제로 사용되어 왔습니다. 데이터 레이크는 추후 분석을 위해 다양한 유형과 출처의 대용량 파일을 저장할 수 있는 확장 가능한 데이터 저장소에 대한 요구를 충족합니다.

데이터 레이크는 페타바이트 규모의 데이터를 원래의 기본 형식으로 보관하는 중앙 집중식 위치로 생각할 수 있습니다. 데이터를 파일과 폴더에 저장하는 계층적 데이터웨어하우스와 달리, 데이터 레이크는 객체 기반 저장소를 갖춘 플랫 아키텍처를 활용합니다. 빅데이터 작업에서는 메타데이터 태그와 식별자를 사용하여 여러 지역에서 데이터를 더 쉽게 찾고 검색할 수 있으며 성능도 향상됩니다. 또한, 여러 애플리케이션이 자체 데이터 형식을 활용할 수 있도록 지원됩니다.

참고문헌

【1】https://www.hpe.com/cn/zh/what-is/data-lake.html