Инфраструктура — важнейший компонент любой платформы данных, и от правильного выбора соответствующих технологий во многом зависит, сможет ли компания реализовать весь потенциал имеющихся технологий. Большинство публикаций по lakehouse традиционно акцентируют внимание лишь на вычислениях и хранении, однако lakehouse также предусматривает слой инфраструктуры, отвечающий за безопасность и интеграцию вычислительных движков со слоем хранения.
Взрывной рост объема получаемых и накапливаемых в компаниях данных, а также увеличение потребителей информации вынуждает пересматривать требования к аналитическим платформам, отказываясь от традиционных архитектур в пользу таких новых принципов, как lakehouse – объединения на одной платформе преимуществ корпоративного хранилища и озера данных для сокращения времени на создание новых сценариев анализа данных и снижения стоимости владения.