Пользователям Amazon Web Services теперь доступно облачное хранилище данных Redshift – недорогая альтернатива хранению данных на собственной площадке. Сервис Amazon Redshift был анонсирован на конференции AWS re:Invent. Пока что для него задействован ЦОД в Северной Вирджинии, и в ближайшие месяцы будут использоваться и другие ЦОД Amazon. Как и в случае других облачных сервисов, Amazon надеется привлечь корпоративных пользователей к Redshift стоимостью и возможностью быстрого развертывания хранилища данных в облаке. Традиционные хранилища данных дороги и сложны в управлении. По информации Amazon, сервис Redshift обойдется пользователям на порядок дешевле, а операции развертывания и администрирования хранилища автоматизированы. С помощью консоли управления AWS Management Console или интерфейсов программирования Amazon Redshift API пользователи могут по умолчанию создать единое хранилище данных емкость 2 Тбайта или кластер из узлов хранения общей емкость 16 Тбайт.
В качестве узлов хранения применяются системы High Storage Extra Large (XL) и Storage Eight Extra Large (8XL). В дополнение к емкости хранения 2 или 16 Тбайт они оснащаются оперативной памятью в 15 или 120 Гбайт of RAM. Стоимость сервиса начинается с 0,85 доллара за узел XL и 6,80 долларов в час за узел 8XL. Долговременное хранение стоит менее 1000 долларов за терабайт в год. Данные в кластере Redshift автоматически реплицируются на другие узлы и копируются в облако Amazon Simple Storage Service (S3).
Для защиты данных Redshift может использовать SSL и шифрование AES-256 с аппаратным ускорением как для основных данных, так и для резервных копий. Через Virtual Private Cloud хранилище Redshift можно подключить к имеющемуся корпоративному ЦОД. Данные передаются по туннелям VPN. Ряд вендоров уже тестируют на базе SQL-хранилища Redshift продукты для Больших Данных и аналитики. Пользователи могут купить в Amazon Marketplace приложение Reporting and Analytics for AWS от Jaspersoft. Кроме того, сервис интегрируется с инструментами аналитики от Business Object и Cognos.
Для загрузки данных в хранилище Redshift компании с большими объемами данных могут использовать AWS Direct Connect – соединение между их ЦОД и облаком Amazon с пропускной способностью 1 или 10 Гбит/с. Для портативных устройств удобно применять AWS Import/Export. Через AWS Data Pipeline хранилище Redshift может импортировать данные из таких сервисов как S3 и DynamoDB.