Google ввела в действие общедоступную бета-версию механизма обработки данных в реальном времени Google Cloud Dataflow. Система позволяет анализировать потоки информации по мере их поступления, а также параллельно обрабатывать в пакетном режиме ранее сохраненные данные, коррелируя результаты. Как утверждают в Google, сервис дает возможность писать приложения обработки очень сложных срезов Больших Данных любому программисту, владеющему Java или Python.
В компании также обновили сервис BigQuery, позволяющий работать с неструктурированными данными с помощью языка запросов SQL. Как сообщают в Google, теперь BigQuery способен загружать до 100 тыс. строк в секунду в расчете на таблицу. Кроме того, добавлена возможность установки прав доступа на уровне строк, что позволяет защищать, например, имена и адреса, сохраняя доступ к другим элементам данных, например, к анонимной истории покупок. Как указывают в Google, сервисы Cloud Dataflow и BigQuery можно использовать совместно — первый для предварительной обработки, второй для анализа.