При этом порядка 80% объема корпоративных данных хранится именно в неструктурированном виде, а не в упорядоченных базах данных. Многие клиенты IBM, добавил Смит, используют сети аппаратных и программных датчиков, которые поставляют огромное количество данных, но у них отсутствуют способы анализа этих данных.
IBM намеревается создать около двадцати новых сервисов, направленных на решение задач анализа петабайтных объемов данных. Один из разрабатываемых инструментов под названием Cloud Workload Analysis предназначается для обобщения характеристик загрузки компьютерного оборудования и выявления заданий, которые можно было бы перевести на облачные платформы. А пакет на базе аналитических платформ InfoSphere BigInsights и Streams, а также кластерной платформы Hadoop позволит с высокой скоростью анализировать потоки текста, видео, аудио, изображений и других видов данных.