Этот номер журнала посвящен обзору решений, образующих основу для платформ Больших Данных. Распространение облаков и рост объемов данных, требующих для своего анализа высокопроизводительных средств потоковой обработки в реальном времени, увеличение доли нерегулярных приложений, имеющих слабую пространственную и временную локальность, заставляют пересмотреть привычные взгляды на аппаратно-программные инфраструктуры. Действительно, как отмечает в своей статье Леонид Черняк, востребованные сегодня приложения в области биоинформатики, анализа социальных сетей, семантических баз данных, извлечения новых знаний, обработки естественного языка, электронной разведки имеют нерегулярную природу. Обычно в них применяются структуры данных на основе указателей — например, несбалансированные деревья, а также неструктурированные сетки и графы. Конечно, процесс обработки таких информационных конструкций можно распараллелить, но все они характеризуются низкой вероятностью повторного обращения к данным по близким адресам, и произвести их эффективное разбиение традиционными методами на существующих аппаратно-программных решениях затруднительно. Поэтому сейчас и заговорили о платформах Больших Данных, а не об очередной модернизации привычных инструментов.
Такие платформы должны обеспечивать возможность работы с данными всех типов и в произвольных форматах; иметь средства визуализации, обнаружения и представления в удобном для восприятия и поиска виде; включать инструменты аналитики как в традиционном пакетном режиме, так и в режиме реального времени; предоставлять средства поддержки традиционных хранилищ данных и системы обработки потоков различных сведений без потерь времени на промежуточное хранение. Ясно, что путем отдельных локальных усовершенствований (например, создавая идеальные во всех отношениях СУБД) новых платформ не построить — требуется как минимум изменить парадигму хранения данных. Сегодня, по мнению наших авторов, уже нельзя представлять хранилище данных в виде четко структурированного склада — скорее, это «озеро» или «водохранилище» данных. Скорость поступления и объемы сведений и данных, требующих анализа, сегодня настолько велики, что «не доходят руки» до их упорядочивания — успеть бы их собрать в реальном времени, а уж потом решать проблемы доступа. Но, как отмечается в статьях номера, для «озер» нужны иные технологии.
Сегодня же пока нет таких технологий и полнофункциональных платформ для работы с Большими Данными — их роль выполняют традиционные платформы, адаптированные к новым условиям. Как отмечает Дмитрий Семынин, в погоне за требованиями современных задач корпоративные ИТ-инфраструктуры все усложняются, выходя из-под контроля администраторов и нынешних средств управления конфигурациями. Временным решением могут стать унификация ИТ-систем и процессов их взаимодействия, а также автоматизация рутинных процессов, иначе говоря — создание ЦОД по запросу. Такие системы позволят превратить ИТ-службу из подразделения, которое старается угнаться за постоянно меняющимися требованиями бизнеса, в его проактивного партнера, предсказывающего вызовы и задачи завтрашнего дня и заранее готовящего адекватные по гибкости и масштабируемости инструменты.
Для работы в новом измерении и с новыми парадигмами нужны и другие специалисты, подготовить которых с помощью старых учебных методик вряд ли удастся — решением может быть мобильное образование, которому посвящен ряд статей этого номера. Как отмечает Наталья Дубова, со времени появления термина eLearning не прекращаются споры о месте и роли компьютерных технологий в системе образования — разброс мнений широк и разногласия обостряются, а на арену уже выходят «мобильное» и «социальное» обучение, правда, пока лишь на Западе, вызывая у российских специалистов немало сомнений и скепсиса. Эволюция мобильных устройств, появление различных типов обучающего мобильного контента, специальных образовательных мобильных приложений и инструментов для их разработки — все это способствовало созданию благоприятных условий для формирования рынка соответствующих решений, а сегодня наступает фаза формирования его ценности. Это означает массовое внедрение решений для мобильного обучения, сопровождаемое появлением в этой области новаций и оригинальных подходов, таких, например, как дополненная реальность, сенсорные технологии, «интеллектуальные» персональные обучающие приложения.
Как в вопросах технологии построения платформ для Больших Данных, так и в вопросах методологии и подготовки кадров для ИТ сегодня еще много неясностей, но очевидно одно — индустрия выходит из линейности нынешней четырехмерной реальности. Однако, совершая этот шаг, мы попадаем не в пространство, содержащее очередную «коробку номер 5», а в нечто большее, получая сразу весь «штабель» из компьютеров, складов данных, сетей и инструментов формирования нового знания, эффективно работать с которым можно лишь как с единым целым.