OpenWorld 2012 встретил участников красной ковровой дорожкой; Источник: Oracle |
В те времена когда компания Oracle не производила ничего, кроме баз данных, повестка дня ее регулярных конференций была на редкость однообразной, повторялась из года в год и сводилась к анонсу Ларри Эллисоном, главой Oracle, новой или обновленной версии СУБД. За анонсом следовали демонстрации преимуществ новинки над немногочисленными конкурентами.
На Oracle OpenWorld 2012 скуки не наблюдалось — были представлены новинки, подтверждающие превращение Oracle в мультипродуктового вендора, способные определить будущее этой компании до конца текущего десятилетия. Трансформация Oracle началась с дополнения СУБД приложениями, позже ПО связующего слоя, железом и системным ПО от Sun, а затем и облачной сервиcной архитектурой, где все вышеперечисленное объединилось, и компания вышла на уровень поставщика сервисов и готовых решений. В подтверждение этого на OpenWorld чаще всего звучали слова «облако», SaaS, PaaS, IaaS. Девизом конференции стала фраза: Hardware and Software Engineered to Work Together («Железо и программы созданы работать вместе»). Производный от нее термин engineered systems в Oracle используют для обозначения программно-аппаратных комплексов Exalogic, Exalytics и SPARC SuperCluster. Их фунционала в сочетании с управляющим ПО от Oracle достаточно для создания облаков любого масштаба.
Облачное единство
Вполне логично, что свое выступление, раскрывающее суть будущей технологической политики Oracle, Эллисон начал с облаков. Он назвал их приход «новой эрой коммунального компьютинга». Эллисон заявил, что возглавляемая им компания способна предложить все три группы главных облачных сервисов. Из них две — SaaS (приложения) и PaaS (СУБД и ПО связующего слоя) — уже были в ее арсенале ранее, а в 2012 году к ним прибавилась еще и третья группа сервисов — IaaS (инфраструктура). Уверенность в том, что ставка должна быть сделана именно на облака, основывается на том, что только облака способны решить основные проблемы пользователей, связанные с постоянно возрастающей сложностью информационных систем. Облака нивелируют эти сложности и предоставляют возможность работать в любом месте с использованием тех устройств доступа, которые предпочтительнее, и получать в распоряжение те ресурсы, которые требуются. «Вместе с облаками мы расширяем наш традиционный бизнес — продажу программ и железа — оказанием услуг. Как следствие, мы вступаем в конкуренцию с компаниями, для которых такой тип бизнеса является основным», — добавил Эллисон.
Схема распространения облачных решений, внедряемая Oracle, заметно отличается от близких по смыслу предложений других компаний. В ней сохраняется традиционно принятое разделение на два типа облаков — частные и глобальные, но это деление, по существу, является условным. Вне зависимости от типа, облака собираются из одних и тех же комплектующих, вопрос только в том, где устанавливается необходимое оборудование — на площадке заказчика или же в одном из корпоративных ЦОД, принадлежащих Oracle. Важна еще одна сторона сервиса, назовем ее «оборудование как сервис», его идея в том, что оборудование для частных облаков не продается заказчику и даже не передается в лизинг, оно остается собственностью Oracle. При этом Oracle берет на себя обязанности по его обслуживанию и модернизации. Соответственно планируется две разных схемы оплаты — за ресурсы глобального облака нужно платить как обычно, то есть по мере их потребления, а арендатору частного облака придется делать ежемесячные платежи. Сервисы SaaS и PaaS для частных и глобальных облаков идентичны.
Системы, готовые к работе
В центре внимания Open World 2012 оказалась Exadata. Первая машина этого типа была создана в 2008 году, еще до поглощения Sun, на аппаратной платформе HP, затем она дважды модернизировалась (в 2009-м и 2010 году) и теперь предстала в четвертом поколении. Exadata X3 построена на новых восьмиядерных процессорах Sandy Bridge-EP Xeon E5-2690, в стойке устанавливается восемь процессорных узлов с 512 Гбайт памяти в каждом, то есть всего 4 Тбайт на стойку. Главное отличие X3 от машин предыдущих поколений в усовершенствованной, увеличенной в четыре раза трехуровневой системе хранения, где данные подразделяются на три категории по уровню их востребованности — горячие, теплые и холодные. С горячими и холодными все, как обычно, они хранятся соответственно в оперативной памяти и на жестких дисках, а для работы с теплыми служит подключаемый по PCI-Express флэш-массив Flash Cache, его еще называют «эвристической иерархической массовой памятью" (heuristic hierarchical mass memory) или сокращенно X3H2M2. Заметим, не storage, a memory, чем подчеркивается тот факт, что X3H2M2 не рассматривается как склад данных. Массив в четыре раза больше, чем в Х2, его объем — 22 Тбайт на стойку. Если учесть, что в Х3 используется разработанный в Oracle алгоритм десятикратной компрессии данных, то окажется, что в оперативной памяти может храниться до 40 Тбайт, а в X3H2M2 — до 220 Тбайт. Наличие X3H2M2 позволяет выполнять чтение со скоростью до 1,5 млн операций ввода-вывода в секунду средствами одной стойки, для достижения такой же скорости потребовалось бы 15 тыс. дисков, размещенных в 150 стойках. Самое заметное улучшение показателей по сравнению с предшествующей моделью Х2 — двадцатикратное увеличение скорости записи.
Oracle не одинока, над флэш-массивами работает еще несколько компаний, ориентация на такие массивы становится одной из важнейших отраслевых тенденций, более того, со временем они вообще смогут изменить представление о системах хранения, поскольку благодаря им стирается грань между собственно хранением и обработкой, системы типа X3H2M2 скорее можно называть специализированными серверами. На выставке в рамках OpenWorld компания Violin Memory представила свой флэш-массив Memory Array, имеющий много общего с Exadata. В EMC после покупки ею компании XtremIO также ведется работа над созданием собственного флэш-массива по проекту Project X. Эти три работы отличаются по степени открытости, почти открытой является архитектура Violin.
Облачная СУБД Oracle 12с
Недолгая история облаков успела показать, что для наиболее эффективного использования облачных ресурсов программные системы и приложения должны строиться по принципу, который получил непереводимое на русский язык название multitenant. Оно образовано от tenant, означающего «жилец» или «арендатор». Есть попытки переводить его как «мультиарендный», но, может быть, стоит остановиться на термине «совместный», поскольку речь идет о технологиях виртуализации, позволяющих совместное использование разделяемых ресурсов. Совместностью отличается представленная на OOW СУБД нового поколения Oracle 12c. Буква «c» в названии указывает на облака. Эллисон еще назвал эту СУБД plausible database, то есть базой с возможностью включения в нее, подчеркнув тем самым, что какое-то количество «жильцов» (multiple tenants) может включаться в общую базу и совместно занимать одно и то же адресное пространство, но при этом совмещении сохраняется их безопасность и изолированность. Среди инструментов 12с есть построитель «тепловой карты», позволяющий оптимизировать использование адресного пространства, перемещать данные в зависимости от их температуры.
Технологии виртуализации баз данных нельзя назвать особым новшеством; например, у VMware есть продукт vFabric, его последняя версия, vFabric Data Director 2.0, поддерживает работу Oracle 10g и 11g на виртуальных машинах. Очень близкое по сути виртуализационное решение, ориентированное на Exadaya, предлагает компания Delphics. Оно поддерживает все версии Oracle, начиная с девятой.
Виртуализация баз данных отличается целом рядом преимуществ, сокращая потребности при использовании процессорных ресурсов и адресного пространства. Эллисон предъявил убедительные данные, свидетельствующие о том, что при совмещенном подходе в одном и том же адресном пространстве можно разместить на порядки больше баз. А если сочетать совмещение с флэш-массивами, то есть шанс вообще отказаться от использования жестких и даже твердотельных дисков. Такое решение на OpenWorld назвали in-memory, что не вполне строго, поскольку к категории «в памяти» причисляются те СУБД, которые ограничены только оперативной памятью, например та же Oracle TimesTen. В данном же случае этот термин трактуется расширительно, включая в понятие «память» еще и флэш-массив. Но тем не менее можно считать, что использование термина in-memory по отношению к 12с оправданно, поскольку СУБД в значительной мере ориентирована на «аналитику в памяти». Адаптированность к аналитике усилена появившейся в 12с возможностью работать не только со строками, но и с колонками.
Высокие гости
В работе OpenWorld приняли участие руководители компаний Fujitsu и EMC. Хориюки Тоеки, вице-президент Fujitsu по корпоративным технологиям, раскрыл некоторые детали проекта по созданию процессора следующего поколения, специально предназначенного для решения проблемы Больших Данных. Основное отличие процесса, создаваемого по проекту «Афина» (Project Athena), в том, что он обеспечит перераспределение функций между аппаратным и программным обеспечением, возьмет на себя часть работы, обычно выполняемой программными средствами. Athena наследует ряд качеств от созданного ранее суперкомпьютера K Computer — это архитектура и технология водяного охлаждения. Первые кристаллы могут появиться в будущем году. Сопоставление фунциональных возможностей трех новинок — готовых специализированныx систем, совместимыx СУБД, и процессоров, реализующих функции СУБД, наводит на мысль, что развитие заложенных в них идей приведет к созданию специализированных машин баз данных следующего поколения.
В выступлении Джо Туччи, президента и генерального директора EMC, внимание было уделено не столько технике работы с Большими Данными, сколько аналитическим методам, развиваемым входящей в состав EMC компанией Greenplum, и роли тех специалистов, которых называют data scientist. Будет ошибкой перевести название этой специальности как «ученый по данным», точнее будет «специалист, изучающий данные». Туччи назвал эту деятельность самым привлекательным занятием XXI века.
О нынешней JavaOne
Параллельно с OpenWorld проходила конференция JavaOne. Имея опыт посещения этой конференции во времена Sun Microsystems, интересно сравнить то, что было тогда, с тем, что стало сейчас. Чисто внешне конференция много потеряла, в отсутствие многихх ее харизматичных лидеров обстановка совершенно иная, но содержательная сторона сохранилась, осталась поддержка всех компонентов Java со стороны Oracle и других вендоров, продолжается активная деятельность сообщества.