За последние несколько лет мы ничего не слышали от Microsoft о новых возможностях SQL Server для локальной бизнес-аналитики. Это продолжительное молчание вынуждало строить догадки о будущем Reporting Services, Analysis Services и других ключевых технологий, на основе которых сегодня принимаются критически важные решения. Наконец, период ожидания и предположений остался позади. Недавно в презентациях на Build и Ignite представители Microsoft анонсировали важные новшества для локальных реализаций SQL Server. Далее в статье я расскажу о ключевых изменениях, касающихся профессиональной бизнес-аналитики.
Основные планируемые инвестиции
Инструменты разработки SQL Server Development Tools (SSDT) и SQL Server BI Tools (BIDS) наконец-то объединены в Visual Studio. Усовершенствована работа программы установки вместе с процессом импорта из конструктора и из Office 2016. Реализованы поддержка табличного языка сценариев Analysis Services и расширенный мониторинг на основе событий в SQL Server Management Studio (SSMS).
Что касается киоска данных или хранилища данных, то в SQL Server 2016 будет включена поддержка обновляемого некластеризованного индекса columnstore при использовании хранилища с колоночным индексом в памяти или строкового хранилища на диске для реализации оперативной аналитики. Технология Polybase, ранее использовавшаяся только в Microsoft Analytics Platform System, теперь будет стандартным компонентом SQL Server 2016. PolyBase позволяет создавать распределенные запросы и запрашивать нереляционные данные Hadoop, большие двоичные объекты, файлы и существующие реляционные данные SQL Server без обязательного перемещения данных. Данные Hadoop можно импортировать для постоянного хранения в SQL Server, а устаревшие реляционные данные экспортировать в Hadoop. PolyBase открывает возможность доступа и запроса данных, хранящихся как на локальных ресурсах, так и в «облаке», что позволяет реализовать гибридные решения на основе данных, находящихся где угодно. Впрочем, эта тема уже заслуживает отдельной статьи.
Обращаю внимание тех, кто работает со службами интеграции (SSIS), на то, что конструктор теперь поддерживает предыдущие версии. Наконец-то разработчики Microsoft осознали, что в реальном мире используются разные редакции и версии. Крупные предприятия далеко не всегда могут обновить все свои процессы извлечения, преобразования и загрузки данных (ETL) до самой современной версии. Прочие новшества в части SSIS включают использование Power Query как источника данных в сценариях обновления от самообслуживаемых ETL-процессов до ETL-процессов корпоративного уровня. Кроме того, высокий уровень доступности совместим с SQL Server Server AlwaysOn. Добавлены новая задача потока данных Azure Data Factory, новые соединители для хранилища Azure, команд Azure, OData версии 4, файловой системы Hadoop (HDFS), JSON, а также соединитель Oracle/Teradata V4 от Attunity. В версии 2016 службы SSIS обретут и другие улучшения в части удобства работы, параметров добавочного развертывания, уровней настраиваемого протоколирования и шаблонов пакетов для повторного использования кода ETL.
В большинстве крупных хранилищ данных применяется управление основными данными о пользователях, продуктах и других базовых параметрах с атрибутами, которые отсылают и получают обновления из различных рабочих приложений. Тех, кто пользуется SQL Server Master Data Services (MDS), порадует то, что в сборках 2016 эти службы получат свою долю преимуществ. Вы непременно отметите повышение производительности при работе с большими моделями, дополнительную возможность сжатия на уровне строк для каждой сущности, удобный административный интерфейс и новые параметры настраиваемого хранения данных. Кроме того, добавлены новые функции, обеспечивающие более высокий уровень детализации чтения, записи, удаления и создания разрешений безопасности. Администраторы данных отметят, что надстройка служб Master Data Services для Excel ускорилась в 15 раз, а в 2016 году будут поддерживаться операции массовой обработки промежуточного хранения по отдельным сущностям (см. рисунок).
Рисунок. Архитектура работы с данными в SQL Server 2016 |
Уже можно заметить, как решения Microsoft выигрывают от приобретения Revolution Analytics вместе с языком R. Долгожданное новшество в SQL Server 2016 — встроенные в базу данных аналитические функции с интеграцией языка R. Раньше вы, вероятно, использовали запросы DMX со службами SQL Server Analysis Services, но возможности этих функций ограничивались несколькими алгоритмами и одним дополнительным уровнем сложности при непроизводительном добавлении экземпляра Analysis Services. Кроме того, средства не вкладывались сюда уже несколько лет. Новая встроенная в базу данных аналитика с интеграцией языка R гораздо эффективнее, так как открывает целый мир неограниченных аналитических алгоритмов и даже позволяет импортировать модели, созданные в Azure ML.
Реальные улучшения наконец-то запланированы и для популярных классических служб Reporting Services (SSRS), с помощью которых теперь можно будет создавать отчеты, оптимизированные для мобильных устройств, с поддержкой современных браузеров на разных платформах. Внутренние соединители позволят взаимодействовать с новейшими версиями источников данных Microsoft, таких как SQL Server и Analysis Services, а также сторонних источников, таких как база данных Oracle, Oracle Essbase, SAP BW и Teradata. С помощью соединителей ODBC и OLEDB можно будет подключаться и ко многим другим источникам данных. Новые темы и стили отчетов, а также оригинальные типы диаграмм откроют новые возможности представления данных. В выпуске 2016 будет усовершенствовано управление запросами на ввод параметров и реализованы динамичные параметризованные варианты разработки отчетов.
Новшества для Analysis Services включают усовершенствования в области готовности предприятия, платформы моделирования, инструментов бизнес-аналитики, интеграции с SharePoint и гибридной бизнес-аналитики. В SQL Server 2016 будет обеспечен функциональный паритет служб Analysis Services с SharePoint vNext и Excel vNext. В области готовности предприятия усовершенствования включают повышение производительности за счет необычных иерархий, числа различных объектов реляционной OLAP, запросов детализации, разделения процессов обработки и запросов и полуаддитивных мер. Для многомерного режима Analysis Services консольные команды базы данных будут поддерживать обнаружение проблем с использованием многомерных индексов OLAP. Кроме того, в качестве источника данных будет доступна база данных Netezza.
Тех, кто работает с Analysis Services в табличном режиме, должно заинтересовать то, что в версии 2016 табличная модель будет в большей степени ориентирована на предприятия. Благодаря оптимизации обработчика запросов вырастет производительность прямых запросов Direct Query. Помимо прочего, повышение производительности будет обеспечено за счет параллельной обработки разделов, расширенного моделирования с двунаправленной (с отношением «многие ко многим») кросс-фильтрацией (сегодня это уже реализовано в Power BI Designer), новых функций DAX (DATEDIFF, GEOMEAN, PERCENTILE, PRODUCT, XIRR, XNPV).
Все это звучит слишком хорошо, чтобы быть правдой? Сомнения понятны, поскольку перечисленные возможности отсутствуют в доступной на сегодня версии CTP. Недоверчивым читателям я предлагаю ознакомиться с тематическими секциями, освещающими процесс эволюции SQL Server 2016 на Channel 9 (http://channel9.msdn.com/Search? term=The%20SQL%20Server%20Evolution#ch9Search), либо поискать публикации по теме BI. При сегодняшнем изобилии новых сведений просто невозможно быть в курсе всего. Если не хотите пропустить выход будущей предварительной CTP-версии, подпишитесь на рассылку на официальной веб-странице SQL Server 2016 (http://www.microsoft.com/en-us/server-cloud/products/sql-server-2016/).