С момента своего основания в 1979 году и вплоть до начала нынешнего десятилетия компания Teradata существовала совершенно независимо от всего окружающего компьютерного мира. Эта исключительность положения объясняется тем, что, в отличие от всех остальных, она не стала заложницей последовательной схемы вычислений, а свой самый первый продукт построила на основе архитектуры с массовым параллелизмом (Massive Parallel Processing, MPP), что гораздо естественнее при работе с большими и сверхбольшими базами данных. В архитектуре Teradata нет ничего однопотокового, при проектировании всегда принимался во внимание аспект параллелизма, ядром этой архитектуры является процессор доступа AMP (Access Module Processor). До 1984 года AMP были аппаратными, но с появлением версии СУБД Teradata для Unix был сделан значительный скачок вперед, процессоры AMP стали виртуальными. Виртуализация позволила отойти от специализированного решения в пользу аппаратной платформы на базе многопроцессорных серверов серии WorldMark, выпускавшихся компанией NCR, в состав которой Teradata входила до 2008 года. Виртуальные процессоры AMP, vproc, являются основой параллелизма, на каждом из них работает собственный экземпляр ПО, управляющего СУБД Teradata Database и виртуальной дисковой подсистемой vdisk.
Все эти годы основными продуктами Teradata были системы семейства 5ХХХ, а также поддерживающее их ПО, параллельная СУБД и соответствующие консалтинговые услуги — в общем, все то, что необходимо для создания хранилищ данных такой бизнес-аналитики, потребителями которой являются крупнейшие компании мира. В настоящее время на долю Teradata приходится примерно 10% общего объема мирового рынка средств бизнес-аналитики, это около 1,7 млрд долл. Всего в мире у компании немногим меньше тысячи заказчиков, а в год систем 5ХХХ выпускается около сотни.
Несколько лет назад «островное» положение Teradata было нарушено появлением конкурентных решений на базе универсальных платформ, разработанных Oracle, IBM и Sybase, от компаний, предлагающих специализированные компьютеры для работы с хранилищами данных, в первую очередь это Netezza и DATAllegro (куплена в 2008 году Microsoft), а также поставщиков специализированного программного обеспечения — Greenplum и Vertica Systems. Их выход на сцену закономерен, объемы данных растут. Обычные системы управления, иногда называемые операционными, не могут обеспечить прежнего конкурентного преимущества. Теперь практически все успехи в бизнесе определяются качеством управления, а это значит, что роль компьютерных систем, поддерживающих аналитику, заметно возрастает. Показательно, что BI относится к числу тех немногих сегментов компьютерного рынка, которые не пострадали от кризиса. Все отраслевые эксперты сходятся во мнении, что рынок BI будет расти и в текущем году, и в последующие годы.
Виртуализованная архитектура позволила ответить должным образом на вызовы конкурентов, Teradata пополнила предлагаемый спектр специализированных компьютеров системами средней и малой производительности. «Мы больше не пытаемся продать лимузин потребителю, которому вполне достаточно размеров семейного седана», — охарактеризовал этот шаг Ян Шимек, вице-президент Teradata по Восточной Европе, во время визита в Москву. Основу линейки составляют три системы. Первые две и компания, и ее конкуренты называют appliance, это Teradata Extreme Data Appliance 1550 (для больших объемов неструктурированных данных) и Teradata Data Warehouse Appliance 2550 (уровень подразделения), за классической системой остается «хранилище данных» Teradata Active Enterprise Data Warehouse 5550 (корпоративный уровень). Все они построены на идентичных четырехъядерных процессорах (один или два), объем памяти — 32 Гбайт, но различаются дисками: чем старше система, тем меньше и производительнее диски, но удельная цена хранения растет. Системы Teradata 1550 и Teradata 5550 построены на основе собственной соединительной системы Bynet, они могут поддерживать до 1024 узлов, в Teradata 2550 ПО Bynet использует стандартный Gigabit Ethernet, здесь масштабирование ограничено 44 узлами. Три MPP-конфигурации дополняются обычными последовательными платформами, предназначенными для витрин данных и для учебно-тестовых целей. Компьютер Teradata Data Mart Appliance 551 является одноузловым с архитектурой SMP, а программный пакет Teradata Software-Only Edition может быть установлен на любом SMP-сервере на базе Intel. Как одно из важнейших достижений рассматривается соглашение, по которому Teradata и SAS осуществляют совместную поставку технологий для аналитики. С появлением этих моделей Teradata не покидает стандартную нишу старшего класса, но в дополнение к ней «спускается» до среднего класса, а также осваивает новую нишу недорогих систем, способных хранить большие объемы данных.
Число внедренных систем BI в России непропорционально мало по отношению к размерам экономики и уровню развития ИТ, поэтому рынок будет с неизбежностью расти, полагает Шимек. В некоторых других подведомственных ему странах (Чехия, Польша и Венгрия) внедрено по четыре-пять систем, в основном в телекоммуникационных компаниях, крупных банках, страховых компаниях. Он считает, что Россия способна потребить как минимум несколько десятков систем старшего уровня.
Сравнивая продукты своей компании с конкурирующими изделиями, Шимек отметил довольно значительные различия между ними. Прежде всего в том, что альтернативные решения в большей степени специализированы, за счет этого они могут быть быстрее внедрены, их стоимость может быть ниже, но в то же время они хуже масштабируются, хуже адаптируются к новым условиям. Перед нами классическая инженерная дилемма, выбор между специализированным инструментом для ограниченного количества операций универсальным инструментом. Тот и другой имеют право на существование, но каждый в своих условиях. Помимо преимуществ масштабирования, использование мощного универсального хранилища позволяет реализовать корпоративную систему бизнес-аналитики по централизованной схеме, избежав «мешанины» из множества разных решений, и обеспечить непротиворечивость результатов при использовании разных аналитических инструментов.
Что касается сферы приложения продуктов Teradata, то потенциально она очень широка. Помимо традиционных систем CRM, они могут быть использованы во множестве разнообразных систем, так или иначе связанных с анализом данных. Например, в финансовых и фискальных организациях можно обнаруживать финансовые утечки и налоговые нарушения. Одна из самых перспективных областей приложения — геология, анализ больших массивов позволяет ускорить обнаружение месторождений и продлить срок их эксплуатации.