Анна Харитонова: «Решение QlikView благодаря возможности масштабирования объема данных и количества конкурентных пользователей может быть интересно не только компаниям сегмента SMB, но и крупным корпоративным заказчикам» |
Сотрудничество компаний «Инфосистемы Джет» и QlikTech началось почти год назад, но зримые результаты появились относительно недавно: в самом начале текущего года интегратор объявил о завершении первого проекта на базе платформы QlikView, а несколько позже – об успешном загрузочном тестировании решения с целью определить, насколько эта система применима для решения задач корпоративного уровня.
QlikTech, специализирующаяся на разработке систем бизнес-анализа (Business Intelligence, BI), была основана в 1993 году, однако ее активное развитие началось в 2005-2006 годах, когда компания предложила решение, основанное на технологии обработки данных в оперативной памяти (In-Memory). На тот момент, как подчеркнул Алексей Артеменко, региональный директор QlikTech в России и странах СНГ, это была инновационная технология, которую конкуренты на рынке систем BI представили значительно позже. Более высокая производительность по сравнению с традиционными аналитическими системами, использование гибкой ассоциативной модели данных, а не структуры с жесткой иерархией, по словам Артеменко, привели к быстрому росту числа клиентов компании. На сегодня у QlikTech насчитывается свыше 24 тыс. клиентов и порядка 1,2 тыс. партнеров в более чем 100 странах, при том что сама компания остается сравнительно небольшой – около 1 тыс. сотрудников в 28 офисах, расположенных в 23 странах, включая Россию (штат московского представительства — десять человек). В нашей стране компания развивает свой бизнес около трех лет, действуя через своих партнеров; их сейчас около полутора десятков. Рост клиентской базы в России, по словам Артеменко, составляет 80% в год, а всего в активе представительства сейчас примерно 150 проектов, осуществленных в России и странах СНГ.
Одним из таких проектов стало создание системы аналитической отчетности на базе платформы QlikView для чеховского завода группы компаний «Danone-Юнимилк». За осуществление проекта взялись «Инфосистемы Джет». Работы велись в течение шести недель, начиная от сбора требований и заканчивая финальной демонстраций результатов проекта. Сейчас система действует в тестовом режиме на одной из производственных линий, к ней подключено десять пользователей, а объем базы данных составляет около 20 млн записей.
С запасом прочности
«Danone-Юнимилк» — крупная компания, однако проект, осуществленный на чеховском заводе, по своим показателям характерен скорее для сегмента SMB, считает Анна Харитонова, начальник отдела бизнес-анализа центра программных решений компании «Инфосистемы Джет». Поскольку, по ее словам, решение QlikView может быть использовано для гораздо более масштабных задач, в «Инфосистемах Джет» предложили провести нагрузочное тестирование системы.
Информация для исследования в виде базы данных, насчитывающей 3 млрд обезличенных записей, была предоставлена одним из партнеров интегратора. В качестве еще одного тестового показателя была взята численность конкурентных пользователей (то есть работающих с данными одновременно), составляющая 500 человек. Дополнительным критерием стало время построения отчета – оно не должно было превышать 5 секунд.
Ключевой проблемой при выборе решения на базе технологии In-Memory, объяснила Харитонова, является то, чему отдать приоритет – объему данных или количеству пользователей, так как емкость оперативной памяти далеко не безгранична. Например, чтобы обеспечить работу с тестовыми показателями (3 млрд записей и 500 пользователей), необходимо порядка 50 Тбайт оперативной памяти, что превышает возможности современных систем. QlikView позволяет обойти это ограничение, в частности за счет использования компрессии, благодаря чему «вес» данных в формате QlikView уменьшается примерно в 30 раз.
Нагрузочное тестирование проводили на трех версиях сервера QlikView и трех стендах различных конфигураций. На первом, отладочном этапе QlikView было протестировано на виртуальной машине с восьмиядерным процессором Intel Xeon, объем оперативной памяти которой составлял 96 Гбайт. Максимальная нагрузка на этом этапе составила 200 пользователей и 2 млрд записей, что в целом отвечает условиям для построения отчетности на предприятиях малого и среднего бизнеса. На втором, основном этапе были использованы два физических сервера, первый был оснащен восемью восьмиядерными процессорами Intel Xeon и 256 Гбайт оперативной памяти, второй использовал четыре шестиядерных процессора AMD Opteron и 128 Гбайт оперативной памяти. На этом этапе были пройдены тестовые показатели – максимальный объем данных составил 4 млрд записей, количество пользователей достигло 500. На третьем, заключительном этапе оба физических сервера были объединены в кластер, и это позволило довести объем обрабатываемых данных до 7 млрд записей. Харитонова полагает, что тем самым с лихвой покрываются потребности большинства крупных предприятий.