Хранилища данных необходимы в системах электронной коммерции, приложениях ERP и CRM
Электронная коммерция, планирование ресурсов предприятия (ERP) и управление взаимоотношениями с потребителями (customer relationship management — CRM) — вот три основные сферы информационных технологий, в которых нельзя обойтись без хранилищ данных. Так считает Билл Инмон, «отец хранилищ данных», недавно основавший новую компанию Pine Cone Systems.
Инмон утверждает: «Как бы часто ни приходилось слышать, что самое главное — это Internet, значимость хранилищ данных не подлежит сомнению. Как только освоен Internet-интерфейс, сразу же возникает потребность в хранилище данных. Специалисты в области электронной коммерции пришли к выводу, что завершаются только 15% ее транзакций, и все потому, что компании, занимающиеся вопросами электронной коммерции, концентрируют свое внимание на Internet, и ни одна из них не заботится о том, что торговым организациям необходимы данные».
Вторая причина, по которой Инмон считает важным использование хранилища данных для Web-узла электронной коммерции, — объем данных. «Узел просто тонет в таким количестве информации, ею становится невозможно управлять», — подчеркнул Инмон.
Что касается ERP, Инмон заметил, что сейчас многие организации вкладывают средства в системы планирования ресурсов предприятия, забывая, что для продуктивной работы с данными этих систем необходимо хранилище данных.
«А CRM без хранилища данных — это всего лишь множество людей, звонящих по телефону. В CRM необходимы интегрированные и собранные в течение длительного времени данные о потребителях. Только так можно действовать осмысленно и эффективно», — объяснил он.
Инмон видит две главенствующие тенденции на рынке хранилищ данных: развитие устройств хранения данных с автоматически устанавливаемыми носителями («близкая память» — near-line storage) и формирование нового отряда пользователей, активно занимающихся «раскопками» информации.
Учитывая огромный объем данных, наполняющих хранилище, устройства хранения с автоматически устанавливаемыми носителями приобретают особое значение. Благодаря им данные помещаются в иерархическую память, а не просто записываются на диск.
Характеризуя так называемые «мертвые данные», он отметил, что если информация занимает 10 Гбайт — она не может быть пассивной, но когда ее объем доходит до 100 Гбайт, то примерно 50% превратятся в данные пассивные. При объеме в 1 Тбайт «мертвыми» становятся 90% информации.
Обработка запроса к базе данных в одноуровневой памяти, значительную долю которой составляют пассивные данные, будет выполняться намного медленнее по сравнению с базой данных, где часто используемые данные расположены на диске, а пассивные — на устройствах хранения с автоматически устанавливаемыми носителями.
Современные хранилища данных применяют стандартную дисковую память, которая в десятки раз дороже, чем память на ленточных накопителях.
Инмон отметил, что приемлемыми решениями для организации иерархической памяти являются оптические диски и ленточные накопители.
Вторая серьезная тенденция связана с использованием хранилищ данных с информацией, полученной в ходе эксперимента.
По словам Инмона, существует два типа пользователей среди руководителей, принимающих решения: «фермеры» и «исследователи».
«Фермеры» — люди предсказуемые, они знают, чего хотят, и у них небольшие запросы. «Они находят крупицы золота, но редко натыкаются на самородок», — сказал он.
Другая категория — «исследователи», которые склонны к непредсказуемым поступкам, не знают, чего хотят, и обращаются с крайне сложными запросами, хотя и нечасто. «Исследователи» обычно работают в страховых и инженерных компаниях, занимающихся управлением процессами.
Существуют три аспекта разработки хранилищ данных. Скажем, SAS Institute занимается добычей и анализом данных; White Cross Systems выпускает специальные аппаратные компоненты для дорогих систем; а Hitachi Data Systems предлагает базовую аппаратную технологию.
«Они не конкурируют и отличаются друг от друга так же, как роликовые коньки от ?Фольксвагена? и танка ?Шерман?», — прокомментировал Инмон.