ВСЕ БОЛЬШЕ И БОЛЬШЕ...
НЕОЖИДАННЫЕ ОТКРЫТИЯ
Развитие компьютерных и телекоммуникационных технологий, несмотря на все разнообразие технологических решений и новшеств, демонстрирует одну постоянную тенденцию: непрерывное увеличение объемов хранимой информации. Усложнение программного обеспечения, качественное изменение самой информации (особенно с учетом ориентации на мультимедиа), появление сетевых технологий, позволяющих передавать большие объемы данных - все это одновременно и причины и следствия происходящей информационной революции. Объем жесткого диска для персонального компьютера менее 1 Гбайта уже сейчас считается архаизмом. Что уж говорить о сетевых серверах, для которых терабайты становятся привычной величиной...
Впрочем, на каждую проблему можно посмотреть с разных сторон. Если говорить о хранении данных, то наиболее актуальным становится вопрос "Как извлекать полезную информацию?", а не "Как хранить?".
ВСЕ БОЛЬШЕ И БОЛЬШЕ...
Увеличение объемов информации приводит к появлению новых инструментов для хранения данных, и, что самое главное, для работы с ними. Задача нахождения нужной информации в море терабайт данных вряд ли когда-нибудь потеряет свою насущность. Кроме того, данные для обработки еще нужно подготовить, особенно если они приходят из множества разных источников, неодинаково структурированы и имеют разную степень достоверности. А все это уже требует не простой обработки информации, а использования элементов искусственного интеллекта. Хотя сложность и высокая стоимость таких систем (речь идет о складах данных, которые рассматриваются в этом номере журнала) и отпугивают потенциальных заказчиков, однако для многих из них они могут стать действительно необходимыми средствами повседневной работы. Причем, на этом пути возможны приятные неожиданности...
НЕОЖИДАННЫЕ ОТКРЫТИЯ
Работая с гигантскими объемами информации, как выясняется, можно сделать интересные открытия. Термин "добыча данных" появился сравнительно недавно, однако сама возможность получения новой информации вызывает горячий интерес. Ведь оказывается, что в больших базах данных можно выявить некоторые новые полезные соответствия между элементами, не связанные с теми правилами, по которым построена такая база. Возможно, на первый взгляд, в этом есть доля мистики: кажется, что информация в больших объемах начинает жить собственной жизнью. Однако все гораздо проще. Ведь не кажущиеся поначалу спорными выводы - есть плод логических рассуждений, которые доступны человеку, и, наверное, могут быть доступны компьютеру, даже при нынешнем уровне развития систем искусственного интеллекта. А практическими результатами добычи данных уже интересуются компании, работающие в сфере услуг и торговли, которые надеются лучше понять, как развивать свой бизнес, изучая уже существующие базы данных покупателей и товаров. Что ж, может быть это одно из спасительных средств, которое позволит в будущем правильно обрабатывать огромные объемы данных и не даст нам погибнуть от передозировки информации...