Количество полезной информации, которую можно извлечь из корпоративных данных, очень зависит от методов работы с ними. Например, по некоторым оценкам, до 80% общего объема данных – это те или иные географические сведения, однако до недавнего времени все они оставались неиспользованными. Сегодня появилась возможность вовлечь в оборот и эти данные – во второй половине текущего десятилетия параллельно с ростом популярности бизнес-аналитики возникло родственное направление Location Intelligence (LI). Речь идет об аналитике, отличающейся от BI наличием привязки объектов к месту действия.
Термин Location Intelligence можно условно интерпретировать как «аналитика, основанная на местоположении», а своим появлением этот тип технологий обязан новейшим достижениям в молодой науке геоинформатике (geoinformatics, geomatics, Earth Science Informatics). Если быть точным, то следует сказать, что предметом геоинформатики являются компьютерные методы обработки цифровой географической информации, что она включает в себя геоинформационные системы, системы сбора географических данных (аэро- и спутниковая съемка), системы глобального позиционирования, а также более традиционные направления, такие как создание национальных топографических сетей и технологии картографии.
Возникновение геоинформатики было вызвано несколькими технологическими достижениями. Во-первых, тем, что современные ИТ открывают широкие возможности для обработки больших объемов данных (успешно решается так называемая проблема Big Data). Во-вторых, появилась недостижимая прежде возможность получения точных географических координат с использованием методов спутниковой навигации. И в-третьих, с появлением цифровых карт упростился доступ к картографической информации.
Основные предпосылки к LI
Помимо известных универсальных программно-аппаратных решений для работы с большими объемами данных (серверы, системы хранения, хранилища данных), применительно к географическим данным создано несколько серьезных специализированных СУБД, большинство которых имеют канадские корни. Для доступа к географическим данным обычно используется подмножество языка SQL/MM, построенного на основе SQL и предназначенного для работы с мультимедийными и пространственными данными. Для описания двухмерных объектов консорциумом OpenGIS утвержден набор примитивов (Simple Features): точка, линия, многоугольник, набор точек, ломаная линия, набор многоугольников и коллекция из примитивов. Наибольшую известность приобрели следующие географические СУБД, которые стали основой для LI.
PostGIS – свободно-распространяемая СУБД, разработанная компанией Refractions Research в 2001 году при содействии региональных властей Британской Колумбии (Канада) путем добавления поддержки графических объектов к известной объектно-реляционной базе PostgreSQL. База PostGIS отвечает спецификациям Simple Features for SQL и сертифицирована консорциумом Open Geospatial Consortium – головной организацией по стандартизации в геоинформатике.
ArcSDE (Spatial Database Engine) – поддерживается компанией Environmental Systems Research Institute, известной своими продуктами ArcGIS, ArcView, ArcIMS. Эта СУБД была разработана двумя австралийскими компаниями, купленными ESRI как дополнение к CУБД InterBase.
Oracle Spatial – опция к СУБД Oracle, разработанная специалистами Канадской гидрографической службы.
JTS Topology Suite – Java-реализация Simple Features Specification for SQL от канадской компании Vivid Solutions.
GEOS (Geometry Engine Open Source) – объединение JTS Topology Suite и PostGIS, разработана совместно Refractions Research и Vivid Solutions.
Важной предпосылкой к формированию LI стала демилитаризация систем спутниковой навигации после того, как в окрестностях Сахалина был сбит южнокорейский пассажирский Boeing 747 рейса KAL007. Независимая экспертиза признала, что наиболее вероятной причиной отклонения лайнера от маршрута была ошибочная настройка автопилота и невозможность уточнения текущих координат. Для исключения подобных трагических недоразумений администрация США взяла на себя обязательство обеспечивать свободный доступ к системе навигации NAVSTAR GPS. В России развертывается своя система ГЛОНАСС, работающая с точностью до 5,5 метра, а в 2011 году этот показатель будет доведен до 2,8 метра. Евросоюз также готовит собственную гражданскую систему навигации Galileo. С появлением GPS произошла геодезическая революция – вместо строго засекреченных и ограниченных в пространстве национальных триангуляционных сетей возникла глобальная космическая сеть, доступная отовсюду. Геодезия и навигация стали всепогодными и круглосуточными. Стоимость навигационных GPS-приемников, обеспечивающих высокую точность, стремительно снижаясь, достигла величин, при которых с ними уже не могут конкурировать обычные геодезические приборы.
Наконец, третий столп LI – цифровая картография. По всей видимости, особенно в России, этот пункт остается одним из самых сложных. С момента создания первых достоверных карт все, что связано с точными географическими координатами, во всех странах попадало под гриф «секретно». Еще совсем недавно в СССР были недоступны даже карты масштаба 1:200 000, а сегодня принята концепция создания и развития инфраструктуры пространственных данных, правовое обеспечение геоинформатики гарантируется законом «О навигационной деятельности», снимающим все запреты на определение пространственных координат объектов, за исключением зон, требующих мер специальной защиты. На российском рынке работают известные поставщики геоинформационных данных Tele Atlas и Navteq, обеспечивающие крупнейших интернет-провайдеров.
Что может LI?
Итак, Location Intelligence – это совокупность методов организации данных и анализа сложных проблем с использованием географических сведений, имеющихся в большинстве информационных источников, технологий геоинформатики и Web 2.0. В сочетании с обычными бизнес-данными географические данные позволяют организациям и предприятиям получить адекватное представление о происходящем в окружающей среде, обнаруживать новые тенденции, улавливать новые образы в действиях партнеров и потребителей, быть готовыми к демографическим и природным процессам и в конечном итоге принимать более точные решения. Наиболее типичные приложения LI таковы:
- анализ информации о потенциальных потребителях и других демографических сведений;
- анализ связи местоположения с операционными данными;
- аккумулирование данных из разных источников;
- анализ взаимосвязей между объектами с разным месторасположением;
- выбор оптимальных маршрутов.
В платформах LI обычно используются индикаторные панели с картографической основой, дополненные технологиями корпоративных коллажей (enterprise mashup), они наиболее удобны для совмещения представлений географической и деловой информации (см. рисунок).
В LI используются геопространственные данные: географические и пространственные системы и системы LI объединяют именно общие пространственные данные, включающие координаты и другие топологические сведения. Поставщиком LI и геоинформационных систем может быть одна и та же компания, например MapInfo, которая теперь называется Pitney Bowes Business Insight. Вторая часть названия отражает пройденный путь от чисто географических систем к системам поддержки бизнеса, ее появление отражает общую тенденцию смещения фокуса от чистой картографии в сторону поддержки бизнеса. Системы LI начинаются там, где заканчивается сфера ГИС, когда данные уже есть и возникают задачи бизнеса.
До последнего времени если географические данные и учитывались при планировании, то делалось это интуитивно. В качестве классического примера обычно приводят выступление Рэя Крока, сделавшего из скромного ресторанчика братьев Макдональдс крупнейшую в мире сеть быстрого питания. Он как-то спросил слушателей, что они считают главной составляющей его бизнеса, и получил ожидаемый ответ – гамбургеры. Однако Крок признал этот ответ неверным: на самом деле он считал своим основным бизнесом недвижимость, – когда компания продает франшизы, то она в первую очередь анализирует место, запланированное для будущего ресторана, все его характеристики с точки зрения последующей деятельности. Ровно то же самое можно отнести к работе других торговых сетей, банков, страховых компаний, всевозможных производств, транспортных компаний, вплоть до планирования чрезвычайных ситуаций. Очевидно, что пространственные данные можно рассматривать в качестве основы успеха бизнеса.
Термин «геопространственные данные» на редкость нескладный, речь идет не о распределении данных в пространстве, а о данных, описывающих поверхность земли. Географические данные указывают местоположение и свойства естественных или искусственно созданных объектов. Что же касается пространственных данных, то в данном контексте слово spatial указывает на область, фрагмент земной поверхности, занимаемый некоторым объектом в пространстве. Оказывается, что для описания такого рода областей достаточно трех простейших компонентов – точки, линии и полигона. В реальном мире точками обозначают отдельные объекты или связанные группы объектов, расположение которых описывается единственной точкой. Линиями представляют дороги, реки, различного рода коммуникации. Полигонами задают однородные по некоторым критериям участки. Вообще в геоинформационных системах пространственные объекты могут быть представлены двумя способами: растровым или векторным. Но в LI предпочтительнее векторная модель данных, представляющая собой объектно-ориентированную систему, которая основана на векторах; ее базовым примитивом является точка, объекты создаются путем соединения точек прямыми линиями или дугами, а площади определяются набором линий.
Сегодня средства для работы с геопространственными данными предлагают не только перечисленные поставщики специализированных географических СУБД, но и производители систем бизнес-аналитики: Teradata, Oracle и Netezza.