Grid-система, созданная для обработки данных, которые будут накапливаться при работе Большого адронного коллайдера (БАК), учеными всего мира также используется для ускорения разработки лекарственных препаратов и обнаружения причин изменения климата.
Ученые Европейского центра ядерных исследований (CERN), провели видеоконференцию со своими коллегами из Северной Америки и Азии, заявив, что эта grid-система готова к работе и ее можно будет использовать сразу же, когда возобновятся эксперименты.
Но они подчеркнули, что эта grid-система уже применяется для других проектов. Треть всех экспериментов, проводимых сегодня, не касаются физики, в частности, они связаны с науками о жизни и биомедицинской инженерией. По словам ученых, с помощью этой системы выполняется моделирование, которое могло бы ускорить разработку новых лекарств от малярии, птичьего гриппа и СПИД.
«Моделирование, которое может выполняться на этих ресурсах, представляет собой научные эксперименты, невозможные прежде. Теперь мы в состоянии организовывать совместную работу буквально на лету», — подчеркнул Ян Берд, руководитель проекта grid-системы БАК.
Около трети grid-инфраструктуры в Европе напрямую не принадлежат и не финансируются БАК, поэтому эти ресурсы должны быть предоставлены для экспериментов, не связанных с физикой.
Вольфганг фон Редер, глава ИТ-подразделения CERN, подчеркнул, что центры обработки данных научных и исследовательских организаций раньше, по-существу, представляли собой замкнутые организации, управляемые местными системными администраторами. Использование grid-технологий позволило открыть цифровую инфраструктуру для науки в беспрецедентном масштабе.
В комментариях ученых можно было уловить досаду на то обстоятельство, что люди просто не очень интересуются физикой частиц.
«Большую часть мира, на самом деле, не волнует, живем ли мы в суперсимметричной Вселенной или нет, имеет наша Вселенная одиннадцать измерений пространства-времени или четыре», — подчеркнул Глен Кроуфорд, глава подразделения физики высоких энергий Министерства энергетики США.
Фон Редеру был задан вопрос о том, как повлияет grid на повседневную жизнь людей. Он сравнил ее по значимости с World Wide Web, созданной почти 20 лет назад.
«Смогу ли я использовать ее дома? Косвенно — да. Если вы идете к своему врачу со снимком компьютерной томографии, и этот снимок может быть проанализирован значительно быстрее с помощью технологий grid, тогда от этого выиграет пациент. Точно так же, как с World Wide Web, я не думаю, что даже Тим Бернерс-Ли мог представить, чем в один прекрасный день она станет».
Эта grid-система использует многоуровневую структуру, которая исходит из ЦЕРН, постепенно распространяясь во все меньшие вычислительные центры по всему миру. Данные, полученные при работе коллайдера (а это, как предполагается, около 15 Тбайт в год), будут записываться локально на ленточные накопители в центре «Уровня 0» (Tier 0), то есть в CERN Computer Centre. Здесь они будут фильтроваться и передаваться в 11 вычислительных центров «Уровня 1» (Tier 1), семь из которых расположены в Европе, три — в Северной Америке и один в Азии, в Тайбее. Эти центры распространяют данные по примерно 160 центрам «Уровня 2» (Tier 2), которые имеют достаточно вычислительных ресурсов и ресурсов хранения для выполнения определенных аналитических задач.
Данные передаются из CERN в центры «Уровня 1» (Tier 1) по новым волоконно-оптическим кабелям с помощью модифицированной версии протокола FTP и из них дальше с помощью стандартных Internet-протоколов.
В рамках проведенного недавно теста центр «Уровня 1» (Tier 1), национальная лаборатория Brookhaven National Laboratory, расположенная недалеко от Нью-Йорка, получала данные из CERN со скоростью 800 Мбайт/с. Однако, как заметил Майкл Эрнст, директор Brookhaven по вычислительным сервисам, предполагается, что к 2010 году скорость передачи можно будет довести до 1,5 Гбайт/c, а к 2012 — до 2,5 Гбайт/с.
В Brookhaven уже накоплено 8 петабайт научных данных, полученных в результате собственных экспериментов лаборатории. Данные БАК будут записываться на ленточные накопители, а 4 петабайт из них — кэшироваться на жестких дисках для того, чтобы к ним можно было получить более быстрый доступ. В центре имеется около 2,5 тыс. серверов в архитектуре x86, каждый из которых имеет до восьми процессорных ядер и использует операционную систему Scientific Linux.
По словам Берда, grid можно расширять и дальше.