Как объявила компания ZeoSync, ей удалось добиться того, что математики и специалисты по информатике в течение полувека считали невозможным.

Если это действительно так, то ZeoSync содала технологию, которая обеспечивает сжатие в несколько проходов, создавая в результате файлы в 100 раз меньшие, чем они были изначально. При этом не допускается никакой потери данных, что неизбежно при использовании большинства современных схем сжатия. Однако многие сомневаются в правдоподобности характеристик, о которых заявляет ZeoSync. Тем не менее в компании обещают вскоре представить доказательства в виде демонстраций и готовых продуктов.

Если такой прорыв действительно совершен, то, как считают специалисты, грядет революция в области хранения и связи. С помощью такого рода сжатия, как заметил Дэвид Хилл, директор по исследованиям систем хранения компании Aberdeen Group, видео по требованию и другие приложения, для которых необходима большая полоса пропускания, смогут работать через стандартные телефонные модемы, не требуя широкополосных соединений. Многие эксперты подчеркивают, что это слишком хорошо, чтобы быть правдой.

Подробное описание своей технологии компания из Флориды хранит в строжайшей тайне. В пресс-релизе, где было объявлено об этом «прорыве», компания дает весьма туманное объяснение: «Технология специальным образом рандомизирует естественно возникающие шаблоны, формируя случайные последовательности энтропического характера, а затем кодирует ими строки в рамках сложных комбинаторных последовательностей, создавая их эквиваленты, значительно меньшие по размеру». Технологию предполагается реализовать «в кремнии», выпустив специализированные микросхемы для кодирования и декодирования информации.

В ответ на просьбу изложить суть технологии в терминах, понятных непрофессионалу, генеральный директор ZeoSync Питер Сент-Джордж представил объяснение, которое может скорее запутать, нежели прояснить суть дела: по его словам, технология ZeoSync на основе файлов данных создает многомерные конструкции.

ZeoSync предоставила некоторым аналитикам краткое описание своей технологии, однако никаких подробностей, подтверждающих заявленные характеристики нового решения, предложены не были.

Многие эксперты скептически относятся к решению ZeoSync не предлагать детального описания. Эрик Шейрер, старший аналитик Forrester Research, заметил, что «все их материалы скрыты завесой тайны, хотя она и весьма тонка, а при попытке выяснить подробности специалисты компании лишь начинают сыпать малопонятными терминами» или утверждать, что некоторые подробности скрыты под грифом «секретно» и потому обсуждать их они не имеют права. «Беседа с представителями ZeoSync напоминает сказку про белого бычка, — заключил он. — Добиться того, о чем заявляет ZeoSync, абсолютно невозможно».

Мнение Шейрера авторитетно еще и потому, что он имеет ученую степень в области сжатия аудиозаписей, полученную им в Массачусетсском технологическом институте, и опубликовал более десятка научных статей по данной теме.

Сент-Джордж, занимавшийся исследованиями этой проблемы в течение 12 лет, утверждает, что скептики заблуждаются, поскольку его компания нашла подход, позволяющий «вытащить нас из скорлупы, в которой мы находились до сих пор».

«Люди сами придумывают себе ограничения, — заметил Сент-Джордж. — Они предпочитают существовать в маленьком пространстве, что помогает им чувствовать себя большой величиной».

Сент-Джордж, безусловно, — чужак в сложившемся кругу математиков. Он не имеет высшего образования, хотя и утверждает, что проучился по три года в университете Сиракуз и университете штата Юта. «Я самоучка», — говорит он, когда речь заходит о математике.

Скептики, которые все же допускают правомерность утверждений представителей ZeoSync, хотели бы получить от компании доказательства, подтверждающие их пока голословные заявления. По мнению Хилла, компания должна дать возможность другим математикам проверить их данные и результаты тестов и провести серию публичных демонстраций. «Демонстрация была бы весьма полезна, — считает Хилл. — И вообще, мне кажется, было бы разумнее подождать с анонсом. Заявление, что вы сделали открытие, которое будет иметь очень важные последствия, мир всегда воспринимает с определенным скепсисом, и этот скепсис улетучивается только после того, как результаты подтверждают авторитетные специалисты».

Сент-Джордж с этим не согласен.

«Если вы ограничитесь узким кругом и не будете публиковать информацию нигде, за исключением научных журналов, обычные люди не смогут воспользоваться этой технологией, — сказал он. — На каждого, кто утверждает, будто бы такое решение невозможно, найдется десяток других, кто поверит».

Сент-Джордж также заметил, что исследователи отказываются поддерживать его точку зрения по той причине, что «у них есть свой интерес в сохранении сложившейся ситуации, поскольку вся их жизнь связана с этими вещами». Он также подтвердил, что публичная демонстрация новой технологии состоится в ближайшее время.

«Я был бы очень рад, если бы все это оказалось правдой, но не существует решений, которые позволили бы этого добиться», — считает Шейрер.

Он допускает, что в ZeoSync могут искренне заблуждаться и ошибочно трактовать полученные ими результаты или создать метод, который работает в очень ограниченных условиях. «О «прорывах» в технологии сжатия уже не раз сообщалось, но в конечном итоге все оказывалось пшиком», — заметил Шейрер.

Однако Сент-Джордж сохраняет оптимизм. Он утверждает, что компания ведет переговоры по поводу этой технологии со студиями Голливуда и производителями полупроводниковых компонентов, причем результаты этих переговоров будут представлены в ближайшие полгода.

Он также обещает продемонстрировать эту технологию в Web.

«Мы понимаем, насколько нам вредит отсутствие опубликованных доказательств, — сказал он. — Как только мы покажем нашу технологию, люди наконец поймут, что они получили. Через какое-то время скептики сами убедятся в нашей правоте».

Если ситуация будет развиваться как планируется, то уже очень скоро скептики действительно смогут убедиться в том, кто прав. Результаты скажут сами за себя.


Что мы знаем о сжатии

Теоретический предел сжатия данных определяется теоремой Шеннона: стоимость кодирования всегда не меньше энтропии источника. Здесь «стоимость кодирования» — средняя длина кодирующей последовательности, «энтропия» — мера неупорядоченности, определяемая вероятностью появления различных символов в источнике. На практике коэффициент сжатия, достигаемый большинством существующих алгоритмов, не превышает 10. Больший коэффициент возможен лишь при чрезмерной избыточности источника (разности между стоимостью его кодирования и энтропией), например при сжатии черно-белых изображений большого объема, кодируемых длинными повторяющимися последовательностями байт.

Сжатие может быть обратимым и необратимым: первый тип сжатия позволяет восстановить источник до первоначального состояния без потерь, второй — нет. Необратимое сжатие широко применяется для компрессии изображений; после сжатия внешне картинка может остаться без изменений, но в реальности какие-то ее атрибуты утрачиваются.

Все существующие алгоритмы обратимого сжатия основаны на снижении избыточности источника. Самый простой метод компрессии — сжатие посредством кодирования серий, когда каждая последовательность повторяющихся байт просто заменяется парой: один кодирующий байт плюс байт, указывающий число символов в последовательности. Остальные методы более сложны и, как правило, представляют собой процесс, состоящий из двух этапов — моделирования и кодирования. В простейшем случае первый этап заключается в оценке частот встречаемости символов в источнике и построении на основе полученных сведений таблицы кодов (каждому из символов источника ставится в соответствие последовательность бит разной длины; чем реже встречается символ, тем длиннее кодирующая последовательность); на втором этапе выполняется собственно преобразование по этой таблице входной последовательности символов в выходную.