В каждой шутке, как всем известно, есть доля истины. И когда шутка затягивается, а истина проступает все более отчетливо, то в итоге всем становится как-то совсем уже и не смешно...

Когда в феврале нынешнего года журнал Nature опубликовал историю о тревожном росте как бы научных публикаций, целиком сконструированных программой-генератором из грамматически правильных, но абсолютно бессмысленных фраз, то поневоле вспомнили и давнюю студенческую шутку, от которой пошла эта напасть.

Программу «бредогенератор» SCIgen около десяти лет назад забавы ради написали несколько аспирантов МТИ, Массачусетского технологического института. Ну а теперь, как выяснил французский исследователь Сирил Лаббе, уже на сотни идет счет статей с чепухой от SCIgen, обнаруживаемых в подписной (кстати, весьма недешевой) продукции солидных научных издательств.

Подгнило что-то в королевстве

Так, в сборниках трудов конференций, выпускаемых издательским домом Springer, выявлено по меньшей мере 16 порождений бредогенератора. А в докладах конференций, публикуемых инфотехнологическим издательством IEEE (Institute of Electrical and Electronic Engineers), статей с ахинеей от SCIgen обнаружилось почти на порядок больше — свыше 100 как минимум...

Чтобы стало яснее, каким образом нынешняя наука сумела дойти до жизни такой, имеет смысл хотя бы вкратце вспомнить предысторию вопроса. Причем делать это надо в непосредственном сопоставлении с параллельным развитием современного искусства и философии — по причинам, которые станут понятны по ходу рассказа.

Вообще говоря, история шуток и мистификаций в литературе, искусстве и науке берет начало в глубине столетий, однако здесь вполне достаточно ограничиться наиболее характерными событиями последнего полувека. А начать рассказ уместно с престранной ситуации в современном искусстве, обсуждая которое, высоколобые критики-интеллектуалы и просто ценители авангарда с умным видом могут превозносить абсолютно любую чушь, — ибо так им видится подлинная красота.

В этой связи очень уместно будет напомнить историю, случившуюся в 1964 г., когда немалый шум наделали картины некоего Пьера Брассо (Pierre Brassau), неизвестного гения с трудной судьбой и «современного Ван Гога» авангардизма. Ну, а когда творчество Брассо собрало достаточное количество восторженных откликов, то стало известно, что вся эта мазня — развлечения четырехлетнего шимпанзе Петера, живущего в одном из шведских зоопарков...

Подгнило что-то в королевстве

В те же 1960—1970-е годы компьютерщики начали развлекаться с программами для генерации текстов — типа рифмованных стихов или заумной псевдофилософской эссеистики. Апофеозом такого творчества можно считать появившуюся в 1996 г. программу «Генератор постмодернизма» Эндрю Балхэка, а также то, как тогда же созвучно ей подшутил над философами математик Алан Сокал.

Смастерив бессмысленный текст в духе «Генератора постмодернизма», Сокал под собственной подписью отправил его смеха ради в журнал Social Text, имеющий в США репутацию серьезного философского издания. И можно представить себе чувства сторон, когда данная статья была действительно опубликована — ибо для редакторов журнала вся эта ахинея ничем особенным не отличалась от прочих публикаций их издания...

Весьма близкие этому процессы в то же самое время стали наблюдаться, как ни странно, и в точных науках — к примеру, в теоретической физике. Самой громкой историей, наверное, можно считать знаменитое «дело Богдановых».

Французские братья-близнецы Игорь и Гришка Богдановы, ведущую свою родословную от древних дворянских домов России и Австрии, на родине были известны как успешные телепродюсеры и создатели популярных ТВ-передач о достижениях науки. Со временем братья ощутили себя в мире ученых настолько своими, что за 1990-е годы настрогали публикаций в разных научных журналах Европы, Америки и Азии, а затем и защитили по диссертации, став «докторами наук» в крайне нетривиальной области квантовой гравитации.

Лишь на этом этапе активность шустрых братьев попала в поле зрения ученых, действительно разбирающихся в данной области. И один из них — Джон Баэз — не удержался и в 2002 г. публично объявил, что для специалиста научное творчество Богдановых представляет собой полнейшую чепуху — набор модных терминов и фразеологических штампов, выстроенных в виде более-менее связных текстов...

Практически все, кто обеспечивал появление в физике двух новых светил — братьев Богдановых, встали на защиту ими содеянного. И вот тут-то выяснилось, что в теоретической физике ныне уже нет критериев, надежно отделяющих ложь от правды. И то, что одним специалистам представляется полной ахинеей, для других выглядит как интересные новаторские идеи. Примерно как в искусстве или философии.

А еще через три года, начиная с 2005 г., произошла целая серия громких (и позорных, что ни говори) историй, связанных с программами-генераторами в стиле розыгрыша от Алана Сокала, но теперь уже породивших научные статьи в области информатики и теоретической физики.

Здесь самой знаменитой, бесспорно, стала программа SCIgen. С ее помощью аспиранты МТИ (Jeremy Stribling, Dan Aguayo, Maxwell Krohn) наглядно продемонстрировали, как жуликоватые организаторы научных конференций бомбят ученых спамом — своими запросами на статьи и доклады, а затем с удовольствием принимают практически любой мусор. Ибо на самом деле таким конференциям нужны не доклады, а деньги — в виде суммы сбора, необходимого для регистрации на их «научном мероприятии».

Когда написанная всего за несколько дней программа-шутка SCIgen стала мгновенно, по нажатию кнопки, «выпекать» все новые и новые статьи в области информатики, аспиранты хохмы ради стали рассылать их в ответ на каждый новый спам-запрос от очередной конференции. И вскоре, к своему удивлению, стали получать подтверждения о том, что их доклады приняты и включены в план выступлений.

Весьма впечатленные своими успехами, Стриблинг и Крон не только опубликовали в Сети подробности о кухне происходящего, но и сделали свою программу SCIgen свободно доступной для всех. Дабы каждый мог лично убедиться, до какой степени «подгнило что-то в датском королевстве».

Подгнило что-то в королевстве

 

Поскольку же мир ученых не знает государственных границ, вскоре пошли сигналы о точно таких же бедах науки и в других странах. В России, в частности, громче всего прогремел скандал в 2008 г. — вокруг знаменитой ныне статьи про «Корчеватель» (Rooter).

Наш известный математик и биолог, профессор биоинформатики Михаил Гельфанд пропустил одно из порождений SCIgen через программу автоматического перевода и чуток подправил в ней совсем уж очевидные ляпы. А затем под вымышленным именем успешно опубликовал сие творение в рецензируемом «Журнале научных публикаций аспирантов и докторантов» (ЖНПАиД), входящем в так называемый «список ВАКа» — составленный Высшей аттестационной комиссией перечень ведущих изданий, где должны быть опубликованы основные научные результаты диссертаций.

Еще одним заметным событием в том же русле стало появление в 2010 г. новой онлайновой забавы — сайта под названием «Шнархив» (snarxiv.org). Программа делает примерно то же самое, что и SCIgen, но только уже в области теоретической физики. Псевдонаучная ахинея и здесь порождается программой с такой впечатляющей натуралистичностью, что для людей, не сведущих в предмете, почти невозможно отличить реальный научный текст от его юмористической подделки.

Но шутки шутками, как говорится, а подлинный черный юмор данной ситуации сводится к тому, что некие не совсем порядочные представители мира ученых усмотрели в SCIgen и подобных программах очень удобное средство для повышения своего научного рейтинга. Во многом он автоматически складывается из количества публикаций, выступлений на конференциях и числа цитат из статей данного автора в других работах.

Именно эту беду, собственно, и вскрыло упомянутое в самом начале исследование Сирила Лаббе. Он написал собственную программу — для автоматического выявления статей, порожденных генераторами текста. И сходу обнаружил почти полторы сотни таких подделок в сборниках трудов конференций, публикуемых солиднейшими научными издательствами.

Комментируя открытия Лаббе, один из создателей SCIgen, Максвелл Крон (возглавляющий ныне небольшую фирму IT-безопасности в Нью-Йорке), особо подчеркнул, что детективные изыскания французского ученого приоткрывают реальную картину того, насколько глубоки и серьезны проблемы современной науки.

Ученые постоянно находятся под интенсивным давлением — они обязательно должны публиковать новые работы, и чем их больше, тем лучше для карьеры. Университеты и исследовательские центры — для повышения собственного статуса — также всячески подталкивают сотрудников к наращиванию числа публикаций. Ну, а научные журналы и конференции, пользуясь такой ситуацией, стремятся к тому, чтобы статьи приносили им прибыль.

По словам Крона, сформировался целый академический андеграунд, и каждая из сторон, похоже, извлекает из сложившейся ситуации свою выгоду. Научные институты при этом сильнейшим образом обдирают, поскольку они вынуждены платить издательствам огромные суммы за подписку на журналы с такими материалами.

На подобную активность затрачивается масса ресурсов, времени и денег, но при этом собственно в науку не добавляется абсолютно ничего... Конечно, с этой явно нездоровой тенденцией пытаются бороться. Но, анализируя уже достаточно отчетливую картину злоупотреблений на предмет дальнейшего развития, эксперты прогнозируют лишь нарастание обозначившейся гонки вооружений.

По мере совершенствования алгоритмов генерации компьютеры будут порождать все более и более убедительные статьи-фальшивки. А другие программы-детекторы, в свою очередь, будут развиваться, для того чтобы все более эффективно выявлять подобный мусор.

Но самое неприятное то, что победить в этой борьбе те или другие программы не способны. Иначе говоря, сами собой столь серьезные проблемы науки с помощью компьютеров не разрешаются.

Тут всю систему менять надо...