Создатель крупнейшего бесплатного хранилища научных статей ArXiv.org покидает проект
11 августа 2011 года

Создатель крупнейшего бесплатного интернет-хранилища научных статей физик Пол Гинспарг (Paul Ginsparg), автор известного всем физикам, математикам и астрономам сервера ArXiv, после 20 лет руководства проектом покидает его и передает права администрирования сотрудникам Корнеллского университета, сообщает журнал Nature.

В августе 1991 года Гинспарг, незадолго до того перешедший на работу в Национальную лабораторию в Лос-Аламосе и впервые получивший в свое распоряжение персональный компьютер, запустил электронную доску объявлений. Целью было облегчить и упростить для коллег обмен и обсуждение препринтов - научных статей, еще не принятых к публикации.

"Сейчас сложно представить, сколько времени и сил приходилось тратить на печать, копирование и рассылку препринтов друзьям и коллегам перед публикацией в журналах", - пишет Гинспарг в статье, опубликованной в Nature.

Первая статья была загружена в электронное хранилище 14 августа 1991 года. Уже через два года arXiv.org стал главным ресурсом для исследователей. Спустя 20 лет в нем накопилось чуть менее 700 тысяч статей, и для большинства физиков, астрономов, математиков, для многих биологов и экономистов он стал незаменимым инструментом для работы.

Гинспарг отмечает, что его проект появился незадолго до массового распространения интернета - первый веб-сайт был запущен в ЦЕРНе всего за несколько дней до того - 6 августа 1991 года. При этом ArXiv "вышел в сеть" задолго до того, как в интернете появились первые сайты "обычных" научных журналов.

Первоначально Гинспарг предполагал, что он будет получать примерно по 100 препринтов в год, которые будут храниться в репозитории примерно три месяца - до того, как они будут приняты к печати и начнут распространяться по традиционным каналам. Однако по многочисленным просьбам коллег статьи удалять не стали.

Сейчас на сервер загружается по 75 тысяч статей в год, а скачивается - более миллиона. Общее число препринтов, по данным на 3 августа, составило 694 тысячи. Больше всего приходится на долю физики высоких энергий (более 150 тысяч), примерно по 125 тысяч статей по математике и по физике твердого тела, на четвертом месте - астрофизика (123 тысячи статей). По 20-30 тысяч статей приходится на долю ИТ-тематики, квантовой и ядерной физики. Меньше всего статей по количественным финансам - 1,5 тысячи.

"Это воодушевляет - 20 лет спустя видеть стабильно и успешно работающий ArXiv, который служит сообществу примерно в тысячу раз большему, чем ожидалось", - говорит Гинспарг.

Сейчас проект курирует библиотека Корнеллского университета. Входной контроль статей обеспечивают студенты-волонтеры. Деньги на работу хранилища выделяют около 123 научных организаций из 11 стран - те, чьи сотрудники обеспечивают наибольшую нагрузку на сервер. К концу 2010 года сервис получил от них 360 тысяч долларов, а в 2011 - уже 324 тысячи долларов от 114 институтов.

Я УСТАЛ, Я УХОЖУ

Двадцать лет назад Гинспарг полагал, что его работа в проекте займет совсем немного времени - сам сервис был полностью автоматизирован и не будет для него "пожизненным приговором". Однако повседневная деятельность по администрированию ресурса пожирала все больше времени, проект требовал внимания каждый день, без выходных и праздников.

"С сентября управление сайтом полностью переходит в руки сотрудников библиотеки Корнеллского университета в город Итака, штат Нью-Йорк", - объявляет Гинспарг.

По его словам, он сам останется в наблюдательном совете проекта, а также будет заниматься исследовательскими проектами в сфере автоматизированного поиска и обработки данных, создания новых форматов документов и фильтров информации.

По мнению автора проекта, за 20 лет в научном мире произошли революционные изменения в системе обмена информацией, и теперь огромные массивы научных данных и литературы доступны в интернете. Однако Гинспарг с разочарованием отмечает, что научные издания в целом по-прежнему находятся на перепутье.

"Нет согласия о том, как наилучшим образом обеспечить контроль качества (научных исследований), как финансировать их, как собирать воедино данные... Я надеюсь, что использование электронной инфраструктуры в конечном счете полностью изменит способы обработки и организации научных данных", - отмечает он.

ЕСЛИ Б НЕ БЫЛО ТЕБЯ

Хранилище препринтов стало незаменимым инструментом для многих ученых. До сих пор от отправки статьи в научный журнал до ее принятия к печати и до самой публикации проходят многие месяцы, в частности из-за того, что много времени требует процедура рецензирования (оценки текста независимыми экспертами).

Кроме того, доступ к подавляющему большинству журнальных публикаций - только по подписке, которая обходится весьма недешево.

С появлением архива временной интервал между подготовкой статьи и возможностью показать ее коллегам по всему миру исчез.

"У меня каждый день начинается с чтения АrXiv'a, - говорит астрофизик Сергей Попов из Астрономического института имени Штернберга. - Это в первую очередь источник свежей информации, позволяющий следить за своей (и не только) областью. Если с ним что-то случится, сразу же появится замена, так как без такого портала жить сложно".

"Проект важен, так как именно там можно бесплатно почитать свежие статьи - для России это важно", - отмечает астроном Леонид Еленин из Института прикладной математики имени Келдыша.

Он напоминает, что стоимость доступа к полному тексту одной статьи на сайте престижного журнала может составлять около 30 долларов. Учитывая не слишком высокие доходы российских ученых, архив для многих из них является единственной возможность оставаться в курсе последних достижений в своей области.

По мнению Попова, в серьезных изменениях архив не нуждается. Все дополнительные функции, такие, например, как более удобный поиск, можно создать на базе других сайтов, которые будут использовать arXiv.org как базу данных.

"Постепенно менять надо. Но надо делать это очень консервативно и аккуратно", - считает он.