Почти любая современная наука имеет дело с огромными объемами данных. Компания Digital Science занимается разработкой инструментария для научной экосистемы, которая упростит и сделает эффективнее исследовательские процессы.
Почти любая современная наука имеет дело с огромными объемами данных. Для того чтобы выдержать нарастающий темп исследований, ученым приходится искать более совершенные подходы к организации научной работы, эффективные способы коллаборации, а также менять принципы распространения и публикации препринтов и статей.
Компания Digital Science занимается разработкой инструментария для научной экосистемы, которая упростит и сделает эффективнее исследовательские процессы. CEO компании Даниэль Хук вместе с коллегами написал доклад The Ascent of Open Access, посвященный теме открытых исследований и доступа к научным результатам.
Роберт Харингтон из The Scholarly Kitchen взял интервью у Даниэля Хука, чтобы поговорить о необходимых изменениях в научном мире, проблемах финансирования и договоренностей сообщества.
Расскажите нашим читателям немного о себе и вашей роли в Digital Science.
По образованию я физик. Мне посчастливилось работать с замечательными коллегами и, кроме того, в области, которая не требует огромного количества оборудования или лабораторного времени. В результате я продолжаю проводить исследования и публиковаться. Мы с коллегами все время шутим, что физика — это не то, что вы делаете, а то, кем вы являетесь. Однако в этом есть доля правды, и мне нравится применять мой исследовательский опыт в работе, которую я делаю в Digital Science: я думаю, что, учитывая миссию Digital Science по улучшению инструментов для всех заинтересованных сторон в исследовательской экосистеме, чрезвычайно важно, чтобы взгляд исследователя был в центре нашей деятельности. Надеюсь, подход, который я применяю, помогает нам идти по правильному пути.
Я пришел на свою нынешнюю должность CEO в Digital Science, будучи соучредителем Symplectic, одной из первых компаний, в которую Digital Science инвестировала. Там я в течение двух лет возглавлял направление по изучению метрик исследований. Этот двухлетний период стал определяющим как для меня, так и для Digital Science. С лета 2013 года по лето 2015 года я отвечал за взаимодействие с CEO компаний Altmetric, Figshare, Symplectic и UberResearch. За это время мы разработали первые версии институциональных продуктов Altmetric и Figshare и создали в Digital Science профильные группы Consultancy и Data Science. Мы запустили Digital Research Reports, систему GRID и сформулировали стратегию, которая в прошлом году привела к запуску инструмента Dimensions.
Моя роль в Digital Science по большей части сводится к тому, чтобы компания могла поддерживать важные разработки в области открытых исследований.
Каковы были мотивы создания вашего недавнего доклада The Ascent of Open Access?
Это в действительности очень просто: открытый доступ (Open Access) является одной из ключевых основ открытых исследований (Open Research). Практически все, что делает Digital Science, — это про то, как поддержать различные заинтересованные стороны, когда речь идет об экосистеме открытых исследований. С запуском Dimensions у нас появился уникальный источник данных, с помощью которого мы можем рассмотреть многие аспекты исследований. Очень здорово иметь доступ ко всем этим данным и способ быстро получить ответы на вопросы в интерактивном режиме через API. Все инвестиции, которые мы вложили в уникальные идентификаторы как сообщество, окупаются благодаря Dimensions: я легко могу посмотреть на регионы (например NUTS), учреждения (например GRID), людей (ORCID), категории предметов (например ANZRC/FOR) и статус открытого доступа (Unpaywall). После добавления данных Unpaywall в общую базу данных в конце прошлого года появился смысл сделать доклад о том, что нам действительно близко.
В названии этого поста я использую слово «открытость», а не «открытый доступ». Постоянно обсуждаются модели открытого доступа, но все меньше разговоров об открытой исследовательской экосистеме. Как вы оцениваете ситуацию с открытыми исследованиями?
Открытые исследования — это масштабная тема, и в нескольких словах ее трудно должным образом обсудить. Я полностью согласен с тем, что открытый доступ — это всего лишь одна из составляющих, однако это, вероятно, лучшая часть инфраструктуры открытых исследований на сегодняшний день. Очевидно, открытые данные — горячая и быстроразвивающаяся тема. Тем не менее я думаю, что нам есть чему поучиться у движения за программное обеспечение с открытым исходным кодом. Для открытых исследований стоит заимствовать идеи Open Source. Это означает, что нам нужно подумать об открытых протоколах и открытых методах, так же как и об открытой экспертной оценке. Существует много процедурных и этических проблем. Часто считается, что существуют технические барьеры для достижения открытости, в то время как проблемы носят преимущественно культурный или системный характер. Чтобы изменить культуру, нам необходимо изменить академические и промышленные стимулы, чтобы открытость обеспечивала большую отдачу для каждого отдельного участника. Я думаю, что частично этого получится добиться благодаря работе DORA — я надеюсь, что результатом этой инициативы будет что-то вроде «Открытой оценки».
Каковы, по-вашему, наиболее значительные препятствия для открытых исследований?
Мы немного коснулись этой темы в предыдущем вопросе. Я думаю, что самым большим препятствием является существующая система стимулов — люди становятся профессорами не для того, чтобы сделать свои исследования открытыми, — это должно измениться. Нынешняя система изначально построена так, что уже не соответствует современному масштабу исследовательского мира. Я думаю, что в научной коммуникации и оценке произойдут некие радикальные изменения. Однако стоит заметить, что исследования — довольно консервативная область. Системы должны быть опробованы и протестированы — мы не можем позволить себе переключиться на систему, чувствительную к таким эффектам, как фальшивые новости. Поэтому я не думаю, что изменения произойдут быстро.
Видите ли вы увеличивающийся разрыв в открытых исследовательских инициативах между хорошо финансируемыми областями науки и социально-гуманитарными науками с минимальным финансированием?
Я не уверен, что имеет смысл классифицировать открытые инициативы по областям на основе финансирования. Биомедицинские исследования на протяжении многих десятилетий финансировались лучше всех остальных, и все же потребовалось более 30 лет, чтобы догнать такие области, как физика, в отношении препринтов. Даже сейчас публикация препринтов ограничивается некоторыми более прогрессивными областями биологических наук, такими как генетика. В то же время экономические исследования публикуются на сайте препринтов RePEc — почти так же давно, как сообщество специалистов в области физики высоких энергий поддерживает arXiv. Я думаю, что существуют специфические для области особенности, которые часто имеют начало где-то глубоко в этических соображениях. Есть также проблемы с форматом — я думаю, что психологически сложнее сделать доступной книгу, чем препринт. И, как всегда, стимулы во многих областях не совсем совпадают с изданием препринтов и открытыми исследованиями в целом.
Какую роль такие сайты препринтов, как arXiv, bioRxiv, и chemRxiv, будут играть в открытых исследованиях в будущем?
Когда я в качестве аспиранта приступил к исследованиям в теоретической физике, мой научный руководитель познакомил меня с тем, как организована работа в этой области. У нас есть алфавитный список соавторов, и когда работа закончена, мы отправляем ее в arXiv, затем ждем пару дней, на случай, если кто-нибудь найдет повод для критики, и затем отправляем ее в журнал. Для меня это обучение было формирующим. Каждое утро я могу посещать arXiv и проверять новейшие разработки в своей области, потому что все делают это именно таким образом. Я всегда в курсе того, о чем думают и над чем работают коллеги. Сокращение длительности процесса обзора делает исследования более эффективными и помогает нам двигаться быстрее. Конечно, рецензирование является критически важным инструментом для проверки результатов и опровержения ложных утверждений. Но я думаю, что arXiv демонстрирует, что это может происходить асинхронно, без ущерба для качества исследований. Я думаю, что эксперимент с нейтрино, которые движутся быстрее скорости света, является отличным примером того, как препринты могут ускорить научный дискурс.
В 2017 году создание клонов по типу arXiv стало очень модным. Я думаю, что есть повод для некоторой консолидации. Первоначальный arXiv особенно не ограничивал предмет (но, возможно, в большей степени зависел от LaTeX), и поэтому он охватывает в основном физику, математику, информатику и за последние годы еще расширился. Я думаю, что объединение некоторых из этих новых arXiv’ов может дать больше возможностей для того, чтобы изменить мир исследований к лучшему.
В своем отчете вы говорите: «Новый "атом" научной коммуникации, выходящий за рамки публикации, глубоко связан с новым развивающимся отношением исследователей к данным». Можете пояснить читателям, что вы имеете в виду?
Это тема, к которой я планирую возвращаться более подробно в ближайшие несколько лет. Слишком сложно каким-то убедительным образом написать это в таком сжатом формате. Скажем так, мы много думали об этом в Digital Science.
Способность понимать данные, манипулировать ими и взаимодействовать с ними проникает в профессиональную жизнь, социальную жизнь, а теперь и в исследования. На мой взгляд, все старшекурсники должны пройти курс науки о данных, независимо от их основного направления обучения. В плане отчета я хотел обобщить работу Марка Ханела и его команды из Figshare за последние несколько лет. Объемы данных, которые теперь есть в распоряжении исследователей почти во всех областях (особенно в гуманитарных и социальных науках), очень сильно отличаются от того, что было всего несколько лет назад. То, что мы думаем об исследовании проблемы, должно быть проверено с помощью данных. Это кажется вполне очевидным в науке [физике] с возрастающей точностью оборудования для экспериментов, со все более быстрыми компьютерами, которые генерируют данные из теоретических моделей. Тем не менее, благодаря повсеместному распространению мобильных гаджетов, портативных видеокамер и прочих записывающих устройств, существует неожиданная информация, которая может принести пользу ученым-социологам, а также коллегам по гуманитарным наукам. Это означает, что исследователи должны быть опытными в использовании различных инструментов для обработки данных, проведения анализа и управления различными вариантами интерпретации.
Одной из наиболее интересных особенностей отчета является ваш анализ глобального сотрудничества и взаимосвязи с инвестициями, сделанными в открытые исследования. Вы можете поподробнее рассказать об этом?
Центральный тезис отчета заключается в том, что развитие открытого доступа поддерживается регулярными волнами политической деятельности, действующей на разных уровнях в экосистеме: здесь меняется национальная политика, там учреждение выполняет распоряжение, спонсор добавляет требование к финансированию программы... Все эти факторы усиливают друг друга из-за фундаментальной взаимосвязанности исследований — условие коллаборации и соавторства означает, что любое из таких изменений политики улучшает ситуацию открытого доступа не только для конкретного учреждения, но и для любого учреждения, которое сотрудничает в рамках этих договоренностей. Как заметил мой друг Джонатан Адамс, международное сотрудничество налаживается. Например, Великобритания является не только одним из крупнейших в мире поставщиков научных результатов, но и одновременно имеет в этой сфере один из самых высоких уровней международного сотрудничества. Это означает, что, когда Великобритания меняет свою политику открытого доступа, как она решительно сделала в случае с рекомендацией REF в 2013 году, это имеет глобальный эффект.
Интересно моделировать и наблюдать, как последовательные изменения политики в разных регионах постепенно подталкивают нас к парадигме, при которой большинство результатов исследований доступны по принципу открытого доступа.
Кажется, что почти каждый день мы видим, как объявляется новый план открытости, будь то план S, план U или совсем недавняя инициатива OA Switchboard, объявленная Ассоциацией научных изданий с открытым доступом (OASPA) в феврале 2019 года. Каким вы видите решение сложностей, с которыми сталкиваются исследователи? Нужен ли нам план Б?
Это большой вопрос, к которому я не чувствую себя вполне подготовленным. Как исследователь я хочу, чтобы все было просто. Я не хочу искать деньги у разных банков, чтобы публиковать свои работы. Я не хочу разбираться в законах о лицензировании и авторском праве и также не хочу понимать, противоречат ли требования моего спонсора требованиям моего учреждения или же мнениям моего правительства относительно того, что означает открытость. Я также не хочу, чтобы мне приходилось с моими данными и программным обеспечением проходить то же самое, что и с моей журнальной статьей. Короче говоря, да, я думаю, что все должно быть проще. Не желая заходить на минное поле, которым является план S, я скажу, что одна вещь, которая должна приветствоваться всеми, — это существование четкой координации между различными заинтересованными сторонами.
В идеале это приведет к созданию механизма или стандарта, который позволит заинтересованным сторонам принять или подписать определенный набор требований открытого доступа, которые являются внутренне согласованными и простыми для понимания.
Вы могли бы дать какие-то напутствия читателям Scholarly Kitchen?
Я дал несколько довольно длинных ответов! Любой, кто доберется до этого момента, заслуживает какого-то приза. Я надеюсь, что всем понравилось читать отчет; нам, конечно же, понравилось его писать.
Источник: Openness: An interview with Daniel Hook, CEO of Digital Science
Поделитесь этим с друзьями!
Будьте первым, кто оставит комментарий
Пожалуйста, авторизируйтесь для возможности комментировать