Костюк Д.М. Широков Н.К. Селиванова И.В.
Связывание авторских профилей в библиографических базах данных на примере РИНЦ и ЕГИСУ НИОКТР
Reporter: Костюк Д.М.
Важным этапом в развитии ученого является защита диссертации, которая отражает результат проведения многолетних исследований. Одним из условий получения научной степени является наличие публикаций в рецензируемых журналах, следовательно, публикационная активность соискателя начинается еще до защиты. Однако важно иметь представление, как именно она изменяется после получения степени. Такой анализ позволит оценить долю кандидатов и докторов наук, которые не продолжают активную научную жизнь.
Для проведения подобного исследования в качестве источников данных были использованы системы «Российский индекс научного цитирования» (РИНЦ) и «Единая государственная информационная система учета результатов научно-исследовательских, опытно-конструкторских и технологических работ гражданского назначения» (ЕГИСУ НИОКТР). Эти системы имеют разные форматы представления информации, что затрудняет проведение совместного анализа и приводит к проблеме связывания данных.
Наиболее точный способ решения проблемы связывания данных – это использование различного вида идентификаторов (ORCID, SPIN-код, ResearcherID, Scopus Author ID и др.). Однако в случае сопоставления данных из РИНЦ и ЕГИСУ НИОКТР использование такого способа невозможно в связи с отсутствием подобных идентификаторов в базе данных диссертаций.
После анализа структуры и содержания баз данных был разработан алгоритм их интеграции, в результате работы которого была сформирована совмещенная база данных.
В докладе представлены результаты работы алгоритма связывания данных о диссертациях российских исследователей с их авторскими профилями для последующего анализа публикационной активности защитивших ученые степени соискателей.
To reports list