Изучение связей между нобелевскими лауреатами с использованием сетевой науки

Сетеведение – это изучение сложных взаимосвязей и подключений, лежащих в основе широких наборов данных, групп отдельных лиц или других систем, состоящих из множества взаимодействующих частей. Это увлекательное исследование связей может быть использовано для создания карт и представлений о многочисленных сферах жизни, начиная от научных явлений и заканчивая социальными группами и даже популярными средствами массовой информации.

Милан Яносов, исследователь сетевых наук и главный специалист по обработке данных в Baoba, исследовал связи, лежащие в основе бесчисленных повседневных сетей, романов, телесериалов и социальных групп. В одной из своих последних статей, предварительно опубликованной на arXiv, он описывает связи между блестящими умами, получившими Нобелевские премии за эти годы.

“Как сетевой ученый, я ищу эти скрытые связи и закономерности буквально за всем, с чем сталкиваюсь”, – сказал Яносов. “Толчком к этому конкретному исследованию послужил документальный фильм, который я посмотрел о жизни Эйнштейна, который заставил меня осознать, сколько самых известных людей той эпохи были друзьями или работали вместе, поэтому я начал задаваться вопросом, видно ли это также в данных, и сохраняется ли эта тесная кластеризация в более поздние времена, поскольку что ж. Короче говоря, я хотел выяснить, насколько хорошо связаны нобелевские лауреаты”.

Основная цель недавней работы Яносова состояла в том, чтобы лучше понять, как нобелевские лауреаты прошлого были социально связаны друг с другом. Чтобы сделать это, он сначала должен был собрать данные, относящиеся к нобелевским лауреатам, в которых также упоминались их связи с другими людьми, также получившими Нобелевскую премию.

“Логика, лежащая в основе исследования, была довольно простой, и для любого, кто имеет опыт программирования на Python, техническая часть была бы такой же”, – объяснил Яносов. “Прежде всего, мне нужны были источники данных. В то время как составить карту социальной сети людей, живущих сегодня, может быть несложно, подключить ученых, работающих в прошлом столетии, может оказаться сложнее, поскольку мы не можем попросить их заполнить опрос. Однако, поскольку они известные, широко признанные люди, у большинства из них есть страницы в Википедии, а это все, что нужно специалисту по обработке данных”.

Таким образом, Яносов решил собрать информацию о нобелевских лауреатах с их страниц в Википедии, поскольку на этих страницах часто упоминаются другие известные люди, с которыми они были связаны социально или профессионально, а также гиперссылки, ведущие на страницы Википедии этих ученых или мыслителей. В совокупности он проанализировал страницы Википедии 682 нобелевских лауреатов, используя инструменты data science, и смог визуально отобразить социальные связи между этими лауреатами.

“если мы внимательнее посмотрим, например, на вики-страницу Эйнштейна и начнем читать историю его жизни, мы заметим, что каждый раз, когда у него были какие-то дела с другим известным вики-персонажем, упоминается этот человек и дается ссылка на его/ее вики-сайт”, – сказал Яносов. “Эта ссылка — именно то, что я искал, – способ формализовать отношения между двумя нобелевскими лауреатами, основываясь на том, знали ли они друг друга”.

Анализ данных, проведенный Яносовым, дал интересные результаты, свидетельствующие о том, что многие нобелевские лауреаты на самом деле были каким-то образом социально связаны друг с другом. Исследователь создал визуальную карту, представляющую отношения между нобелевскими лауреатами, которая состояла из 682 узлов (т.е. точек) и 588 связей между этими узлами (представляющих связи между лауреатами).

“Наиболее поразительной особенностью сетевого графика является его сильная так называемая структура ядро-периферия”, – объяснил Яносов. “Это означает, что в центре находится большой, подключенный, широко взаимосвязанный компонент, который содержит более 30% узлов. Кроме того, оказалось, что те, кто находится в центре сети, имеют — в среднем — в два раза больше просмотров в Википедии, так что они оба сосредоточены на своем собственном мире и на глазах общественности”.

Интересно, что центральным компонентом визуальной карты, созданной Яносовым, является так называемая бимодальная сеть. По сути, это график, состоящий из двух ярко выраженных половин, соединенных между собой несколькими узлами, в данном случае несколькими нобелевскими лауреатами.

“Слева от моста находится кластер наук, таких как физика, химия и физиология”, — сказал Яносов. “Самые громкие имена здесь – Эйнштейн, Гейзенберг, Мария Кюри и, с недавних пор, Роджер Пенроуз. В отличие от этого, справа от моста находятся гуманитарные науки, такие как экономика, литература и лауреаты премии мира, с ярко выраженными центрами, такими как Нельсон Мандела, Барак Обама и ЕС. Я думаю, этот пример достаточно хорошо показывает, как наука о данных и сетях может быть использована для составления карт социальных систем, которые, по первому впечатлению, трудно отследить”.

Недавняя работа Яносова демонстрирует огромный потенциал сетевой науки для понимания различных взаимоотношений, включая социальные связи между людьми, которые являются частью одной группы или категории. Его визуальная карта сети нобелевских лауреатов, например, показывает, что, хотя существует множество связей между получателями Нобелевских премий, по-видимому, существует неравенство в видимости разных лауреатов. Другими словами, в то время как некоторые лауреаты Нобелевской премии тесно связаны друг с другом, другие остаются на “задворках” сети, не будучи социально связанными с большинством других лауреатов Нобелевской премии.

Нобелевская сеть Яносова также выявила четкое различие между теми, кто получал премии за научную и гуманистическую деятельность, поскольку лауреаты премий по этим различным дисциплинам редко оказывались социально связанными. Наконец, его визуальная карта высветила недопредставленность женщин в некоторых номинациях Нобелевской премии, включая физику.

“Эта работа показывает, как выявлять интересные или неожиданные закономерности в структуре сети и как описывать и интерпретировать сетевой график”, – добавил Яносов. “Такого рода анализ взаимоотношений имеет множество применений, начиная с образования и социограмм, учителя могут полагаться на такие карты, чтобы лучше организовать свои занятия и помочь тем, кто остался позади. Мы также можем использовать эти методы для изучения и количественной оценки совместной работы, от науки до рабочих пространств, что подводит меня к другой важной группе приложений — HR-аналитике, основанной на данных. В этом случае, например, можно использовать внутренние данные, такие как опросы или рассылка по электронной почте, для определения внутренней структуры компании, выявления слабых мест и предложения планов развития.”

Proudly powered by forbusinessman.ru