воскресенье, 14 января 2018 г.

Дюшаны и Микеланджело в социальных исследованиях

Часто в социальных науках ученые выстраивают дизайн исследования, будто они Микеланджело. У Микеланджело есть идея сделать Давида, и он его делает, он не ищет кусок мрамора, который бы напоминал Давида. Иными словами, у таких исследователей есть теория, и они проверяют, насколько она жизнеспособна в реальном мире.
Есть также и другого рода социальные исследователи, которые действуют скорее как Марсель Дюшан. Дюшан берет уже существующую вещь из повседневности и переделывает ее в объект искусства. Эти исследователи сначала наблюдают какое-то явление в реальной жизни, и только потом пытаются его объяснить. Это сравнение разных типов исследователей - пример из новой книги "Бит по биту" о вычислительных социальных науках.
Такой пример, несомненно, достаточно грубо разбивает социальных исследователей на две группы. Мэтью Салганик, автор книги и профессор в Принстонском университете, пишет, что в эпоху цифровых исследований в социальных науках будут и те, и другие, Дюшаны не заменят Микеланджело, чего многие опасаются.

Фонтан Марселя Дюшана как аналогия readymade подхода к социальным исследованиям. Пример из книги "Бит по биту" М. Салганика, автор фото А. Стиглих, 1917. Источник: Wikimedia Commons.
Давид Микеланджело как пример custommade подхода к социальным исследованиям. Пример из книги "Бит по биту" М. Салганика. Источник.

После известной статьи в журнале Wired о конце социальной теории представления исследователей о социальных исследованиях слегка пошатнулись. Эта статья вышла еще десять лет назад, в 2008 году, и очень точно очертила перемены, которые начали происходить в социальных науках в то время. Перемены заключались в том, что раньше процесс научного исследования был таков: мы выдвигаем гипотезы, тестируем их и получаем результаты, которые подтверждают или опровергают наши изначальные предположения (напоминает Микеланджело, правда?). Сегодня же набор данных настолько массивен и возможностей для их анализа так много, что времени и желания на то, чтобы изучать теорию, выдвигать гипотезы и только так, постепенно, шаг за шагом двигаться к результатам, нет. Такой подход от данных к теории также сравнивается с философией Гугла, который не знает точно, почему одна страница лучше другой, но если статистика посещений говорит об этом, уже этого для многих простых задач достаточно. Алгоритмы могут без подробного изучения того, что же на самом деле происходит, предложить человеку соответствующую рекламу или переводить с одного языка на другой. Конечно, они иногда ошибаются, но как иначе работать с огромным массивом данных?

Иллюстрация М. Бантьеса "Все модели ложные, но некоторые полезны" к статье в Wired 23 июня 2008 года о конце теории. Источник

Действительно, кого сегодня волнует, почему люди что-то делают? Важно то, что они это делают, и мы можем это зафиксировать и измерить даже в тех случаях, когда они ошибаются, врут или забывают. Например, известно, что в опросах люди склонны выбирать социально желательные пункты, даже если опрос анонимный. В то же время, ответы на некоторые сенситивные вопросы можно сравнить с их индикаторами в поисковых запросах. Можно посмотреть, какое количество людей признает, что они гомосексуальны и ищет соответствующее порно; сравнить, что люди говорят о количестве сексуальных контактов и как обсуждают онлайн то, что партнер больше не хочет секса; что люди говорят о расизме, и что они на самом деле ищут по этой теме, формируя запросы таким образом, что все мусульмане становятся террористами.
Конечно, было много критики этой статьи из Wired и последующая дискуссия, в которой было признано, что все это - непозволительное упрощение того, как действительно работают социальные ученые. Большинство исследователей работают в колесе теории и данных, где мы мечемся между теорией и результатами, постоянно возвращаясь то к одному, то к другому. Эти дискуссии не прошли стороной, и некоторые исследователи сегодня говорят, что они занимаются вычислительными социальным науками, давая понять, что они отличаются от более классических подходов. Иными словами, они все в душе немного Дюшаны. Но чем они отличаются от классических социальных исследователей?
Первый признак, который приписывается вычислительным социальным наукам - это интерес к изучению социальных законов. Эти исследователи часто интересуются универсальными паттернами человеческого поведения, и именно по этой причине в вычислительных социальных науках так много физиков. Наглядный пример - это степенной закон в социальных сетях. Если мы посмотрим на популярность акторов (на распределение центральностей) в социальной сети, то мы увидим интересную закономерность. В этой сети будет очень мало чрезвычайно популярных акторов и достаточно много - непопулярных. Например, если подумать о своих друзьях и ближайших знакомых, можно по пальцам пересчитать 2-3 людей, которые действительно имеют невообразимо большое количество друзей и знакомых. Остальные, скорее всего, связаны на среднем уровне - они не сетевые звезды, но имеют достаточно количество друзей и знакомых, чтобы не чувствовать себя совсем одинокими. Это универсальный социальный закон, и многие исследователи из вычислительных социальных наук это доказали - распределение центральностей в социальных сетях устроено именно так. Если бы распределение друзей было случайно, то оно бы имело форму нормального распределения, когда все в среднем в одинаковой степени знают друг друга, и нет сетевых звезд или совсем одиноких людей.


Распределение центральности в случайных графах и реальных социальных сетях. На графике слева мы видим нормальное распределение, то есть все акторы в среднем имеют одинаковое количество связей. На графике справа мы видим распределение по степенному закону, то есть в сети есть небольшая доля акторов с очень большим количеством связей, но большинство имеет достаточно малое количество связей. Рисунок с сайта Network Science

В то же время, вычислительные социальные науки часто критикуют за чрезмерную описательность. Редко можно встретить глубокий анализ социальных процессов, которые стоят за обнаруженным социальным законом или закономерностью. Например, почему все люди имеют разное число друзей? Одно из простых объяснений в том, что кто-то более общительный, а кто-то - менее, у людей разные потребности в общении с окружающим миром, разные психологические характеристики. Также, общество так устроено, что не у всех есть доступ ко всем возможным ресурсам социальной сети. Может быть, каждый хотел бы быть сетевой звездой, чтобы при любом трудном случае можно было быстро активизировать свои контакты и попросить о помощи. Это невозможно, потому что наши связи - это также результат социального неравенства. Например, предположим, что в школьный класс переводится ученица, которая отличается по национальности, социальному положению и успеваемости от всего остального класса. Как бы она не старалась завязать хорошие отношения со всем классом, скорее всего, это ей будет даваться сложно, ввиду изначального социального неравенства по другим характеристикам. Можно придумать еще несколько объяснений того, почему в социальных сетях мы наблюдаем сетевой закон. Но часто исследователи из вычислительных социальных наук забывают о том, что социальные законы намного интереснее интерпретировать, чем просто наблюдать.
Второй признак вычислительных социальных наук - это расширение набора методов, которые допустимо использовать в социальных науках. Как правило, это изучение социальных законов с использованием вычислительных подходов и новых для социальных наук методов. Это агентное моделирование, машинное обучение, сетевой анализ, онлайн-эксперименты. Большинство работ в этой области используют данные о поведении людей из онлайна, например, это перемещения по городу, выбор жилья на Airbnb, лайки и комментарии, сеть связей в онлайн сети.
В целом, для вычислительных социальных наук важно то, что социальный мир - это результат интеракций между людьми. Изучая поведение людей, мы можем что-то понять в целом об обществе. В свою очередь, это общество и определяет наши паттерны интеракций друг с другом. Получается такой же замкнутный круг “микро-макро”, как и колесо “теория-данные”. Напоследок, советуем посмотреть короткое видео о так называемой “лодке Колмана”, которая разъясняет, где микро-, а где макроуровни, и как все это удивительным образом переплетено в нашем непростом социальном мире.




Что еще почитать на тему:
* Книгу "Бит по биту" можно читать онлайн на сайте самой книги.
* Совсем недавно вышла статья, поясняющая различия между вычислительными социальными науками и аналитической социологией: можно почитать полный текст по этой ссылке.
* Как пример работ, которые используют подход вычислительных социальных наук, можно почитать свежую статью про то, как совы и жаворонки (те, кто поздно или рано встает) по-разному дружат, и про то, что существует число Данбара для мест, которые мы посещаем.

Комментариев нет:

Отправить комментарий