понедельник, 8 февраля 2016 г.

Кого читать: Юрий Лесковец



    Продолжим нашу серию постов про интересных исследователей социальных сетей. Раньше мы уже писали про Ладу Адамик.
       Одним из наиболее значимых исследователей онлайн-сетей последнего времени по праву считается Юрий Лесковец. Он информатик, в сферу интересов которого входит анализ социальных сетей, преимущественно онлайн, методами машинного обучения. В настоящее время Лесковец работает на факультете компьютерных наук Стэнфорда, а также в лабораториях искусственного интеллекта и изучения информации. Ранее он работал в Корнелльском университете, а Phd защитил в университете Карнеги Меллон.
Его интересует анализ структуры социальных сетей, а также процессы распространения информации. Охватить вниманием все работы Юрия у нас не получится, поэтому мы расскажем о двух наиболее интересных его статьях.
Источник

Работа «Моделирование диффузии информации в скрытых сетях» не только стала лучшей статьей конференции IEEE International Conference On Data Mining (ICDM) в 2010 году, но и задала тон в исследовании распространения информации в социальных онлайн-сетях. Дело в том, что Лесковец и его соавтор Йевон Янг предсказали механизм распространения информации по социальной сети фактически без учета структуры графа. Для этого они разработали модель линейного влияния (Linear Influence Model). Таким образом, зная определенные параметры распространяемой новости можно предсказать с какой скоростью она будет распространяться по социальной сети и какое число участников соцсети в результате ее прочтут.
Статья «Жизнь и смерть онлайн-сообществ: предсказание роста и продолжительности существования групп» посвящена описанию механизмов роста и развития онлайн-сообществ в социальной сети Ning. Проанализировав данные о более чем 4 тысячах групп в соцсети, авторы пришли к выводу о том, что формирование и рост сети может происходить по двум механизмам: диффузионном и недиффузионному. В ходе диффузионного роста к сообществу присоединяются друзья участников сообщества, в случае недиффузионного роста – участники, у которых нет связей с теми, кто уже состоит в сообществе. При этом наибольшего роста могут достигнуть сообщества, которые развиваются по преимущественно недиффузионному механизму. Это говорит о том, что для развития сообществ необходимо в первую очередь качественное наполнение, которое привлечет новых пользователей.
За кадром осталось множество других интересных исследований Лесковца. С полным списком его работ можно ознакомиться здесь.
Расскажем немного про образовательную деятельность. Юрий Лесковец читает в Стэнфорде курсы по анализу социальных сетей, причем все материалы курса доступны. А по этой ссылке можно просмотреть некоторые материалы воркшопов, которые проводились Лесковцом. Совместно с коллегами он написал учебник «Mining of Massive Datasets», которая размещена в открытом доступе. По этой книге впоследствии был создан курс на Курсере по анализу больших данных, несколько лекций которого читает Лесковец.



В ходе обучения в аспирантуре Лесковец начал разрабатывать инструментарий для анализа графов, впоследствии проект получил название SNAP (Stanford Network Analysis Platform). Основным отличием SNAP от привычных инструментов по визуализации и расчету описательных статистик для сетей является ее эффективность при работе с большими сетями. В настоящий момент программа доработана и ее можно загрузить здесь.
Очень важной инициативой, на наш взгляд, является размещение сетевых данных в открытом доступе. На сайте Лесковца размещены данные о сетях Facebook, Amazon, Twitter и т.д., при этом большинство сетей представляют собой большие данные. Например, 35 млн обзоров с сайта Amazon, данные о 5 млн пользователей и почти 70 млн взаимодействий между ними с сайта Livejournal. Вишенкой на торте можно считать данные о более чем 65 млн пользователей соцсети Friendster и почти 2 млрд взаимодействиями между ними. Публичное размещение данных позволяет, во-первых, осуществить проверку результатов исследования, что в последние месяцы стало важным направлением дискуссий в научной среде. Во-вторых, именно на доступных данных начинающие исследователи могут сделать первые шаги в исследовании больших сетевых данных. 
Помимо обширной и активной научно-преподавательской работы Лесковец является научным руководителем в социальном фото-хостинге Pinterest. Кроме того Лесковец пробовал себя и в качестве стартапера и стал одним из сооснователей компании Kosei, выполняющей задачи машинного обучения. Kosei была приобретена Pinterest.

Комментариев нет:

Отправить комментарий