1803.03697 Ru

Взаимодействие сообществ и конфликты в сети интернет
Шриджан Кумар (Srijan Kumar) Стэнфордский Уильям Л. Гамильтон (William L. Hamilton)

университет, США srijan@cs.stanford.edu Стэнфордский университет, США
wleif@stanford.edu
Юре Лесковец (Jure Leskovec) Стэнфордский
университет, США jure@cs.stanford.edu Дэн Джурафски (Dan Jurafsky) Стэнфордский университет, США
jurafsky@stanford.edu
ФИЛЬМЫ
ПОПУЛЯРНОЕ/
РЕЗЮМЕ МЕМЫ
На веб-платформах пользователи объединяются в сообщества. МУЗЫКА

Данные сообщества могут взаимодействовать друг с другом, что
часто приводит к конфликтам и токсичным взаимодействиям. ГОРОДА
Однако мало что известно о механизмах взаимодействия сообществ
и о том, как они влияют на пользователей.
В рамках настоящего исследования мы изучили взаимодействия ИГРЫ
между 36 000 сообществ на Reddit, обращая особое внимание на
случаи, когда пользователи в рамках одного сообщества испытывают КОММЕРЦ
негатив, который заставляет их писать комментарии в другом
сообществе. Мы определили, что такие конфликты, как правило,
ПСИХОЛОГИЯ/
инициируются небольшим количеством сообществ: менее 1%
arXiv:1803.03697v1 [cs.SI] 9 марта
ПРОТИВОРЕЧИВЫЕ
СОВЕТ
сообществ начинают 74% конфликтов. Хотя конфликты, как ВОПРО
правило, разжигаются очень активными членами сообщества, в их
СПОРТИВНЫЕ
распространении участвуют значительно менее активные члены. Мы
обнаружили, что конфликты характеризуются возникновением эхо-
камер, где пользователи в основном общаются с другими
пользователями из своего сообщества. В долгосрочной перспективе
конфликты имеют неблагоприятные последствия и снижают общую
активность пользователей в сообществах, подвергшихся атаке.
В рамках нашего анализа взаимодействия пользователей также
предлагаются стратегии смягчения негативного воздействия ПОРНОГРАФИЯ
конфликтов, например, увеличение прямого взаимодействия между
ТЕХНОЛОГИИ
атакующими и защищающимися. Более того, мы способны сделать
точный прогноз вероятности возникновение конфликта благодаря
созданию новой модели LSTM (долгая краткосрочная память),
которая включает в себя графические вложения, пользователей,
сообщества и текстовые функции. Эта модель может использоваться
для создания системы раннего предупреждения для модераторов Рис. 1: Сообщества в Reddit: каждая точка обозначает
сообщества в целях предотвращения конфликтов. В целом, сообщество. В отличие от голубых точек, в красных
настоящее исследование представляет собой основанный на данных точках зарождается большее количество конфликтов.
взгляд на взаимодействие и конфликты между сообществами и Сообщества отображаются путем использования
показывает пути построения более здоровых онлайн-сообществ.
информации о сообществе и его участниках, как
Справочный формат Ассоциации вычислительной техники описано в Разделе 6. Максимальная наглядность
(ACM): графика обеспечивается за счет использования
Шриджан Кумар, Уильям Л. Гамильтон, Юре Лесковец и Дэн цветной картинки.
Джурафски. 2018 г. Взаимодействие сообществ и конфликты в сети
интернет На WWW 2018: Конференции World Wide Web 2018 года, 23- члены одного сообщества взаимодействуют с членами другого
27 апреля 2018 г., Лион, Франция. ACM, Нью-Йорк, штат Нью-Йорк, сообщества. Исследования динамики внутреннего
США, 11 страниц. https://doi.org/10.1145/3178876.3186141 взаимодействия в среде офлайн показали, что внутреннее
взаимодействие может быть положительным - приводящим к
1 ВВЕДЕНИЕ обмену информацией и идеями [6, 22, 65, 70] - или
Пользовательские сообщества являются важным компонентом отрицательным, то есть приводящим к открытым
многих веб-платформ, на которых пользователи выражают свои конфликтам между членами сообщества [31, 58, 75].
идеи, мнения и обмениваются информацией. Такие сообщества не Учитывая, что на веб-платформах преобладает
только представляют собой площадку для внутреннего
взаимодействия между членами одного и того же сообщества, взаимодействие на уровне сообществ, понимание его
они также способствуют внешним взаимодействиям, когда механизмов и влияния на пользователей важно для
содействия позитивному взаимодействию между
Данное исследование опубликовано на основании международной сообществами и уменьшения негативного воздействия
лицензии Creative Commons 4.0 с требованием указания авторства (CC BY внутренних конфликтов на пользователей.
4.0). Авторы оставляют за собой право публиковать данное исследование на Однако анализ внешнего взаимодействия и конфликтов в
своих личных и корпоративных веб-сайтах с указанием соответствующего значительной степени отсутствует в предыдущем
первоисточника.
Конференция WWW 2018, 23–27 апреля 2018 г., Лион, Франция
исследовании веб-сообществ, которое, в первую очередь,
© 2018 IW3C2 (Комитет Международной конференции World Wide Web),
сосредотачивается на обнаружении сообществ [18, 80],
опубликовано на основании лицензии Creative Commons CC BY 4.0. взаимодействии внутри отдельных сообществ [38, 47, 49] и
ACM ISBN 978-1-4503-5639-8/18/04. на том, как пользователи распределяют свое внимание
https://doi.org/10.1145/3178876.3186141 между целой гаммой сообществ [26, 76, 83]. Более того,
существующие исследования в области социальной
психологии на тему конфликтов между небольшими
группами в лабораторных условиях [31, 70, 75] не дают нам
возможности детально проследить процесс зарождения
индивидуальных конфликтов в сети, не описывают детально
поведение
Исходное Целевое
сообщество сообщество
пользователей в процессе таких взаимодействий и влияние
таких конфликтов на их участников.
Следствием этого методологического ограничения является Перекрестн
ая ссылка
отсутствие инструментов для прогнозирования и смягчения
конфликтов между сообществами в крупномасштабных веб- Линия
средах. Случаи харассмента, «бригейдинга» (организованная времени
совместная онлайн-атака группы лиц на одного человека или Инициирование Взаимодействие Воздействие
меньшую группу) или «троллинга» одного онлайн-сообщества по
отношению к другому неизбежны [23, 28, 51], но каким образом Рис. 2: Хронология взаимодействий: взаимодействие
сообщества могут защититься от этих атак? Исследования сообществ можно разделить на три этапа: (i) инициирование,
«сближающихся эхо-камер» [21] и положительных результатов когда создается перекрестная ссылка от исходного
межгруппового диалога [5, 64] предполагают, что прямое сообщества к целевому сообществу,
взаимодействие может быть эффективным для смягчения таких (ii) взаимодействие, когда члены исходного сообщества
конфликтов, но также достаточно свидетельств, что лучшая защита - взаимодействуют с теми, кто находится в целевом сообществе, и
просто игнорировать антисоциальное поведение атакующего (iii) долгосрочное воздействие, когда некоторые члены
сообщества [7]. Итак, что эффективнее в конфликтах веб-сообществ - исходного сообщества могут оставаться в целевом сообществе, а
игнорировать и изолировать атакующих пользователей или некоторые члены целевого сообщества могут из него выйти.
напрямую взаимодействовать с ними? В рамках настоящего
исследования мы даем ответ на эти вопросы. проходят через эти три этапа, мы смогли охарактеризовать типы
Настоящее исследование. Мы обеспечили крупномасштабный пользователей и сообществ, которые инициируют конфликты между
обзор межгрупповых взаимодействий и конфликтов через призму сообществами и участвуют в них, и описать возможные стратегии
Reddit, популярного веб-сайта, на котором пользователи создают смягчения негативных последствий, которые могут использоваться
основанные на интересах сообщества, называемые сабреддитами, и защищающимися сообществами.
участвуют в них. Мы проанализировали данные за 40 месяцев,
содержащие 1,8 миллиарда комментариев, сделанных более чем 100
миллионами пользователей из 36 000 сообществ [3]. Инициирование мобилизации. Наши результаты показывают,
что небольшая группа сообществ ответственна за большинство
Естественно, нет очевидной статистики по тому, в какой момент
сообщества взаимодействуют и атакуют друг на друга. Ключевым негативных мобилизаций: 74% негативных мобилизаций
инициируются всего 1% исходных сообществ. Более того, мы
методологическим нововведением нашей работы является факт
обнаружили, что эти взаимодействия обычно происходят между
выявления и анализа конкретных примеров взаимодействия и
конфликта между сообществами: мы выявляем случаи, когда очень похожими сообществами. На рисунке 1 показана изученная
двумерная социальная карта сообществ Reddit (см. подробности в
сообщение в одном «исходном» сообществе ссылается на сообщение
разделе 6), где каждая точка является сообществом, а красный
в другом «целевом» сообществе, после чего мы создаем нулевую
модель активности пользователей для выявления случаев, когда цвет точки указывает на долю перекрестных ссылок с
негативными комментариями, которые в нем создаются.
данные гиперссылки мобилизуют значительное количество
Относительно немногочисленные сообщества, инициирующие
пользователей для написания комментариев к целевой публикации.
Мы также используем поставленные пользователями ярлыки, чтобы конфликты (т. е. сообщества, отмеченные красным цветом),
сконцентрированы в трех плотных регионах данной социальной
классифицировать эмоциональный подтекст таких перекрестных
карты Reddit. Удивительным образом, на уровне пользователей мы
постов, чтобы выявить случаи негативной мобилизации, когда
пользователи были явно мобилизованы негативными наблюдаем, что, хотя негативные мобилизации инициируются
высокоактивными членами исходного сообщества, фактические
сообщениями.
участники негативных мобилизаций - это значительно менее
В качестве примера такой негативной мобилизации можно привести
активные пользователи.
следующий пост в сообществе «r/Теория заговора», который критическим
образом ссылается на пост в сообществе «r/Документальные фильмы»: Взаимодействия пользователей в процессе мобилизаций.
Анализируя ответы пользователей на целевые цепочки
Только посмотрите, как промывают мозги этим идиотам в комментариев в процессе негативных мобилизаций, мы получаем
Документальных фильмах. Серьезно, никто из них не готов детальное представление о динамике поведения пользователей в
конфликтах между сообществами. Мы создаем два варианта
даже ПРЕДПОЛОЖИТЬ, что наше собственное правительство алгоритма ссылочного ранжирования (PageRank), которые
организовало теракты 11 сентября. измеряют информационный поток с точки зрения атакующих и
Все они на 100% уверены, что за всем этим стояли «террористы», и защищающихся соответственно. Используя эти инструменты, мы
все умные люди, которые с этим не согласны, сталкиваются с обнаружили, что важным маркером негативной мобилизации
таким количеством негатива, что их посты скатываются в является эффект эхо-камеры, где участники преимущественно
рейтинге на глубину ада. Просто позор. Хотелось бы, чтобы взаимодействуют с членами своего «домашнего» сообщества, т. е.
атакующие общаются с другими атакующими, а защищающиеся - с
люди знали, о чем они говорят. Вот ссылка [ПЕРЕКРЕСТНАЯ другими защищающимися. Более того, мы обнаружили, что
ССЫЛКА]. атакующие склонны выбирать и коллективно «нападать» на
Этот пост привел к тому, что несколько участников r/ Теории небольшую группу защищающихся.
заговора разместили гневные и оскорбительные комментарии к Воздействие мобилизации. Негативная мобилизация оказывает
посту в сообществе r/Документальные фильмы. долгосрочное неблагоприятное воздействие на вовлеченных
Мы приводим основанный на данных взгляд на такие негативные пользователей и сообщества. Мы обнаружили, что негативная
мобилизации, которые можно условно разделить на три этапа (рис. мобилизация приводит к эффекту «колонизации», когда
2). Первый этап - это инициирование: пользователь в исходном защищающиеся перестают активно участвовать в целевом
сообществе публикует перекрестную ссылку на целевое сообщество, сообществе, а атакующие, наоборот, становятся более
что (потенциально) мобилизует подмножество пользователей активными. Однако, результаты проведенного нами анализа
(рисунок 2, слева). Второй этап - это взаимодействие: после того, взаимодействий на уровне пользователя предлагают возможный
как сообщение с перекрестной ссылкой мобилизовало путь смягчения таких неблагоприятных последствий: они
подмножество пользователей, атакующие начинают показывают, что уменьшение эффекта эхо-камеры,
комментировать цепочку комментариев целевого сообщения и сопровождающееся характерным усилением взаимодействия
взаимодействовать с членами целевого сообщества (то есть с между атакующими и защищающимися, и увеличение степени
защищающимися; Рисунок 2, посередине). Заключительный этап - использования защищающимися гневных выражений по
воздействие: даже после окончания периода негативной отношению к атакующим связано со снижением степени
мобилизации, событие может иметь долгосрочное влияние на колонизации и активизацией участия защищающихся в
поведение атакующих и защищающихся пользователей (рис. 2, сообществе в будущем. Таким образом, похоже, что повышенное
справа). Путем анализа того, как тысячи негативных мобилизаций взаимодействие и
более жесткий отпор могут быть более эффективной стратегией
смягчения последствий, нежели игнорирование или изоляция
атакующих пользователей.
Прогнозирование мобилизаций. На завершающем этапе
исследования мы разработали модели, позволяющие предсказать,
приведет ли перекрестная ссылка к мобилизации. Наша модель
объединяет последние достижения в области глубинного обучения в
социальных сетях с новым вариантом модели LSTM для
рекуррентной нейронной сети, которую мы называем «социально
ориентированной» моделью LSTM. Наша модель достигает уровня
AUC (площадь под ROC-кривой) 0,76 при прогнозировании того,
приведет ли перекрестная ссылка к мобилизации, что значительно
превосходит достигающий AUC 0,67 уровень прогнозирования
стандартных моделей, основанных на функциях, разработанных
экспертами. Данная модель может быть использована на практике
для создания систем раннего предупреждения
В целом результаты нашего исследования проливают свет на то, Рис. 3: Перекрестные ссылки приводят к увеличению количества
как в сети происходит взаимодействие между сообществами и комментариев, которые члены исходного сообщества оставляют в целевой
конфликты, и открывают путь к разработке и поддержанию более цепочке комментариев.
здоровых онлайн-платформ.
Чтобы обеспечить базовое сравнение таких пользователей, мы также
2 ДАННЫЕ И ТЕРМИНОЛОГИЯ используем процесс сопоставления. Для каждого члена сообщества S,
Пользователи Reddit создают и присоединяются к сообществам по который комментирует целевую цепочку комментариев в
интересам, называемым сабреддитами (например, процессе мобилизации, мы случайным образом выбираем
«r/Документальные фильмы» или «r/Звездные войны»), в таких сопоставимого члена сообщества S, который ее не
сообществах они публикуют и комментируют контент (например, прокомментировал. Такой соизмеримый пользователь
изображения, видео, ссылки на статьи и так далее). В целях выбирается из числа пользователей, которые оставили такое же
анализа взаимодействия между такими сабреддитами мы количество комментариев за последние 30 дней, что и исходный
используем данные о публикациях и комментариях в Reddit за 40 участник. Аналогичный процесс используется для сопоставления
месяцев с января 2014 года по апрель 2017 года [3]. Весь анализ членов сообщества T.
основан на общедоступных данных [3], соответствующие коды и
данные доступны на сайте нашего проекта [1]. 2.1 Определение мобилизаций.
Поскольку в Reddit нет явных ярлыков для взаимодействия между В начале мы занимались выявлением случаев мобилизации. Мы определяем
сообществами, мы используем гиперссылки, когда пост в одном мобилизацию как случаи, когда перекрестная ссылка приводит к
сообществе (которое мы называем исходным) ссылается на увеличению количества комментариев текущих участников исходного
сообщение в другом сообществе (которое мы называем целевым). сообщества в ветке обсуждения под целевым постом. Выявление таких
Такие перекрестные ссылки инициируют (возможное) мобилизаций является сложной задачей, потому что простой подсчет
взаимодействие между двумя сообществами (т. е. это первый этап количества членов исходного сообщества, которые комментируют целевую
«инициирование» на временной шкале на Рисунке 2). Следуя по цепочку комментариев, не учитывает, что текущие члены исходного
перекрестной ссылке, пользователи могут переходитьиз исходного сообщества могут комментировать посты в целевом сообществе случайным
сообщества, чтобы прокомментировать связанный пост в целевом образом, а не в результате публикации перекрестной ссылки. Поэтому, чтобы
сообществе, в результате чего происходят «взаимодействия» между определить случаи, когда участники исходного сообщества мобилизуются в
сообществами (второй этап на рисунке 2). Если убрать повторяющиеся результате публикации перекрестной ссылки, мы сравниваем
перекрестные ссылки, мы получаем 137 113 перекрестных ссылок между полученный результат с нулевой моделью, которая измеряет
36 000 сообществ, это и есть тот набор данных, который мы ожидаемую частоту комментариев участников исходного
анализируем. сообщества в целевой цепочке комментариев. Чтобы учесть
Активность пользователей на Reddit в основном происходит в изначальную популярность постов, создается нулевая модель с
обсуждениях под постами. Чтобы выявить явный эффект использованием комментариев, сделанных к контрольным
перекрестных ссылок и контролировать различия на уровне целевым постам, ограничиваясь случаями, когда целевые и
сообщества и временные погрешности в рамках нашего анализа контрольные посты имеют примерно равное количество
данных цепочек, мы использовали процесс сопоставления для комментариев до того, как будет сделана перекрестная ссылка (в
обеспечения точки отсчета для постов, которые связаны с в частности, где разница в количестве комментариев меньше 5).
перекрестными ссылками (т.е. исходный пост, содержащий Мы сравниваем количество комментариев, сделанных
перекрестную ссылку и целевой пост, на который участниками исходного сообщества в двух потоках, в течение 12-
осуществляется переход по ссылке). В частности, для каждого часов до и после создания перекрестной ссылки.
поста p, который мы анализируем, мы выбираем совпадающий На рисунке 3 показано изменение среднего количества
(контрольный) пост того же сообщества, который был создан комментариев, сделанных участниками исходного сообщества в целевом
ближе всего по времени к p и не несет в себе исходящих или потоке, на который ведет перекрестная ссылка, по сравнению с
входящих перекрестных ссылок. Временное ограничение контрольным потоком, ограничиваясь теми парами потоков, количество
гарантирует, что контролируются ежечасные, ежедневные или комментариев в которых до публикации перекрестной ссылки
еженедельные изменения в поведении пользователей, а выбор одинаково. Однако после публикации перекрестной ссылки
контрольных постов из соответствующих сообществ гарантирует, наблюдается увеличение количества комментариев в обеих цепочках
что результаты не будут искажены из-за разноуровневых сообществ. комментариев: в среднем контрольные цепочки комментариев
показывают увеличение в 1,6 раза относительно «до и после», в то
время как целевые цепочки комментариев соответствующих
сообществ гарантирует, что на результаты нашего исследования не
влияют споры между членами одного сообщества.
Для целей нашего анализа мы также определяем членов 1
Важно обратить внимание на то, что в рамках анализа истории пользователей мы всегда убираем комментарии,
исходного, S, и целевого, T, сообщества в момент публикации каждой сделанные в течение 3 дней от момента публикации перекрестной ссылки, чтобы устранить возможные погрешности.
Наш анализ сосредоточен на исключительных членах двух взаимодействующих сообществ, исходя из результатов исследований, проведенных в
перекрестной ссылки. В частности, для перекрестной ссылки, рамках социальной психологии [31, 70, 75], где участники всегда являются исключительно членами одного из двух сообществ. Другие
типы пользователей, такие как члены обоих сообществ, объединяют в себе тенденции обоих сообществ, в то время как новые
опубликованной в день d, мы определяем членов сообщества S (и пользователи или пользователи, которые не являются членами данных сообществ, практически не дополняют информацию в
соответственно, T) как пользователей, которые оставили хотя бы один рамках исследования. Их влияние может быть изучено в рамках будущих исследований.
комментарий в сообществе S (и соответственно, T) за 30 дней до дня d,

но которые
демонстрируют увеличение количества комментариев в 8,8 раз.
× ×
Увеличение контрольного уровня в 1,6 раза для контрольных
цепочек комментариев иллюстрирует ожидаемое увеличение
количества комментариев членами исходного сообщества в рамках
нашей нулевой модели (т.е. независимо от публикации
перекрестных ссылок). Основываясь на этих наблюдениях, мы
определяем мобилизацию как случаи, когда перекрестная ссылка
приводит к увеличению количества комментариев членов исходного
сообщества в целевом потоке, которое
× превышает контрольный
уровень (т. е. увеличение в >1,6 раз после публикации
перекрестной ссылки). В результате, мы получаем в общей
сложности 22 075 мобилизаций, что составляет около 16% от
общего набора данных по перекрестным ссылкам, которые мы
изучаем.
Классификация эмоциональной составляющей мобилизации
Чтобы дополнительно классифицировать взаимодействия, мы разбиваем Рисунок 4: Небольшое количество сообществ инициируют
перекрестные ссылки, исходя из эмоциональной окраски исходного большинство конфликтов.
сообщения. Явно негативное намерение исходного поста по отношению к
посту в целевом сообществе может сигнализировать о стремлении
провести грань между «нами» и «ими» [30], которое является 3.1 Какие сообщества инициируют негативные мобилизации?
фундаментальным компонентом любого межгруппового конфликта В отличие от лабораторных исследований, в которых участвуют
[73, 75]. две группы, между которыми выявляются взаимодействия и
Мы привлекли к работе фрилансеров с площадки Mechanical Turk, межгрупповые конфликты [31, 70, 75], на веб-платформах
которые получили пары исходных и целевых постов и должны были существуют тысячи сообществ, которые потенциально могут
обозначить эмоциональную окраску исходного поста по отношению к взаимодействовать между собой. Итак, какие из этих сообществ
целевому посту как отрицательную, нейтральную или положительную. склонны инициировать негативную мобилизацию, и какие
Фрилансеры сообщили об очень небольшом количестве случаев позитивных сообщества подвергаются их атакам?
постов, поэтому мы объединили посты с позитивной и нейтральной Начнем с анализа свойств исходного сообщества. Мы обнаружили, что
эмоциональной окраской. Мы разделили на две категории (отрицательный большинство негативных мобилизаций инициируется небольшим
или нейтральный эмоциональный окрас) случайно отобранный набор из количеством сообществ (см. Рисунок 4) - на менее 0,1% и 1% исходных
1020 пар, причем мнение людей, проставляющих данные метки, совпало в сообществ приходится 38% и 74% негативных мобилизаций,
более чем 95% случаев. Затем, мы преобразовали текст исходного поста 3 в соответственно. Это означает, что это небольшое количество
большой набор характеристик: лексические особенности из сообществ является центром негативной мобилизации
словарей программ для текстового анализа LIWC [77] и VADER пользователей. Этот вывод перекликается с выводами об
[36], а также стилистические лингвистические особенности, такие антисоциальном поведении, которые показывают, что такое
как средняя длина слова, оценка удобочитаемости и пунктуация. поведение, как троллинг, приходится на небольшое количество
4Путем использования классификатора случайного леса (Random Forest) сообществ [12], и что принятие профилактических мер, таких как
запрет сообществ с особенно вопиющим поведением, может стать
наша модель классификации достигает точности 0,80 при 10-кратной эффективным инструментом сдерживания такого поведения. [10].
перекрестной проверке. 5 Мы использовали этот классификатор, чтобы После этого, мы проанализировали сходства между исходными
классифицировать оставшиеся исходные сообщения, и он пометил 8% из и целевыми сообществами, задействованными в мобилизации.
них как негативные. Предыдущие исследования выдвинули предположения, что в
Сопоставляя эту оценку эмоциональной окраски с фокусе конфликтующих сообществ, вероятно, будут тематически
мобилизацией, мы называем мобилизации, инициированные схожие области [14, 25], в рамках данного исследования мы
негативными постами, негативными мобилизациями (всего 1 809 проанализировали эту гипотезу. Глядя на пару взаимодействующих
случаев), а те, которые инициируются нейтральными постами, - сообществ, мы количественно оцениваем сходство двух сообществ с
нейтральными мобилизациями (всего 20 266 случаев). точки зрения их сходства по показателю TF-IDF постов. 6Мы
Здесь мы также определяем два термина: атакующие - это обнаружили, что негативная мобилизация (и мобилизация в целом), как
члены исходного сообщества, а защищающиеся - это члены правило, происходит между очень похожими сообществами - среднее
целевого сообщества, которые комментируют (связанный сходство содержимого TF-IDF между исходными и целевыми
перекрестной ссылкой) целевой поток в течение негативной сообществами при мобилизации в 1,5 раза выше, чем среднее значение
мобилизации. Обратите внимание, что мы используем данные × показателя между случайными парами сообществ (0,51 к 0,34; р
данного
термины, поскольку они ясны и интуитивно понятны. Однако не все
«атакующие» обязательно публикуют негативные комментарии <0,001).7 Изучение этих пар сообществ вручную показывает, что они,
(хотя мы видимо, что чаще всего они именно это и делают (см. как правило, сосредотачиваются на схожих темах, но имеют разные
Раздел 4)). Точно так же «защищающиеся» могут и не защищать взгляды на предмет (например, r/Теория заговора и r/Мировые
позицию, высказанную в посте, во время негативной мобилизации. новости или r/ Права человека и r/Против прав человека), что
соответствует логике предыдущих обсуждений этого феномена [14,
Данная терминология используется для простоты понимания.
25].
3 ИНИЦИИРОВАНИЕ МОБИЛИЗАЦИИ 3.2 Какие пользователи участвуют в негативных

Мы начинаем наши наблюдения с первого этапа, инициирования мобилизациях?
взаимодействия между сообществами, как показано на рисунке 2. В сетевых сообществах, состоящих из тысяч или даже миллионов
Мы стремимся охарактеризовать свойства ключевых субъектов, пользователей - с разными уровнями участия - только небольшая доля
участвующих в данном взаимодействии: двух сообществ и их
участвующих членов. 6 Значение показателя сходства TF [69] вычисляется для всех
сообщений постов
сообществ с использованием первых 10 000 слов с точки зрения общего рейтинга
частоты использования на Reddit.
7 Все представленные значения p основаны на критерии знаковых рангов Вилкоксона
3 Мы удалили слова, часто встречающиеся в исходных и целевых постах, поскольку исходное
сообщение может цитировать (часть) целевого сообщения. (Wilcoxon) для парных сравнений
4 Полный перечень характеристик см. в онлайн приложении к исследованию [1]. и, в иных случаях, на U-критерии Манна-Уитни [71].
5 Мы использовали пакет программного обеспечения scikit-learn [60] с «лесами», состоящими из
400 «деревьев».
Рис. 5: Успешные негативные мобилизующие посты создаются негативной мобилизации: у атакующих более высокий
очень активным «ядром» исходного сообщества. рейтинг А по PageRank, чем у защищающихся, у которых
более высокий рейтинг D по PageRank.
пользователей будет фактически вовлечена в любую отдельную
негативную мобилизацию. Итак, что характеризует вовлеченных 4 ВЗАИМОДЕЙСТВИЯ ПОЛЬЗОВАТЕЛЕЙ В ПРОЦЕССЕ МОБИЛИЗАЦИЙ
пользователей, по сравнению с теми, кто не вовлечен? Мы отвечаем Теперь, когда мы охарактеризовали субъекты, вовлеченные в
на этот вопрос путем анализа пользователя, который создает пост с негативную мобилизацию - как сообщества, так и пользователей,
перекрестной ссылкой, инициируя, таким образом, негативную - необходимо охарактеризовать динамику взаимодействия
мобилизацию, а также пользователей, которые мобилизуются и пользователей во время этих событий. Общаются ли атакующие
участвуют в получившемся обсуждении. и защищающиеся друг с другом, или они создают отдельные
Анализ авторов перекрестных ссылок, мы видим, что обсуждения, где разговаривают с другими похожими на них
негативные сообщения с перекрестными ссылками создаются пользователями, воспроизводя эффект эхо-камеры?
пользователями, которые на 10% более активны в исходном Мы отвечаем на эти вопросы путем анализа сети ответов пользователей в
сообществе по сравнению со случайно выбранным соизмеримым обсуждениях целевого поста на втором этапе мобилизации, то есть на
пользователем (p <0,001, рисунок 5 (a); подробную информацию о этапе взаимодействия (см. Рисунок 2). Этот инструмент дает нам
процессе сопоставления см. в Разделе 2). Поскольку не все уникальную возможность изучить тысячи очень разнообразных
перекрестные ссылки приводят к мобилизации, мы также взаимодействий между пользователями во время негативной
обнаружили, что пользователи, которым удается успешно мобилизации, что обеспечивает абсолютно новый уровень
мобилизовать других, значительно более активны, чем те, кому это масштабности и детализации для изучения конфликтов между
не удается (p <0,001). Таким образом, мы видим, что очень активные сообществами [74].
члены исходного сообщества несут ответственность за Негативные мобилизации приводят к негативным
инициирование негативных мобилизаций. Аналогичные взаимодействиям. Мы обнаруживаем, что негативная
наблюдения можно сделать и в случае нейтральных мобилизаций. мобилизация отрицательно влияет на эмоции и степень
Но кто на самом деле несет ответственность за негативную вежливости в рамках обсуждения целевого поста. Мы сравниваем
мобилизацию? Это те же очень активные члены исходного комментарии, сделанные к целевым потокам негативных
сообщества? Чтобы ответить на этот вопрос, мы сравниваем мобилизаций и к сопоставимым потокам (подробную
мобилизованных членов атакующего исходного сообщества информацию о процессе сопоставления см. в Разделе 2). Целевые
(атакующих) с другими пользователями сообщества. Мы цепочки комментариев с большей вероятностью будут содержать
обнаружили, что атакующие на самом деле значительно менее гневные слова (увеличение на 44%; p <0,001) и на 25 пп больше
активны в исходном сообществе (доля прошлых комментариев в ×
вероятность, что эти комментарии будут удалены модератором
исходном сообществе составляет 0,30 к 0,17, p <0,001). Мы также
обнаружили, что атакующие выражали больше «гнева» в своих (процент удаления 0,205 против 0,008; p <0,001). 9 Для
сравнения, эти показатели резко снижаются в случае
прошлых комментариях; 8 атакующие используют гневные слова (из нейтральной мобилизации (т. е. не обнаруживается значительное
словаря LIWC [77]) в 1,2 раза чаще, чем аналогичные участники изменение вероятности удаления комментария, p> 0,05).
сообщества (0,31×к 0,26, p <0,001). Количественная оценка эхо-камер при негативной
Точно так же анализ участников целевого сообщества, которые были мобилизации.
мобилизованы для защиты во время данных атак, показывает Общаются ли атакующие и защищающиеся между собой во время
аналогичные результаты - защищающиеся менее активны в целевом негативной мобилизации? Или они разделяются на
сообществе (доля прошлых комментариев в целевом сообществе противоборствующие лагеря, проявляя, таким образом,
составляет 0,27 к 0,19, p <0,001) и используют в 2,2 раза чаще гомофилию и создавая эхо-камеры? Мы отвечаем на этот вопрос,
гневные слова, чем аналогичные участники сообщества (0,32 к вычленяя сети ответов от одного пользователя - другому в
×
0,145, p <0,001). Таким образом, мы видим, что защищающиеся и рамках комментариев, сделанных к целевому потоку. Сеть
атакующие пользователи похожи: они, как правило, менее направлена и взвешена, причем вес ответа от пользователя i
активны в своих домашних сообществах и в прошлом пользователю j соответствует количеству раз, когда i
использовали больше гневных слов. непосредственно ответил на один из комментариев j.
В целом, мы обнаружили, что негативные мобилизации Наш анализ показывает наличие гомофилии и эффекта эхо-
инициируются горсткой сообществ, которые атакуют очень похожие камер, в рамках которых атакующие преимущественно
на них сообщества. Хотя эти взаимодействия инициируются очень взаимодействуют с другими атакующими, а защищающиеся - с
активными пользователями исходного сообщества, атакующие и другими защищающимися.
защищающиеся, которые фактически вовлекаются в негативную
мобилизацию, гораздо менее активны, по сравнению с ними - это 9 Обратите внимание, что этот результат также является статистически
наблюдение соответствует результатам психологических значимым после макро-усреднения коэффициентов удаления
исследований, показывающих, что члены периферийной группы комментариев по сообществам, то есть этот показатель не связан с тем, что
более склонны к участию в публичных демонстрациях различий целевые сообщества могут иметь изначально более высокие коэффициенты
между «нами» и «ими» [57]. В предыдущих исследованиях удаления.
утверждалось, что этот феномен связан с желанием периферийных
членов сообщества повысить свой статус внутри группы (там же),
удивительно, что этот эффект наблюдается даже на Reddit, где
вместо настоящих имен используются псевдонимы.
8Этот показатель подсчитывается на основе комментариев, сделанных за последние 30

дней.
Рис. 6: Эхо-камеры образуются во время

Изменение доли комментариев в
Например, путем исследования прямых взаимодействий между
пользователями (т. е. случаев, когда i ответил j или наоборот), мы
обнаружили, что атакующие взаимодействуют с другими 0,0 Негативная мобилизация
×
атакующими в 2 раза больше, чем с защищающимися, в то время 4 Нейтральная мобилизация
целевом сообществе
как защищающиеся взаимодействуют с другими
защищающимися на 20 больше, чем с атакующими (p <0,001). Мы 0,0
×
количественно оценили этот эффект эхо-камеры, используя два 3
варианта оценки PageRank [59]: PageRank защищающегося (D-
PageRank) и PageRank атакующего (A-PageRank), которые 0,0
количественно определяют центральную роль пользователя в сети
ответов с точки зрения защищающихся и атакующих 2
соответственно. Как и в классической статистике PageRank [59],
значения D и A по PageRank для пользователя i соответствуют 0,0 Атакующий Защищающийся
вероятности 1
0,0
0
−0,
01
−0,
02
случайного посещения узла, коррелирующего с i, причем такое Рис. 7: Влияние негативной мобилизации: защищающиеся
случайное посещение следует по определенным ступеням с становятся менее активными, а атакующие более активными
вероятностью перехода, пропорциональной весу и «переходит» в целевом сообществе.
в новую случайную начальную точку с вероятностью 0,25 на
каждом шаге. Однако, в отличие от стандартного PageRank, мы 5 ВОЗДЕЙСТВИЕ МОБИЛИЗАЦИИ
вычисляем D-PageRank и A-PageRank, ограничивая набор Как было показано в предыдущем разделе, атакующие
возможностей такого перехода узлами защищающихся и объединяются в группы для нападения на защищающихся
узлами атакующих соответственно, аналогично подходу, пользователей во время негативных мобилизаций. Но влияют ли эти
используемому Гаримелла и соавт. (Garimella et al). для атаки на вовлеченных пользователей в долгосрочной перспективе?
количественной оценки противоречивых вопросов [20]. И что необходимо делать защищающимся, чтобы предотвратить
На рисунке 6 показаны значения данных показателей. Мы негативные последствия таких событий - должны ли они
видим, что у атакующих значительно более высокий рейтинг A- игнорировать атакующих во время обсуждений или активно
PageRank, то есть они с большей вероятностью окажутся взаимодействовать с ними? В этом разделе мы даем ответ на эти
вовлеченными при случайном посещении узла, начиная с вопросы в процессе анализа третьего этапа мобилизации (рисунок
момента публикации комментариев других атакующих, - в то 2), то есть этапа воздействия, в рамках которого мы измерили
время как защищающиеся имеют значительно более высокий изменения в активности пользователей после завершения
рейтинг D-PageRank. Таким образом, мы видим, что обсуждения конфликта.
во время негативных мобилизаций, по-видимому, отмечены
разделением между атакующими и защищающимися, при
котором участники в основном общаются с другими членами
5.1 Количественная оценка воздействия
своего «домашнего» сообщества. Подобные эффекты эхо-камеры Мы измерили влияние мобилизации после ее завершения по изменению
были обнаружены во время вызывающих споры дискуссий в степени участия атакующих и защищающихся в целевом сообществе. Все
социальных сетях [13, 16, 19, 67]. изменения измеряются как разница между средними уровнями активности
Атакующие группой «нападают» на защищающихся. Конечно, пользователей за 30 дней до начала мобилизации и в течение 30 дней после
несмотря на эффект эхо-камеры, описанный выше, атакующие и окончания мобилизации (окончанием мобилизации считается период в
защищающиеся неизбежно будут вступать в прямое взаимодействие. течение 3х дней после создания первоначального поста с перекрестными
Но как выглядят такие взаимодействия? Изучая оценки A-PageRank ссылками). В качестве контрольной группы мы снова берем случайно
защищающихся, мы обнаруживаем, что, хотя 83% защищающихся подобранных сравнимых пользователей (подробнее см. Раздел 2).
имеют ровно нулевой балл, очень небольшая часть защищающихся На рисунке 7 мы измеряем изменение (минус означает
(1,14%) имеет рейтинг A-PageRank, который как минимум в десять показатель до мобилизации) доли комментариев, которые
раз превышает среднее значение среди всех атакующих и атакующие и защищающиеся делают в целевом сообществе после
защищающихся. Это сильно неравномерное распределение оценок A- окончания негативной мобилизации (аналогичные значения
PageRank защищающихся указывает на то, что небольшая группа показаны для нейтральных мобилизаций). Положительное
защищающихся участвует в большинстве взаимодействий с (отрицательное, соответственно) изменение указывает на
атакующими. Кроме того, мы обнаружили, что в комментариях повышенное (уменьшенное, соответственно ) участие в целевом
между атакующими и защищающимися используется очень гневный сообществе. Мы видим, что после негативных мобилизаций
язык - атакующие чаще используют гневные слова в общении с атакующие чаще публикуют сообщения в целевом сообществе, а
защищающимися, чем в общении с другими атакующими (0,015 к защищающиеся публикуют сообщения реже (p <0,001), это
0,011; p <0,001), что также свойственно для защищающихся (0,017 к указывает на то, что негативные мобилизации часто приводят к
0,014; р <0,001). В совокупности эти результаты говорят о том, что, «колонизации», когда члены атакующего сообщества становятся
хотя атакующие не общаются с большинством защищающихся, они, постоянными членами целевого сообщества. Такая колонизация
как правило, выделяют и в группе нападают на горстку может привести к дальнейшим неблагоприятным последствиям для
защищающихся. целевого сообщества, поскольку входящие пользователи, как
правило, проявляют больше агрессии, по сравнению со средними
В целом, мы обнаружили, что негативная мобилизация приводит значениями, и склонны нарушать нормы сообщества (см. Раздел 4).
к созданию эхо-камер в целевой дискуссии, где атакующие в Напротив, нейтральная мобилизация приводит к «иммиграции»,
основном общаются с другими атакующими, а защищающиеся - с когда мобилизованные пользователи становятся более активными в
другими защищающимися. Но всякий раз, когда они общаются целевом сообществе, при этом не происходит никаких значительных
между собой, они обмениваются очень гневными комментариями. изменений для «защищающихся» (рис. 5). Более того, поскольку
Более того, наш анализ показывает, что атакующие, как правило, мобилизованные пользователи в нейтральной мобилизации
«объединяются в группы», чтобы вместе атаковать некоторых становятся более цивилизованными (см. Раздел 4), этот эффект
защищающихся пользователей, в то время как другие может привести к увеличению позитивных взаимодействий
защищающиеся пользователи просто не взаимодействуют с между сообществами, что является открытой областью для
атакующими. будущих исследований.
Сетка ответов при неуспешной защите Сетка ответов при успешной защите
Атакующие группой
«нападают» на
защищающихся.
Защищающиеся
вступают в борьбу с
атакующими и
Условные обозначения:
Атакующие сближаются с имеют более
Атакующий другими атакующими и высокий рейтинг D-
Защищающийся имеют более высокий PageRank
рейтинг A-PageRank.
(a)
(а)
Рисунок 8: (a) Две сетки ответов по двум реальным целевым потокам из анализируемых нами данных, показывающие ключевые
характерные различия между успешными и неуспешными системами защиты. При неуспешной защите атакующие «объединяются в
группы» для нападения на защищающихся; в то время при успешной защите защищающиеся взаимодействуют с атакующими
напрямую. При успешной защите: (b) защищающиеся больше отвечают атакующим, (c) A-PageRank защищающегося выше, (d) D-
PageRank атакующего выше, и (e) защищающиеся используют больше гневных слов в ответах атакующим.
5.2 Что делает защиту успешной? значения указывают на уменьшение (т. е. на неуспешную защиту)
Поскольку негативная мобилизация отрицательно сказывается на относительно ожидаемого контрольного изменения (рассчитанного
целевом сообществе, есть ли какие-либо способы предотвратить это? на основе показателей соизмеримых пользователей, согласно
Является ли игнорирование атакующих оптимальным способом, как в определению в разделе 2). Графики сглажены как скользящее ±
случае антисоциального поведения, такого как троллинг [7], или среднее (размер окна 5), чтобы не учитывать незначительные
прямое взаимодействие более эффективно, как предполагают теории отклонения. Вместе эти цифры показывают, что защита успешна,
снижения враждебности [5, 63, 64]? когда защищающиеся склонны вступать в прямой ожесточенный
Чтобы понять стратегии, которые могут быть полезны для диалог с атакующими, тем самым не позволяя им «объединиться в
смягчения этих неблагоприятных воздействий негативной группу» для атаки и разрушая эхо-камеры, которые обычно
мобилизации, мы сравнили случаи успешной и неуспешной защиты. образуются в процессе негативной мобилизации (см. Раздел 4). Мы
Мы определяем защиту как «успешную», когда защищающиеся приводим подробное объяснение этих показателей в следующих нескольких
становятся более активными в своем сообществе после того, как абзацах.
негативная мобилизация заканчивается, при этом «неуспешная» Хотя статистически значимого увеличения числа защищающихся
не происходит (p = 0,05), мы обнаружили, что успешная защита
защита - когда защищающиеся становятся менее активными. 10 Мы характеризуется значительным увеличением доли ответов
сравниваем 10% наиболее успешных и 10% наименее успешных защит и защищающихся в в отношении атакующих (Рисунок 8 (b); коэффициент
показываем различия в усредненной статистике по двум категориям. корреляции = 0,97 ). Кроме того, мы используем два новых варианта
На рис. 8 (а) показаны самые большие связанные компоненты двух PageRank, A-PageRank и D-PageRank, разработанные в рамках Раздела
реальных цепочек ответов из анализируемых нами данных - одна 4. Успешной защите соответствуют защищающиеся с более высоким
показывает пример неуспешной защиты, а другая - успешной защиты; A-PageRank (0,036 против 0,031, p <0,001; рисунок 8 (c)) и атакующие
приведены несколько разных параметров для наблюдения. На с более высоким показателем D-PageRank (0,052 против 0,028; p
прилагаемых рисунках 8 (b–e) показаны характерные различия между <0,001; рисунок 8 (d)). Таким образом, защищающиеся способствуют
успешной и неуспешной защитой в целом. По оси х на этих рисунках большему количеству дискуссий с атакующими для успешной
показывается среднее изменение (минус означает показатель до защиты, и между ними значительно больше перекрестной
мобилизации) в доле комментариев защищающихся в целевом коммуникации, что предотвращает образование эхо-камер.
сообществе после окончания негативной мобилизации - Но будет ли такое усиление перекрестной коммуникации
положительные значения указывают на увеличение доли (т. е. на способствовать цивилизованному диалогу или ожесточенным спорам?
успешную защиту), а отрицательные Мы ответили на этот вопрос, вычислив вероятность, что пользователи
10 Альтернативные определения «успешности», например, с учетом будут использовать «гневные» слова (из словаря LIWC [77]) в прямых
ответах атакующих защищающимся и наоборот. Мы обнаружили, что
качественности будущих комментариев, могут быть изучены в
последующих исследованиях.
6.2 Встраивание текста, пользователей и сообществ
Хотя в моделях глубинного обучения обычно используется текстовая
информация, наши данные также содержат обширную социальную
информацию о пользователях и сообществах, которую мы можем
использовать в наших прогнозах. Поэтому мы конвертируем текст,
пользователей и сообщества в 300-мерные вложения, которые будут
использоваться в качестве входных данных для нашей модели глубинного
обучения. Для конвертации текста мы используем стандартные методы.
12Для осуществления процесса встраивания пользователей и сообществ мы
инновационно используем сеть «какие пользователи публикуют в каком
сообществе» для преобразования пользователей и сообществ во
встраиваемые векторы со следующей логикой: два вектора сообщества
будут близко друг к другу расположены, если похожие пользователи
размещают в них сообщения, и два пользовательских вектора будут
похожи, если
они склонны размещать сообщения в одних и тех же сообществах.
Рис. 9: Архитектура социально ориентированной модели LSTM. С более формальной точки зрения, мы обучаем систему встраиванию
при успешной защите защищающиеся используют больше гневных пользователей и сообществ на основе двудольного мультиграфа между
слов по отношению к атакующим, чем атакующие по отношению к пользователями и сообществами, где одно ребро пользователь/сообщество, u i,
защищающимся (0,017 против 0,015; p <0,05), в то время как при c j , появляется в графе каждый раз, когда пользователь ui публикует
неуспешной защите обе группы одинаково проявляют агрессию сообщения в сообществе c j . Адаптируя подход, использованный в ряде
по отношению друг к другу (p = 0,37). Это показывает, что в недавних успешных исследований [27, 53, 62], мы изучаем встраивания
случаях успешной защиты защищающиеся становятся более
агрессивными по отношению к атакующим. В целом, мы пользователей и сообществ u i R d, c j R d с помощью этого графика,
обнаружили, что негативные мобилизации часто приводят к используя алгоритм оптимизации с отрицательной выборкой и
«колонизации», при которой после окончания конфликта атакующие следующими элементами потерь:
становятся постоянными членами L= − log(σ (u⊤c )) − K · E log(−σ (u⊤c )), (1)
(ui , cj i j cn ∼Pn in
)∈E
целевого сообщества, а защищающиеся проявляют меньшую где E - набор ребер в двудольном мультиграфе, Pn - показатель
активность в рамках данного сообщества. Однако мы E (
равномерного распределения по всем сообществам (используется для
обнаружили, что этот негативный результат можно генерации отрицательных выборок), а K = 5 - количество
предотвратить, если защищающиеся разрушают эхо-камеры и использованных отрицательных выборок.
вступают в прямые эмоциональные взаимодействия с Мы обучили векторные представления,
∈ ∈ 100 раз пропустив их через
атакующими. публикации на ресурсе Reddit в течение полных 40 месяцев с
использованием стохастического кода градиентного спуска, который
6 ПРОГНОЗИРОВАНИЕ МОБИЛИЗАЦИИ приводится в работе Levy et al. [48]. На рис.1 показаны результирующие
векторные представления сообществ, построенные в виде двумерной
Проведенный в предыдущих разделах анализ показал, что визуализации [50]. Размер сообществ соответствует количеству
негативная мобилизация способна иметь долгосрочные размещенных в них публикаций, при этом они обозначены
негативные последствия. Итак, можем ли мы предсказать, различными цветами в соответствии с долей исходящих перекрестных
приведет ли пост к негативной мобилизации сразу после ссылок, которые являются негативными (красный указывает на
публикации? Затем эффективная модель может быть высокий уровень негатива, а синий - на низкий). Сообщества были
использована для создания системы раннего предупреждения, вручную сгруппированы по категориям высокого уровня, таким как
позволяющей модераторам сообщества принимать спортивные команды, технологии и т.д. Согласно нашим
соответствующие меры предосторожности. В настоящем разделе наблюдениям, большинство кластеров сообществ в основном
мы сосредоточимся именно на этой задаче прогнозирования. обозначены синим, в то время как спорные темы (например, кластер с
Мы создаем новую “социально ориентированную” модель LSTM наряду с r/conspiracy и r/theredpill) и сообщества для получения рекомендаций
базой на основе характеристик, предназначенной для сравнения. Для генерируют большое количество негативных перекрестных ссылок.
прогнозирования наша модель глубокого обучения использует как текст Указанные векторные представления текстов, пользователей и
публикации, так и сеть взаимодействий пользователей с сообществом. Мы сообществ будут использоваться в качестве входных данных для
покажем значительное превосходство нашей модели над базой на основе нашей социально ориентированной модели LSTM, описание которой
характеристик для решения задачи по прогнозированию возможной приводится ниже.
мобилизации пользователей вследствие публикации сообщения с
перекрестными ссылками. 6.3 Социально ориентированная модель LSTM.
6.1 Базовая модель на основе характеристик С целью структурированного ∈ объединения социальных и текстовых
∈ данных
для получения прогнозов мы создали новую «социально ориентированную»
В качестве базы мы создадим традиционную модель на основе
большого набора из 263 вручную созданных характеристик, модель LSTM. Используя в качестве входных данных векторные
представления слов, пользователей и сообществ, мы обучаем рекуррентную
включая11
Характеристики публикаций: Статистические данные о модель LSTM в соответствии с рис. 9. Модели LSTM являются популярным
количестве лексики в публикации (например, полученные вариантом рекуррентных нейронных сетей (RNN), т. е. нейросетей,
которые оперируют последовательными входными последовательностями
благодаря LIWC [77] и VADER [36]) и значения сходства tf-idf [
между содержанием публикации в исходном/конечном x1, ..., xT [34]. Основная идея моделей LSTM заключается в том, что они
сообществе. Пользовательские характеристики: Уровни используют комбинацию нейросетей с плотной структуры для
активности создателя публикации (например, доля постов в отображения текущего входного значения xt Rd∈ вместе с вектором
целевом сообществе) и усредненные лексические скрытого состояния ht Rh в виде нового скрытого состояния ht +1 Rh .
характеристики предыдущих публикаций пользователя. В нашей социально ориентированной модели LSTM входные
Характеристики сообщества: сходство tf-idf между контентом в последовательности представляют собой объединение (i) векторного
исходном и целевом сообществах. представления пользователя для автора публикации ui , (ii) векторного
Данные характеристики используются не только в качестве представления сообщества для исходного и целевого сообществ cs and ct ,
базы в модели случайного леса [60], но и в сочетании с а также(iii) векторных представлений слов в тексте публикации,
углубленной моделью в виде ансамбля, как это поясняется далее.
11 Полный перечень характеристик см. на веб-сайте проекта [1]. 12 Готовые векторные представления слов GloVe были обучены на основе
840 миллиардов слов [61].
w0, ..., wL (где L обозначает длину текста). Традиционные LSTM поощряющих дискриминационные высказывания, позволила
[
работают только с текстовыми данными, в то время как эффективно снизить их количество[10].f В отличие от указанных
«социальная ориентированность» означает, что для обучения исследований, которые дают важную аналитическую информацию
дополнительно используется информация о пользователях и об опасностях негативного поведения в Интернете и эффективности
сообществах. Для прогнозирования мобилизации возьмем среднее коррекционных мер, в нашем исследовании основное внимание
значение скрытых состояний LSTM по каждому временному шагу, а уделяется (негативным) взаимодействиям диад «сообщество-
затем введем результирующий вектор через слой softmax (т.е., сообщество» и их влиянию.
логистический):
[h1, ..., hL+3] = LSTM([ui, cs , ct , w1, ..., wL ]) (2) 8 ОБСУЖДЕНИЕ И ВЫВОДЫ
Результаты нашего исследования дают новое масштабное
1 представление о взаимодействии между сообществами и
конфликтах
в Интернете. Используя перекрестные ссылки между
где y обозначает вероятность того, что публикация приведет к
публикациями в сообществах и тщательно контролируя базовые
мобилизации, а ht означает количество скрытых состояний LST.14
показатели
6.4 Результаты предсказания

активности пользователей, мы смогли выявить явные случаи
мобилизации сообществ.
Рассматриваемая нами задача прогнозирования заключается в Согласно нашему анализу, негативные мобилизации имеют
следующем: выяснить, мобилизует ли публикация членов важные долгосрочные негативные последствия, приводящие к
исходного сообщества, путем использования полного набора процессам «колонизации», когда в целевом сообществе начинают
перекрестных ссылок из раздела 2. Мы случайным образом используем
доминировать пользователи с ненадлежащим поведением. Однако
80% данных для обучения, 10% для проверки, а остальные 10% в качестве
мы также обнаружили смягчающие факторы, которые коррелируют
предлагаемого тестового набора.15 со снижением частоты таких неблагоприятных исходов — особенно
В рамках данной задачи AUC модели случайного леса на основе заметно, что активизация участия членов взаимодействующих
характеристик (масштаб 500) достигает 0,67. В качестве ориентира мы сообществ в дискуссиях приводит к улучшению результатов. Кроме
включаем традиционную модель LSTM, которая использует только того, для прогнозирования возможности мобилизации с AUC в
текстовую информацию (т. е. без векторных представлений) размере 0,76 мы разработали новую социально ориентированную
пользователей и сообществ). Ее AUC достигает 0,66, что почти равно модель LSTM, которая сочетает в себе векторные представления
AUC модели случайного леса. Наша социально ориентированная пользователей, сообществ и текстов.
модель LSTM значительно превосходит обе эти модели: ее AUC Тем не менее, наш анализ имеет ограничения, которые указывают
составляет 0,72. Кроме того, мы создаем модель ансамбля случайного на интересные направления для будущей работы. Во-первых, мы
леса, в которой используются все вручную разработанные изучили взаимодействие между парами сообществ, однако
характеристики, векторные представления пользователей, векторные исследование взаимодействия с участием более двух сообществ
представления сообществ и средний показатель скрытых состояний может выявить более масштабную динамику взаимодействий между
LSTM, благодаря чему производительность повышается еще больше - сообществами. Кроме того, наш анализ опирается на единую
до AUC в размере 0,76. Данное обстоятельство свидетельствует о том, платформу, где пользователи действуют под псевдонимами, в то
что и характеристики, и модель LSTM способствуют повышению время как характер взаимодействия и конфликтов в сообществе
производительности ансамбля. может быть иным, когда люди используют свои «настоящие»
В целом, в настоящем разделе мы описали несколько созданных личности (например, в Facebook или Twitter). Более того, в то время как
нами моделей прогнозирования машинного обучения и достигли мы изучаем влияние мобилизации на вовлеченных пользователей,
высокого AUC 0,76 для прогнозирования возможности анализ обсуждений с участием остальных членов сообщества может дать
мобилизации пользователей в результате публикации. Указанные нам дополнительное представление о влиянии взаимодействий между
модели могут быть использованы на практике с целью создания сообществами. Кроме того, связь взаимодействий между сообществами и
систем раннего предупреждения для модераторов сообществ, антисоциальным поведением, таким как троллинг [12] и
способных прогнозировать потенциальную негативную использование ботов [39], до сих пор не изучена. Наконец, наш
мобилизацию сразу после создания публикации с перекрестными анализ тональности мобилизации между сообществами ограничен
ссылками, и содействовать устранению неблагоприятных примерами явных настроений, когда негативные (или
последствий этих событий. нейтральные) настроения очевидны даже относительно
неосведомленному краудворкеру. Однако введение ограничений
7 ДАЛЬНЕЙШИЕ СМЕЖНЫЕ ИССЛЕДОВАНИЯ в сообществе способно
В дополнение к ранее упомянутой литературе по вычислительной предотвратить создание явных уничижительных постов и вместо
социологии и социальной психологии, наша работа также опирается и этого спровоцировать появление скрытых негативных
вносит свой вклад в обширное направление исследований в области настроений. Выявление неявных настроений и их использование
дискриминационных высказываний в Интернете и антисоциального для изучения взаимодействия между сообществами открывает
поведения. Исследования негативных взаимодействий на онлайн- важное направление для будущей работы.
платформах были сосредоточены в основном в области противоречий С помощью выявления, анализа и прогнозирования мобилизации
[4, 13, 20, 21, 45, 52] и антисоциального поведения в форме троллинга между сообществами наше исследование описывает методику на основе
[11, 12, 42], использования ботов [39], травли и кибербуллинга [8, 23, данных, предназначенную для количественной оценки влияния таких
32, 35, 55, 66, 79], вандализма [43], дискриминационных взаимодействий и прогнозирования момента их возникновения.
высказываний [9, 15, 51, 56, 72] и прочего [17, 24, 40, 41, 44, 46, 54, Управление сообществами крайне негативного и дестабилизирующего
68, 78, 81]. Несмотря на то, что эти исследования охватывают широкий характера, в частности, становится все более важным для платформ с
спектр антисоциального поведения, основное внимание в них несколькими сообществами [29], в то время как наш анализ помогает
уделяется анализу на уровне пользователей. Наше же исследование, подготовить почву для разработки политики, стратегий и
напротив, сосредоточено на взаимодействии на уровне сообщества. инструментов, способствующих позитивному взаимодействию на
Недавние исследования также показали, что организованное этих платформах.
негативное поведение может распространяться на разные платформы
[33, 82], и что блокировка сообществ на ресурсе Reddit, БЛАГОДАРНОСТИ
13 Мы используем максимальную длину L = 50, отбрасывая слова, которые идут после данной
Некоторые разделы данного исследования были подготовлены
точки. при поддержке NIH BD2K, DARPA NGS2, ARO MURI, IARPA HFC, ONR
14 Мы обучили модель с использованием PyTorch [2], оптимизатора Adam [37] и стандартного CEROSS, Стэнфордской инициативы в области науки о данных,
метода потери перекрестной энтропии. На веб-сайте проекта [1] размещены данные и Chan Zuckerberg Biohub, IIS-1514268, Программы стипендий SAP
код для репликации.
15 Мы не ограничиваемся негативной мобилизацией, поскольку сами метки тональности Стэнфордского университета и программы грантов для
были сгенерированы классификатором машинного обучения. Прогнозирование негативной аспирантов NSERC PGS Авторы выражают благодарность д-ру
мобилизации может быть выполнено путем объединения данного классификатора с Аджаю Диваракану и д-ру Карану Сикка за плодотворные
классификатором тональности, разработанным и описанным в разделе 2.
дискуссии.
[32] S. Hinduja and J. W. Patchin. «Буллинг вне школьного двора: предотвращение и реагирование
СПИСОК ЛИТЕРАТУРЫ на кибербуллинг» (Bullying beyond the schoolyard: Preventing and responding to cyberbullying).
Corwin Press, 2014.
[1] Онлайн-приложение. http://snap.stanford.edu/conflict.
[33] G. E. Hine, J. Onaolapo, E. De Cristofaro, N. Kourtellis, I. Leontiadis, R. Samaras,G. Stringhini, and J.
[2] Pytorch v0.2. http://pytorch.org/. Blackburn. «”Кек”, рогоносцы и Бог-Император Трамп: оценочное исследование политически
[3] Хранилище данных Reddit. http://files.pushshift.io/reddit/. Данные получены: 2017-10-27. некорректного форума 4chan и его влияния на Интернет» (Kek, cucks, and god emperor trump: A
measurement study of 4chan’s politically incorrect forum and its effects on the web). In Proceedings of the
[4] A. Addawood, R. Rezapour, O. Abdar, and J. Diesner. «Как отличить твиты, связанные со спорными темами, от The International AAAI Conference on Web and Social Media (ICWSM), 2017.
остальных?» (Telling apart tweets associated with controversial versus non-controversial topics). In Proceedings
of the 2nd Workshop on NLP and Computational Social Science, 2017. [34] S. Hochreiter and J. Schmidhuber. «Долгая краткосрочная память» (Long short-term memory). Neural
computation, 9(8):1735–1780, 1997.
[5] G. W. Allport. «Характер предубеждений» (The nature of prejudice). Basic Books, 1979.
[35] H. Hosseinmardi, A. Ghasemianlangroodi, R. Han, Q. Lv, and S. Mishra. «К пониманию кибербуллингового
[6] V. Belák, S. Lam, and C. Hayes. «Влияние сообществ дискуссионных форумов друг на друга» (Cross-community influence in поведения в полуанонимной социальной сети» (Towards understanding cyberbullying behavior in a semi-
discussion fora). anonymous social network). In Advances in Social Networks Analysis and Mining (ASONAM), 2014
ICWSM, 12:34–41, 2012. IEEE/ACM International Conference on, pages 244–252. IEEE, 2014.
[7] A. Binns. «Не кормите троллей! Как усмирить нарушителей порядка в онлайн-сообществах журналов» [36] C. J. Hutto and E. Gilbert. «Vader: экономная модель на основе правил, предназначенная для анализа
(Don’t feed the trolls! managing troublemakers in magazines’ online communities). Journalism Practice, тональности высказываний в социальных сетях» (Vader: A parsimonious rule-based model for sentiment
6(4):547–562, 2012. analysis of social media text). In Proceedings of the International AAAI Conference on Weblogs and Social
Media (ICWSM), 2014.
[8] J. Blackburn and H. Kwak. «Закрой рот, нуб! Прогнозирование краудсорсинговых решений в отношении
[37] D. Kingma and J. Ba. Адам: «Метод стохастической оптимизации» (A method for stochastic optimization).
токсичного поведения в онлайн-играх» (Stfu noob!: predicting crowdsourced decisions on toxic behavior in
online games). In Proceedings of the 23rd international conference on World wide web, pages 877–888. arXiv:1412.6980, 2014.
ACM, 2014. [38] R. E. Kraut, P. Resnick, S. Kiesler, M. Burke, Y. Chen, N. Kittur, J. Konstan, Y. Ren, and J. Riedl.
[9] P. Burnap and M. L. Williams. «Мы и они: выявление кибер-ненависти в Twitter по нескольким «Построение успешных Интернет-сообществ: социальное проектирование на основе
параметрам защиты» (Us and them: identifying cyber hate on twitter across multiple protected фактических данных» (Building successful online communities: Evidence-based social design). MIT Press,
characteristics). EPJ Data Science, 5(1):11, 2016. 2012.
[10] E. Chandrasekharan, U. Pavalanathan, A. Srinivasan, A. Glynn, J. Eisenstein, and [39] S. Kumar, J. Cheng, J. Leskovec, and V. Subrahmanian. «Моя армия: боты в Интернет-сообществах для
дискуссий» (An army of me: Sockpup- pets in online discussion communities). In Proceedings of the 26th
E. Gilbert. «Вы не можете здесь оставаться: изучение эффективности банов реддиторов в 2015 году с International Conference on World Wide Web, 2017.
точки зрения дискриминационных высказываний» (You canâĂŹt stay here: The efficacy of redditâĂŹs
2015 ban examined through hate speech). In Proceedings of the ACM Human-Computer Interaction, [40] S. Kumar, B. Hooi, D. Makhija, M. Kumar, C. Faloutsos, and V. Subrahamanian. «Rev2: мошенническое
2017. прогнозирование пользователей на рейтинговых платформах» (Rev2: Fraudulent user prediction in
rating platforms). Proceedings of the 11th ACM International Conference on Web Search and Data
[11] J. Cheng, M. Bernstein, C. Danescu-Niculescu-Mizil, and J. Leskovec. «Стать троллем может каждый: причины Mining, 2018.
троллингового поведения в дискуссиях в Интернете» (Anyone can become a troll: Causes of trolling behavior in
online discussions). In Proceedings of the 20th ACM Conference on Computer-Supported Cooperative Work [41] S. Kumar and N. Shah. «Ложная информация в Интернете и социальных сетях: исследование» (False
and Social Computing (CSCW), 2017. information on web and social media: A survey). In
[12] J. Cheng, C. Danescu-Niculescu-Mizil, and J. Leskovec. «Антисоциальное поведение в Интернет- Social Media Analytics: Advances and Applications. CRC, 2018.
сообществах для дискуссий» (Antisocial behavior in online discussion communities). In Proceedings of [42] S. Kumar, F. Spezzano, and V. Subrahmanian. «Точное обнаружение троллей в Slashdot Zoo с
the The International AAAI Conference on Web and Social Media (ICWSM), 2015. помощью устранения помех» (Accurately detecting trolls in slashdot zoo via decluttering). In Advances
[13] M. Conover, J. Ratkiewicz, M. R. Francisco, B. Gonçalves, F. Menczer, and A. Flam- mini. «Политическая in Social Networks Analysis and Mining (ASONAM), 2014 IEEE/ACM International Conference on, pages
поляризация в Тwitter» (Political polarization on twitter). Proceedings of the 5th International AAAI Conference 188–195. IEEE, 2014.
on Web and Social Media (ICWSM), 2011. [43] S. Kumar, F. Spezzano, and V. Subrahmanian. «Vews: система «Википедии» для раннего оповещения о
[14] S. Datta, C. Phelan, and E. Adar. «Выявление рассогласованных межгрупповых взаимосвязей и вандализме» (Vews: A wikipedia vandal early warning system). In Proceedings of the 21th ACM SIGKDD
сообществ» (Identifying misaligned inter-group links and communities). Proceedings of the ACM Human- International Conference on Knowledge Discovery and Data Mining. ACM, 2015.
Computer Interaction, 2017. [44] S. Kumar, R. West, and J. Leskovec. «Дезинформация в Интернете: воздействие, характеристики и
[15] (N. LUTSEY). Djuric, J. Zhou, R. Morris, M. Grbovic, V. Radosavljevic, and N. Bhamidipati. «Обнаружение обнаружение недостоверной информации в «Википедии» (Disinformation on the web: Impact, characteristics,
дискриминационных высказываний с помощью векторных представлений комментариев» (Hate speech and detection of wikipedia hoaxes). In Proceedings of the 25th International Conference on World Wide Web,
detection with comment embeddings). In Proceedings of the 24th International Conference on World Wide 2016.
Web (WWW). ACM, 2015. [45] H. Lamba, M. M. Malik, and J. Pfeffer. «Буря в стакане? Анализ вспышек общественного негодования в
[16] R. Faris, H. Roberts, B. Etling, N. Bourassa, E. Zuckerman, and Y. Benkler. «Ангажированность, пропаганда и Twitter» (A tempest in a teacup? analyzing firestorms on twitter). In Proceedings of the 2015 IEEE/ACM
дезинформация: онлайн-медиа и президентские выборы 2016-го года» (Partisanship, propaganda, and International Conference on Advances in Social Networks Analysis and Mining (ASONAM). IEEE,
disinformation: Online media and the 2016 us presidential election). Berkman Klein Center for Internet & 2015.
Society Research Paper, 2017. [46] K. Lee, P. Tamilarasan, and J. Caverlee. «Краудсёрферы, кампании и социальные медиа: отслеживание
[17] E. Ferrara. «Динамика распространения экстремистской пропаганды в соцсетях» (Contagion и обнаружение коллективных манипуляций социальными медиа» (Crowdturfers, campaigns, and social
dynamics of extremist propaganda in social networks). media: Tracking and revealing crowdsourced manipulation of social media). In ICWSM, 2013.
Information Sciences, 2017. [47] J. Leskovec, D. Huttenlocher, and J. Kleinberg. «Прогнозирование положительных и отрицательных
ссылок в онлайн-социальных сетях» (Predicting positive and negative links in online social networks). In
[18] S. Fortunato. «Определение сообщества в графах» (Community detection in graphs). Physics Reports, Proceedings of the 19th international conference on World Wide Web (WWW). ACM, 2010.
486(3):75–174, 2010.
[48] O. Levy and Y. Goldberg. «Векторные представления слов на основе зависимостей» (Dependency-based word
[19] D. Garcia, F. Mendez, U. Serdült, and F. Schweitzer. «Политическая поляризация и популярность в embeddings). In Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (ACL),
коллективных медиа: интегрированный подход» (Political polarization and popularity in online 2014.
participatory media: an integrated approach). In Proceedings of the 1st Workshop on Politics, Elections
and Data. ACM, 2012. [49] D. Liben-Nowell and J. Kleinberg. «Проблема прогнозирования ссылок для социальных сетей» (The link-
prediction problem for social networks). Journal of the Association for Information Science and Technology
[20] K. Garimella, G. De Francisci Morales, A. Gionis, and M. Mathioudakis. «Количественная оценка (JASIST), 58(7):1019–1031, 2007.
противоречий в социальных сетях» (Quantifying controversy in social media). In Proceedings of the 9th
ACM International Conference on Web Search and Data Mining (WSDM). ACM, 2016. [50] L. v. d. Maaten and G. Hinton. «Визуализация данных с помощью t-SNE» (Visualizing data using t-sne).
Journal of Machine Learning Research (JMLR), 9(Nov):2579–2605, 2008.
[21] K. Garimella, G. De Francisci Morales, A. Gionis, and M. Mathioudakis. «Уменьшение разногласий путем
объединения противоположных взглядов» (Reducing controversy by connecting opposing views). In [51] J. N. Matias, A. Johnson, W. E. Boesel, B. Keegan, J. Friedman, and C. DeTar. «Информарование,
Proceedings of the 10th ACM International Conference on Web Search and Data Mining (WSDM). анализ и реагирование на травлю в Тwitter» (Reporting, reviewing, and responding to harassment on
ACM, 2017. twitter). arXiv:1505.03359, 2015.
[22] H. Giles. «Межгрупповая коммуникация: несколько точек зрения» (Intergroup communication: Multiple [52] Y. Mejova, A. X. Zhang, N. Diakopoulos, and C. Castillo. «Противоречия и тональность Интернет-новостей»
perspectives), volume 2. Peter Lang, 2005. (Controversy and sentiment in online news). Computation and Journalism Symposium, 2014.
[23] J. Golbeck, Z. Ashktorab, R. O. Banjo, A. Berlinger, S. Bhagwan, C. Buntain, [53] ТЕЛ. Mikolov, I. Sutskever, K. Chen, G. Corrado, and J. Dean. «Распределенные представления слов и фраз и их
P. Cheakalos, A. A. Geller, Q. Gergory, R. K. Gnanasekaran, et al. «Обширный корпус с маркировками композиционность» (Distributed representations of words and phrases and their compositionality). In Proceedings of
для исследования травли в Интернете» (A large labeled corpus for online harassment research). In the Advances in Neural Information Processing Systems (NIPS), 2013.
Proceedings of the 2017 ACM on Web Science Conference (WebSci). ACM, 2017. [54] T. Mitra and E. Gilbert. «Credbank: крупномасштабный корпус социальных сетей с соответствующими пометками о
[24] S. C. Guntuku, D. B. Yaden, M. L. Kern, L. H. Ungar, and J. C. Eichstaedt. «Выявление депрессии и надежности». (Credbank: A large-scale social media corpus with associated credibility annotations). In ICWSM,
психических заболеваний в социальных сетях: комплексный обзор» (Detecting depression and mental illness pages 258–267, 2015.
on social media: an integrative review). Current Opinion in Behavioral Sciences, 18:43–49, 2017. [55] K. Munger. «Как публикация твитов действует на объекты твитов: экспериментальное сокращение
[25] W. Hamilton, K. Clark, J. Leskovec, and D. Jurafsky. «Индуцирование лексиконов настроений применительно к отдельным числа расистских притеснений» (Тweetment effects on the tweeted: Experimentally reducing racist
областям на основе немаркированных корпусов» (Inducing domain-specific sentiment lexicons from unlabeled corpora). harassment). Political Behavior, 39(3):629–649, 2017.
Proceedings of the 2016 Conference on Empirical Methods on Natural Language Processing (EMNLP), [56] C. Nobata, J. Tetreault, A. Thomas, Y. Mehdad, and Y. Chang. «Обнаружение ненормативной лексики в
2016. контенте, генерируемом Интернет-пользователями» (Abusive language detection in online user content).
[26] W. Hamilton, J. Zhang, C. Danescu-Niculescu-Mizil, D. Jurafsky, and J. Leskovec. «Лояльность в Интернет-сообществах» (Loyalty in In Proceedings of the 25th International Conference on World Wide Web (WWW), 2016.
online communities). In Proceedings of 2017 The International AAAI Conference on Web and Social Media [57] J. G. Noel, D. L. Wann, and N. R. Branscombe. «Статус членства в периферийных группах и негативное
(ICWSM), 2017. отношение общественности к внешним группам» (Peripheral ingroup membership status and public
[27] W. L. Hamilton, R. Ying, and J. Leskovec. «Изучение представлений данных на графах: методы и области применения» negativity toward outgroups). Journal of Personality and Social Psychology, 68:127–127, 1995.
(Representation learning on graphs: Methods and applications. IEEE Data Engineering Bulletin, 2017. [58] U. of Oklahoma. Institute of Group Relations and M. Sherif. Intergroup conflict and cooperation: The Robbers Cave
[28] К. Hardaker. «Троллинг в асинхронных коммуникациях посредством компьютера: от пользовательских experiment, volume 10. University Book Exchange Norman, 1961.
обсуждений к научным определениям» (Trolling in asynchronous computer-mediated communication: From
user discussions to academic definitions). Journal of Politeness Research, 2010. [59] L. Page, S. Brin, R. Motwani, and T. Winograd. «Рейтинг цитирования PageRank: наведение порядка в
[29] C. Hauser. «Reddit пресекает распространение материалов с пропагандой насилия путем банов Интернете» (The pagerank citation ranking: Bringing order to the web). Technical report, Stanford
InfoLab, 1999.
нацистских группировок и прочих пользователей» (Reddit nazi groups and others in crackdown on violent
content).
[60] F. Pedregosa, G. Varoquaux, A. Gramfort, V. Michel, B. Thirion, O. Grisel, M. Blon- del, P. Prettenhofer, R. Weiss,
V. Dubourg, J. Vanderplas, A. Passos, D. Cournapeau,
New York Times, October 2017. [Online; posted 26-October-2017]. M. Brucher, M. Perrot, and E. Duchesnay. «scikit-learn: машинное обучение на Python» (scikit-learn: Machine
[30] M. Hewstone, M. Rubin, and H. Willis. «Межгрупповая предвзятость» (Intergroup bias). Annual learning in Python). The Journal of Machine Learning Research (JMLR), 2011.
Review of Psychology, 53(1):575–604, 2002.
[61] J. Pennington, R. Socher, and C. Manning. «Glove: глобальные векторы для представления слов».
[31] M. E. Hewstone and R. E. Brown. «Контакт и конфликт в межгрупповых столкновениях» (Contact (Glove: Global vectors for word representation). In Proceedings of the 2014 Conference on Empirical
and conflict in intergroup encounters). Methods in Natural Language Processing (EMNLP), 2014.
Basil Blackwell, 1986.
[62] B. Perozzi, R. Al-Rfou, and S. Skiena. «Deepwalk: обучение социальным представлениям в Интернете»
(Deepwalk: Online learning of social representations). In Proceedings of the 20th ACM SIGKDD [73] H. Tajfel. «Социальная психология межгрупповых отношений» (Social psychology of intergroup relations).
International Conference on Knowledge Discovery and Data Mining (KDD), pages 701–710. ACM, Annual Review of Psychology, 33(1):1–39, 1982.
2014. [74] H. Tajfel. «Социальная идентичность и межгрупповые отношения» (Social identity and intergroup
[63] T. F. Pettigrew. «Обобщенное межгрупповое взаимодействие влияет на предубеждения». (Generalized intergroup relations). Cambridge University Press, 2010.
contact effects on prejudice). Personality and Social Psychology Bulletin, 23(2):173–185, 1997. [75] H. Tajfel and J. C. Turner. «Интегративная теория межгруппового конфликта» (An integrative theory of
[64] T. F. Pettigrew and L. R. Tropp. «Снижает ли предубежденность межгрупповое взаимодействие? Выводы недавнего мета- intergroup conflict). The Social Psychology of Intergroup Relations, 1979.
анализа» (Does intergroup contact reduce prejudice? recent meta-analytic findings). Reducing Prejudice and [76] C. Tan and L. Lee. «Все блуждающие: о распространенности и характеристиках взаимодействия
Discrimination, 93:114, 2000. с участием нескольких сообществ» (All who wander: On the prevalence and characteristics of multi-
[65] M. A. Rahim. «Урегулирование конфликтов в организациях» (Managing conflict in organizations). community engagement). In Proceedings of International World Wide Web Conference (WWW), 2015.
Transaction Publishers, 2010. [77] Y. R. Tausczik and J. W. Pennebaker. «Психологическое значение слов: программа LIWC и
[66] J. Ratkiewicz, M. Conover, M. R. Meiss, B. Gonçalves, A. Flammini, and F. Menczer. «Выявление и компьютеризированные методы анализа текста» (The psychological meaning of words: LIWC and
отслеживание политических злоупотреблений в социальных сетях» (Detecting and tracking political abuse in computerized text analysis methods). Journal of Language and Social Psychology, Mar. 2010.
social media). Proceedings of the 5th International AAAI Conference on Web and Social Media (ICWSM), [78] W. Wang, L. Chen, K. Thirunarayan, and A. P. Sheth. «Английские ругательства в Тwitter» (Cursing in english on twitter). In
2011. Proceedings of the 17th ACM conference on Computer supported cooperative work & social computing
[67] M. H. Ribeiro, P. H. Calais, V. A. Almeida, and W. Meira Jr. «Все, с чем я не согласен, - это #фейковые (CSCW). ACM, 2014.
новости: корреляция между политической поляризацией и распространение недостоверной [79] E. Wulczyn, N. Thain, and L. Dixon. «Из машины: атаки на отдельных людей с точки зрения масштаба»
информации» (“everything i disagree with is# fakenews”: Correlating political polarization and spread of (Ex machina: Personal attacks seen at scale). In Proceedings of the 26th International Conference on
misinforma- tion). arXiv:1706.05924, 2017. World Wide Web, pages 1391–1399. International World Wide Web Conferences Steering Committee, 2017.
[68] H. Saif, M. Fernandez, M. Rowe, and H. Alani. «О роли семантики в выявлении сторонников ИГИЛ в [80] J. Xie, S. Kelley, and B. K. Szymanski. «Обнаружение совпадающих сообществ в сетях:
социальных сетях» (On the role of semantics for detecting pro-isis stances on social media). In современное сравнительное исследование» «Overlapping community detection in networks: The
Proceedings of the CEUR Workshop, volume 1690, 2016. state-of-the-art and comparative study). ACM Computing Surveys (CSUR), 45(4):43, 2013.
[69] G. Salton and C. Buckley. Подходы к взвешиванию терминов при автоматическом поиске текста (Term- [81] T. Yasseri, R. Sumi, A. Rung, A. Kornai, and J. Kertész. «Динамика конфликтов в «Википедии» (Dynamics of conflicts in
weighting approaches in automatic text retrieval). wikipedia). PloS One, 7(6):e38869, 2012.
Information Processing & Management, 24(5):513–523, 1988. [82] S. Zannettou, T. Caulfield, E. De Cristofaro, N. Kourtelris, I. Leontiadis, M. Siriv- ianos, G. Stringhini, and J.
Blackburn. «Сетевая сороконожка: понимание взаимовлияния веб-сообществ через призму основных и
[70] M. Sherif. «Групповые конфликты и сотрудничество: социальная психология» (Group conflict альтернативных источников новостей» (The web centipede: understanding how web communities
and co-operation: Their social psychology), volume 29. Psychology Press, 2015. influence each other through the lens of mainstream and alter- native news sources). In Proceedings of the
[71] С. Siegal. «Непараметрическая статистика для бихевиоризма». (Nonparametric statistics for the 2017 Internet Measurement Conference, pages 405–417. ACM, 2017.
behavioral sciences). McGraw-hill, 1956. [83] J. Zhang, W. Hamilton, C. Danescu-Niculescu-Mizil, D. Jurafsky, and J. Leskovec. «Идентичность сообщества и
[72] L. A. Silva, M. Mondal, D. Correa, F. Benevenuto, and I. Weber. «Анализ целевых объектов ненависти в взаимодействие с пользователями в условиях наличия нескольких сообществ» (Community identity and user
социальных сетях в Интернете» (Analyzing the targets of hate in online social media). In Proceedings of engagement in a multi-community landscape). In Proceedings of 2017 The International AAAI Conference on
the 2016 The International AAAI Conference on Web and Social Media (ICWSM), 2016. Web and Social Media (ICWSM), 2017.

1803.03697 Ru

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

1803.03697 Ru

Загружено:

Авторское право:

Доступные форматы

Взаимодействие сообществ и конфликты в сети интернет

Шриджан Кумар (Srijan Kumar) Стэнфордский Уильям Л. Гамильтон (William L. Hamilton)

На веб-платформах пользователи объединяются в сообщества. МУЗЫКА

комментарий в сообществе S (и соответственно, T) за 30 дней до дня d,

Классификация эмоциональной составляющей мобилизации

3 ИНИЦИИРОВАНИЕ МОБИЛИЗАЦИИ 3.2 Какие пользователи участвуют в негативных

8Этот показатель подсчитывается на основе комментариев, сделанных за последние 30

Рис. 6: Эхо-камеры образуются во время

6.4 Результаты предсказания

Вам также может понравиться