Исследование популярности сообществ в социальной сети VK на основании анализа профилей 5.990 подростков (14-20 лет) из 33 населённых пунктов Калужской области. Охватывает 559.115 VK-сообществ (уникальных - 142.980), для которых были построены рейтинги популярности.
О том, какую опасность представляет плохо воспитанная молодежь, писали ещё эллинские поэты:
Старых родителей скоро совсем почитать перестанут; Будут их яро и зло поносить нечестивые дети Тяжкою бранью, не зная возмездья богов; не захочет Больше никто доставлять пропитанья родителям старым. Правду заменит кулак. Города подпадут разграбленью. И не возбудит ни в ком уваженья ни клятвохранитель, Ни справедливый, ни добрый. Скорей наглецу и злодею Станет почет воздаваться. Где сила, там будет и право. (из поэмы “Труды и дни” Гесиода в переводе В.В. Вересаева)
Современная молодёжь внушает не меньшее беспокойство. Куда взор ни обрати, найдешь стайку несмышленышей с открытыми ртами – глазами хлопают и чужие глупости на сотый раз повторяют. Вокруг них так и вьются всякие хайпотрейдеры, вейподилеры, торговцы сладостями, видеоинфлюенсеры, производители трэш-контента, косплейщики пионерии. А чуть поодаль ещё более жуткая и шерстистая нечисть стоит, своего людоедского часа дожидается.
И сколько депутатов и чиновников в соцсетях не тэгай и кляуз в АПэшечку не пиши, тревога за будущее поколение не уменьшится.
Именно по этой причине мы решили погрузиться в мир подростковых интересов и посмотреть, чем сегодня заняты их мозги и куда их тянет спираль нашего лихолетья.
План исследования выбран примерно такой:
Часть 1.
сформировать выборку VK-профилей подростков 14-20 лет из населенных пунктов Калужской области
собрать перечень VK-сообществ, на которые они подписаны
построить рейтинги VK-сообществ
Часть 2.
выделить крупные кластеры сообществ и пользователей
сделать выводы о невиданном упадке нравов
Во-первых, выбор не особо велик. Почти половина этой выборки успешно преодолело пубертат без доступа к ресурсам Цукерберга и Маска.
Во-вторых, у VK в России, очевидно, большое будущее! Это признают даже министры образования, которые педагогов направляют к внедрению современных инструментов слежки и скоринга.
В-третьих, VK предоставляет готовые инструменты для анализа VK API, которыми мы и воспользуемся.
Средствами VK API собрали 15.537 профилей подростков с 14 до 20 лет, указавших в качестве места проживания следующие населенные пункты Калужской области (всего – 33):
В целях исключения давно не использовавшихся профилей из первоначальной выборки отобрали 8.677 профилей, для которых была зарегистрирована активность после 30 апреля 2024 года. Таким образом, мы исключили из исследования около половины первоначально отобранных пользователей, поскольку их последняя активность либо недоступна в силу настроек безопасности в личном профиле, либо была зарегистрирована до мая 2024 года.
Из профилей пользователей мы средствами VK API собрали список VK-сообществ, на которые подписаны владельцы профилей.
Настройки конфиденциальности позволяют скрыть список сообществ, на которые подписан пользователь. Для 2.291 профилей сведения о группах оказались недоступны, для оставшихся 6.386 профилей было собрано 859.661 пар {пользователь-группа}, в которых 194.505 уникальных сообществ.
Мы предположили, что некоторые пользовательские профили могли быть созданы не для личного пользования, а для иных задач (например, для маркетинга или мониторинга настроений). Разумеется, такие профили делаются очень похожими на профили реальных людей, но скорее всего они подписаны на большое количество сообществ, чтобы иметь доступ к зкрытым записям сообществ.
На рисунке ниже показано распределение VK-профилей пользователей по количеству VK-сообществ, на которые они подписаны. Крайний слева столбец соответствует группе пользователей, у которых от 0 до 9 VK-сообществ в подписках, второй слева – пользователям, у которых от 10 до 19 VK-сообществ, и так далее. Указанные 2 группы являются самыми крупными по количеству профилей пользователей. Далее, по мере движения слева направо, с увеличением количества сообществ, количество VK-профилей пользователей уменьшается.

Будем считать, что профили, которые подписаны на 500 и более сообществ – это либо боты, либо такие пользователи, которые подписываются на группы без особого внимания. 396 таких профилей мы исключили из дальнейшего исследования.
Итоговая выборка выглядит так:
уникальных профилей – 5.990, из них 51.4% – юноши.
уникальных сообществ – 142.980
уникальных строк вида {пользователь-группа} – 559.115.
В выборку попали 140 сообществ, заблокированных ВК по разным причинам. У некоторых сообществ в названии или в адресе угадываются тематики, признаваемые госрегуляторами благопристойности и правопорядка как запрещенные или небезопасные. Заблокированные сообщества не исключались из настоящего исследования, но при упоминаниях в тексте или в таблицах имеют соответствующую отметку.
Наибольшее количество профилей отобралось из Калуги и Обнинска, следом идут Людиново и Малоярославец.

Выборка имеет смещение в сторону более старшего возраста, самые малочисленные группы пользователей – с 14 до 15 лет.

Прежде чем приступать к анализу VK-сообществ, на которые подписаны владельцы профилей, мы проверили распределение указанных дней рождения. Резонно предположить, что некоторые пользователи, не желая указывать настоящую дату рождения, могли использовать те цифры, которые быстрее всего выбрать – например, 01 января.
Распределение дней рождения на иллюстрации ниже подтверждает существование таких пользователей – доля профилей с датой рождения 01 января в несколько раз выше, чем доля профилей с другими датами, но масштаб искажений, которые такие “фейковые” профили привносят в выборку, не превышает 1%.

Показанное на иллюстрации распределение не доказывает, что в профилях с датами рождения, отличными от 01.01, приведены настоящие даты рождения, но указывает на то, что доля придуманных дней рождения относительно невелика, т.е. в большинстве профилей указан реальный возраст.
В таблицах ниже отражаются данные о VK-сообществах, собранные из сервиса vk.com в период исследования, со следующими изменениями: (а) телефонные номеры и адреса веб-сайтов заменены на *******, (б) обсценные слова на {censored}.
Актуальные названия VK-сообществ могут отличаться от тех, что представлены в таблицах (так как названия сообществ могут быть изменены), но все гиперссылки должны открываться в веб-браузере.
Упоминание любых VK-сообществ не носит рекламный характер и не является рекомендацией вступать в эти сообщества.
В таблице 2 приведен рейтинг VK-сообществ по количеству подписчиков, показаны только сообщества, на которые подписаны не менее 0.5% юношей из исследуемой выборки.
В Таблице 3 для наиболее популярных VK-сообществ рейтинга показана доля подписчиков среди пользователей определенного возраста из исследуемой выборки.
В таблице 4 приведены рейтинги VK-групп для юношей различного возраста.
В таблице 5 приведен рейтинг VK-сообществ по количеству подписчиков, показаны только сообщества, на которые подписаны не менее 0.5% девушек из исследуемой выборки.
В Таблице 6 для наиболее популярных VK-сообществ рейтинга показана доля подписчиков среди пользователей определенного возраста из исследуемой выборки.
В таблице 7 приведены рейтинги VK-групп для юношей различного возраста.
Очевидно, что одни группы более популярны среди парней (например, GGSTANDOFF: 260 из 269 профилей из выборки – юноши), другие – среди девушек (например, GIRL MEMES: 206 из 213 профилей из выборки – девушки). На иллюстрации ниже VK-сообщества представлены в виде кругов (радиус пропорционален количеству профилей любого пола в выборке), которые распределены следующим образом: слева – VK-сообщества более популярные среди девушек, справа – среди юношей. Наведение курсора на круг позволяет увидеть сведения о группе, клик – открывает VK-страницу сообщества в новом окне веб-браузера.
Интерактивные таблицы 2-7 показывают не все сообщества, а только те, что преодолели 0.5% порог популярности (т.е. на сообщество должны быть подписаны 0.5% или более от общего числа девушек или юношей). Таблицы содержат поле для быстрого поиска сообществ по названию или описанию – заинтересованные пользователи могут проверить собственные предположения.
Например, можно обнаружить, что популярность сообщества “Типичный Обнинск” с возрастом заметно растёт, а популярность сообщества “Типичная Калуга” – снижается, причем эффект наблюдается как для девушек, так и для юношей.
Однако, количество собранных нами сообществ существенно больше и ниже мы приведем несколько примеров рейтингов, построенных для сообществ, объединенных нами в условные мини-группы.
Эти группы не преодолевают 5% порог популярности, что, наверное, правильно. Негоже несовершеннолетним читать посты чиновников, многие из которых пребывают в перманентном отчаянии и бездарно симулируют энтузиазм.
Здесь рулит Движение Первых со своими региональными филиалами, но им тоже нечем похвастаться. Если посмотреть внимательно на таблицы 3 и 6, то видно, что популярность главного паблика Движения Первых с 16 до 20 лет неумолимо снижается и у девушек, и у парней (в движении возрастной ценз до 18 лет).
В эту группу мы включили сообщества библиотек, музеев, театров… почти всё менее 1%.
Популярность у наиболее популярных групп достигает 2-3%.
Те же 1-2%.
Вы тоже заметили, что девушки в выбранных нами примерах более активны? Мальчишки, по большей части, страдают
фигнёйв сообществах, посвященных знакомствам и другим ресентиментам (не у всех “хромосомка” в правильном месте надломлена).
В первой части мы ограничились базовым описанием собранных данных и построением первичных рейтингов. В следующих частях мы предполагаем:
выполнить анализ ассоциативной близости сообществ (подобно тому, как злоупотребление одной субстанцией часто приводит к знакомству с другими, увлечение одной дуростью оставляет в человеческую психике приоткрытую дверь для других)
сформировать кластеры похожих сообществ (у некоторых артистов помимо официального паблика в VK есть многочисленные фан-сообщества)
сформировать кластеры пользователей и попытаться субъективно оценить доли толковых ребят и откровенных дуралеев в исследуемой выборке.
В будущем мы планируем опубликовать обезличенный массив сообществ для тех исследователей будущего, кто заинтересуется этой темой.
Нравятся наши материалы? 👉 ТГ-канал Regina Lab
Интересы подростков Калужской области в социальной сети VK (Часть 1). // Блог Regina Lab. - 2024. - URL: https://reginaobninsklab.github.io/posts/kaluga-vk-youth-part1/. - Дата публикации: 28 августа 2024 г.
Если не указано иное, то статья целиком и составляющие её текст, иллюстрации и данные могут использоваться на условиях публичной лицензии Creative Commons CC BY 4.0 Deed Attribution 4.0 International.
См. соответствующий раздел на странице “О проекте”.
Allaire J, Xie Y, Dervieux C, McPherson J, Luraschi J, Ushey K, Atkins A, Wickham H, Cheng J, Chang W, Iannone R (2023). rmarkdown: Dynamic Documents for R. R package version 2.22, https://github.com/rstudio/rmarkdown.
Kunst J (2022). highcharter: A Wrapper for the ‘Highcharts’ Library. R package version 0.9.4, https://CRAN.R-project.org/package=highcharter.
Wickham H (2022). stringr: Simple, Consistent Wrappers for Common String Operations. R package version 1.5.0, https://CRAN.R-project.org/package=stringr.
Wickham H, François R, Henry L, Müller K, Vaughan D (2023). dplyr: A Grammar of Data Manipulation. R package version 1.1.2, https://CRAN.R-project.org/package=dplyr.
Wickham H, Henry L (2023). purrr: Functional Programming Tools. R package version 1.0.1, https://CRAN.R-project.org/package=purrr.
Wickham H, Hester J, Bryan J (2024). readr: Read Rectangular Text Data. R package version 2.1.5, https://CRAN.R-project.org/package=readr.
Wickham H, Seidel D (2022). scales: Scale Functions for Visualization. R package version 1.2.1, https://CRAN.R-project.org/package=scales.
Wickham H, Vaughan D, Girlich M (2024). tidyr: Tidy Messy Data. R package version 1.3.1, https://CRAN.R-project.org/package=tidyr.
Xie Y (2023). knitr: A General-Purpose Package for Dynamic Report Generation in R. R package version 1.43, https://yihui.org/knitr/.
Xie Y (2015). Dynamic Documents with R and knitr, 2nd edition. Chapman and Hall/CRC, Boca Raton, Florida. ISBN 978-1498716963, https://yihui.org/knitr/.
Xie Y (2014). “knitr: A Comprehensive Tool for Reproducible Research in R.” In Stodden V, Leisch F, Peng RD (eds.), Implementing Reproducible Computational Research. Chapman and Hall/CRC. ISBN 978-1466561595.
Xie Y, Cheng J, Tan X (2024). DT: A Wrapper of the JavaScript Library ‘DataTables’. R package version 0.33, https://CRAN.R-project.org/package=DT.
Xie Y, Allaire J, Grolemund G (2018). R Markdown: The Definitive Guide. Chapman and Hall/CRC, Boca Raton, Florida. ISBN 9781138359338, https://bookdown.org/yihui/rmarkdown.
Xie Y, Dervieux C, Riederer E (2020). R Markdown Cookbook. Chapman and Hall/CRC, Boca Raton, Florida. ISBN 9780367563837, https://bookdown.org/yihui/rmarkdown-cookbook.