Интересы подростков Калужской области в социальной сети VK (Часть 1)

калужская область VK социология ВКонтакте молодёжь

Исследование популярности сообществ в социальной сети VK на основании анализа профилей 5.990 подростков (14-20 лет) из 33 населённых пунктов Калужской области. Охватывает 559.115 VK-сообществ (уникальных - 142.980), для которых были построены рейтинги популярности.

Вступление

О том, какую опасность представляет плохо воспитанная молодежь, писали ещё эллинские поэты:

Старых родителей скоро совсем почитать перестанут;
Будут их яро и зло поносить нечестивые дети
Тяжкою бранью, не зная возмездья богов; не захочет
Больше никто доставлять пропитанья родителям старым.
Правду заменит кулак. Города подпадут разграбленью.
И не возбудит ни в ком уваженья ни клятвохранитель,
Ни справедливый, ни добрый. Скорей наглецу и злодею
Станет почет воздаваться. Где сила, там будет и право.
(из поэмы “Труды и дни” Гесиода в переводе В.В. Вересаева)

Современная молодёжь внушает не меньшее беспокойство. Куда взор ни обрати, найдешь стайку несмышленышей с открытыми ртами – глазами хлопают и чужие глупости на сотый раз повторяют. Вокруг них так и вьются всякие хайпотрейдеры, вейподилеры, торговцы сладостями, видеоинфлюенсеры, производители трэш-контента, косплейщики пионерии. А чуть поодаль ещё более жуткая и шерстистая нечисть стоит, своего людоедского часа дожидается.

И сколько депутатов и чиновников в соцсетях не тэгай и кляуз в АПэшечку не пиши, тревога за будущее поколение не уменьшится.

Именно по этой причине мы решили погрузиться в мир подростковых интересов и посмотреть, чем сегодня заняты их мозги и куда их тянет спираль нашего лихолетья.

План исследования выбран примерно такой:

Часть 1.

Часть 2.

Почему VK?

Во-первых, выбор не особо велик. Почти половина этой выборки успешно преодолело пубертат без доступа к ресурсам Цукерберга и Маска.

Во-вторых, у VK в России, очевидно, большое будущее! Это признают даже министры образования, которые педагогов направляют к внедрению современных инструментов слежки и скоринга.

В-третьих, VK предоставляет готовые инструменты для анализа VK API, которыми мы и воспользуемся.

Данные

Средствами VK API собрали 15.537 профилей подростков с 14 до 20 лет, указавших в качестве места проживания следующие населенные пункты Калужской области (всего – 33):

Пользователи без подтверждённой активности

В целях исключения давно не использовавшихся профилей из первоначальной выборки отобрали 8.677 профилей, для которых была зарегистрирована активность после 30 апреля 2024 года. Таким образом, мы исключили из исследования около половины первоначально отобранных пользователей, поскольку их последняя активность либо недоступна в силу настроек безопасности в личном профиле, либо была зарегистрирована до мая 2024 года.

Из профилей пользователей мы средствами VK API собрали список VK-сообществ, на которые подписаны владельцы профилей.

Профили без доступа к подпискам

Настройки конфиденциальности позволяют скрыть список сообществ, на которые подписан пользователь. Для 2.291 профилей сведения о группах оказались недоступны, для оставшихся 6.386 профилей было собрано 859.661 пар {пользователь-группа}, в которых 194.505 уникальных сообществ.

Исключение ботов и неразборчивых пользователей

Мы предположили, что некоторые пользовательские профили могли быть созданы не для личного пользования, а для иных задач (например, для маркетинга или мониторинга настроений). Разумеется, такие профили делаются очень похожими на профили реальных людей, но скорее всего они подписаны на большое количество сообществ, чтобы иметь доступ к зкрытым записям сообществ.

На рисунке ниже показано распределение VK-профилей пользователей по количеству VK-сообществ, на которые они подписаны. Крайний слева столбец соответствует группе пользователей, у которых от 0 до 9 VK-сообществ в подписках, второй слева – пользователям, у которых от 10 до 19 VK-сообществ, и так далее. Указанные 2 группы являются самыми крупными по количеству профилей пользователей. Далее, по мере движения слева направо, с увеличением количества сообществ, количество VK-профилей пользователей уменьшается.

Будем считать, что профили, которые подписаны на 500 и более сообществ – это либо боты, либо такие пользователи, которые подписываются на группы без особого внимания. 396 таких профилей мы исключили из дальнейшего исследования.

Итоговая выборка выглядит так:

Заблокированные сообщества

В выборку попали 140 сообществ, заблокированных ВК по разным причинам. У некоторых сообществ в названии или в адресе угадываются тематики, признаваемые госрегуляторами благопристойности и правопорядка как запрещенные или небезопасные. Заблокированные сообщества не исключались из настоящего исследования, но при упоминаниях в тексте или в таблицах имеют соответствующую отметку.

Характеристики выборки

Распределение по городам

Наибольшее количество профилей отобралось из Калуги и Обнинска, следом идут Людиново и Малоярославец.

Распределение по возрасту

Выборка имеет смещение в сторону более старшего возраста, самые малочисленные группы пользователей – с 14 до 15 лет.

Распределение по датам календаря

Прежде чем приступать к анализу VK-сообществ, на которые подписаны владельцы профилей, мы проверили распределение указанных дней рождения. Резонно предположить, что некоторые пользователи, не желая указывать настоящую дату рождения, могли использовать те цифры, которые быстрее всего выбрать – например, 01 января.

Распределение дней рождения на иллюстрации ниже подтверждает существование таких пользователей – доля профилей с датой рождения 01 января в несколько раз выше, чем доля профилей с другими датами, но масштаб искажений, которые такие “фейковые” профили привносят в выборку, не превышает 1%.

Показанное на иллюстрации распределение не доказывает, что в профилях с датами рождения, отличными от 01.01, приведены настоящие даты рождения, но указывает на то, что доля придуманных дней рождения относительно невелика, т.е. в большинстве профилей указан реальный возраст.

Исследование популярности VK-сообществ

  1. В таблицах ниже отражаются данные о VK-сообществах, собранные из сервиса vk.com в период исследования, со следующими изменениями: (а) телефонные номеры и адреса веб-сайтов заменены на *******, (б) обсценные слова на {censored}.

  2. Актуальные названия VK-сообществ могут отличаться от тех, что представлены в таблицах (так как названия сообществ могут быть изменены), но все гиперссылки должны открываться в веб-браузере.

  3. Упоминание любых VK-сообществ не носит рекламный характер и не является рекомендацией вступать в эти сообщества.

Рейтинг VK-сообществ (юноши)

В таблице 2 приведен рейтинг VK-сообществ по количеству подписчиков, показаны только сообщества, на которые подписаны не менее 0.5% юношей из исследуемой выборки.

В Таблице 3 для наиболее популярных VK-сообществ рейтинга показана доля подписчиков среди пользователей определенного возраста из исследуемой выборки.

В таблице 4 приведены рейтинги VK-групп для юношей различного возраста.


Рейтинг VK-сообществ (девушки)

В таблице 5 приведен рейтинг VK-сообществ по количеству подписчиков, показаны только сообщества, на которые подписаны не менее 0.5% девушек из исследуемой выборки.

В Таблице 6 для наиболее популярных VK-сообществ рейтинга показана доля подписчиков среди пользователей определенного возраста из исследуемой выборки.

В таблице 7 приведены рейтинги VK-групп для юношей различного возраста.


Гендерные различия

Очевидно, что одни группы более популярны среди парней (например, GGSTANDOFF: 260 из 269 профилей из выборки – юноши), другие – среди девушек (например, GIRL MEMES: 206 из 213 профилей из выборки – девушки). На иллюстрации ниже VK-сообщества представлены в виде кругов (радиус пропорционален количеству профилей любого пола в выборке), которые распределены следующим образом: слева – VK-сообщества более популярные среди девушек, справа – среди юношей. Наведение курсора на круг позволяет увидеть сведения о группе, клик – открывает VK-страницу сообщества в новом окне веб-браузера.

Наблюдения

Интерактивные таблицы 2-7 показывают не все сообщества, а только те, что преодолели 0.5% порог популярности (т.е. на сообщество должны быть подписаны 0.5% или более от общего числа девушек или юношей). Таблицы содержат поле для быстрого поиска сообществ по названию или описанию – заинтересованные пользователи могут проверить собственные предположения.

Например, можно обнаружить, что популярность сообщества “Типичный Обнинск” с возрастом заметно растёт, а популярность сообщества “Типичная Калуга” – снижается, причем эффект наблюдается как для девушек, так и для юношей.

Однако, количество собранных нами сообществ существенно больше и ниже мы приведем несколько примеров рейтингов, построенных для сообществ, объединенных нами в условные мини-группы.

1. Правительственные и околоправительственные паблики

Эти группы не преодолевают 5% порог популярности, что, наверное, правильно. Негоже несовершеннолетним читать посты чиновников, многие из которых пребывают в перманентном отчаянии и бездарно симулируют энтузиазм.

2. Молодёжные организации и движения

Здесь рулит Движение Первых со своими региональными филиалами, но им тоже нечем похвастаться. Если посмотреть внимательно на таблицы 3 и 6, то видно, что популярность главного паблика Движения Первых с 16 до 20 лет неумолимо снижается и у девушек, и у парней (в движении возрастной ценз до 18 лет).

3. Сообщества заведений культуры

В эту группу мы включили сообщества библиотек, музеев, театров… почти всё менее 1%.

3. Сообщества для поиска работы

Популярность у наиболее популярных групп достигает 2-3%.

5. Сообщества, посвященные изучению иностранных языков

Те же 1-2%.

Вы тоже заметили, что девушки в выбранных нами примерах более активны? Мальчишки, по большей части, страдают фигнёй в сообществах, посвященных знакомствам и другим ресентиментам (не у всех “хромосомка” в правильном месте надломлена).

Что дальше?

В первой части мы ограничились базовым описанием собранных данных и построением первичных рейтингов. В следующих частях мы предполагаем:

В будущем мы планируем опубликовать обезличенный массив сообществ для тех исследователей будущего, кто заинтересуется этой темой.


Нравятся наши материалы? 👉 ТГ-канал Regina Lab


Поделиться

Ссылка для цитирования

Интересы подростков Калужской области в социальной сети VK (Часть 1). // Блог Regina Lab. - 2024. - URL: https://reginaobninsklab.github.io/posts/kaluga-vk-youth-part1/. - Дата публикации: 28 августа 2024 г.

Права

Если не указано иное, то статья целиком и составляющие её текст, иллюстрации и данные могут использоваться на условиях публичной лицензии Creative Commons CC BY 4.0 Deed Attribution 4.0 International.

Отказ от ответственности

См. соответствующий раздел на странице “О проекте”.

Софт

Allaire J, Xie Y, Dervieux C, McPherson J, Luraschi J, Ushey K, Atkins A, Wickham H, Cheng J, Chang W, Iannone R (2023). rmarkdown: Dynamic Documents for R. R package version 2.22, https://github.com/rstudio/rmarkdown.

Kunst J (2022). highcharter: A Wrapper for the ‘Highcharts’ Library. R package version 0.9.4, https://CRAN.R-project.org/package=highcharter.

Wickham H (2022). stringr: Simple, Consistent Wrappers for Common String Operations. R package version 1.5.0, https://CRAN.R-project.org/package=stringr.

Wickham H, François R, Henry L, Müller K, Vaughan D (2023). dplyr: A Grammar of Data Manipulation. R package version 1.1.2, https://CRAN.R-project.org/package=dplyr.

Wickham H, Henry L (2023). purrr: Functional Programming Tools. R package version 1.0.1, https://CRAN.R-project.org/package=purrr.

Wickham H, Hester J, Bryan J (2024). readr: Read Rectangular Text Data. R package version 2.1.5, https://CRAN.R-project.org/package=readr.

Wickham H, Seidel D (2022). scales: Scale Functions for Visualization. R package version 1.2.1, https://CRAN.R-project.org/package=scales.

Wickham H, Vaughan D, Girlich M (2024). tidyr: Tidy Messy Data. R package version 1.3.1, https://CRAN.R-project.org/package=tidyr.

Xie Y (2023). knitr: A General-Purpose Package for Dynamic Report Generation in R. R package version 1.43, https://yihui.org/knitr/.

Xie Y (2015). Dynamic Documents with R and knitr, 2nd edition. Chapman and Hall/CRC, Boca Raton, Florida. ISBN 978-1498716963, https://yihui.org/knitr/.

Xie Y (2014). “knitr: A Comprehensive Tool for Reproducible Research in R.” In Stodden V, Leisch F, Peng RD (eds.), Implementing Reproducible Computational Research. Chapman and Hall/CRC. ISBN 978-1466561595.

Xie Y, Cheng J, Tan X (2024). DT: A Wrapper of the JavaScript Library ‘DataTables’. R package version 0.33, https://CRAN.R-project.org/package=DT.

Xie Y, Allaire J, Grolemund G (2018). R Markdown: The Definitive Guide. Chapman and Hall/CRC, Boca Raton, Florida. ISBN 9781138359338, https://bookdown.org/yihui/rmarkdown.

Xie Y, Dervieux C, Riederer E (2020). R Markdown Cookbook. Chapman and Hall/CRC, Boca Raton, Florida. ISBN 9780367563837, https://bookdown.org/yihui/rmarkdown-cookbook.