Менее 1% аккаунтов, но почти 12% комментариев: масштаб ботнетов в политическом YouTube. 39% видео атакованы ботнетами.
В рамках данного исследования был проведен комплексный анализ комментариев к видеоконтенту для выявления координированной активности ботнетов. Исследование включало разработку и применение методологии обнаружения ботов, анализ их поведенческих характеристик, сетевых взаимосвязей, содержания комментариев и временных паттернов активности.
Исследование было направлено на понимание масштабов, стратегий и целей ботнет-активности в контексте комментирования видеоконтента.
Методология обнаружения ботнетов
Теоретическая основа
Обнаружение ботнетов в комментариях основано на комбинации нескольких методов анализа:
- Взвешенная оценка признаков (Feature-based scoring) — основной метод, использующий набор признаков поведения с соответствующими весами
- Обнаружение аномалий (Anomaly detection) — для выявления отклонений от нормального поведения пользователей
- Кластеризация (Clustering) — для группировки ботов по схожим поведенческим паттернам
- Сетевой анализ (Network analysis) — для выявления связей между ботами через комментируемые видео
Математическая модель определения ботов
Объем и состав проанализированных данных
В рамках исследования был проведен анализ комментариев к видеоконтенту, собранных в марте 2025 года. Исходные данные имели следующие характеристики:
- 2148 видео
- 111 каналов
- 94532 комментария
Результаты обнаружения ботов
Применение описанной методологии позволило выявить 599 ботов, на долю которых пришлось почти 11000 комментариев, оставленных к 833 видео. Таким образом, несмотря на то, что боты составили относительно небольшую долю от общего числа аккаунтов (менее 1%), они генерировали около 11,6% всех комментариев и охватывали 38,8% анализируемых видео.
В ходе анализа было выявлено, что некоторые аккаунты, принадлежащие владельцам каналов, демонстрируют поведенческие паттерны, схожие с ботами. Эти аккаунты часто генерируют однотипные комментарии, что приводит к ложноположительным срабатываниям алгоритма обнаружения ботов.
На основе ручной проверки мы исключили из числа ботов несколько активных аккаунтов:
- @ZERKALOIO
- @zroblenaupolscy
- @BalaganOFF
- @viachaslau_sikora
Анализ характеристик обнаруженных ботов
Распределение ботов по bot score
Визуализация «Top 30 Bots by Bot Score» отображает 30 аккаунтов с наивысшими значениями bot score (оценки вероятности того, что аккаунт является ботом).
Ключевые наблюдения:
Все 30 топовых ботов имеют высокие значения bot score, примерно от 0.8 до 1.0
Наблюдается градация цветовой интенсивности полос, отражающая значения bot score
Три аккаунта с наивысшими показателями: @JosefOh-i8x, @Blog_Blog2, @ВячеславРязанов-63р
В именах многих аккаунтов прослеживаются характерные паттерны, типичные для ботов:
- Комбинация кириллических имен с цифро-буквенными суффиксами
- Латинские имена с цифровыми суффиксами
- Сочетание имя-фамилия с цифровыми/буквенными кодами
Наблюдаемые паттерны в названиях аккаунтов подтверждают эффективность методологии, так как такие шаблонные названия часто используются при автоматической генерации учетных записей.
Распределение ботов по количеству комментариев
Визуализация «Top 30 Bots by Comment Count» отображает 30 ботов с наибольшим количеством оставленных комментариев.
Ключевые наблюдения:
- Значительный разброс в количестве комментариев — от примерно 75 у наименее активных ботов из топ-30 до более 550 у самых активных
- Два бота значительно опережают остальных по числу комментариев: @Александр-д7n1ч (~550) и @Dushman-z4f (~530)
- Наблюдается резкое снижение активности после третьего бота (@irishaphill7794)
- Можно выделить несколько уровней активности среди ботов: сверхактивные (>500), высокоактивные (300-500), среднеактивные (200-300), малоактивные (100-200)
Сравнительный анализ с распределением по bot score:
- Списки «Top 30 Bots by Bot Score» и «Top 30 Bots by Comment Count» содержат разные аккаунты
- Это указывает на то, что наиболее подозрительные по поведенческим признакам боты не обязательно являются наиболее активными
- Отсутствие пересечений между топ-ботами по score и по количеству комментариев указывает на разнообразие ботнетов и их стратегий
Кластеризация ботов
Визуализация «Bot Clusters by Comment Count and Bot Score» демонстрирует распределение ботов по двум ключевым параметрам (количество комментариев и bot score) с группировкой по кластерам.
Ключевые наблюдения:
- Большинство обнаруженных ботов сконцентрировано в левой части графика (менее 100 комментариев)
- Bot score варьируется от 0.4 до 1.0, с большой концентрацией в диапазоне 0.5-0.7
- Наблюдается отрицательная корреляция между количеством комментариев и bot score
- Выделяются разные кластеры ботов с различными характеристиками
- Наиболее активные боты (300-550 комментариев) классифицированы как «шумовые точки» и имеют умеренные значения bot score (0.4-0.6)
Интерпретация:
- График демонстрирует обратную зависимость между активностью и «очевидностью» бота
- Различные кластеры представляют разные ботнеты с различными стратегиями и целями
- Боты с высокими показателями bot score используют более примитивные тактики, в то время как боты с высокой активностью, но более низкими bot score, используют более продвинутые методы имитации человеческого поведения
Анализ сетевых взаимосвязей ботов
Сетевой граф визуализирует связи между обнаруженными ботами, где узлы представляют отдельных ботов, а рёбра показывают связи через общие видео, которые они комментировали.
Ключевые наблюдения:
- Сеть демонстрирует сложную, неоднородную структуру с несколькими ярко выраженными кластерами
- Присутствует центральный плотный кластер с большим количеством взаимосвязей
- Видны несколько периферийных, более разреженных кластеров, соединенных с центральным
- В центре графа находятся узлы самого большого размера — ключевые боты с множеством связей
- Боты с высоким bot score (красные узлы) относительно равномерно распределены по всему графу
Выводы:
- Сетевой граф убедительно демонстрирует существование координированных групп ботов (ботнетов)
- Плотность связей указывает на то, что многие боты комментируют одни и те же видео
- Центральный кластер представляет наиболее крупный и активный ботнет
- Периферийные кластеры могут представлять отдельные ботнеты с более узкой специализацией
- Масштаб и сложность сети указывают на высокий уровень организации и координации
Анализ содержания комментариев ботов
Анализ наиболее частых n-грамм
Визуализация «Top 3-grams in Bot Comments» отображает частотный анализ триграмм (последовательностей из трех слов) в комментариях ботов.
Ключевые наблюдения:
- Две триграммы значительно превосходят остальные по частоте использования: «жыве беларусь слава» и «беларусь слава украiне»
- Выделяются тематические кластеры триграмм:
- Политические лозунги: «жыве беларусь слава», «беларусь слава украiне»
- Криптовалютные спам-сообщения
- Маркетинговые «шоу обычное утро», «поддержку шоу обычное»
- Упоминания этнических групп: «угорцы фiны албанцы»
- Связанные с фразой «пауля/паўля»: «пауля севярняща верым»
- Удивительной особенностью является присутствие демократических и оппозиционных белорусских слоганов, что не соответствует обычной российской пропаганде
Интерпретация:
- Присутствие демократических и проукраинских лозунгов может объясняться:
- Стратегией маскировки ботов
- Целью искусственного усиления поляризации дискуссии
- Дискредитацией оппозиции через неподходящее использование лозунгов
- Наличием различных операторов ботнетов с противоположными политическими целями
Облако слов
Облако слов визуализирует частоту употребления отдельных слов в комментариях ботов.
Ключевые наблюдения:
- Крупнейшие слова: «беларуси», «жыве», «беларусь», «лукашенко», «дзякуй», «вялiкi», «россия/россии», «украiне/украине», «слава»
- Наблюдается поляризация политических нарративов: одновременно присутствуют продемократические белорусские и украинские лозунги, а также термины, которые могут использоваться в пророссийской риторике
- Заметно использование нескольких языков: русского, белорусского, украинского
- Присутствуют отсылки к исторической идентичности (ВКЛ, лiтвiны)
Выводы:
- Облако слов демонстрирует крайнюю неоднородность политической направленности контента, создаваемого ботами
- Обнаруженные боты, скорее всего, контролируются разными операторами с разнонаправленными целями
- Политическая направленность контента не должна быть фактором при классификации аккаунтов как ботов
Анализ дублирующихся комментариев
Визуализация «Top Duplicate Comments» отображает наиболее часто повторяющиеся комментарии, оставленные ботами.
Ключевые наблюдения:
- Наиболее распространенные дубликаты: «Дзякуй за працу» (~49), «ЖЫВЕ БЕЛАРУСЬ» (~43), «Каментар для прасоўвання ролiка па Ютубе павiнен з…» (~40)
- Выделяются тематические категории повторяющихся комментариев:
- Политические и патриотические лозунги: «ЖЫВЕ БЕЛАРУСЬ», «Slava Ukraini Živie Belarus»
- Маркетинговые и продвиженческие: «Каментар для прасоўвання ролiка па Ютубе павiнен з…»
- Благодарности и приветствия: «Дзякуй за працу», «Спасибо Артём»
- Религиозные и морально-этические высказывания: «Дай ему Бог того чего он заслужил»
- Наблюдается языковое разнообразие: белорусский, русский, украинский, смешанный
Выводы:
- Высокая частота идентичных комментариев однозначно подтверждает применение автоматизированных инструментов
- Дублирующиеся комментарии обслуживают различные цели: от политической активности до продвижения контента
- Некоторые комментарии прямо указывают на свою маркетинговую природу («для прасоўвання ролiка па Ютубе»)
- Использование нескольких языков указывает на стремление охватить различные аудитории
Временной анализ активности ботов
Динамика активности по дням
Визуализация «Bot Activity Over Time» отображает динамику активности ботов на протяжении марта 2025 года.
Ключевые наблюдения:
- Начало периода (1 марта): практически нулевая активность
- Быстрый рост в первые дни марта до уровня ~250-300 комментариев в день
- Относительная стабилизация в середине месяца (300-400 комментариев ежедневно)
- Резкий пик активности 26-27 марта (~840 комментариев в день)
- Последующее снижение к концу месяца
Связь с публикацией видео о Лукашенко:
- Экстремальный пик активности приходится точно на 26 марта 2025 — день публикации видео «Лукашенко умирает на глазах и даже не может сам одеться» каналом БЕЛСАТ Now
- Публикация этого видео вызвала беспрецедентную мобилизацию ботнет-ресурсов
- Повышенный уровень активности сохранялся в течение нескольких дней после публикации видео
Распределение активности по часам и дням недели
Тепловая карта «Bot Activity by Hour and Day» отображает распределение активности ботов по часам и дням недели.
Ключевые наблюдения:
- Наиболее интенсивная активность наблюдается в период с 6 до 10 часов и с 17 до 20 часов по Гринвичу
- Четко прослеживается биполярный характер активности с двумя пиками (утренним и вечерним)
- Ранние утренние часы (0-4) и поздние вечерние (22-23) демонстрируют минимальную активность
- Рабочие дни показывают более стабильный паттерн активности, чем выходные
Анализ привязки к рабочему дню:
- Учитывая, что время указано по Гринвичу (UTC+0), пики активности в 7-8 и 18-19 часов соответствуют 9-11 утра и 20-22 вечера в Восточной Европе (UTC+2/+3)
- Эти пики четко совпадают с началом рабочего дня и вечерним временем после работы
- Паттерны активности убедительно указывают на то, что управление ботнетами осуществляется в соответствии с обычным рабочим графиком в Восточной Европе
Анализ целевых видео
Визуализация «Top 20 Videos Targeted by Bots» демонстрирует видео, привлекшие наибольшее количество комментариев от ботов.
Ключевые наблюдения:
- 17 из 20 наиболее атакуемых видео (85%) содержат фамилию «Лукашенко» в заголовке
- Абсолютный лидер по количеству бот-комментариев (более 350) — видео «Лукашенко умирает на глазах и даже не может сам одеться» от БЕЛСАТ Now
- Выделяются тематические группы заголовков:
- Здоровье и дееспособность: «Лукашенко умирает на глазах…», «Лукашенко в ЯРОСТИ»
- Угроза власти: «Лукашенко осталось три дня», «Лукашенко сломал ВСЕ в Беларуси»
- Коррупция: «Лукашенко получил взятку!»
- Международные отношения: «Лукашенко летит на ковер к Путину»
- Большинство заголовков имеют сенсационный характер с элементами кликбейта
Проверка гипотезы: Данные подтверждают гипотезу о том, что использование фамилии Лукашенко в кликбейтных заголовках не только увеличивает органическую вовлеченность, но и провоцирует масштабные «набеги ботов». Особенно ярко это проявляется для самых провокационных заголовков.
Визуализация «Bot Activity per Video» отображает соотношение между количеством уникальных ботов, комментирующих видео, общим количеством комментариев от ботов и средним числом комментариев на одного бота.
Ключевые наблюдения:
- Большинство видео привлекают относительно небольшое количество ботов (до 25 уникальных ботов)
- Наиболее заметный выброс — видео «Лукашенко умирает на глазах и даже не может сам одеться», которое привлекло 58 уникальных ботов, оставивших 344 комментария
- Выявляются разные стратегии использования ботов:
- Массированная атака — привлечение большого количества ботов к одному видео
- Интенсивная атака — использование небольшого числа ботов, которые оставляют непропорционально большое количество комментариев
- Распределенная активность — умеренное количество комментариев от умеренного количества ботов
Ключевые выводы и рекомендации
Общие выводы
- Масштаб и влияние ботнетов: Исследование выявило значительное присутствие ботнетов в комментариях к видеоконтенту. Несмотря на то, что боты составили менее 1% аккаунтов, они генерировали 11,6% всех комментариев и охватывали почти 40% видео.
- Разнородность ботнетов: Обнаружены различные типы ботнетов с разными стратегиями, целями и уровнями софистикации. Кластеризация выявила как минимум 7 различных групп ботов с уникальными характеристиками.
- Профессиональный характер операций: Временные паттерны активности указывают на то, что за ботнетами стоят организованные структуры, работающие по регулярному рабочему графику, характерному для Восточной Европы.
- Разнонаправленная политическая активность: Анализ содержания комментариев выявил удивительное разнообразие политических нарративов — от пробелорусских и проукраинских до пророссийских. Это указывает на наличие различных операторов ботнетов с разными политическими целями.
- Таргетирование контента: Ботнеты демонстрируют явное предпочтение видео с сенсационными заголовками, содержащими имя Лукашенко, что подтверждает гипотезу о взаимосвязи между кликбейтными заголовками и активностью ботов.
- Координация действий: Наблюдается значительная координация между ботами, особенно в случаях реагирования на важные информационные поводы, такие как публикация видео о состоянии здоровья Лукашенко.
- Эволюция тактик: Обнаружена обратная зависимость между активностью ботов и их «очевидностью» (bot score), что указывает на эволюцию тактик ботов для избежания обнаружения.
Практические рекомендации
- Для платформ и модераторов:
- Внедрить многоуровневую систему обнаружения ботов, учитывающую как поведенческие характеристики, так и сетевые взаимосвязи
- Обратить особое внимание на видео с высокой концентрацией комментариев от подозрительных аккаунтов
- Уделять повышенное внимание аккаунтам с типичными для ботов паттернами наименования
- Отслеживать синхронизированную активность комментирования как признак координированных действий
- Для создателей контента:
- Осознавать, что использование кликбейтных заголовков с упоминанием политических фигур привлекает не только органических пользователей, но и ботов
- Учитывать, что высокие показатели комментирования могут быть результатом ботнет-активности, а не реального интереса аудитории
- Рассмотреть возможность более строгой модерации комментариев под чувствительным политическим контентом
- Для исследователей:
- Применять комплексный подход к обнаружению ботов, сочетающий анализ поведения, контента и сетевых связей
- Учитывать, что политическая направленность комментариев не является надежным индикатором ботнет-активности
- Использовать временной анализ для выявления аномальных всплесков активности, связанных с конкретными информационными поводами
- Для пользователей:
- Критически оценивать комментарии под политическим контентом, особенно под видео с сенсационными заголовками
- Обращать внимание на признаки потенциально автоматизированной активности: однотипные комментарии, шаблонные выражения, нетипичные паттерны активности
Заключение
Проведенное исследование демонстрирует сложность и многогранность проблемы ботнет-активности в комментариях к видеоконтенту. Выявленные паттерны указывают на высокий уровень организации и координации ботнетов, их способность быстро мобилизоваться в ответ на значимые информационные поводы, а также на разнообразие политических целей их операторов.
Результаты исследования подчеркивают необходимость постоянного совершенствования методов обнаружения ботов и противодействия им, учитывая эволюционный характер их тактик и стратегий. Важно продолжать мониторинг и анализ ботнет-активности для лучшего понимания ее влияния на информационное пространство и общественное мнение.