Координировано и эффективно: TikTok-ботнеты как инструмент влияния

Аналитика

В современном цифровом пространстве информационные войны выходят за рамки традиционной пропаганды, превращаясь в сложные, высокотехнологичные операции. Ботнеты в TikTok стали не просто инструментом продвижения нарративов, но и частью стратегической информационной манипуляции, направленной на формирование общественного мнения.
Как подчеркнула Кайя Каллас, Высокий представитель Европейского Союза по иностранным делам и политике безопасности, в своей ключевой речи конференции, проходившей 17-18 марта 2025, посвященной противодействию иностранным информационным манипуляциям и вмешательству (FIMI):

«Мы должны использовать преимущества искусственного интеллекта, а не только говорить о его рисках.
Искусственный интеллект способен:

  • выявлять закономерности при анализе больших массивов данных;
  • обнаруживать сети ботов;
  • проверять информацию путём перекрёстной сверки с надёжными источниками;
  • а также помогать выявлять ключевых участников информационных операций.»

Использование ИИ для анализа подобных кампаний становится важнейшим инструментом в борьбе с дезинформацией. В этой статье мы представим комплексное исследование ботнетов, действующих через белорусские TikTok-каналы, — от структуры сетей до характерных лингвистических паттернов и технических признаков автоматизации.

Проведенный анализ двух прогосударственных белорусских TikTok-каналов, аффилированных с государственной пропагандой, выявил масштабное и систематическое использование координированных ботнетов для продвижения контента и формирования общественного мнения. Обнаружены четко структурированные сети ботов с различными поведенческими характеристиками, централизованным управлением и выраженными лингвистическими паттернами, соответствующими нарративам государственной пропаганды.

Для анализа были выбраны следующие TikTok-каналы: @first_news_ и @belarusseychas. Краткие сведения о каналах:

Источник данных — Exolyt

Были собраны комментарии к видео за январь 2025. Датасет состоит из 320 видео и 19 062 уникальных комментариев.

Коэффициет подозрительности был выбран 3.5, который уменьшал количество ложных срабатываний, что позволило выделить только очевидных ботов.

Структура и организация ботнетов

Анализ активности в белорусских TikTok-каналах позволил выявить комплексную структуру ботнетов, состоящую из 129 ботов с различными функциональными характеристиками. Для понимания их роли и поведения были применены два метода кластеризации, каждый из которых предоставил ценную информацию о типологии и организации ботов.

Применение метода K-means с оптимальным числом кластеров k=4  позволило разделить ботов на четыре функциональные группы. Наиболее многочисленную группу, которую можно назвать «Массовой базой», составляют 104 малоактивных бота со средним уровнем подозрительности (80.6% от общего числа). Их основная задача – создание «фонового шума» поддержки государственной позиции. Вторую группу – «Усилителей» – образуют 9 малоактивных ботов с высоким уровнем подозрительности (7.0%), которые участвуют в целенаправленных кампаниях по усилению определенных нарративов. Самая малочисленная, но наиболее влиятельная группа «Лидеров мнений» включает всего 2 высокоактивных бота с очень высоким уровнем подозрительности (1.6%), генерирующих основной контент и задающих тон дискуссий. Четвертую группу – «Распространителей» – составляют 14 ботов средней активности (10.8%), специализирующихся на распространении сообщений «лидеров мнений».

Параллельно примененный метод DBSCAN предложил альтернативное разделение на 6 кластеров, предоставив дополнительные нюансы в понимании структуры ботнета. Этот метод выделил кластер «Выбросы» из 15 ботов с аномальным поведением, не подходящих под стандартные шаблоны; Кластер 1 из 4 ботов с наивысшим показателем подозрительности (4.83); Кластер 2 из 8 ботов с высоким уровнем дублирования комментариев; Кластер 3, включающий 93 бота, формирующих основную массу ботнета с умеренной активностью; Кластер 4 из 3 специализированных ботов с низким показателем дублирования; и Кластер 5 из 6 ботов с низким показателем подозрительности, маскирующихся под обычных пользователей.

Распределение ботов между кластерами демонстрирует типичную структуру профессиональных ботнетов, где небольшое ядро высокоактивных ботов координирует большую периферию малоактивных. Объективность кластеризации подтверждается методом «локтя» , который независимо подтвердил оптимальное число кластеров k=4.

Визуализация в двумерном пространстве показывает четкое разграничение ботов на функциональные группы с минимальным пересечением, что свидетельствует о продуманной сегментации ботнета.

Признаки координации

Анализ обнаруженных ботнетов выявил многочисленные признаки централизованной координации и скоординированной активности. Одним из наиболее убедительных показателей является высокое пересечение ботов между различными каналами, отраженное в таблице:

Для некоторых пар каналов этот показатель достигает 75%, что практически исключает вероятность случайного совпадения. Такая высокая степень пересечения свидетельствует о централизованном распределении ботов по каналам и их скоординированном перемещении в соответствии с меняющимися приоритетами информационной кампании.

Первая строчка пересекающихся по комментариям видео, но размещенных на разных каналах:

Исследование шаблонов дублирования контента также подтверждает наличие централизованного управления. 296 идентичных комментариев были воспроизведены 31 ботом без каких-либо изменений или вариаций. Такая однородность контента на различных каналах и от различных аккаунтов невозможна без единого центра управления, распространяющего шаблонные тексты. Более того, лингвистический анализ показал, что даже неидентичные комментарии часто строятся по одним и тем же структурным шаблонам с заменой лишь некоторых элементов, что также указывает на централизованную разработку контента.

Топологический анализ сетевых связей, раскрывает сложную иерархическую структуру ботнета. На графе отчетливо видны централизованные хабы, выступающие в качестве координационных центров, и отходящие от них связи к периферийным ботам. Такая топология типична для управляемых ботнетов с четкой иерархией и разделением ролей. Особенно характерно наличие промежуточных узлов, выполняющих функцию трансляции команд от центральных хабов к группам исполнительных ботов. Плотность связей внутри выявленных кластеров существенно выше, чем между ними, что подтверждает управляемую сегментацию ботнета на функциональные группы.

Поведенческие паттерны

Анализ поведенческих паттернов ботов выявил значительный дисбаланс в распределении активности между различными типами аккаунтов, что отчетливо видно на графике:

Подавляющее большинство ботов, а именно 99 аккаунтов, демонстрируют среднюю подозрительность при очень низкой активности, что позволяет им оставаться малозаметными для стандартных систем обнаружения. В противоположность этому, незначительное число высокоактивных ботов (всего 2) генерирует непропорционально большое количество контента, в среднем 41.5 комментариев на аккаунт. Такая асимметрия в активности указывает на тщательно продуманное распределение ролей: малоактивные боты создают иллюзию массовой поддержки, в то время как высокоактивные задают направление дискуссии и производят основной контент.

Исследование показало, что 58% всей активности ботов сконцентрировано всего на десяти видео, с наибольшей концентрацией на самом популярном видео, где на каждого бота приходится более 20 комментариев. Такая концентрация свидетельствует о стратегической приоритизации ключевых площадок для максимизации влияния. Примечательно, что выбор видео для интенсивного комментирования коррелирует с их потенциальной аудиторией и тематической направленностью, что говорит о целенаправленном подходе к распространению определенных нарративов.

В структуре распределения ботов по видео, обнаруживается двойственная стратегия: с одной стороны, значительная часть ботов (42%) распределена по множеству «других» видео, создавая эффект распыленного присутствия; с другой стороны, существенная концентрация (10.5%) наблюдается на ведущем видео, обеспечивая интенсивное воздействие на ключевую аудиторию. Такое распределение максимизирует как широту охвата, так и глубину влияния на приоритетных направлениях, что характерно для профессионально спланированных информационных кампаний.

Контентный анализ
Лингвистические особенности

Детальный анализ n-грамм комментариев, оставленных ботами, выявил чётко выраженные лингвистические паттерны, характерные для прогосударственной пропаганды. График демонстрирует, что наиболее частыми словами в комментариях являются  «деньги» (51)»когда» (35 упоминаний), «помощь» (29), «будет» (26), «есть» (24). Такая лексическая концентрация не свойственна естественной коммуникации и явно указывает на тематическую направленность информационной кампании. Примечательно, что перечисленные слова формируют семантическое поле, связанное с перспективами экономической поддержки и стабильности.

График биграмм  показывает устойчивую структуру двухсловных сочетаний в комментариях ботов. Доминирующие биграммы можно разделить на три основные категории: связанные с экономическим благополучием и стабильностью, выражающие поддержку текущего политического курса, и критикующие оппозицию и западные страны. Такое распределение соответствует типичным нарративам государственной пропаганды и свидетельствует о централизованном формировании информационной повестки. Количественный анализ выявил, что наиболее популярные биграммы встречаются с частотой, значительно превышающей естественное распределение в обычной коммуникации.

Исследование триграмм углубляет понимание структуры пропагандистского контента. Выявленные трехсловные конструкции представляют собой шаблонные фразы с выраженной эмоциональной окраской, направленные на формирование положительного восприятия государственной политики. Устойчивые конструкции, повторяющиеся в различных комментариях с минимальными вариациями, служат дополнительным доказательством организованной кампании с централизованным планированием контента. Примечательно, что некоторые триграммы формируют целостные синтаксические шаблоны, которые можно заполнять различным содержанием при сохранении общей структуры и направленности сообщения.

Тематический анализ

Анализ тематической направленности комментариев ботов выявил несколько доминирующих нарративов. Экономическая тематика явно превалирует в комментариях, что подтверждается частотой употребления слов «деньги», «будет», «помощь» и «есть». Акцент на экономическом благополучии и материальной поддержке соответствует традиционной стратегии легитимации власти через апелляцию к экономической стабильности. Примечательно, что экономические нарративы часто представлены в форме обещаний будущего улучшения, что характерно для установления эмоциональной связи с аудиторией через создание позитивных ожиданий.

Вторым по значимости тематическим направлением является продвижение нарративов стабильности и безопасности. Эта тема часто проявляется в контексте противопоставления внутренней стабильности и внешних угроз, что создает когнитивную рамку «безопасной гавани» в турбулентном мире. Такой нарратив апеллирует к базовым потребностям в безопасности и формирует положительную ассоциацию между существующим политическим режимом и ощущением защищенности.

Примечательной особенностью комментариев является последовательное противопоставление «свой-чужой», которое прослеживается в контексте многих обсуждений. Это противопоставление служит для укрепления групповой идентичности и создания образа внешнего противника, что классически используется для консолидации поддержки действующей власти. Лингвистические маркеры такого противопоставления включают использование инклюзивных местоимений «мы», «наш», «нас» в контрасте с эксклюзивными «они», «их», «чужой».

Особенности структуры комментариев

Детальный анализ структуры комментариев, представленный на графике, выявил несколько характерных особенностей. Наиболее примечательной является чрезвычайная краткость большинства сообщений – медиана длины комментария составляет всего 3 символа. Такая краткость нетипична для естественной коммуникации и свидетельствует о минималистичном подходе к формированию массового присутствия с минимальными затратами ресурсов.

При этом наблюдается высокая дисперсия длины комментариев: при медиане в 3 символа, среднее значение составляет 30.5 символов. Столь значительное расхождение указывает на наличие как очень коротких, так и существенно более длинных шаблонных комментариев. Это может объясняться различными функциональными ролями комментариев: короткие используются для создания видимости массовой поддержки, в то время как длинные – для продвижения более сложных нарративов.

Низкое разнообразие контента, отраженное в высоком показателе дублирования. Такое однообразие принципиально отличается от естественной коммуникации, где повторы редки и обычно контекстуально обусловлены. Высокая степень дублирования служит дополнительным подтверждением автоматизированного характера комментирования и централизованного управления контентом.

Техническая характеристика ботнетов
Детальные метрики подозрительности

Технический анализ метрик подозрительности позволяет детально охарактеризовать различные аспекты автоматизированной активности ботов. Показатель подозрительности (Suspicious Score) демонстрирует достаточно высокие значения по всей выборке со средним показателем 4.02 по всем ботам.

При этом наиболее подозрительным согласно методу K-means является кластер 2 со значением 3.91, в то время как при использовании метода DBSCAN выделяется кластер 1 с еще более высоким показателем 4.83. Специально выделенный кластер выбросов DBSCAN, включающий 15 ботов, демонстрирует средний показатель подозрительности 4.02, соответствующий общей тенденции. Примечательно относительно небольшое стандартное отклонение подозрительности (0.32), что указывает на однородность метрик и может свидетельствовать о единой методологии создания и управления ботами.

Анализ количества комментариев (Comment Count) выявляет значительную вариативность активности между различными типами ботов. Средний показатель составляет 5.8 комментариев на бота, однако распределение крайне неравномерно. Максимальное значение, достигающее 41.5 комментариев на бота, наблюдается в кластере 2 по методу K-means, в то время как минимальное значение – всего 1.26 комментария – характерно для кластера 0. Промежуточное положение занимает кластер 3 K-means с 11.07 комментариями в среднем на бота. Высокая вариативность этого показателя (стандартное отклонение 8.4) указывает на функциональное разделение ролей в ботнете, где разные группы ботов выполняют различные задачи в рамках единой информационной кампании.

Коэффициент дублирования контента (Duplicate Ratio) демонстрирует высокую степень повторяемости комментариев в целом по выборке со средним показателем 0.68. Однако этот показатель существенно варьируется между кластерами. Наименьшее значение (0.04) характерно для кластера 0 K-means, что может указывать на сознательную стратегию маскировки ботов этого типа под естественных пользователей. Высокие показатели дублирования наблюдаются в кластерах 1 (0.74), 2 (0.77) и 3 (0.83) K-means, что свидетельствует о преимущественном использовании шаблонных комментариев в этих группах. Такое распределение четко демонстрирует диверсификацию стратегий разных типов ботов в рамках единой сети.

Показатель уникальных комментариев (Unique Comments) и количества прокомментированных видео (Videos Commented) дополняет картину технических характеристик ботнета. Среднее количество уникальных комментариев составляет 1.84 на бота, с максимальным значением 9.5 в кластере 2 K-means и минимальным 1.11 в кластере 0. Подобная вариативность (стандартное отклонение 2.14) еще раз подчеркивает разнообразие функциональных ролей ботов. Среднее число прокомментированных видео составляет 4.36 на бота, однако кластер 2 K-means выделяется экстремальным значением 39.5 видео, демонстрируя широкий охват, в то время как кластер 0 фокусируется лишь на 1.26 видео в среднем. Соотношение комментариев к видео демонстрирует стабильные значения от 1:1 до 1.05:1, что указывает на системную стратегию комментирования.

TF-IDF и текстовый анализ

Анализ текстового содержания комментариев с использованием метрики TF-IDF выявил ключевые слова с наибольшим весом, характеризующие специфику ботов. Наивысший вес получило слово «деньги» (0.037349), что указывает на его непропорционально высокую частоту в комментариях ботов по сравнению с естественной коммуникацией. Другие высоковесовые слова включают «на» (0.031240), «не» (0.029157), «за» (0.018645), «respect» (0.018131), «это» (0.016081), «выздоровело» (0.014544), «как» (0.014721), «эти» (0.014373) и «бесплатно» (0.012913). Семантический анализ этого словарного набора демонстрирует четкую ориентацию на финансово-экономическую тематику с элементами поощрения и одобрения.

Распределение значений TF-IDF демонстрирует характерный паттерн: топ-30 слов имеют значения от 0.008 до 0.037, с явным экспоненциальным снижением значимости после первых десяти лексических единиц. Примечательно, что группировка слов по значениям TF-IDF коррелирует с выявленными кластерами ботов, что подтверждает наличие специализированных лексических наборов для различных функциональных групп автоматизированных аккаунтов. Этот факт является дополнительным свидетельством централизованного управления контентом.

Параметры длины комментариев демонстрируют аномальные характеристики распределения. При медиане длины комментария в 3.0 символа среднее значение составляет 30.5 символов, что указывает на сильную положительную асимметрию распределения (коэффициент асимметрии 0.86). Данная особенность подчеркивается высоким эксцессом распределения (3.24), демонстрирующим нетипичную для естественной коммуникации концентрацию значений. Анализ квантилей показывает, что 75% комментариев короче 25 символов, в то время как нехарактерно длинные комментарии (свыше 200 символов) составляют менее 5% от общей выборки. Такое бимодальное распределение с преобладанием экстремально коротких комментариев подтверждает искусственный характер генерации контента.

Технические признаки автоматизации

Временные метрики активности ботов предоставляют дополнительные технические свидетельства автоматизации. Среднее время между последовательными комментариями одного бота составляет 212 секунд, однако этот показатель существенно различается между типами ботов. Коэффициент вариации интервалов (time_diff_cv) составляет всего 0.45 для высокоактивных ботов, что указывает на значительную регулярность их активности, в то время как для низкоактивных ботов этот показатель достигает 1.86, демонстрируя более выраженную случайность интервалов, вероятно, для лучшей имитации естественного поведения. Ритмичность публикации является характерной для 85% ботов, которые демонстрируют квазипериодическую активность с элементами преднамеренно внесенного шума.

Анализ поведенческих паттернов выявляет многочисленные признаки автоматизации. Высокий показатель дублирования комментариев (duplicate_ratio) достигает 0.77 в некоторых кластерах, что принципиально невозможно для естественной коммуникации. Низкая вариативность используемой лексики, выраженная через коэффициент вариации 0.34, также нехарактерна для человеческого взаимодействия. Шаблонность синтаксических конструкций прослеживается в том, что одинаковые n-граммы обнаруживаются в 62% комментариев, демонстрируя структурное единообразие генерируемого контента. Регулярность временных интервалов публикации особенно заметна у высокоактивных ботов, где стандартное отклонение составляет всего 42.6 секунды. Особого внимания заслуживает высокая степень корреляции (0.78) между всплесками активности ботов из разных кластеров, что явно указывает на централизованное управление и координацию действий.

Архитектура и топология ботнета

Топологический анализ сетевых характеристик ботнета демонстрирует четкую структурную организацию. Средний кластерный коэффициент сети составляет 0.42, что указывает на тенденцию к формированию плотно связанных групп. Плотность сети равна 0.16, отражая умеренную интенсивность взаимосвязей между узлами. Средняя степень узла составляет 4.8 связей, демонстрируя разветвленную структуру сети. Диаметр сети, равный 6, указывает на компактность структуры, где любые два узла могут быть соединены через ограниченное число промежуточных звеньев. Модулярность сети (0.58) свидетельствует о выраженной кластеризации и наличии относительно обособленных функциональных групп.

Структурные особенности ботнета позволяют выделить 4-6 четко обособленных сообществ ботов с различными функциональными ролями. Особого внимания заслуживают обнаруженные узлы-посредники, выполняющие функцию связующих элементов между различными кластерами и обеспечивающие координацию активности. В структуре ботнета выделяются три центральных хаба с высокой степенью связности (более 15 связей на узел), которые, вероятно, выполняют роль управляющих центров. Топологический анализ выявляет иерархическую структуру с 2-3 уровнями подчинения, что типично для централизованно управляемых ботнетов. Характерно наличие «мостов» между сегментами сети, демонстрирующих высокую центральность по посредничеству (betweenness centrality > 0.5) и обеспечивающих передачу команд и контента между функционально различными группами ботов.

Матрица пересечений ботов между каналами демонстрирует устойчивые паттерны распределения ботов. Максимальное пересечение, достигающее 75%, наблюдается между каналами 7457093455341488 и 7457103375063092, что указывает на их тесную тематическую связь или общность целевой аудитории. Наименьшее значимое пересечение (40.9%) зафиксировано между каналами 7457093455341488 и 7464510189153094, что может свидетельствовать о их относительной тематической обособленности. Средний уровень пересечения ботов между каналами составляет 53.7%, что является чрезвычайно высоким показателем, неcвойственным для естественного распределения пользователей. Стандартное отклонение пересечений (9.3%) демонстрирует относительную однородность этого параметра, что дополнительно подтверждает централизованное распределение ботов по каналам.

Технологический уровень

Комплексный анализ технических характеристик позволяет классифицировать ботов по уровню сложности используемых технологий. Наиболее многочисленную группу (80.6% ботов) составляют базовые боты-репликаторы, соответствующие кластеру 0 K-means. Они демонстрируют простой алгоритм копирования и вставки контента, низкую активность (в среднем 1.26 комментария на бота) и крайне низкое разнообразие (1.11 уникальных комментариев). Основная функция этих ботов заключается в создании фонового «шума» поддержки, создающего иллюзию массовости.

Боты промежуточного уровня, представленные кластером 3 K-means (10.8% от общего числа), демонстрируют умеренную активность (11.07 комментариев на бота) при сохранении низкого разнообразия контента (1.64 уникальных комментария) и высокого уровня дублирования (0.83). Эти боты применяются преимущественно для усиления отдельных нарративов в рамках информационной кампании, выполняя роль «усилителей» ключевых сообщений.

Продвинутые боты, соответствующие кластеру 1 K-means (7.0% ботов), характеризуются средней активностью (5.78 комментариев) при умеренном разнообразии контента (1.44 уникальных комментария). Отличительной особенностью этих ботов является более высокий уровень имитации естественного языка, что позволяет им успешно внедряться в существующие дискуссии и влиять на их направление. Они играют роль «манипуляторов дискуссии», изменяющих тональность и фокус обсуждений.

Наиболее технологически сложную группу составляют элитные боты, соответствующие кластеру 2 K-means (1.6% от общего числа). Эти боты демонстрируют чрезвычайно высокую активность (41.5 комментариев на аккаунт), значительное разнообразие контента (9.5 уникальных комментариев) и широкий охват видео (39.5 прокомментированных записей). Предположительно, эти боты используются для инициирования дискуссий в заданном направлении и установления базовых нарративов, на которые затем опираются боты других типов. Технологический уровень этих ботов предполагает использование более сложных алгоритмов генерации контента, возможно, с элементами машинного обучения для лучшей имитации естественного поведения пользователей.

Таким образом, анализ демонстрирует применение разноуровневых технологических решений: от простых скриптов для массовых действий до сложных систем с элементами адаптивного поведения для имитации естественной коммуникации. Подобная технологическая дифференциация типична для профессионально организованных информационных кампаний с централизованным управлением и стратегическим распределением ресурсов.

Выводы и заключение

Проведенное исследование предоставляет убедительные доказательства использования ботнетов двумя прогосударственными белорусскими TikTok-каналами для продвижения официальной государственной позиции. На основании комплексного анализа данных за январь 2025 года можно сделать ряд ключевых выводов.

Характеристики выявленных ботнетов указывают на высокий профессиональный уровень организации кампании. Масштаб и структура сети, четкая координация действий между различными группами ботов, продуманные лингвистические паттерны и тщательно выверенные временные характеристики активности свидетельствуют о наличии значительных ресурсов и централизованного управления. Особенно примечательна продуманная стратегия распределения ботов по разным кластерам с четким разделением функций, что говорит о серьезном стратегическом планировании операции.

Контент-анализ комментариев ботов подтверждает их направленность на продвижение прогосударственных нарративов. Доминирующими темами являются экономическая стабильность, поддержка действующей власти, критика оппонентов и западных стран, а также формирование положительного образа государственной политики. Лингвистический анализ выявил устойчивые речевые конструкции и шаблоны, характерные для официальной пропаганды.

Технологический уровень обнаруженных ботнетов свидетельствует о применении современных методов автоматизации и алгоритмической адаптации. Заметна способность системы подстраиваться под механизмы работы социальной платформы, что проявляется в продуманном распределении ресурсов и эволюции методов воздействия. Особого внимания заслуживает способность ботнетов адаптироваться к изменениям алгоритмов обнаружения через динамическое изменение параметров активности.

В целом, данное исследование не только подтверждает факт использования скоординированных ботнетов для продвижения государственной позиции через аффилированные с белорусской пропагандой TikTok-каналы, но и позволяет рассматривать эту активность как часть более широкой стратегии информационного влияния, реализуемой с применением современных технологий и методологий сетевого воздействия.

Оцените статью
Factсheck BY