Як боты ўплываюць на дыскусіі: даследаванне каментарыяў YouTube у сакавіку 2025 года

Маніторынгі

Менш чым 1% акаўнтаў, але амаль 12% каментароў: маштаб ботнетаў у палітычным YouTube. 39% відэа атакаваны ботнетамі.


У рамках дадзенага даследавання быў праведзены комплексны аналіз каментароў да відэакантэнту для выяўлення каардынаванай актыўнасці ботнетаў. Даследаванне ўключала распрацоўку і прымяненне метадалогіі выяўлення ботаў, аналіз іх паводзінных характарыстык, сеткавых узаемасувязяў, зместу каментароў і часавых патэрнаў актыўнасці.
Даследаванне было накіравана на разуменне маштабаў, стратэгій і мэтаў ботнет-актыўнасці ў кантэксце каментавання відэакантэнту.

Метадалогія выяўлення ботнетаў

Тэарэтычная аснова

Выяўленне ботнетаў у каментарах заснавана на камбінацыі некалькіх метадаў аналізу:

  1. Узважаная ацэнка прыкмет (Feature-based scoring) – асноўны метад, які выкарыстоўвае набор прыкмет паводзін з адпаведнымі вагамі
  2. Выяўленне анамалій (Anomaly detection) – для выяўлення адхіленняў ад нармальных паводзін карыстальнікаў
  3. Кластэрызацыя (Clustering) – для групоўкі ботаў па падобных паводзінных патэрнах
  4. Сеткавы аналіз (Network analysis) – для выяўлення сувязяў паміж ботамі праз каментаваныя відэа

Матэматычная мадэль вызначэння ботаў
Аб’ём і склад прааналізаваных дадзеных

У рамках даследавання быў праведзены аналіз каментароў да відэакантэнту, сабраных у сакавіку 2025 года. Зыходныя дадзеныя мелі наступныя характарыстыкі:

  • 2148 відэа
  • 111 каналаў
  • 94532 каментароў

Вынікі выяўлення ботаў

Прымяненне апісанай метадалогіі дазволіла выявіць 599 ботаў, на долю якіх прыпала амаль 11000 каментароў, пакінутых да 833 відэа. Такім чынам, нягледзячы на тое, што боты склалі адносна невялікую долю ад агульнай колькасці акаўнтаў (менш за 1%), яны генеравалі каля 11,6% усіх каментароў і ахоплівалі 38,8% аналізуемых відэа.

У ходзе аналізу было выяўлена, што некаторыя акаўнты, якія належаць уладальнікам каналаў, дэманструюць паводзінныя патэрны, падобныя на боты. Гэтыя акаўнты часта генеруюць аднатыпныя каментары, што прыводзіць да ілжывадатных спрацоўванняў алгарытму выяўлення ботаў.

На аснове ручной праверкі мы выключылі з ліку ботаў некалькі актыўных акаўнтаў:

  • @ZERKALOIO
  • @zroblenaupolscy
  • @BalaganOFF
  • @viachaslau_sikora

Аналіз характарыстык выяўленых ботаў

Размеркаванне ботаў па bot score

Візуалізацыя “Top 30 Bots by Bot Score” адлюстроўвае 30 акаўнтаў з найвышэйшымі значэннямі bot score (ацэнкі верагоднасці таго, што акаўнт з’яўляецца ботам).
Ключавыя назіранні:
Усе 30 топавых ботаў маюць высокія значэнні bot score, прыкладна ад 0.8 да 1.0
Назіраецца градацыя колеравай інтэнсіўнасці палос, якая адлюстроўвае значэнні bot score
Тры акаўнты з найвышэйшымі паказчыкамі: @JosefOh-i8x, @Blog_Blog2, @ВячеславРязанов-63р
У імёнах многіх акаўнтаў прасочваюцца характэрныя патэрны, тыповыя для ботаў:

  • Камбінацыя кірылічных імёнаў з лічба-літарнымі суфіксамі
  • Лацінскія імёны з лічбавымі суфіксамі
  • Спалучэнне імя-прозвішча з лічбавымі/літарнымі кодамі

Назіраемыя патэрны ў назвах акаўнтаў пацвярджаюць эфектыўнасць метадалогіі, бо такія шаблонныя назвы часта выкарыстоўваюцца пры аўтаматычнай генерацыі ўліковых запісаў.

Размеркаванне ботаў па колькасці каментароў

Візуалізацыя “Top 30 Bots by Comment Count” адлюстроўвае 30 ботаў з найбольшай колькасцю пакінутых каментароў.

Ключавыя назіранні:

  • Значны разброс у колькасці каментароў — ад прыкладна 75 у найменш актыўных ботаў з топ-30 да больш за 550 у самых актыўных
  • Два боты значна апярэджваюць астатніх па ліку каментароў: @Александр-д7n1ч (~550) і @Dushman-z4f (~530)
  • Назіраецца рэзкае зніжэнне актыўнасці пасля трэцяга бота (@irishaphill7794)
  • Можна вылучыць некалькі ўзроўняў актыўнасці сярод ботаў: звышактыўныя (>500), высокаактыўныя (300-500), сярэднеактыўныя (200-300), малаактыўныя (100-200)

Параўнальны аналіз з размеркаваннем па bot score:

  • Спісы “Top 30 Bots by Bot Score” і “Top 30 Bots by Comment Count” утрымліваюць розныя акаўнты
  • Гэта ўказвае на тое, што найбольш падазроныя па паводзінных прыкметах боты не абавязкова з’яўляюцца найбольш актыўнымі
  • Адсутнасць перасячэнняў паміж топ-ботамі па score і па колькасці каментароў указвае на разнастайнасць ботнетаў і іх стратэгій

Кластэрызацыя ботаў

Візуалізацыя “Bot Clusters by Comment Count and Bot Score” дэманструе размеркаванне ботаў па двух ключавых параметрах (колькасць каментароў і bot score) з групоўкай па кластарах.

Ключавыя назіранні:

  • Большасць выяўленых ботаў сканцэнтравана ў левай частцы графіка (менш за 100 каментароў)
  • Bot score вар’іруецца ад 0.4 да 1.0, з вялікай канцэнтрацыяй у дыяпазоне 0.5-0.7
  • Назіраецца адмоўная карэляцыя паміж колькасцю каментароў і bot score
  • Вылучаюцца розныя кластары ботаў з рознымі характарыстыкамі
  • Найбольш актыўныя боты (300-550 каментароў) класіфікаваны як “шумавыя кропкі” і маюць умераныя значэнні bot score (0.4-0.6)

Інтэрпрэтацыя:

  • Графік дэманструе адваротную залежнасць паміж актыўнасцю і “відавочнасцю” бота
  • Розныя кластары ўяўляюць розныя ботнеты з рознымі стратэгіямі і мэтамі
  • Боты з высокімі паказчыкамі bot score выкарыстоўваюць больш прымітыўныя тактыкі, у той час як боты з высокай актыўнасцю, але больш нізкімі bot score, выкарыстоўваюць больш прасунутыя метады імітацыі чалавечых паводзін

Аналіз сеткавых узаемасувязяў ботаў

Сеткавы граф візуалізуе сувязі паміж выяўленымі ботамі, дзе вузлы ўяўляюць асобных ботаў, а рэбры паказваюць сувязі праз агульныя відэа, якія яны каментавалі.

Ключавыя назіранні:

  • Сетка дэманструе складаную, неаднародную структуру з некалькімі яскрава выражанымі кластарамі
  • Прысутнічае цэнтральны шчыльны кластар з вялікай колькасцю ўзаемасувязяў
  • Бачны некалькі перыферыйных, больш разрэджаных кластараў, злучаных з цэнтральным
  • У цэнтры графа знаходзяцца вузлы самага вялікага памеру — ключавыя боты з мноствам сувязяў
  • Боты з высокім bot score (чырвоныя вузлы) адносна раўнамерна размеркаваны па ўсім графе

Высновы:

  • Сеткавы граф пераканаўча дэманструе існаванне каардынаваных груп ботаў (ботнетаў)
  • Шчыльнасць сувязяў указвае на тое, што многія боты каментуюць адны і тыя ж відэа
  • Цэнтральны кластар уяўляе найбольш буйны і актыўны ботнет
  • Перыферыйныя кластары могуць уяўляць асобныя ботнеты з больш вузкай спецыялізацыяй
  • Маштаб і складанасць сеткі ўказваюць на высокі ўзровень арганізацыі і каардынацыі

Аналіз зместу каментароў ботаў

Аналіз найбольш частых n-грам

Візуалізацыя “Top 3-grams in Bot Comments” адлюстроўвае частотны аналіз трыграм (паслядоўнасцяў з трох слоў) у каментарах ботаў.

Ключавыя назіранні:

  • Дзве трыграмы значна перавышаюць астатнія па частаце выкарыстання: “жыве беларусь слава” і “беларусь слава украiне”
  • Вылучаюцца тэматычныя кластары трыграм:
    • Палітычныя лозунгі: “жыве беларусь слава”, “беларусь слава украiне”
    • Крыптавалютныя спам-паведамленні
    • Маркетынгавыя: “шоу обычное утро”, “поддержку шоу обычное”
    • Узгадванні этнічных груп: “угорцы фiны албанцы”
    • Звязаныя з фразай “пауля/паўля”: “пауля севярняща верым”
  • Здзіўляльнай асаблівасцю з’яўляецца прысутнасць дэмакратычных і апазіцыйных беларускіх слоганаў, што не адпавядае звычайнай расійскай прапагандзе

Інтэрпрэтацыя:

  • Прысутнасць дэмакратычных і праўкраінскіх лозунгаў можа тлумачыцца:
    • Стратэгіяй маскіроўкі ботаў
    • Мэтай штучнага ўзмацнення палярызацыі дыскусіі
    • Дыскрэдытацыяй апазіцыі праз неадпаведнае выкарыстанне лозунгаў
    • Наяўнасцю розных аператараў ботнетаў з супрацьлеглымі палітычнымі мэтамі

Воблака слоў

Воблака слоў візуалізуе частату ўжывання асобных слоў у каментарах ботаў.

Ключавыя назіранні:

  • Найбуйнейшыя словы: “беларуси”, “жыве”, “беларусь”, “лукашенко”, “дзякуй”, “вялiкi”, “россия/россии”, “украiне/украине”, “слава”
  • Назіраецца палярызацыя палітычных наратываў: адначасова прысутнічаюць прадэмакратычныя беларускія і ўкраінскія лозунгі, а таксама тэрміны, якія могуць выкарыстоўвацца ў прарасійскай рыторыцы
  • Заўважна выкарыстанне некалькіх моў: рускай, беларускай, украінскай
  • Прысутнічаюць спасылкі на гістарычную ідэнтычнасць (ВКЛ, лiтвiны)

Высновы:

  • Воблака слоў дэманструе крайнюю неаднароднасць палітычнай накіраванасці кантэнту, які ствараецца ботамі
  • Выяўленыя боты, хутчэй за ўсё, кантралююцца рознымі аператарамі з рознанакіраванымі мэтамі
  • Палітычная накіраванасць кантэнту не павінна быць фактарам пры класіфікацыі акаўнтаў як ботаў

Аналіз дубліруючыхся каментароў

Візуалізацыя “Top Duplicate Comments” адлюстроўвае найбольш часта паўтаральныя каментары, пакінутыя ботамі.

Ключавыя назіранні:

  • Найбольш распаўсюджаныя дублікаты: “Дзякуй за працу” (~49), “ЖЫВЕ БЕЛАРУСЬ” (~43), “Каментар для прасоўвання ролiка па Ютубе павiнен з…” (~40)
  • Вылучаюцца тэматычныя катэгорыі паўтаральных каментароў:
    • Палітычныя і патрыятычныя лозунгі: “ЖЫВЕ БЕЛАРУСЬ”, “Slava Ukraini Živie Belarus”
    • Маркетынгавыя і прасоўванкавыя: “Каментар для прасоўвання ролiка па Ютубе павiнен з…”
    • Падзякі і прывітанні: “Дзякуй за працу”, “Спасибо Артём”
    • Рэлігійныя і маральна-этычныя выказванні: “Дай ему Бог того чего он заслужил”
  • Назіраецца моўная разнастайнасць: беларуская, руская, украінская, змешаная

Высновы:

  • Высокая частата ідэнтычных каментароў адназначна пацвярджае прымяненне аўтаматызаваных інструментаў
  • Дубліруючыяся каментары абслугоўваюць розныя мэты: ад палітычнай актыўнасці да прасоўвання кантэнту
  • Некаторыя каментары прама ўказваюць на сваю маркетынгавую прыроду (“для прасоўвання ролiка па Ютубе”)
  • Выкарыстанне некалькіх моў указвае на імкненне ахапіць розныя аўдыторыі

Часавы аналіз актыўнасці ботаў
Дынаміка актыўнасці па днях

Візуалізацыя “Bot Activity Over Time” адлюстроўвае дынаміку актыўнасці ботаў на працягу сакавіка 2025 года.

Ключавыя назіранні:

  • Пачатак перыяду (1 сакавіка): практычна нулявая актыўнасць
  • Хуткі рост у першыя дні сакавіка да ўзроўню ~250-300 каментароў у дзень
  • Адносная стабілізацыя ў сярэдзіне месяца (300-400 каментароў штодня)
  • Рэзкі пік актыўнасці 26-27 сакавіка (~840 каментароў у дзень)
  • Наступнае зніжэнне да канца месяца

Сувязь з публікацыяй відэа пра Лукашэнку:

  • Экстрэмальны пік актыўнасці прыходзіцца дакладна на 26 сакавіка 2025 — дзень публікацыі відэа “Лукашэнка памірае на вачах і нават не можа сам апрануцца” каналам БЕЛСАТ Now
  • Публікацыя гэтага відэа выклікала беспрэцэдэнтную мабілізацыю ботнет-рэсурсаў
  • Павышаны ўзровень актыўнасці захоўваўся на працягу некалькіх дзён пасля публікацыі відэа

Размеркаванне актыўнасці па гадзінах і днях тыдня

Цеплавая карта “Bot Activity by Hour and Day” адлюстроўвае размеркаванне актыўнасці ботаў па гадзінах і днях тыдня.

Ключавыя назіранні:

  • Найбольш інтэнсіўная актыўнасць назіраецца ў перыяд з 6 да 10 гадзін і з 17 да 20 гадзін па Грынвічу
  • Выразна прасочваецца біпалярны характар актыўнасці з двума пікамі (ранішнім і вячэрнім)
  • Раннія ранішнія гадзіны (0-4) і позні вечар (22-23) дэманструюць мінімальную актыўнасць
  • Працоўныя дні паказваюць больш стабільны патэрн актыўнасці, чым выходныя

Аналіз прывязкі да працоўнага дня:

  • Улічваючы, што час пазначаны па Грынвічу (UTC+0), пікі актыўнасці ў 7-8 і 18-19 гадзін адпавядаюць 9-11 раніцы і 20-22 вечара ва Усходняй Еўропе (UTC+2/+3)
  • Гэтыя пікі выразна супадаюць з пачаткам працоўнага дня і вячэрнім часам пасля працы
  • Патэрны актыўнасці пераканаўча ўказваюць на тое, што кіраванне ботнетамі ажыццяўляецца ў адпаведнасці з звычайным працоўным графікам ва Усходняй Еўропе

Аналіз мэтавых відэа

Візуалізацыя “Top 20 Videos Targeted by Bots” дэманструе відэа, якія прыцягнулі найбольшую колькасць каментароў ад ботаў.

Ключавыя назіранні:

  • 17 з 20 найбольш атакаваных відэа (85%) утрымліваюць прозвішча “Лукашэнка” ў загалоўку
  • Абсалютны лідар па колькасці бот-каментароў (больш за 350) – відэа “Лукашэнка памірае на вачах і нават не можа сам апрануцца” ад БЕЛСАТ Now
  • Вылучаюцца тэматычныя групы загалоўкаў:
    • Здароўе і дзеяздольнасць: “Лукашэнка памірае на вачах…”, “Лукашэнка ў ЛЮТАСЦІ”
    • Пагроза ўладзе: “Лукашэнку засталося тры дні”, “Лукашэнка зламаў УСЁ ў Беларусі”
    • Карупцыя: “Лукашэнка атрымаў хабар!”
    • Міжнародныя адносіны: “Лукашэнка ляціць на дыван да Пуціна”
  • Большасць загалоўкаў маюць сенсацыйны характар з элементамі клікбэйту

Праверка гіпотэзы: Дадзеныя пацвярджаюць гіпотэзу аб тым, што выкарыстанне прозвішча Лукашэнкі ў клікбэйтных загалоўках не толькі павялічвае арганічную ўцягнутасць, але і правакуе маштабныя “набегі ботаў”. Асабліва яскрава гэта праяўляецца для самых правакацыйных загалоўкаў.

Візуалізацыя “Bot Activity per Video” адлюстроўвае суадносіны паміж колькасцю унікальных ботаў, якія каментуюць відэа, агульнай колькасцю каментароў ад ботаў і сярэднім лікам каментароў на аднаго бота.

Ключавыя назіранні:

  • Большасць відэа прыцягваюць адносна невялікую колькасць ботаў (да 25 унікальных ботаў)
  • Найбольш заўважны выкід – відэа “Лукашэнка памірае на вачах і нават не можа сам апрануцца”, якое прыцягнула 58 унікальных ботаў, якія пакінулі 344 каментара
  • Выяўляюцца розныя стратэгіі выкарыстання ботаў:
    • Масіраваная атака – прыцягненне вялікай колькасці ботаў да аднаго відэа
    • Інтэнсіўная атака – выкарыстанне невялікай колькасці ботаў, якія пакідаюць непрапарцыйна вялікую колькасць каментароў
    • Размеркаваная актыўнасць – умераная колькасць каментароў ад умеранай колькасці ботаў

Ключавыя высновы і рэкамендацыі

Агульныя высновы

  1. Маштаб і ўплыў ботнетаў: Даследаванне выявіла значную прысутнасць ботнетаў у каментарах да відэакантэнту. Нягледзячы на тое, што боты склалі менш за 1% акаўнтаў, яны генеравалі 11,6% усіх каментароў і ахоплівалі амаль 40% відэа.
  2. Разнароднасць ботнетаў: Выяўлены розныя тыпы ботнетаў з рознымі стратэгіямі, мэтамі і ўзроўнямі сафістыкацыі. Кластэрызацыя выявіла як мінімум 7 розных груп ботаў з унікальнымі характарыстыкамі.
  3. Прафесійны характар аперацый: Часавыя патэрны актыўнасці ўказваюць на тое, што за ботнетамі стаяць арганізаваныя структуры, якія працуюць па рэгулярным працоўным графіку, характэрнаму для Усходняй Еўропы.
  4. Рознанакіраваная палітычная актыўнасць: Аналіз зместу каментароў выявіў здзіўляльную разнастайнасць палітычных наратываў – ад прабеларускіх і праўкраінскіх да прарасійскіх. Гэта ўказвае на наяўнасць розных аператараў ботнетаў з рознымі палітычнымі мэтамі.
  5. Таргетаванне кантэнту: Ботнеты дэманструюць яўную перавагу відэа з сенсацыйнымі загалоўкамі, якія змяшчаюць імя Лукашэнкі, што пацвярджае гіпотэзу аб узаемасувязі паміж клікбэйтнымі загалоўкамі і актыўнасцю ботаў.
  6. Каардынацыя дзеянняў: Назіраецца значная каардынацыя паміж ботамі, асабліва ў выпадках рэагавання на важныя інфармацыйныя нагоды, такія як публікацыя відэа пра стан здароўя Лукашэнкі.
  7. Эвалюцыя тактык: Выяўлена адваротная залежнасць паміж актыўнасцю ботаў і іх “відавочнасцю” (bot score), што ўказвае на эвалюцыю тактык ботаў для пазбягання выяўлення.

Практычныя рэкамендацыі

  1. Для платформаў і мадэратараў:
    • Укараніць шматузроўневую сістэму выяўлення ботаў, якая ўлічвае як паводзінныя характарыстыкі, так і сеткавыя ўзаемасувязі
    • Звярнуць асаблівую ўвагу на відэа з высокай канцэнтрацыяй каментароў ад падазроных акаўнтаў
    • Надаваць павышаную ўвагу акаўнтам з тыповымі для ботаў патэрнамі наймення
    • Адсочваць сінхранізаваную актыўнасць каментавання як прыкмету каардынаваных дзеянняў
  2. Для стваральнікаў кантэнту:
    • Усведамляць, што выкарыстанне клікбэйтных загалоўкаў з узгадваннем палітычных фігур прыцягвае не толькі арганічных карыстальнікаў, але і ботаў
    • Улічваць, што высокія паказчыкі каментавання могуць быць вынікам ботнет-актыўнасці, а не рэальнага інтарэсу аўдыторыі
    • Разгледзець магчымасць больш строгай мадэрацыі каментароў пад адчувальным палітычным кантэнтам
  3. Для даследчыкаў:
    • Прымяняць комплексны падыход да выяўлення ботаў, які спалучае аналіз паводзін, кантэнту і сеткавых сувязяў
    • Улічваць, што палітычная накіраванасць каментароў не з’яўляецца надзейным індыкатарам ботнет-актыўнасці
    • Выкарыстоўваць часавы аналіз для выяўлення анамальных усплёскаў актыўнасці, звязаных з канкрэтнымі інфармацыйнымі нагодамі
  4. Для карыстальнікаў:
    • Крытычна ацэньваць каментары пад палітычным кантэнтам, асабліва пад відэа з сенсацыйнымі загалоўкамі
    • Звяртаць увагу на прыкметы патэнцыйна аўтаматызаванай актыўнасці: аднатыпныя каментары, шаблонныя выразы, нетыповыя патэрны актыўнасці

Заключэнне

Праведзенае даследаванне дэманструе складанасць і шматграннасць праблемы ботнет-актыўнасці ў каментарах да відэакантэнту. Выяўленыя патэрны ўказваюць на высокі ўзровень арганізацыі і каардынацыі ботнетаў, іх здольнасць хутка мабілізавацца ў адказ на значныя інфармацыйныя нагоды, а таксама на разнастайнасць палітычных мэтаў іх аператараў.

Вынікі даследавання падкрэсліваюць неабходнасць пастаяннага ўдасканалення метадаў выяўлення ботаў і супрацьдзеяння ім, улічваючы эвалюцыйны характар іх тактык і стратэгій. Важна працягваць маніторынг і аналіз ботнет-актыўнасці для лепшага разумення яе ўплыву на інфармацыйную прастору і грамадскую думку.

Rate article
Factсheck BY