Продолжаем анализировать и наблюдать за публикациями в социальной сети TikTok, как потенциально опасном источнике дезинформационных и фейковых нарративов, распространяемых в беларуском информационном пространстве.
В отличии от предыдущей публикации Анализ использования хэштега #беларусь в TikTok за период с 1 марта по 14 июня 2024 года для данной публикации датасет был собран за более короткий периода — ноябрь 2024 года.
Было собрано с хэштегом #беларусь за ноябрь 2024 года:
Общее число видео: 8235
С общим числом просмотров: 474,185,017
Общее число лайков: 17,148,143
Средняя вовлеченность: 0.05%
Коллаж видео, которые собрали больше всего просмотров:
В дальнейшем будет проведен фактчекинг видео с фейковым контентом, включая различного рода дезинформационные нарративы.
Нарядные графики пересечения (overlap) хэштега #беларусь с другими хэштегами за последних 30 дней:
В данном круговом представлении уже пересечение только с видео в Беларуси:
Теперь от сложных визуализций перейдем к простым столбчатым диаграмам.
Двадцать TikTok акаунтов, которые собрали больше всего просмотров видео с хэштегом #беларусь:
Видно достаточо много провластных акаунтов и акаунты с сомнительным содержанием, которые требуют дополнительной фактчекинговой проверки на содержание их видео.
Какие еще хэштеги использовались совместно с #беларусь?
На этом графике обращает внимание, что в пересечения попадают хэштеги нато и сво (аббревиатура используемая Российской Федерацией для определения своего военного вторжения на территорию Украины).
Теперь построим диаграммы видео, которые собрали больше всего просмотров и лайков:
На этих графиках видны также видео с вирусным контентом, которые были в коллаборациях.
Полный инерактивный график здесь.
Теперь немного поизучаем контент. Традиционно начнем с «облака слов»:
Какой-то предсказуемый набор оказался и на этой VLOP (Very large online platform).
Теперь построим топ-20 триграмм, полученных с использованием Term Frequency-Inverse Document Frequency (TF-IDF):
Здесь можно выделить несколько интересных паттернов и сделать важные наблюдения:
Тематические кластеры:
- Геополитический кластер: Самые высокие TF-IDF значения (137-140) связаны с группой «Украина-Беларусь-Казахстан»
- Военно-политический кластер: Значения около 118-119 для триграмм, связанных с НАТО, США и СВО
- Новостной кластер: Значения 104-118 для общих новостных триграмм («новости мир политика»)
- Локальный беларусский кластер: Более низкие значения (50-77) для местных беларусских тем
Структурные особенности:
Заметно четкое разделение по значениям TF-IDF:
- Высокий уровень: 137-140
- Средний уровень: 118-119
- Низкий уровень: 50-77
Ключевые темы по значимости:
- Международные отношения (самые высокие значения)
- Военно-политическая тематика (средние значения)
- Локальные новости (низкие значения)