Экономим рекламный бюджет с помощью кластерного анализа площадок в рекламных сетях Яндекса
Реклама
Анализ данных
Автор
Александр Коршаков
Дата публикации
29 марта 2024 г.
Кластерный анализ
Кластерный анализ позволит выявить группы (кластеры) площадок с различными характеристиками, при этом не дожидаясь набора статистически значимых данных. Например, с помощью кластерного анализа мы сможем выявить группу неэффективных площадок и запретить показы на них.
Кластерный анализ проводится в несколько этапов:
подготовка данных
поиск оптимального числа кластеров
кластеризация
анализ результатов
Рассмотрим каждый этап подробнее.
Подготовим данные
Подготовим данные для кластеризации. Оставим площадки:
по которым были затраты
уберем минус площадки (площадки, которые были отминусованы в ходе оптимизации проекта)
Кластеризацию проведем по параметрам:
Cost — затраты на площадку
Goals — кол-во достигнутых целей на площадку
Imp — кол-во показов
Clicls — кол-во переходов (кликов)
Bounces — кол-во отказов
Session — кол-во сессий
CPA — стоимость обращения
CPC — стоимость клика
SR — коэф. сеанса, отношение сессии к кликам
BR - коэф. отказов
Данные параметры наиболее важны для анализа качества площадки, на которой происходит показ объявления.
В итоге всех преобразований получаем таблицу для кластерного анализа.
Проведем стандартизацию данных для повышения качества анализа.
Таблица: Стандартизированная таблица
Cost
Goals
Imp
Clicks
Bounces
Sessions
CPA
CPC
SR
BR
1plus1tv.ru
-0.0300722
-0.0940711
-0.0520325
0.0654478
0.0382431
-0.0308824
-0.0625495
-0.9305891
-1.0463487
1.4843830
93.ru
0.2868610
3.7794466
-0.0084711
0.1427832
0.2762003
0.3087894
2.1230391
0.0862317
0.8446429
0.1150861
allserial.ag
-0.0737872
-0.0940711
-0.0180362
-0.0273546
0.0382431
-0.0308824
-0.0625495
-0.9305891
0.0042022
1.4843830
amedia.online
-0.0756086
-0.0940711
-0.0445418
-0.0428217
-0.0212462
-0.0308824
-0.0625495
-0.7457126
0.6345328
0.3433023
ar.com.develup
-0.0683228
-0.0940711
-0.0586013
-0.0582888
-0.0807355
-0.0551447
-0.0625495
0.0862317
0.6345328
-0.7977784
armfilms.space
-0.0391795
-0.0940711
-0.0561812
-0.0273546
-0.0807355
-0.0794070
-0.0625495
-0.3759596
-1.4665691
-0.7977784
Поиск оптимального числа кластеров
Автоматический подбор номеров кластера по 30 индексам.
Метод кластеризации k-means.
Используем «манхетенское» расстояние для расчётов.
Among all indices:
===================
* 2 proposed 0 as the best number of clusters
* 1 proposed 1 as the best number of clusters
* 4 proposed 2 as the best number of clusters
* 11 proposed 3 as the best number of clusters
* 1 proposed 4 as the best number of clusters
* 4 proposed 5 as the best number of clusters
* 2 proposed 7 as the best number of clusters
* 1 proposed 9 as the best number of clusters
Conclusion
=========================
* According to the majority rule, the best number of clusters is 3 .
Вывод
Методом голосования по 30 индексам алгоритм предлагает использовать 3 или 5 кластеров.
Кластеризация методом k-means
График: Визуальный анализ кластеризации
Код
# визуализацияfviz_cluster( fit,stand =FALSE,data = df_st, geom =c('point', 'text'),labelsize =5 ) +theme_minimal() +labs(title =NULL) +theme(legend.position ="top",legend.title =element_text(size =10, color ="gray40"),legend.text =element_text(size =10, color ="gray40"),axis.title =element_text(size =8, color ="gray40"),axis.text =element_text(size =8, color ="gray50") )
Вывод
Видим сильно отличающийся кластер №1, в который вошел один сайт. В левом углу графика сосредоточены остальные кластеры.
Данный график лучше рассматривать вместе с табличными данными результата кластеризации.
В кластер №1 вошла одна площадка, которая больше всех расходует бюджет и имеет приемлемые характеристики.
Кластер №2 содержит площадки с повышенным коэф. отказов. Необходимо рассмотреть данный кластер подробнее.
Кластеры №3 и №5 содержат площадки с хорошими характеристиками.
Площадки в кластере №4 можно смело минусовать, так как на них теряются клики, т.е. скорее всего с этих площадок идет бот-трафик.
С помощью таблицы ниже можно подробнее рассмотреть каждый кластер и площадки входящие в него. Указываем в соответствуещем поле номер кластера. Также есть возможность выгрузить результаты в табличном формате, при этом, выгрузка учитывает выбранные фильтры и выгрузит отфильтрованные данные.
Таблица для ручного анализа кластеров
Таблица содержит столбцы:
Cluster — номер кластера
Placement — название площадки
n — кол-во площадок в кластере
Cost — потрачено денег на площадку
Goals — кол-во достигнутых целей на площадке
Imp — кол-во показов на площадке
Clicks — кол-во переходов с площадки
Session — кол-во сеансов с площадки
CPC — стоимость клика
CPA — стоимость конверсии
CTR — коэффициента кликабельности объявлений
CR — коэффициент конверсии из клика в достигнутую цель
BR — коэффициенто отказа
SR — коэффициент сеанса (Session / Clicks). Показывает потерю клику на площадках. Если значение ниже 0.6, что означает потерю 40% кликов, то площадку можно минусовать.
Поиск минус площадок.
Минус-площадки — площадки которые не подходят для проекта, например, приложения.
С помощью данного анализа можно быстро найти минус-площадки и запретить по ним показы, чтобы не слить бюджет.