Сегментация rfm: Применение RFM-анализа в сегментировании клиентской базы / UniSender corporate blog / Habr – подробная инструкция + 27 примеров
if(rtbW>=960){var rtbBlockID="R-A-744041-3";} else{var rtbBlockID="R-A-744041-5";}
window.yaContextCb.push(()=>{Ya.Context.AdvManager.render({renderTo:"yandex_rtb_7",blockId:rtbBlockID,pageNumber:7,onError:(data)=>{var g=document.createElement("ins");g.className="adsbygoogle";g.style.display="inline";if(rtbW>=960){g.style.width="580px";g.style.height="400px";g.setAttribute("data-ad-slot","9935184599");}else{g.style.width="300px";g.style.height="600px";g.setAttribute("data-ad-slot","9935184599");} g.setAttribute("data-ad-client","ca-pub-1812626643144578");g.setAttribute("data-alternate-ad-url",stroke2);document.getElementById("yandex_rtb_7").appendChild(g);(adsbygoogle=window.adsbygoogle||[]).push({});}})});
window.addEventListener("load",()=>{
var ins=document.getElementById("yandex_rtb_7");if(ins.clientHeight =="0"){ins.innerHTML=stroke3;}},true);
Применение RFM-анализа в сегментировании клиентской базы / UniSender corporate blog / Habr
if(rtbW>=960){var rtbBlockID="R-A-744041-3";} else{var rtbBlockID="R-A-744041-5";}
window.yaContextCb.push(()=>{Ya.Context.AdvManager.render({renderTo:"yandex_rtb_6",blockId:rtbBlockID,pageNumber:6,onError:(data)=>{var g=document.createElement("ins");g.className="adsbygoogle";g.style.display="inline";if(rtbW>=960){g.style.width="580px";g.style.height="400px";g.setAttribute("data-ad-slot","9935184599");}else{g.style.width="300px";g.style.height="600px";g.setAttribute("data-ad-slot","9935184599");} g.setAttribute("data-ad-client","ca-pub-1812626643144578");g.setAttribute("data-alternate-ad-url",stroke2);document.getElementById("yandex_rtb_6").appendChild(g);(adsbygoogle=window.adsbygoogle||[]).push({});}})});
window.addEventListener("load",()=>{
var ins=document.getElementById("yandex_rtb_6");if(ins.clientHeight =="0"){ins.innerHTML=stroke3;}},true); Сегментация и таргетинг — это альфа и омега маркетинга, и email-маркетинг — не исключение. Даже если у вас есть накопленная за годы работы клиентская база, веерные рассылки могут принести вам не меньше вреда, чем пользы. Вам нужно уметь отправлять именно те письма, которые будут нужны вашим клиентам и принесут вам необходимые продажи или, например, регистрации на сайте, при этом не заваливая ящики ваших клиентов ненужными сообщениями, которые они бы воспринимали как спам. Для этого необходимо чётко понимать, кому и зачем вы отправляете каждое ваше письмо.
Специально для хабраблога компании Unisender мы подготовили цикл материалов «Таргетинг и сегментация email-рассылок». Во второй статье мы переходим к рассмотрению конкретных методик сегментации и расскажем о применении RFM-анализа в сегментации клиентской базы.
В классическом маркетинге существует методика RFM-анализа, который применяется для прогнозирования поведения клиента на основе его прошлых действий. RFM – аббревиатура слов Recency (новизна), Frequency (частота), Monetary (вложения).
Recency – это время, прошедшее с последней активности клиента, будь то покупка, переход по ссылке или просто открытие письма.
Frequency – количество действий, совершенных клиентом.
Monetary – денежные затраты клиента на товары и услуги компании.
Предполагается, что клиент, проявивший себя недавно, показывающий повышенную активность с момента своей регистрации или тратящий на ваши товары больше денег, будет более заинтересован в вашей рекламной кампании.
Существует также довольно актуальная для легальных рассылок вариация RFD, в которой D (Duration) – общая продолжительность знакомства с клиентом. Для описанной мною ниже методики непринципиально, учитываются ли вложения клиента или то, насколько давно он является подписчиком.
В ходе деления на сегменты нашего адресного списка мы рассмотрим каждую из деталей паззла по отдельности и придадим картине целостность в конце.
if(rtbW>=960){var rtbBlockID="R-A-744041-3";} else{var rtbBlockID="R-A-744041-5";}
window.yaContextCb.push(()=>{Ya.Context.AdvManager.render({renderTo:"yandex_rtb_5",blockId:rtbBlockID,pageNumber:5,onError:(data)=>{var g=document.createElement("ins");g.className="adsbygoogle";g.style.display="inline";if(rtbW>=960){g.style.width="580px";g.style.height="400px";g.setAttribute("data-ad-slot","9935184599");}else{g.style.width="300px";g.style.height="600px";g.setAttribute("data-ad-slot","9935184599");} g.setAttribute("data-ad-client","ca-pub-1812626643144578");g.setAttribute("data-alternate-ad-url",stroke2);document.getElementById("yandex_rtb_5").appendChild(g);(adsbygoogle=window.adsbygoogle||[]).push({});}})});
window.addEventListener("load",()=>{
var ins=document.getElementById("yandex_rtb_5");if(ins.clientHeight =="0"){ins.innerHTML=stroke3;}},true);
R = Recency
В соответствии со спецификой предлагаемых вами услуг необходимо определиться с критерием активности клиента. Будет это дата совершения последней покупки, момент последнего перехода по ссылке в письме или же достаточно и последнего открытия письма – решать вам.
Следует условно определить несколько временных циклов, активность за которые будет учитываться. Как правило, если речь идет о рассылках, маркетологи останавливаются на пяти периодах совершения последнего действия: последний месяц, два месяца, три, полгода и год.
Теперь, используя собранные данные, следует «раскидать» клиентов по временным группам. У вас должно получиться нечто подобное:
1. 0-30 дней: 5,100 покупателей/подписчиков
2. 31-60 дней: 12,300
3. 61-90 дней: 32,800
4. 91-180 дней: 75,000
5. 181-365 дней: 123,400
Группа 1 здесь и далее будет включать самых выгодных клиентов. «Лучший» сегмент всегда будет иметь наименьшее число покупателей/подписчиков, в то время как «худший» будет самым крупным. Не пытайтесь изменить критерии групп так, чтобы они были равны. Напротив, у вас должно выйти нечто вроде пирамиды.
F = Frequency
Здесь мы будем рассматривать то, насколько часто клиент проявлял активность. Как и в случае с Recency, мы остановимся на пяти пунктах, каждый из которых будет содержать определенный количественный спектр покупок/действий.
Опять же, группа 1 будет учитывать наиболее активных. Хорошенько подумайте, после какого количества действий ваш клиент считается самым выгодным: установка слишком высокой или слишком низкой планки может сбить точность подсчета.
Конечный вариант может выглядеть примерно так:
1. 16+ покупок/действий
2. 11-15
3. 5-11
4. 2-4
5. 0-1
M = Monetary
Этот пункт определяет «качество» совершаемых пользователем действий, как правило, измеряемое в потраченных на ваши товары и услуги деньгах. Это может быть также и непрямой доход от действий клиента. В некоторых случаях, когда выгоду от действий пользователя сложно учесть в деньгах или иной конкретной величине, или ценность каждого действия, совершенного пользователем, одинакова, этот пункт может быть заменен на продолжительность подписки клиента или отсутствовать вовсе.
if(rtbW>=960){var rtbBlockID="R-A-744041-3";} else{var rtbBlockID="R-A-744041-5";}
window.yaContextCb.push(()=>{Ya.Context.AdvManager.render({renderTo:"yandex_rtb_4",blockId:rtbBlockID,pageNumber:4,onError:(data)=>{var g=document.createElement("ins");g.className="adsbygoogle";g.style.display="inline";if(rtbW>=960){g.style.width="580px";g.style.height="400px";g.setAttribute("data-ad-slot","9935184599");}else{g.style.width="300px";g.style.height="600px";g.setAttribute("data-ad-slot","9935184599");} g.setAttribute("data-ad-client","ca-pub-1812626643144578");g.setAttribute("data-alternate-ad-url",stroke2);document.getElementById("yandex_rtb_4").appendChild(g);(adsbygoogle=window.adsbygoogle||[]).push({});}})});
window.addEventListener("load",()=>{
var ins=document.getElementById("yandex_rtb_4");if(ins.clientHeight =="0"){ins.innerHTML=stroke3;}},true);Так же, как и в предыдущем пункте, необходимо определить индивидуальные для каждой компании значимые пределы денежных вложений.
1. $1001+
2. $601-1000
3. $351-600
4. $201-350
5. $0-200
Таким образом, мы получим без малого 125 групп: 555, 554, 553, 552, 551, 545, и так вплоть до 111. Но это далеко не значит, но нужно адресовать каждой из групп индивидуальные письма: как правило, такое детальное разделение применяется для анализа. Сгруппировав клиентов таким образом, вы сразу получите целостную картину происходящего с вашей клиентской базой. Скажем, клиенты 5R-5F-1M могли обратиться к вашим услугам лишь разово, потратив немалую сумму, но не рассчитывая на долговременное сотрудничество. А вот 5R-3F-1M с большей вероятностью стали недовольны услугами компании или потеряли к ней интерес.
1R-1F-1M
Это – сливки вашего клиентского списка. Если вы верно избрали пределы групп R, F и M, то этот сегмент должен быть крайне мал – не более 5% адресной базы. Что бы вы ни делали, вам уже вряд ли удастся испортить отношения с такими клиентами.
В связи с этим многие компании полагают, что лучше оставить отношения с такими клиентами как есть – и они продолжат лидировать в списках продаж. Но – этим они теряют возможность дать им лидировать с большим отрывом. У совершенства не бывает предела.
Можно расширить границы сотрудничества с этими людьми, учредив программу лояльности, приглашая на специальные мероприятия или же анкетируя их на предмет пожеланий к развитию компании. Важно всячески показывать таким клиентам, что они – уважаемые и желанные гости, а не случайные прохожие.
5R-5F-5M
Хоть эти клиенты и кажутся наименее перспективными, не стоит совсем скидывать их со счетов: хоть раз, но они все же проявили интерес к вашей продукции. Чаще всего рекламщики готовят для них специальные, «провокационные» сообщения, которые позволяют избавиться от балласта из тех, кто совсем не проявляет интереса (или просто забросил электронный ящик), а остальных перевести в следующую категорию.
«1» только в одной категории
if(rtbW>=960){var rtbBlockID="R-A-744041-3";} else{var rtbBlockID="R-A-744041-5";}
window.yaContextCb.push(()=>{Ya.Context.AdvManager.render({renderTo:"yandex_rtb_3",blockId:rtbBlockID,pageNumber:3,onError:(data)=>{var g=document.createElement("ins");g.className="adsbygoogle";g.style.display="inline";if(rtbW>=960){g.style.width="580px";g.style.height="400px";g.setAttribute("data-ad-slot","9935184599");}else{g.style.width="300px";g.style.height="600px";g.setAttribute("data-ad-slot","9935184599");} g.setAttribute("data-ad-client","ca-pub-1812626643144578");g.setAttribute("data-alternate-ad-url",stroke2);document.getElementById("yandex_rtb_3").appendChild(g);(adsbygoogle=window.adsbygoogle||[]).push({});}})});
window.addEventListener("load",()=>{
var ins=document.getElementById("yandex_rtb_3");if(ins.clientHeight =="0"){ins.innerHTML=stroke3;}},true);
Тем, у кого единица только в категории Recency, следует дать немного времени, чтобы определиться. Они знают о ваших услугах и, возможно, скоро проявят к ним интерес. Аппетитные рассылки в этом случае – самый эффективный способ удержать их внимание.
Клиенты, покупающие часто (1F), но на небольшие суммы, ценны для вас своим постоянством. Попробуйте воспользоваться методикой из предыдущей статьи: предложить им товары, которые как правило покупают за компанию с теми, что приобрели они. Возможно, это сможет расширить ассортимент их покупок.
Клиент с 1М крайне цене для вашей компании своими существенными вложениями, но не проявляет активности. Следует показать его особую ценность для вас. Взгляните на то, что они покупали и как давно не совершали никаких действий. Вам необходимо аккуратно выяснить, чего бы они хотели от вашей компании? Чего им не хватает, чтобы стать вашими постоянными покупателями? Небольшое анкетирование может пойти на пользу.
«5» только в одной из категорий
Эти пользователи – подающий большие надежды сегмент и простор для вашей исследовательской деятельности. Они достаточно постоянны, чтобы вы смогли поэкспериментировать и найти подходящий под специфику вашей компании способ вытягивать клиентов со значений в 2-4 в каждом из пунктов.
Методика RFM – далеко не абсолютный, но крайне полезный инструмент анализа адресного списка. Оглянитесь: проделав сравнительно6о небольшую работу, вы уже видите индивидуальный подход к своим клиентам. Дело за малым: приступать к действию.
По материалам статей Kelly Lorenz — RFM Segmentation and Analysis: Part 1, Part 2, Part 3.
if(rtbW>=960){var rtbBlockID="R-A-744041-3";} else{var rtbBlockID="R-A-744041-5";}
window.yaContextCb.push(()=>{Ya.Context.AdvManager.render({renderTo:"yandex_rtb_2",blockId:rtbBlockID,pageNumber:2,onError:(data)=>{var g=document.createElement("ins");g.className="adsbygoogle";g.style.display="inline";if(rtbW>=960){g.style.width="580px";g.style.height="400px";g.setAttribute("data-ad-slot","9935184599");}else{g.style.width="300px";g.style.height="600px";g.setAttribute("data-ad-slot","9935184599");} g.setAttribute("data-ad-client","ca-pub-1812626643144578");g.setAttribute("data-alternate-ad-url",stroke2);document.getElementById("yandex_rtb_2").appendChild(g);(adsbygoogle=window.adsbygoogle||[]).push({});}})});
window.addEventListener("load",()=>{
var ins=document.getElementById("yandex_rtb_2");if(ins.clientHeight =="0"){ins.innerHTML=stroke3;}},true);
«Таргетинг и сегментация email-рассылок», специально для хабраблога компании Unisender. Предыдущая статья.
Чтобы не пропустить следующие материалы по этой теме, нажмите сердечко в нашем профиле и отметьте блог компании Unisender в настройках вашей хабраленты.
RFM сегментация в электронном маркетинге
Насколько органичен и прост RFM анализ в e-marketing, настолько же он отпугивающе далек для тех, кто еще не начал им пользоваться. Лично нам этот подход настолько понравился, что мы уже дважды писали статьи о нем (раз и два) и даже уже интегрировали его в систему email маркетинга eSputnik.
И вот мы снова пишем об RFM, однако, в этот раз мы покажем как он строится на конкретном примере, воспользовавшись базой данных вымышленного интернет-магазина «Тип-топс». Постараемся все объяснить подробно и человеческим языком, так что приглашаем к чтению и экспериментированию маркетологов, для которых RFM это пока только знакомая аббревиатура, а не практичный инструмент.
Табличный файл Analysis_Sample
Файл с базой данных и всеми расчетами можно загрузить по ссылке. Мы уже описывали этот файл и работу с ним в первой статье аналитической серии — Анализ данных в электронном маркетинге. Статья 1 — Каналы привлечения клиентов — поэтому здесь подробно остановимся только на том, что нужно непосредственно для RFM анализа.
А понадобится нам только база продаж, в которой есть информация о дате, цене заказа и id клиента. Результаты мы найдем на листе «RFM_Анализ», в то время как часть промежуточных расчетов автоматом делается на листе «База_клиентов».
RFM-анализ — это просто
Что такое RFM-анализ? Это, всего навсего, один из способов сегментации базы клиентов.
По какому принципу сегментируется? По активности клиента. Смотрим, как часто он делал покупки (
if(rtbW>=960){var rtbBlockID="R-A-744041-3";} else{var rtbBlockID="R-A-744041-5";}
window.yaContextCb.push(()=>{Ya.Context.AdvManager.render({renderTo:"yandex_rtb_1",blockId:rtbBlockID,pageNumber:1,onError:(data)=>{var g=document.createElement("ins");g.className="adsbygoogle";g.style.display="inline";if(rtbW>=960){g.style.width="580px";g.style.height="400px";g.setAttribute("data-ad-slot","9935184599");}else{g.style.width="300px";g.style.height="600px";g.setAttribute("data-ad-slot","9935184599");} g.setAttribute("data-ad-client","ca-pub-1812626643144578");g.setAttribute("data-alternate-ad-url",stroke2);document.getElementById("yandex_rtb_1").appendChild(g);(adsbygoogle=window.adsbygoogle||[]).push({});}})});
window.addEventListener("load",()=>{
var ins=document.getElementById("yandex_rtb_1");if(ins.clientHeight =="0"){ins.innerHTML=stroke3;}},true);Frequency), как давно (Recency) и насколько дорогие (Monetary). Еще не делал покупки? Тоже не проблема.
Что нам это даст? Мы можем «приблизить» свое маркетинговое предложение к клиенту, даже не зная о нем никакой дополнительной информации.
Где это работает? Везде, где есть множество клиентов и возможность адресно обратиться к каждому. Мы анализируем частоту и давность покупок в ecommerce, но с таким же успехом, это могут быть прочтения писем в подписном бизнесе или заходы в приложение в SaaS.
В самом начале я уже снабдил RFM-анализ эпитетами «органичный» и «простой». Это, действительно, самый естественный способ составить представление о клиенте без дополнительных данных о нем. Все что нужно — это история наших с клиентом взаимоотношений. Причем в некоторых случаях RFM может быть упрощен до RF, т.е. анализом цен можно пожертвовать в угоду большей простоте и универсальности. Благо информация о частоте покупок может косвенно, но с большой достоверностью говорить о доходе, который нам принес клиент.
Далее мы покажем как мы сегментировали нашу базу продаж по R, F и M.
База клиентов
Первое, что мы сделали, это построили базу клиентов с такими полями для каждого:
- id клиента (уникальный идентификатор)
- дата последнего заказа
- количество заказов
- сумма цен по всем заказам
Нам не потребовалась для этого помощь программиста баз данных, все данные у нас уже были в базе продаж. Потребовалось, конечно, некоторое знание формул табличного редактора, хотя тот же результат можно было получить и с помощью инструмента сводных таблиц, который более известен, чем формулы работы с массивами.
Основной целью было сформировать таблицу, где каждый клиент имеет свою строку и встречается только один раз в отличие от базы продаж, где он мог встретиться столько раз, сколько заказов сделал.
Recency
Для сегментации по Recency, т.е. по давности последней покупки, мы задали периоды для четырех сегментов. Обратите вниамние, все пользовательские данные в нашем файле заносятся в оранжевые ячейки.
Мы выбрали:
- Сегмент 1 — До месяца
- Сегмент 2 — До 3 месяцев
- Сегмент 3 — До года
- Сегмент 4 — Более года
Самый благоприятный для нас сегмент — сегмент самых недавних покупок — имеет номер 1. Если вы привыкли к обратной нумерации, то можете изменить порядок в оранжевых ячейках последнего столбца показанной выше таблицы.
Последняя дата всей нашей базы известна, т.е. мы можем отсчитать от нее в обратную сторону длительности сегментов и получить даты их границ.
И теперь нам остается сопоставить даты границ сегментов и даты последних заказов и уже по этим датам присвоить номера сегментов 1-4 каждому клиенту.
Результат — в колонке «Recency_Segment» на листе «База_клиентов». Общее количество клиентов по сегментам можно увидеть на показанном выше скриншоте с листа «RFM_Анализ».
Frequency
Точно так же задаем границы сегментов, на этот раз — количество заказов:
- Сегмент 4 — 1 заказ
- Сегмент 3 — 2 заказа
- Сегмент 2 — 3-4 заказа
- Сегмент 1 — 5 и более заказов
Результат смотрим в колонке «Frequency_Segment» на листе «База_клиентов» и в соответствующей таблице на листе «RFM_Анализ».
Обращаем внимание, что в нашей базе — только клиенты, которые сделали хотя бы одну покупку. Такой же анализ можно делать и с участием клиентов, вообще не делавших покупок, но эта ситуация не обрабатывается в наших формулах и требует небольшой настройки.
Также придется настраивать расчет и при увеличении количества сегментов. Мы выбрали по 4 сегмента для каждого направления, чтобы не наплодить несметного количества вариантов. Ведь предполагается, что к каждому сегменту будет привязано какое-то маркетинговое действие.
Monetary
Как уже говорилось, интересные и полезные результаты можно получить уже при совместном анализе только R и F. Мы построили также сегменты и для M, там все аналогично предыдущим двум направлениям. Результат — в колонке «Money_Segment» на листе «База_клиентов» и в соответствующей таблице на листе «RFM_Анализ».
Матрица RF
В результате нашего анализа по R и F мы строим матрицу, располагая сегменты Recency по горизонтали, а сегменты Frequency — по вертикали. У нас получается 16 (4х4) производных сегментов клиентской базы. Это уже достаточно много, так как нам нужно настроить соответствующую реакцию для каждого клиентского сегмента. Но весь смысл матричного сопоставления R и F заключается в том, что мы можем объединять сегменты, выделяя группы клиентов на свое усмотрение.
Кто-то предлагает объединить все мелкие сегменты в четыре квадранта (например, Джим Ново в статье на своем блоге), кто-то — использовать персонализированное разделение матрицы.
Мы пошли по второму пути, определив 7 клиентских сегментов. Это позволило нам сократить с 16 до 7 число групп, для которых мы прописываем индивидуальные действия. Результат показан на скриншоте выше. В первой таблице скриншота посчитано количество клиентов из нашей базы в каждом сегменте, во второй — приводится расшифровка сегментов, в третьей — примеры маркетинговых действий для каждого сегмента.
Продолжение следует…
Обратите внимание, что мы выделили сегмент тех клиентов, которые не покупали очень давно — сегмент «Ушедшие». Мы с полным правом можем вычеркнуть из списка активных клиентов, сэкономив, тем самым, на персональном маркетинге для них.
Кроме того, сегмент «ушедшие» может задать нам критерий конца жизненного цикла клиента, который так неоднозначен в ecommerce. Мы покажем как это может работать для расчета оттока клиентов и Lifetime value на примере когортной сегментации, о которой поговорим в следующей статье нашей аналитической серии.
Stay tuned 🙂
P.S. RFM анализ, как мы уже говорили, очень эффективен именно в email маркетинге, так как позволяет полностью автоматизировать «умные» персонализированные маркетинговые рассылки.
Статья 1 — Каналы привлечения клиентов
Статья 3 — Когортный анализ и LTV
Статья обновлена от 26.02.2015
3.6
из 5 на основе 289
оценок
RFM Сегментация и Анализ. Блог о email маркетинге и рассылках eSputnik
В продолжение серии постов о сегментации, поговорим сегодня о RFM анализе, который тоже основан на поведенческих факторах группы или сегмента существующих клиентов. Метод RFM анализа позволяет оценить общее состояние базы, грамотно организовать директ-маркетинг и выгодно отличаться от конкурентов. При правильной мотивации клиента, можно будет улучшить полученные при анализе результаты. Если вы уже знаете, что такое RFM анализ, вам будет интересно прочитать о нашем опыте и открытиях, связанных с темой RFM анализа.
RFM сегментация состоит из трёх параметров:
Recency (R) — давность последней покупки
То есть, сколько времени прошло со времени взаимодействия c клиентом в днях, неделях или месяцах. Рассчитывается как разность между текущей и датой последнего заказа. Клиенты, которые недавно совершали у вас покупки, более предрасположены к повторным заказам, чем те, кто давно уже не проявлял никаких действий. Пользователей, которые покупали давно, можно возобновить только предложениями, которые привлекают вернуться обратно.
Frequency (F) — суммарная частота покупок
Показывает сколько взаимодействий (покупок) в течение определённого периода времени было у вас с клиентом. Если обе стороны остались довольны — есть шанс поддержать частоту покупок или увеличить в свою пользу. Чем больше клиент совершал покупок у вас, тем больше вероятность, что он их будет повторять и в будущем. Обычно, этот показатель тесно взаимосвязан с давностью покупки.
Monetary (M) — объём покупок
Как и предыдущие показатели, рассчитывается за определенный период или количество взаимодействий. Показывает какой была «стоимость клиентов» с точки зрения доходов и прибыльности, а точнее, сумма денег, которая была потрачена. Сгруппированные по денежным показателям анализы часто получают представление клиентов, чьи покупки отражают более высокую ценность для вашего бизнеса.
Все вышеуказанные показатели важно рассчитывать за период, который наиболее точно отобразит нужные данные. Допустим, можно взять выборку за один год и разделить её на кварталы.
Как правило, небольшой процент клиентов реагирует на общие рекламные предложения. RFM является отличным методом сегментации для прогнозирования реакции клиента и улучшения взаимодействия, а также повышение прибыли. RFM использует поведение покупателей, чтобы определить, как работать с каждой группой клиентов. Важность показателей ранжируется согласно последовательности букв — давность, частота, деньги.
Иногда встречается название RF сегментация, когда показатель Monetary не используется, потому что его значение часто зависит от Frequency. Сегментация клиентской базы по такому принципу позволяет выделить тех с кем вам действительно надо работать, разделяя их на сегменты клиентов (активный, спящий, растущий), разрабатывая целевые маркетинговые предложения для наиболее активной группы клиентов.
Эффективный email-маркетинг с eSputnik
Регистрация
Хотите провести RFM анализ контактной базы клиентов вашего бизнеса?
- Напишите нам на [email protected].
- Мы свяжемся с вами, уточним, какие данные у вас есть и на их основе в течение недели подготовим документ с отчетом бесплатно.
- Нам доверяют более 2 000 компаний, но чтобы вы были уверены в сохранности данных ваших клиентов, мы можем подписать договор о защите конфиденциальных данных.
Определение условий RFM
Определения «давность», «частота» и «деньги» понятны даже интуитивно, но наша задача, превратить их в цифры, которые можно использовать для оценки RFM, а это уже несколько сложнее.
Представим наши данные в виде таблицы, упорядоченной по первому значению — дате последней покупки (R).
Контакт
|
Дата последней покупки (R)
|
Объём покупок (F)
|
Сумма покупок, грн
|
Средний чек, грн. (M)
|
---|---|---|---|---|
Иван Петров
|
05.09.2013
|
5
|
2600
|
520
|
Петр Иванов
|
07.08.2013
|
1
|
960
|
960
|
Олег Плющ
|
15.07.2013
|
3
|
1500
|
500
|
Сидор Петров
|
04.06.2013
|
2
|
600
|
300
|
Оля Сидорова
|
25.02.2013
|
3
|
900
|
300
|
Анна Волкова
|
05.10.2012
|
4
|
3300
|
825
|
Сразу же проставим по каждому показателю (R, F, M) «вес» для каждого клиента, исходя из полученных данных. Для оценки клиентской базы будем использовать числовые значения от 1 до 3, или же в процентном соотношении, назначенном каждому клиенту в результате анализа. Для удобства разделим всю клиентскую базу для начала на 5 равных частей по каждому из показателей. Допустим, из нашего примера по показателю «объём покупок» F — 1,2,3,4,5.
1 — наихудший для нас объём, пометим, как 1;
2,3,4 — средний результат, отметим его, как 2;
5 — самое лучшее значение F. Это наше 3.
Итак: 1 — это плохо, 2 — средний показатель и 3 — хороший. Проставив по каждому показателю «вес», чтобы с помощью этих весов ранжировать список.
Контакт
|
Дата последней покупки (R)
|
Объём покупок (F)
|
Средний чек, грн. (M)
|
Вес для (R)
|
Вес для (F)
|
Вес для (M)
|
---|---|---|---|---|---|---|
Иван Петров
|
05.09.2013
|
5
|
520
|
3
|
3
|
2
|
Петр Иванов
|
07.08.2013
|
1
|
960
|
3
|
1
|
3
|
Олег Плющ
|
15.07.2013
|
3
|
500
|
2
|
2
|
2
|
Сидор Петров
|
04.06.2013
|
2
|
300
|
2
|
1
|
1
|
Оля Сидорова
|
25.02.2013
|
3
|
300
|
1
|
2
|
1
|
Анна Волкова
|
05.10.2012
|
4
|
825
|
1
|
3
|
3
|
Теперь мы можем легко определить, что для нас лучший клиент с результатами 333. 111 показывает, что клиент интересуется нами редко, возможно даже единоразово. Исходя из полученных результатов можно выбирать варианты, как поступать с той или иной группой клиентов.
Грустно то, что обычно 111 — самый большой сегмент. А радостно, что можно не тратить время на тех, кто уже потерян и сконцентрироваться на действительно важных для нас клиентах.
Last post
Плюс RFM сегментации ещё и в том, что анализ можно делать даже по одному показателю, который вас наиболее интересует или комбинировать показатели, хотя полная сегментация клиентской базы даст вам гораздо больше возможностей. Допустим, возьмём за основу только давность и частоту, а получившиеся данные изобразим графически:
Зелёный сектор 5% — самые лучшие клиенты, которые активно на всё реагируют, покупают и т.д., соответственно сектор 1,1 — «мы их теряям». С каждым из сегментов таблицы нужно работать по-разному, предлагая им разные условия сотрудничества.
Мы всегда говорим, что хорошо видеть ситуацию в статике (как у нас дела сейчас), но еще важнее увидеть в динамике (куда мы движемся). Если рассчитать такую же таблицу за предыдущий период и «наложить» её на актуальную сегодняшнюю — можно увидеть, как изменяются данные:
В секторе 1,1 показатель упал на 6%, благодаря уменьшению числа пассивных клиентов. Зато в секторе 3,3 число «хороших клиентов» увеличилось на 2%. Что же, значит мы работаем в нужном направлении. Надо проанализировать за счет чего это происходит и закрепить результат.
Этих данных уже достаточно для эффективной работы с клиентами, но если ещё к этому показателю добавить и сегмент денег, то работать над цифрами станет ещё интереснее:) RFM позволяет сегментировать базу так, чтобы вы тратили время и деньги на нужных клиентов. Попробуйте сделать сегментацию хотя бы по одному показателю и даже работа с этими данными может способствовать росту постоянных клиентов.
Статья обновлена от 17.11.2013
3.4
из 5 на основе 333
оценок
RFM-анализ для увеличения повторных покупок
Подробнее о том, что такое RFM в другой статье. Я подготовил RFM анализ для нашего сервиса eSputnik, чтобы понять картину с нашими клиентами. Мне понравился этот метод, как очень простой способ визуализации поведения клиентов. Да, это было интересно, но очень скоро я понял, что в этой картинке нет практической пользы.
В цифрах вообще нет пользы, если они не меняют наших действий на завтра.
RFM анализ в email маркетинге
В этот раз я поделюсь с вами опытом и наблюдениями как извлекать пользу из RFM даже не имея трёхлетней истории продаж. Мы провели RFM анализ клиентов для десятков различных магазинов и столкнулись с рядом преград на пути к получению реальных результатов. До того как описать их все, давайте ещё раз вспомним, что нам даёт RFM модель.
Что такое RFM анализ?
RFM анализ — это способ сегментировать аудиторию, основанный на 3 показателях:
|
Подробнее о том, что такое RFM-сегментация и анализ, читайте в другой статье.
Мне кажется, показатель Monetary не обязательно привязывать к деньгам. Это может быть любой фильтр, наложенный на основные показатели этого метода: Давность и Частота.
Например, для информационного портала можно взять время просмотра страницы или глубину просмотра страниц на сайте. RF матрицу можно рассматривать отдельно для разных типов клиентов, фильтруя по источнику клиента, по регионам, по категориям купленых товаров, по возрасту и многое другое.
Как провести RFM анализ клиентской базы?
Если разбить всех ваших клиентов по давности последней покупки на несколько групп и по количеству сделанных покупок, то можно построить матрицу из которой видно как разбить ваших клиентов по группам, на основании их активности:
- Новички
- Одноразовые покупатели
- Растущие
- Потерянные клиенты
- VIP
На самом деле групп гораздо больше, но об этом потом. Обычно я строю шкалы по частоте и давности, по принципу: от плохого к хорошему. Получается:
- По давности: слева те, кто покупал очень давно, а справа — кто покупал недавно.
- По частоте: снизу те, кто сделал одну покупку, а сверху — много. Тогда визуально разделение групп будет выглядеть примерно так:
Об этом мы уже писали и раньше, но давайте посмотрим детальнее как разбить базу на группы и разметить шкалы, сколько групп выделить и что с ними делать дальше.
Самый важный показатель — «Давность». Чем больше времени прошло с момента последней продажи, тем меньше вероятность следующей покупки. И падает эта вероятность очень стремительно. Давайте разберёмся с «Давностью» с самого начала. К примеру, у нас есть 3 клиента (квадрат, круг, треугольник), и на графике мы отметим время когда каждый клиент делал покупку.
Важно, прошу прощения, я почему-то нарисовал график давности в обратном направлении от хорошего к плохому, исправлю, но чуть позже 🙁
Задача — определить сколько клиентов по «Давности» попадёт в каждый из периодов. Важно понимать, что давность — это показатель, который принимает во внимание только последнюю покупку, предыдущие покупки будут отмечены в частоте. Таким образом правильным ответом на задачку будет:
- Период 1: 1 (только круг)
- Период 2: 1 (только треугольник)
- Период 3: 1 (только квадрат, потому что круг и треугольник покупали и после того)
- Период 4: 0 (все делали покупку после этого)
Если взять и посчитать сколько клиентов попадают в каждый сегмент, то можно построить графики, которые могут выглядеть приблизительно так:
И снова вопрос: какой из трёх вариантов лучше?
Часто я слышу что «красный (3)» — потому что он стабильный. На самом деле, он показывает что мы постоянно привлекаем клиентов, которые делают покупку и не возвращаются снова. Хорошо что показатель немного нарастает, но всё же «сиреневый (1)» — лучше. По нему видно, что большинство нашей аудитории недавно покупали и сильно вовлечены в процесс покупки. Конечно, самый плохой — «зеленый (2)» график. В этом случае у нас был всплеск активности (может быть Новый год или сильные инвестиции в контекст), а потом всё растеряли.
Хотите автопостроение RFM?
Начать сейчас!
В большинстве книг по анализу, в том числе в популярном издании «Маркетинг на основе баз данных» Артура М. Хьюза, предлагается очень простой механизм разделения «Давности» по сегментам: отсортировать все контакты по давности и разбить на 5 равных групп. То же самое рекомендуется сделать и с Частотой и с Деньгами:
Этот способ работает и помогает разбить всех клиентов на: покупали только что, недавно, так себе, давно, очень давно относительно друг друга. Но что значит «когда»? Если мы не можем сказать точно «когда», то и оценивать эту группу тоже тяжело. Например, в соседние группы могут попасть контакты покупавшие в один и тот же день. Это лишь значит, что для одинаковых клиентов мы будем по разному себя вести… Зачем тогда вообще такой анализ? Всю глубину проблемы я постараюсь показать на двух примерах.
Примеры RFM-анализа в email-рассылках
Пример 1: В вашем магазине всё было хорошо, и вдруг в течение месяца ни одной покупки. Всё плохо, но если разбивать на равные части — ничего не изменится и всё те же последние покупатели попадут в сегмент «только что покупали».
Пример 2: Если у вас ещё нет данных о продажах за несколько лет, а Вы только начали свой бизнес, то границы с каждым днём будут очень сильно отличаться и пользоваться результатом такого анализа вообще нет смысла.
Сезонности, акции и праздники тоже сильно влияют на общую картину.
Любой сегмент контактов, о которых вы не можете сказать что-то определённое — плохой сегмент
Мне кажется логичнее фиксировать не количество, а время. Тогда оптимизация количества в группах и будет нашей задачей. Надо как можно больше получить контактов в группе «только что» и как можно меньше «давно».
Осталось только определить какие временные пределы лучше выставить. Для этого надо ответить для себя на несколько вопросов:
- Какой естественный период покупки?
- Какая сезонность?
- За какое время большинство клиентов успевает совершить повторную покупку?
- Какой период неактивности клиента можно считать, что мы потеряли клиента (длина жизненного цикла клиента)
Для компаний, у которых нет данных, можно предположить эти периоды. Для компаний «с историей» очень помогут несколько графиков (о которых я расскажу дальше) с разницей между покупками.
Я привёл пример графика с разницей в месяцах между первой и второй покупками. У большинства магазинов он выглядит примерно также, как на рисунке. Тут видно, что 50% всех повторных покупок делаются в течение 2 первых месяцев. За полгода 75% процентов делают свой второй заказ и 90% из тех кто покупают снова — покупают в течение 13 месяцев. Какой из этого можно сделать практический вывод? Мне кажется, ненадо спешить давать скидку тем, кто купит и так, без нашей помощи. Предлагать скидку надо через 2 месяца после первой покупки. До этого надо показывать релевантные предложения, быть на слуху и главное — быть полезным клиенту.
Если построить матрицу разности между любыми соседними покупками, то получится примерно следующая картина:
Интересно, что разница между первой и второй покупкой всегда больше, чем между второй и третьей. А между второй и третьей больше, чем между третьей и четвёртой, но чем дальше, тем меньше влияет количество покупок на разницу между ними. Выходит, что вначале человеку надо время, чтобы поверить. Возможно, в следующий раз он попробует купить в другом месте или просто подождёт. Но чем чаще он покупает, тем время между покупками становится меньше. Джим Ново в своей книге Drilling Down говорит, что этот график сначала падает, потом стабилизируется, потом начинает расти. Это очень похоже на жизненный цикл клиента, когда он понемногу перестаёт быть клиентом, все реже покупая. Но я ни разу не видел этой картины на практике.
Важно: для получения этих цифр лучше использовать не среднее, а медиану. Сейчас быстро попытаюсь объяснить разницу. Среднее — это сумма всех значений делённая на их количество, а медиана — это значение элемента, который находится посередине в отсортированной последовательности. То есть гарантировано 50% всех значений меньше или равны медиане, и 50% больше или равны медиане. Медиана лучше среднего, потому что в средних значениях сильное влияние имеют «аномальные значения». Те значения, которые очень редкие, но сильно выходящие за пределы большинства. Обычно медианы значительно меньше средних.
Real email-marketing
Try Now
Ещё хорошо бы посмотреть на сезонность — часто это 12 месяцев. Посмотрев на все цифры можно сделать вывод, какой период поставить для групп, например:
- до 1 месяца
- до полугода
- до года
- до двух лет
- более двух лет
Но даже с таким подходом есть вопросы. А что если у одних клиентов естественный период покупки маленький, а у других большой? В таком случае я создаю каждому из клиентов профиль и для каждого профиля создаю свою градацию, которую нормализую по оси Давности в относительные категории:
- ожидаемого времени покупки
- если не купил — что-то странное
- мы его теряем
- мы его потеряли, но есть последний шанс
- наверняка мы его потеряли
Точно такая же история и для «Частоты», только почти всегда у меня получается приблизительно одна и та же шкала. Те, кто сделали:
- 1 покупку (этих большинство)
- 2 покупки (преодолели психологический барьер и пришли снова, уже зная о том, как работает магазин)
- 3-4 покупки (несмотря ни на что, продолжают покупать. Надо удержать любой ценой)
- 5-15 покупок (поверили, на них вся надежда. Тут верхняя граница бывает очень разная)
- больше 15 покупок (маньяки, часто это перекупщики, партнёры, т.п. К ним надо присмотреться отдельно)
Ну вот и весь RF анализ. Если посмотреть на матрицу RF, зная как разбиты сегменты, то сразу понятно кто такие новички: совершили одну покупку совсем недавно. Одноразовые — совершили покупку давно, и уже наверняка забыли об этом. Вряд ли они придут к нам снова. Джим Ново говорит, что таких клиентов всегда 50-60% от всей базы клиентов и с этим надо смириться. Я обычно вижу 70% от всей базе в этом грустном сегменте. Для того, чтобы убедиться, что сегмент грустный можно попробовать вернуть кого-то и для этого Джим Ново предлагает стратегию — «смириться», но если не верите, то начните с:
- Тех у кого несколько товаров в чеке
- Тех у кого чек больше
- Одноразовые покупатели, которые вернули товар — вероятнее придут к вам за второй покупкой, чем те, кто «всем доволен».
Если не удается их вернуть — вам никого не получится вернуть.
Единственная возможность вернуть покупателей за второй покупкой — обратиться к ним как можно быстрее. Но не слишком рано
Обратитесь слишком рано и будете навязчивым и будете предлагать лишние убийственные для бизнеса скидки.
Анализируйте эффективность писем в два клика
Зарегистрироваться
Давайте посмотрим на RF в динамике. Интересно, что по шкале давности мы всегда начинаем с хорошего (только что купили) и скатываемся к плохому (давно не покупал). И как только сделана покупка, мы всегда возвращаемся снова в самый оптимистичный сегмент:
С частотой все наоборот. Начинаем всегда с самого плохого сегмента (1 покупка) и с каждой покупкой становимся лучше. Шансов вернуться обратно практически нет (если считать частоту за какое-то окно (например, 2 года), то частота может уменьшаться)
А теперь посмотрим на всю картину целиком в матрице RF:
Мы всегда начинаем в сегменте «Только что» и с «1 покупки». А мечтаем, чтобы все клиенты попали в сегмент VIP. И самый короткий путь для этого — постоянные покупки. Если со старта клиент ничего не делает, он «сползает» по Давности в «редко», в сегмент «Одноразовых клиентов». Наша цель — не дать ему уйти. Для этого и созданы автоматические реанимационные письма 😉
Есть ещё один тонкий момент: что делать если пауза «затянулась» и клиент не покупал очень давно (значительно превышая жизненный цикл клиента). Мне кажется, в таком случае если он и придет к нам снова, то только если мы снова его «купим» контекстом, сео или разонравится тот магазин, где он все это время покупал. В любом случае к нам придёт совсем другой человек с другими интересами и возможностями. Поэтому мы предлагаем как в детской игре сделать «сброс».
Особенности такого подхода к RFM в том, что его можно применять в первый же день использования магазина. следить за динамикой активности ваших клиентов:
- Кого вы теряете?
- Что надо сделать, чтобы вернуть клиентов тогда, когда это ещё возможно?
А также сразу настроить триггера основанные на неактивности клиента.
Last post
Для кого подходит RFM-анализ клиентов?
В первую очередь это необходимо маркетологам:
- RFM полезен для различных типов бизнеса — онлайн, розничная торговля, direct-маркетинг и т.д.
- Чтобы создавать более точные маркетинговые кампании, что помогает выращивать лояльность клиентов.
- Для понимания своей аудитории и более удобной работы с сегментами.
- Чтобы объединять данные с другими инструментами, с целью получить подходящий портрет клиента.
Кроме того, это точно необходимо вам, если вы хотите:
1. Автоматизировать общение
С RFM легко построить сегменты по жизненному циклу клиентов как в CRM, так и в esp, который используется. Можно использовать сегментированный подход как на основе открытия писем и кликов, а также по покупкам.
2. Увеличить срок жизненного цикла клиента
RFM может помочь в сокращении оттока клиентов, для использования в дополнительных или кросс-продажах отдельным сегментам, которые с большей вероятностью откликнутся на предложение.
3. Минимизировать затраты на маркетинг и улучшить ROI
Нецелевые маркетинговые кампании зачастую обходятся дороже, чем небольшой, но целевой сегмент клиентов. Таким образом вы можете значительно сократит расходы, проводить больше экспериментов и более детальноь анализировать полученные данные.
4. Лучше понять ваш бизнес
Сбор данных о поведении клиента зачастую бывает сложным и трудоёмким. RFM анализ один из быстрых методов, чтобы исправить эту ситуацию. Вы сможете оценивать не только историю транзакция, а и сравнивать сегменты друг с другом, отслеживать переход клиента их одной группы в другую.
Как часто нужно будет пересматривать данные по RFM?
Можете потренироваться и построить таблицу RFM-анализа в Excel, тогда вам придётся при каждом заходе в актуализировать данные вручную.
Нашим клиентам достаточно будет после интеграции с сервисом зайти в раздел Контакты — Аналитика и автоматичестки построится RFM в email-рассылках, где станут доступны:
- анализ повторных покупок,
- данные по прочтениям и переходам,
- построение и выгрузка отдельных сегментов для рассылок
Данные по полученным сегментам будут обновляться ежедневно, в зависимости от поведения клиентов. Если интеграции с сервисом пока нет, тогда данные будут строиться только по показателям прочтений писем.
Вместо выводов
На этом я обзорную статью заканчиваю, и обещаю написать следующую, в которой постараюсь дать ответы на такие вопросы:
- Как каждый из сегментов читает почту? Сегмент «потерянные» вообще реагируют на почту?
- Какая доля в продажах каждого сегмента?
- Какое типичное соотношение клиентов по сегментам?
- Как изменяется стратегия работы с каждым сегментом?
- Кому продавать, а кому не мешать покупать?
Анализируйте эффективность писем в два клика
Зарегистрироваться
Хороших клиентов вам, пусть они все идут по самому короткому пути от Новичков в VIP 🙂
Статья обновлена от 16.06.2014
3.4
из 5 на основе 197
оценок
Как мы написали еще один алгоритм RFM-анализа / Mindbox corporate blog / Habr
Недавно мы рассказали, почему придумали свой RFM-сегментатор, который помогает сделать RFM-анализ за 20 секунд, и показали, как использовать его результаты в маркетинге.
Теперь рассказываем, как он устроен.
Нас не устроили имеющиеся подходы к RFM-анализу. Поэтому мы решили сделать свой сегментатор, который:
- Работает полностью автоматически.
- Строит от 3 до 15 сегментов.
- Подстраивается под любую сферу деятельности клиента (неважно, что это: магазин цветов или электроинструментов).
- Определяет количество и расположение сегментов на основе имеющихся данных, а не заранее заданных параметров, которые не могут быть универсальными.
- Выделяет сегменты так, чтобы в них всегда были потребители (в отличие от некоторых подходов, когда часть сегментов оказываются пустыми).
Когда мы осознали задачу, поняли, что человеку она не под силу, и попросили помощи у искусственного интеллекта. Чтобы научить машину делить потребителей на сегменты, решили использовать методы кластеризации.
Методы кластеризации используются для поиска структуры в данных и выделения в них групп похожих объектов — как раз то, что нужно для RFM-анализа.
Кластеризация относится к методам машинного обучения класса «обучение без учителя». Класс называется так, потому что есть данные, но никто не знает, что с ними делать, поэтому не может научить машину.
Нам не удалось найти на рынке компании, использующие подобный подход. Хотя нашли одну статью, в которой автор проводит научное исследование на эту тему. Но, как мы поняли на собственном опыте, от науки до бизнеса совсем не один шаг.
Этап 1. Предобработка данных
К кластеризации данные нужно подготовить.
Сначала проверяем их на наличие некорректных значений: отрицательные величины и т. п.
Затем удаляем выбросы — потребителей с необычными характеристиками. Их немного, но они могут сильно повлиять на результат, причем не в лучшую сторону. Чтобы их отделить, используем специальный метод машинного обучения — Local Outlier Factor.
Здесь на картинках использую только два измерения (R и M) из трех для облегчения восприятия.
Выбросы не участвуют в построении сегментов, но распределяются по ним после того, как сегменты сформированы.
Этап 2. Кластеризация потребителей
Уточняю терминологию: кластерами я называю группы объектов, которые получаются в результате использования алгоритмов кластеризации, а сегментами — конечный результат, то есть результат RFM-анализа.
Алгоритмов кластеризации несколько десятков. Примеры работы некоторых из них можно посмотреть в документации пакета scikit-learn.
Мы попробовали восемь алгоритмов с различными модификациями. Большинству не хватало памяти. Или же время их работы стремилось к бесконечности. Почти все алгоритмы, которым технически удалось справиться с задачей, выдавали жутковатые результаты: например, популярный DBSCAN счел 55% объектов шумом, а остальные разделил на 4302 кластера.
Фиолетовые объекты определены как «шум»
В результате мы выбрали алгоритм K-Means (K-средних), потому что он не ищет скоплений точек, а просто группирует точки вокруг центров. Как оказалось, это было верным решением.
Но сначала мы решили несколько проблем:
Неустойчивость. Это известная проблема большинства алгоритмов кластеризации и K-Means в том числе. Неустойчивость заключается в том, что при повторных запусках результаты могут быть разными, так как используется элемент случайности.
Поэтому мы кластеризуем многократно, а затем снова кластеризуем, но уже центры кластеров. В качестве конечных центров кластеров берем центры полученных кластеров (то есть кластеров, образованных центрами первых кластеров).Число кластеров. Данные могут быть разными, и число кластеров тоже должно быть разным.
Чтобы найти оптимальное число кластеров для каждой базы потребителей мы проводим кластеризацию с разным числом кластеров, а затем выбираем лучший результат.Скорость. Алгоритм K-means работает не очень быстро, но приемлемо (несколько минут для средней базы в несколько сотен тысяч потребителей). Однако мы запускаем его многократно: во-первых, для повышения устойчивости, во-вторых, для выбора числа кластеров. И время работы увеличивается очень сильно.
Для ускорения мы используем модификацию Mini Batch K-Means. Она пересчитывает центры кластеров на каждой итерации не по всем объектам, а только по небольшой подвыборке. Качество падает совсем немного, а вот время сокращается значительно.
Как только мы решили эти проблемы, кластеризация стала проходить успешно.
Этап 3. Постобработка кластеров
Полученные с помощью алгоритма кластеры нужно привести к удобному для восприятия виду.
Во-первых, мы превращаем эти кластеры из кривых в прямоугольные. Собственно, это и делает их сегментами. Прямоугольность сегментов — требование нашей системы и, кроме того, добавляет самим сегментам понятности. Для преобразования используем еще один алгоритм машинного обучения — дерево решений.
Решающее дерево строится на данных без выбросов, а выбросы затем распределяются по готовым сегментам
Во-вторых, мы сделали еще одну крутую штуку — описание сегментов. Специальный алгоритм, используя словарь, описывает каждый сегмент на живом русском языке, чтобы люди не испытывали тоску, глядя на бездушные цифры.
Продукт готов. Но перед началом продаж его нужно протестировать. То есть проверить, выполняется ли RFM-анализ так, как мы задумали.
Мы знаем, что лучший способ понять, сделали ли мы что-то стоящее, это узнать, насколько анализ полезен нашим клиентам. И мы так и сделаем. Но это долго, и результаты будут потом, а мы хотим знать, насколько успешно мы справились с задачей, уже сейчас.
Поэтому в качестве более простой и быстрой метрики мы использовали метод «исторической контрольной группы».
Для этого взяли несколько баз данных и просегментировали их с помощью RFM-анализа на разные моменты прошлого: одну базу на состояние полгода назад, другую — год назад и т. д.
На основании каждой сегментации для каждой базы мы построили свой прогноз действий клиентов от выбранного момента до настоящего. Затем сравнили эти прогнозы с реальным поведением покупателей.
Пример тестирования на исторической контрольной группе с контрольным периодом полгода
На картинке:
- Столбцы R, F и M условно обозначают границы сегментов по каждой из осей. Это результат сегментации базы в том виде, в котором она была полгода назад.
- Столбец «Размер» показывает размер сегмента полгода назад относительно общего размера базы.
- Столбы «Вероятность покупки» и «Сумма» — это данные о реальном поведении потребителей в течение следующих полугода.
- Вероятность покупки определяется как отношение количества потребителей из сегмента, совершивших покупку, к общему количеству потребителей в сегменте.
- Сумма — общая потраченная потребителями из сегмента сумма относительно суммы, потраченной потребителями из всех сегментов.
Результаты совпали. Например, клиенты из сегментов, для которых мы прогнозировали высокую частоту покупок, действительно покупали чаще.
Хотя мы и не можем на основании такого тестирования гарантировать правильность работы алгоритма на 100 процентов, мы решили, что оно прошло успешно.
Машинное обучение реально способно помочь бизнесу решить нерешаемые или решаемые очень плохо задачи.
Но реальная задача — это не соревнование на Kaggle. Здесь, кроме достижения лучшего качества по заданной метрике, нужно подумать о том, сколько алгоритм будет работать, будет ли он удобен людям и, вообще, нужно ли решать задачу при помощи ML или можно придумать способ попроще.
И, наконец, отсутствие формальной метрики качества в несколько раз усложняет задачу, потому что трудно правильно оценить результат.
Сегментация пользователей с помощью RFM-анализа
Публикация выходит в рамках цикла материалов об игровых метриках от App2Top.ru и devtodev. Статьи делятся по сезонам, каждый из которых посвящен конкретной теме. Второй сезон называется «Пользователи». В нем мы рассказываем про те бизнес-метрики, которые отражают эффективность приложения в плане работы с аудиторией.
Вера Карпова
В данной статье пойдет речь про еще один инструмент сегментации платящих пользователей – RFM-анализ. Он делит пользователей на определенные группы в зависимости от давности (Recency), частоты (Frequency) и общей суммы (Monetary) их платежей.
Обычно задача такого анализа – изучить поведение пользователей, то, как они совершают платежи, чтобы сделать более релевантные предложения каждой из выделенных групп, сформированных по трем критериям.
- Recency – разница между текущей датой и датой последнего платежа, совершенного пользователем.
- Frequency – количество транзакций, которые сделал пользователь за исследуемый промежуток времени.
- Monetary – сумма покупок пользователя за этот же исследуемый период
Все эти три показателя рассчитываются отдельно для каждого пользователя за выбранный период, после чего пользователям должна быть проставлена оценка по каждому из трех критериев. Диапазон оценок может быть разный: 1-3, 1-4, 1-5 и так далее. Чем шире диапазон, тем больше групп получится и тем «чувствительнее» и точнее будут показатели, но в то же время тем будет тяжелее с ними работать из-за большого разнообразия комбинаций.
Для выставления баллов пользователям обычно используется два метода:
1) Фиксированные диапазоны
В этом случае надо самостоятельно определить границы для каждого из критериев, используя свой опыт работы с продуктом, определить, что значит платеж, совершенный давно, недавно, на крупную сумму или среднюю и так далее. Затем нужно присвоить пользователям соответствующие оценки.
Например, можно задать следующие рамки для параметров RFM:
Recency
а) Те пользователи, которые платили последний раз давно (более 14-дней назад) получат 1 балл.
б) Те, кто платили 8-14 дней назад – 2 балла.
в) Те, кто платил последний раз недавно (1-7 дней назад) получат 3 балла.
Frequency
а) Совершившие только 1 платеж за выбранный период – 1 балл.
б) Кто платил со средней регулярностью и совершил 2-3 платежа – 2 балла.
в) Кто платил часто и сделал более 3 платежей – 3 балла.
Monetary
а) Те, кто заплатил $1-$10 получают 1 балл, так как это минимальная сумма платежа в проекте.
б) Те, кто заплатил $11-$20 получат 2 балла
в) Те, кто оставил в продукте более $20 получат 3 балла.
2) Квантили
Второй метод определения границ – использование квантилей. Для этого нужно упорядочить данные по одному из критериев, например, по количеству платежей, а затем разделить пользователей либо на равные группы (например, выделить 4 группы по 25% пользователей в каждой), либо выделить первые 10% пользователей и присвоить им максимальный балл как платящим много, следующим 50% – 2 балла, и тем, кто платил совсем мало (40%) – 1 балл. В этом случае границы определяются экспертно.
Попробуем использовать эти методы на примере и предположим, что у нас есть следующие данные о пользователях.
Вначале попробуем метод фиксированных диапазонов и в качестве границ каждого измерения используем те, что были описаны выше, после чего, исходя из этих значений, проставим оценку каждому пользователю.
Теперь проставим баллы пользователям, используя квантили. Для этого нужно упорядочить их по возрастанию одного из трех показателей и разделить на равные части (пусть этих частей будет 3).
Так нужно сделать по каждому показателю. В итоге получаем таблицу с баллами.
Когда оценки проставлены, пользователей можно сгруппировать в определенные сегменты. В нашем примере используем первый вариант выставления баллов, когда границы задавались экспертным путем.
И помимо количества пользователей в каждом сегменте, посчитаем доход от них.
Из этого видно, что большее кол-во пользователей – те, кто платили со средней регулярностью мало и давно.
Такие пользователи, скорее всего, потеряны для проекта, но все же можно попытаться их вернуть, связавшись каким-либо образом и предложив что-то, что может быть им полезно и интересно в этот момент, сохранив тем самым их в проекте.
Цель RFM-анализа и формирования сегментов заключается в том, чтобы в зависимости от платежного поведения пользователей, определенным образом на них воздействовать: отправлять пуш или email-уведомления, предлагать бонусы, офферы и скидки, разблокировать контент и так далее. Причем важно делать все это таргетированно с посылом, который будет релевантен каждой отдельной группе.
В результате этих действий можно улучшить удержание, возвращая в проект тех платящих пользователей, которые перестали быть активны, можно повысить доход, конвертируя пользователей, совершивших один платеж, предотвращая тем самым отток лояльных пользователей.
Вот несколько примеров сегментов, которые можно выделить в результате RFM анализа:
1) Те, кто платил часто, много и недавно (R=3, F=3, M=3) – это самые лояльные и активные пользователи, которых нужно беречь и поддерживать их интерес к проекту.
2) Их полная противоположность (R=1, F=1, M=1). Скорее всего, это уже потерянные пользователи: они платили давно, мало и редко.
3) Те, кто когда-то платил много и часто, но давно (R=1, F=2/3, M=2/3) – лояльные пользователи на грани ухода. Как и предыдущую категорию, можно попробовать их вернуть в проект, прислав push уведомление или предложив бонус или скидку
4) Тех, кто совершил недавно один платеж (R=3, F=1, M=X) стоит мотивировать на совершение повторных платежей.
Поскольку в анализе присутствуют 3 показателя, стандартные графики или таблицы обычно имеют 2 измерения, чаще всего 2 из них совмещают. Обычно это «frequency и monetary» или «frequency и recency», как в devtodev.
Стоит отметить, что показатель monetary не всегда учитывается для сегментации платящих пользователей. Одной из разновидностей такой сегментации является RF-анализ, который учитывает только давность и частоту платежей, уменьшая кол-во групп и упрощая восприятие результатов.
RFM-анализ – полезный инструмент сегментирования пользователей, позволяющий проанализировать платящую аудиторию проекта, выявить превалирующие сегменты, определить таким образом слабые места в приложении, а также повысить ключевые метрики продукта, такие как удержание, конверсия и доход, взаимодействуя с каждым пользовательским сегментом наиболее подходящим для него способом.
Читайте также материалы про другие метрики:
Сегментация базы клиентов в e-mail маркетинге. RFM-анализ
Автор: Татьяна Гаврилина, специалист по e-mail маркетингу компании Promodo. Автор ряда публикаций на тему интернет-маркетинга, в частности — SEO-копирайтинга, продвижения в социальных медиа и др.
Сегментация клиентов ― обязательное мероприятие в интернет-маркетинге. Только имея представление о том, какие клиенты формируют базу данных, и какого рода предложение с большей вероятностью их заинтересует, можно рассчитывать на успех рекламной кампании в целом. Особенно вопрос сегментации базы клиентов актуален в контексте стремительного развития e-commerce. Интернет-магазинов становится все больше, но лишь немногие извлекают выгоду из онлайн-торговли. Понять предпочтения своих клиентов поможет их сегментация по определенным параметрам. Один из способов сегментации списка клиентов ― RFM-анализ.
Особенности RFM-анализа
RFM-анализ ― это возможность оценить клиентскую базу на предмет ее склонности к отклику на предложение. Грубо говоря, такая сегментация даст понимание того, какие клиенты сделают покупку, а какие ― даже не откроют письмо.
Таким образом, можно определить, насколько целесообразно тратить рекламный бюджет на привлечение того или иного клиента: по истории покупок можно решить, заслуживает ли клиент новой маркетинговой стратегии. Это называется целевым выбором, целевой стратегией.
Основан анализ на трех переменных:
- Recency ― давность покупки (период, который прошел с момента последней покупки и до сегодняшнего дня)
- Frequency ― частота покупок (сколько всего покупок сделал клиент за всю историю общения с компанией)
- Monetary ― денежная ценность покупок (общая сумма денег, на которую были совершены покупки)
Последовательность букв, из которых состоит аббревиатура RFM, неслучайна, и указывает на степень важности каждой переменной. Давность ― более приоритетный критерий по сравнению с частотой и ценностью, в свою очередь, ценность ― менее приоритетный показатель, чем частота.
Не стоит расценивать RFM-анализ как способ просто предугадать поведение потребителей. С его помощью можно более-менее точно спрогнозировать это поведение. Анализ отталкивается от истории покупок. Другими словами, RFM-анализ применим только по отношению к состоявшимся клиентам, поскольку у потенциальных клиентов еще нет истории покупок. Данный метод сегментации клиентской базы одинаково подходит как для потребительского рынка, так и для корпоративного.
Реализуется анализ за счет применения метода точных квинтилей, который, по сравнению с методом жесткого кодирования, более точный.
Сегментация по давности покупок
С чего начать? Есть база клиентов, где содержатся демографические данные по каждому клиенту, и история их покупок (Что? Сколько? Когда? Почем?). Сначала анализируется база данных по давности покупок. Для этого нужно поделить всю базу клиентов на 5 точных квинтилей в зависимости от того, когда была осуществлена последняя покупка.
Получается что-то похожее на столбик, разделенный на сегменты. Самому верхнему сегменту присваивается код 5, следующему ― 4, затем ― 3, 2 и 1.
Сегмент с кодом 5 охватывает покупателей, которые совершили покупку недавно, то есть, позже всех; сегмент с кодом 1 охватывает тех, кто совершил покупки давно, то есть, раньше всех. Остальные сегменты (2, 3, 4) ― это данные по клиентам, которые сделали покупки в промежутке между самой ранней и самой поздней покупками.
Для точности результатов сегментирования необходимо определиться с тем, какой временной промежуток берется за основу. Другими словами, «позже всех» ― это сколько?
Например:
Сегмент «5»: 0-1 месяцев
Сегмент «4»: 2-4 месяцев
Сегмент «3»: 5-8 месяцев
Сегмент «2»: 9-11 месяцев
Сегмент «1»: 12 месяцев и больше
Мы осуществили кодировку базы данных по давности. Исходя из полученных результатов, можно предположить, представители какого сегмента быстрее и охотнее откликнутся на наше предложение. Ими будут клиенты с кодом 5. При этом, уровень отклика на предложение в квинтиле 5 будет выше, чем в квинтиле 4, который, в свою очередь, будет активнее представителей квинтеля 3, и т.д.
Почему так? Чем свежее память о совершенной недавно покупке, тем выше вероятность еще одной покупки. В данном случае, на первый план выходит психология. Что для человека покупка? Удовольствие от того, что деньги инвестируются правильно, что у него появилась долгожданная вещь, которая однозначно улучшит его жизнь. Когда приятные эмоции от совершенной, допустим, вчера покупки еще актуальны, есть все шансы воспользоваться ими и продать такому покупателю что-то еще. И наоборот: чем больше времени прошло с момента последней покупки, тем ниже вероятность того, что этот клиент совершит очередную покупку в этом же магазине.
Сегментация по частоте покупок
Следует отметить, что для каждой сферы бизнеса понятие «покупка» свое. Это может быть как покупка телевизора (если речь идет об интернет-магазине аудио-, видеотехники), так и переход на новый тарифный план (если речь идет б интернет-провайдере, веб-студии и т.д.), и вообще любое изменение клиентом предыдущей модели сотрудничества. Необходимо определиться с пониманием слова «покупка».
Аналогично предыдущей схеме, нужно сегментировать клиентов/подписчиков на пять квинтилей. В квинтиль с кодом 5 попадут клиенты, чаще всего совершающие покупки, в квинтиль 4 ― клиенты, совершающие покупки не так часто, как представители верхнего квинтиля, и так далее, по ниспадающей. Следует понимать, что среди клиентов квинтиля 1 окажутся те, которые совершают покупки реже всех, и имеют непродолжительную историю сотрудничества с компанией.
Например, клиент сделал покупку вчера. По критерию давности он получит код 5, а по критерию частоты ― 1. И таких клиентов, совершивших одну покупку как вчера, так и год назад ― большое количество. Именно поэтому квинтиль с кодом 1 окажется большим. Сегментация клиентов по частоте покупок станет отличной демонстрацией «привязанности» клиентов к компании. Чем чаще клиент пользуется услугами/предложениями, тем вероятнее высокий уровень его доверия.
Чтобы получить максимально точный результат кодировки базы данных по показателю частоты, следует определиться, какая частота будет оптимальной, на что нужно будет ориентироваться, какое количество сделок (покупок/заказов/подключений) будет тем максимумом, от которого надо отталкиваться.
Например:
Сегмент «5»: 20 и больше покупок
Сегмент «4»: 15-19 покупок
Сегмент «3»: 11-14 покупок
Сегмент «2»: 5-10 покупок
Сегмент «1»: 0-4 покупок
Сегментация по денежной ценности
Критерий денежной ценности покупок менее важен, чем критерий давности и частоты. Однако и его следует учитывать. Чтобы осуществить деление базы данных по денежной ценности, нужно определить для каждого клиента общую сумму денег, на которую он совершил покупки (другие действия) на сайте. В сегмент с кодом 5 попадут клиенты, которые потратили больше всех денег, в сегмент с кодом 1 ― меньше всех.
При этом, важно понимать, что покупатели нижнего сегмента (1) могут покупать часто, но за небольшие деньги. То есть, они неохотно тратят большие суммы денег, им лучше купить много недорогих товаров, чем совершать серьезные приобретения. Таким образом, можно предположить, какому сегменту какие товары предлагать (по цене, количеству).
Сегментация осуществлена. Что дальше?
Результаты анализа должны помочь разобраться, с какими категориями клиентов предстоит иметь дело, и как использовать эту информацию:
- Кто тратит много и часто?
- Кто делает дорогие покупки раз в полгода?
- Кто давно заходил на сайт и кого можно «реанимировать», и т.д.
Путем сегментации каждому клиенту присваивается трехзначная цифра, состоящую из показателя давности, частоты и ценности. Всего ― 125 ячеек, которые выглядят как 555, 554, 553, 552, 551… 113, 112, 111. Это характеристики клиентов, выраженные в цифрах.
Чтобы понять, насколько правильно осуществлен анализ, следует сформировать предложение и отправить его тест-группе ― то есть, составить список получателей по принципу «каждый N-й». Как правило, каждый N-й ― это каждый 10-й (может быть и другая выборка). Результаты отклика на предложение можно использовать при определении уровня и индекса безубыточности.
Задача ― зарабатывать на продажах, а не нести убытки. Чтобы контролировать данный процесс, в маркетинге введено понятие «уровень безубыточности». Это процентное соотношение прибыли от продаж тестовой группе к затратам, потраченным на рекламу, адресованную этой же группе.
УрБез = затраты на акт продажи / чистая прибыль с одной продажи
Например, если на одной продаже удалось заработать 100 гривен, а затраты на продажу составили те же 100 гривен, значит, уровень безубыточности ― 0. То есть, 0 – это тот показатель, которого должна достигнуть тестовая группа, чтобы обеспечить безубыточность рекламной кампании.
Чтобы понимать, какая из ячеек самая прибыльная и наоборот, нужен индекс безубыточности. Он также просчитывается по формуле и демонстрирует, насколько та или иная ячейка безубыточна. Так, если полученный показатель будет со знаком минус, это говорит об убыточности RFM-ячейки, если он равен 0 ― ячейка убытков не приносит.
Формула для определения индекса безубыточности:
k = ((r – УрБез) / (УрБез)) * 100%, где r ― уровень отклика ячейки.
Размер ячейки ― важный для достоверности результатов критерий. В зависимости от того, идет речь о потребительских клиентских рынках или о корпоративных, размер каждой RFM-ячейки будет варьироваться. Чем больше клиентов, тем больше будет ячейка, и наоборот. Для корпоративных клиентов, допустим, эти размеры будут небольшими. С одной стороны, в каждой такой ячейке должно быть достаточно много респондентов, чтобы данные были максимально достоверными, с другой ― достаточно мало, чтобы затраты на маркетинговые активности были невысокими.
Определить минимальный объем ячейки поможет следующая формула:
RFM-ячейка = 4 / УрБез
Что нам даст знание, какая из RFM-ячеек какую имеет кодировку?
Клиенты 555:
- последнюю покупку сделали недавно
- покупки делают часто
- денег на покупки тратят много
Это наиболее привлекательная ниша. Главный упор в данном случае необходимо делать на формировании лояльных отношений с такими клиентами. И, напротив ― от предложений о скидках, акциях и распродажах следует отказаться.
Клиенты 111:
- последнюю покупку сделали давно
- покупок делают мало
- денег на покупки тратят мало
Такие клиенты представляют небольшую ценность. В некоторых сферах бизнеса от них целесообразней отказаться, чем тратить на их привлечение бюджет и время специалистов. Вполне возможно, это «мертвая» зона, сегмент «транзитных» клиентов, которым все равно, у кого покупать, и которые с трудом расстаются со своими деньгами.
Клиенты 511:
- последнюю покупку сделали недавно
- покупок делают мало
- денег на покупки тратят мало
Это могут быть:
а) клиенты, которые впервые сделали покупку в магазине
б) клиенты, к которым вернулся интерес к интернет-магазину. На первый взгляд, такие клиенты безнадежны. С другой же стороны, есть шанс заинтересовать их привлекательным и вовремя отправленным предложением. Важно мотивировать их скидками, акционными и бонусными предложениями
Клиенты 115:
- последнюю покупку сделали давно
- покупок делают мало
- денег на покупки тратят много
Такие клиенты, вполне возможно, обдуманно подходят к покупкам, и готовы к большим капиталовложениям при правильной мотивации. Давность покупок свидетельствует лишь о том, что надо активно действовать по возврату этих клиентов.
RFM-анализ может сослужить полезную службу маркетологу, если стоит цель ― изучить клиентскую базу и понять, что, кому, когда, в каких объемах и по какой цене предлагать. В конце концов, это один из способов заработать больше, используя для этого прежние ресурсы.