Здравствуйте, Николай. Небольшое вступление: представьтесь, пожалуйста, нашим читателям.
Меня зовут Николай Хлебинский, я руковожу компанией Retail Rocket, являюсь её со-основателем и генеральным директором. Retail Rocket — это платформа мультиканальной персонализации интернет-магазинов на основе анализа данных. Система выявляет потребности посетителей интернет-магазинов и в определённый момент делает им соответствующие предложения: на сайте магазина, через электронную почту и при помощи других необходимых каналов коммуникации с клиентами. Таким образом, увеличивается доход магазина за счет роста конверсии, среднего чека и частоты повторных покупок.
Каковы стоимость внедрения и совместимость с различными CMS?
Никаких требований или ограничений по системе управления сайтом нет. Дело в том, что принцип нашей работы похож во-первых на Google Analytics, а именно: есть небольшой фрагмент кода, который устанавливается на сайт. Соответственно, как нет специфических требований у GA — система применима ко всем сайтам, то же самое происходит и у нас.
Кроме всего прочего, мы поддерживаем выгрузку товаров в формате Яндекс.Маркета, так называемые YML файлы — они есть у любого интернет-магазина, который размещается на Маркете и активно занимается трафик-менеджментом. Но даже если у владельца ресурса такого файла нет, у нас есть специальные модули для различных CMS, которые позволяют сформировать такой файл.
Мы расцениваем ресурсы, которые нужны на внедрение в 15-30 минут IT специалиста.
Вы работаете в ритейле уже более 10 лет, ваш сервис обслуживает более 500 сайтов. Разумно вас спросить, как вы видите состояние ритейл-отрасли на данный момент: какие есть сильные и слабые стороны?
У нас развивающийся рынок. Поскольку с одной стороны Россия имеет самое большое количество пользователей в Европе, с другой стороны проникновение электронной коммерции в общий ритейл значительно отстаёт от западных рынков. Около 2% занимает электронная торговля от общего рынка, в то время как, например, в Англии это около 6-7%, а в США ещё больше: примерно 10%. Это значит, что есть куда расти.
До сих пор в большом количестве ниш электронной коммерции не существует явного лидера. Есть доминирующие игроки, которые «держат» большую долю рынка, но как таковых явных лидеров пока что нет. Явная консолидация рынка, конечно, начинается: происходят сделки по слиянию компаний, но, в основном, это происходит в сегменте электроники, бытовой техники. В других сегментах эта тенденция пока не набрала обороты. Это даёт повод для привлечения инвестиционного капитала в развивающиеся ниши: детские товары, спортивные товары, ювелирка и ещё ряд самых быстрорастущих сегментов.
Можно ли сказать, что «все ушли в интернет»?
Зависит от сегмента. Если говорить про электронику, то, конечно, все крупнейшие магазины имеют интернет-площадку. И их онлайн магазин будет одним из крупнейших магазинов электроники в стране. Если говорить, например, про направление fashion, то здесь хотя сегмент и развит серьёзно — это Wildberries, Lamoda и т. д., но, в то же время, крупные оффлайн бренды делают пока что только первые шаги в Интернете. У крупнейших брендов, которые мы все видим в крупнейших торговых центрах интернет-магазины только начинают появляться сейчас.
В секторе travel, если мы возьмём Аэрофлот, то это на сегодняшний день крупнейший e-commerce в России и там с интернетом очень давно всё обстоит очень серьёзно. В целом, проникновение будет безусловно расти.
Мы сейчас находимся на той стадии, на которой Англия находилась 5-6 лет назад и 7-8 лет назад на этой стадии находились США.
Какие аналоги есть у вашего сервиса?
Первые упоминания о технологии товарных рекоммендаций именно в электронной коммерции датируются девяносто четвертым годом. Тогда в США начали появляться первые публикации о том, как математические модели позволяют больше продавать.
В России первые упоминания появляются где-то в середине двухтысячных: 2006-2007 год. Тогда начали публиковаться цифры и крупнейшие магазины начали использовать этот подход. Хедлайнером рекомендательных систем был Amazon, в России это был Ozon.ru В итоге, бывшие сотрудники Амазона создали несколько рекомендательных платформ, которыми пользуются на сегодняшний день. На западе таких решений больше, чем в России. Многие западные решения работают на российском рынке, но мы с ними успешно конкурируем.
Есть и русские аналоги: примерно раз в месяц у нас появляется новый конкурент. Какая-нибудь команда решает сделать похожую систему, делают прототип, и пытаются с этим прототипом выйти на рынок.Это не удивительно, потому что фундаментальные математические подходы, которые используются в данного типа системах — находятся в открытом доступе. Скажу даже больше: за последние лет 10 с точки зрения науки здесь ничего нового особо не появилось. Дело кроется, естественно, в деталях. Мы недавно посчитали: на создание нашей системы мы потратили, в общей сложности, 35 человеколет. За это время мы сделали так много, что в России пока что догнать нас никто не может.
Каковы конкурентные преимущества Retail Rocket?
Это зрелый продукт. Над его созданием и улучшением работают люди, которые большое количество лет занимались построением рекомендательных систем в крупнейших интернет-магазинах.
У нас соответствующе выстроены процессы по сбору, хранению и анализу данных. У нас регулярно проходят split-тесты новых механизмов: мы проверяем гипотезы, которые должны улучшать показатели текущей экономической эффективности, благодаря чему эффективность системы для наших пользователей непрерывно растёт — мы работаем над этим. Это наша культура разработки.
Мы строим высоконагруженную систему, которой пользуются крупнейшие интернет-магазины, а у них соответствующие требования к стабильности и отказоустойчивости. Мы работаем по высоким стандартам.
Расскажите, пожалуйста, про Big Data и облачные технологии, задействованные в системе.
Как правило, мне не нравится говорить о Big Data и облачных технологиях. Зачастую маркетологи используют их «для красного словца». У нас есть такое понимание, как «большие данные», но для них есть довольно строгое определение: это любые объемы данных, которые не помещаются в максимально доступный на сегодняшний день объем оперативной памяти одной машины. Если отбросить суперкомпьютеры, которые вы сможете найти только во вполне конкретных университетах в Америке, то это будет в районе ста с лишним гигабайт. Если есть объем данных, превышающий этот порог, то никакими обычными доступными человеку средствами этот объем данных обработать нельзя. Вот тогда в игру вступают аналитические системы, которые занимаются расчетами на основе этих данных.
Что касается облачных технологий, то я и здесь предпочитаю конкретику. Я считаю, что «облачным» сейчас могут назвать почти любой сервис, который находится не на компьютере пользователя. С точки зрения наших клиентов, мы являемся облачным сервисом, поскольку вычислительные мощности (так как эти объемы больших данных) находятся на нашей стороне и клиенту нет необходимости следить за этими вычислительными мощностями, администрировать их, добавлять новые и т. д.
В нашем случае это довольно актуально, поскольку в основе математических операций, которые находятся в зоне нашей экспертизы, лежат помимо сбора и хранения большого количества данных, ну, скажем, операции по перемножению матриц. Они довольно ресурсоёмки, потому что размер этих матриц измеряется объемом количества товаров, перемноженного на количество товаров или количество пользователей. Это шестизначные цифры, на самом деле в размерности. Работа с такими объемами довольно затратна и требует определённых навыков. Здесь нужна не только сама математика, но и инженерные навыки: как построить систему, которая будет стабильно работать на таких объемах. Поэтому с точки зрения наших клиентов мы являемся облачным сервисом.
Хотелось бы понять масштаб вычислений. Назовите, пожалуйста, цифры.
Мы арендуем в дата-центре несколько стоек, на которых расположены около 70 серверов. Большая часть Российского Big Data сосредоточена в Hetzner.
Вычисления идут непрерывно, на нескольких уровнях. У нас есть подсистема, которая строит персональные рекомендации в реальном времени. Это значит, что в момент запроса, поднимаются все данные, которые есть по пользователю, обрабатываются, и выдаётся тот набор товаров, который актуален для человека в данный момент. Также, есть системы, которые производят вычисления в оффлайне и тоже делают это непрерывно. Например, это анализ характеристик товаров — товары меняются нечасто. Меняется в целом картина, когда добавляются новые товары. Однако делать это в реальном времени особого смысла нет.
С точки зрения объемов, последняя цифра, которая у меня есть на момент середины лета — это примерно 6 Гб сырых данных для анализа в час.
Как устроена система почтовых рассылок в применении к рекомендательным сервисам?
У нас своя идеология: мы не занимаемся email маркетингом в традиционном для электронной коммерции виде, когда раз в неделю или несколько раз в неделю уходят рассылки, которые формирует редактор. Такие системы уже существуют, их довольно много, больше десятка даже в России: это и Intelligent Emails, GetResponse, Unisender, Expertsender, Sendsey и ещё много других.
Мы занимаемся тем, что называется «триггерные рассылки». Это письма, которые автоматически отправляются человеку в зависимости от того, на каком этапе воронки продаж он остановился. Такие письма настраиваются один раз. На данный момент у нас есть около десятка таких сценариев, завязанных на поведении пользователя на сайте и воронке продаж.
Наиболее распространенный на сегодня сценарий — это так называемая «Брошенная корзина», когда пользователь начал покупать на сайте, добавил товары в корзину, но затем не оформил заказ. Для многих он уже доказал свою эффективность, а мы, помимо такого, предлагаем еще десяток настолько же эффективных.
Может ли маркетолог-редактор, который занимается редакторскими рассылками, контролировать их частоту в соотношении с триггерными? Предусмотрена ли такая прозрачность системой?
Конечно, система предоставляет развёрнутую отчетность, которая показывает все рассылки. Кроме того, система подразумевает и другие важнейшие инструменты работы с почтовой рассылкой. Так, мы тщательно следим за анти-спам политикой: рассылаем письма только тем, кто дал согласие на их получение. Это важный для нас аспект, поскольку рассылка идёт от лица клиента, хотя и производится через нашу платформу. Все письма содержат принудительно ссылку на отписку, которую нельзя удалить из тела письма. Любой человек может отказаться от получения этих писем и больше никогда их не получит.
А также система следит за количеством жалоб на спам. Есть вполне определённые отраслевые стандарты: на сегодняшний день доля жалоб на спам не должна превышать 0.2% от отправленных писем. Это значит, что на каждую тысячу писем не должно быть более двух жалоб на спам. Если эти показатели превышаются, то система будет сама останавливать рассылку и уведомит пользователя о необходимости принятия мер.
Также у нас есть интеграция со всеми крупнейшими российскими системами для email-маркетинга. В этом случае мы являемся поставщиком данных, а отправка писем производится через третью сторону. Это опция для тех наших крупных клиентов, которые предпочитают весь email-маркетинг вести в своей системе.
Какие мероприятия в сфере маркетинга вы посещаете?
В России есть несколько мероприятий, посвященных электронной коммерции. Ближайшее будет проводиться в начале ноября — «Электронная торговля», которое организует Оборот.ру, после этого в ноябре будет «Онлайн ритейл», который два раза в год проходит. Есть ещё несколько мероприятий поменьше, которые связаны с электронной коммерцией, это eRetailForum, а также Практика Days. Последниее мероприятие организуют Борис Преображенский и Давлет Сулейманов. Есть Case-club e-commerce, организуемый Сергеем Егорушкиным. Кроме того, проходят мероприятия связанные с аналитикой и разработкой ПО: это HighLoad++, iMetrics и GoAnalytics!, который, кстати, будет на этой неделе..
Есть секции, посвященные электронной коммерции на крупнейших мероприятиях типа российского Интернет-форума или Russian Internet Week.
Наша Команда команда аналитиков участвует регулярно (и довольно успешно) участвует в конкурсах, которые проходят не в России и посвящены Big Data и анализу данных – kaggle, texata и т.д.
Что бы вы пожелали коллегам по индустрии?
Пожалуй, пожелал бы побольше решений, особенно важных решений, принимать не на основе экспертных оценок или субъективных идей, а на основе анализа данных — их в Интернете на сегодняшний день более чем достаточно, чтобы буквально на любой вопрос получить ответ.
Обсуждение