3 Min. Read

Рубрика «Блог CEO»: борьба с мошенничеством, Google Search и машинное обучение

Avatar Oren Kaniel May 18, 2017

Масштаб и изощренность мошенничеств в сфере мобильной рекламы растут с угрожающей скоростью, делая это явление более опасным, чем когда-либо.

Поскольку мы в AppsFlyer работаем со многими крупнейшими рекламодателями по всему миру, мы распознали первые формы мошенничества в мобильной рекламе еще в 2012 году. Это подтолкнуло нас к быстрому созданию механизмов для блокировке этих ранних форм мошенничества, таких как автоматическая блокировка подозрительных IP-адресов и введение собственной аутентификации SDK на стороне клиента. Мы также объединились с компаниями, занимающимися борьбой с мошенничеством, чтобы наши клиенты смогли работать с понравившимися им инструментами. Однако мы довольно быстро поняли, что, благодаря своим масштабам, мы гораздо быстрее обнаруживаем и блокируем отклонения, чем кто-либо другой в индустрии.

Для меня это был момент осознания: данные — это не просто новое топливо, это абсолютно все! Данные — это топливо, сетевой эффект, значимый порог входа, а самое главное — ценность, которую может предоставить своим клиентам компания, и никто другой кроме нее. Грандиозные технологии — это еще не все, ведь сейчас практически любую технологию можно сравнительно легко имитировать. Как только вы начинаете предлагать отличную технологию и продукт, который нравится клиентам, можно переходить к следующему этапу — совершенствованию технологии и продукта за счет максимально эффективного использования собранных данных и машинного обучения. И это именно тот момент, когда можно провести четкую границу между превосходным и посредственным.

Давайте отвлечемся на мгновение и посмотрим на Google Search. Технология индексирования доступна для использования компаниям (и теоретически кому угодно) уже довольно давно. Так почему же Google не знает равных на этом поле уже более 15 лет? Ответ прост: данные! Данные, каждый день собираемые поисковой системой, — это топливо, питающее ее поисковый алгоритм. Технически это мы, пользователи, целый день подпитываем Google данными. Ежедневно. Именно из-за этого нескончаемого потока данных компания Google способна обеспечивать превосходные результаты поиска. Теоретически, если бы все мы перестали использовать Google Search и перешли на другого провайдера — скажем, Bing, — он вскоре стал бы лучше выдавать результаты поиска, в то время как результаты Google со временем утратили бы актуальность.

Именно так устроены Active Fraud Suite и DeviceRank от AppsFlyer. AppsFlyer измеряет миллиарды долларов затрат на мобильную рекламу, более 500 миллиардов мобильных взаимодействий примерно с 98% смартфонов по всему миру ежемесячно. В среднем мы взаимодействуем с каждым устройством и видим его несколько раз в день. Ежедневно. Это позволяет нам распознавать аномалии устройства как на уровне пользователя, так и на уровне рекламной сети. Например, поскольку (i) пользователь не может щелкнуть по нескольким объявлениям за одну секунду, (ii) физически не может одновременно находиться в нескольких точках мира и (iii) мы распознаем 98% мировых устройств, кампания просто не может иметь показатель новых устройств 70%. Если такое происходит, это 100% мошенничество.

Лично я не поклонник хайпа. Машинное обучение и искусственный интеллект сейчас определенно на первых ролях, но нужно смотреть шире! Машинное обучение ничего не стоит без непрерывного потока масштабных данных, на которых происходит обучение. Таким образом, только имея надежную технологию, отличный продукт и масштабные данные, вы можете вывести свой продукт из разряда качественных в разряд превосходных. И именно так достигается уровень, на котором вы предлагаете ценность, которую никто другой предложить не может.

Антимошеннический продукт — это подстава, поскольку он в основном состоит из внутренних алгоритмов и машинного обучения, делающих его гораздо менее заметным. Пока наши конкуренты пытаются наверстать то, что мы уже узнали и внедрили несколько лет назад, мы опережаем их на несколько шагов в эффективном использовании своего масштаба и данных. В результате наши конкуренты интенсивно инвестируют в маркетинг, вызывая ажиотаж на рынке и среди рекламодателей, в то время как их антифрод-инструменты сосредоточены на статических, основанных на правилах механизмах без данных. Как Bing.

Борьба с мошенничеством — это игра в кошки-мышки. Наши масштабы позволяют нам быстро поймать мошенников (мышей), автоматически прививая иммунитет от мошенничества всей нашей клиентской базе.