Викторина, тесты и кредит доверия: все через большие данные

Продолжаем серию публикаций, связанных Big-Data. Это слово не сходит с языка многих бизнес-конференций. Интересно, что на сегодняшний момент, оно еще не пришло в малые бизнес сообщества, онлайн школы, тренинги, семинары. Big-Data в основном обсуждаются на крупных конференциях. Преимущество от их использования, соответственно, есть у крупного и среднего бизнеса, но в недалеком будущем их получит не только малый бизнес, но и каждый человек.

Cambridge Analytica

Эта корпорация знаменита тем, что выпустила приложение «This Is your Digital Life» (это есть твоя цифровая жизнь), в котором пользователям предлагалось пройти увлекательную викторину с ответом на множество вопросов о себе, о предпочтениях, жизни и иных вещах, для многих являющихся весьма интимными. Вроде ничего особенного, пользователи же на все отвечают добровольно, однако потом выяснилось, что эти данные попросту собираются и на основе их проводятся серьезные исследования. При этом они сличают с тем, чего пользователи о себе не рассказывали, но это известно из их профиля на facebook. Таким образом, удалось выявить такой параметр как «честность», но это далеко не все.

  • Cambridge Analytica по различным сведениям собрала около 81 миллион аккаунтов Facebook, принадлежащих реальным лицам. Сканировались не только анкеты, со скажем так, добровольческими ответами пользователей, но и их аккаунты, и все данные сличались.

Глубинный анализ больших данных

Cambridge Analytica — хороший пример глубинного анализа данных. Именно так компания себя позиционирует. Такая услуга в списке стоит на первом месте. Кстати, в нем есть необычные направления, например «политическое консультирование». Интересно, что к услугам этой компании из Великобритании прибегал Сбербанк для улучшения так называемого скоринга.

Глубинный анализ подразумевает моделирование ситуаций в социальных массах при вымышленных (планируемых) факторах на основе того, что происходило ранее, и было записано в больших данных. Такой метод носит название как «Имитационное моделирование» и его рекомендует крупная консалтинговая компания McKinsey. Такое моделирование нельзя проводить вручную. Требуются компьютеры и огромная вычислительная мощность.

Нужно проводить поиск среди массивов данных объемом эксабайты. Поисковые гиганты Google или Яндекс, работают с куда меньшими объемами данных, поскольку из всего гигантского интернета они учитывают только тексты. А часто это даже не сами тексты с сайтов, а только так называемые проиндексированные фрагменты.

Клиенты нужны всем, персонифицированная реклама или Big-Data в массы

Большие данные имеют не только громадный объем, но и гигантский охват аудитории. По рекомендациям специалистов, относить данные к большим данным целесообразно только тогда, когда объем их сбора превышает 100 Гб в день. Большой охват аудитории позволяет знать практически всё происходящее у людей. Это кажется чрезвычайно интересным, чтобы посмотреть аккаунты в соцсетях, привычки, слабости и сильные стороны каждого человеке, однако… для бизнеса это не представляет интереса. Действительно, на основе десятков миллионов аккаунтов в соцсетях крайне сложно сделать бизнес-модель. Долгое время Big-Data были уделом специальных служб, но всё поменялось с появлением новой бизнес-модели. Ей стала персональная реклама.

  • Персональная реклама учитывает нынешнее состояние общества и количество населения, когда люди друг для друга мало представляют интереса, а уж как его преобразовать в деньги… Получилось так, что большинство людей не представляет никакого интереса для компаний, кроме как потребители.

Хорошо это или плохо сказать крайне сложно. С другой стороны, как-то сложно придумать большим данным другое применение. Остается еще и безопасность, но для нее не нужно столько. Вполне хватает куда меньших сведений о человеке. По крайней мере, исторический опыт показывает, что социальная стабильность в куда более сложных условиях существования государств, чем сейчас отлично держится и без Big-Data. Тем, кто пересмотрел Эдварда Снодена, нужно напомнить, что «прослушка» и безопасность — это не основное применение больших данных. Основное, это как раз та самая персональная реклама, или реклама с индивидуальным подбором.

Системы персонифицированной рекламы есть у каждой крупной IT-корпорации с большим охватом аудитории: Google, Яндекс, Facebook, Вконтакте. Они называются по-разному: тизерные сети, таргетинг, ретаргетинг, контекстная реклама, но везде используются примерно одинаковые принципы. Это подбор рекламы в зависимости от того, чем пользователь интересуется.

В примитивном варианте пользователю показывают буквально, то, чем он интересовался несколько минут, дней или даже недель назад. Работу такой рекламы каждый проверял на себе, достаточно лишь набрать какой-либо товарный вопрос в поисковике.

  • Куда интереснее дело получается, когда реклама показывается не о том, что вы искали, а о том, чего только хотели бы купить. Выглядит это буквально как «чтение мыслей», но тут нет ничего удивительного, банальная техника прогнозирования, которую используют психологи.

Конечно, в ручном режиме, никто не проводит психологических работ со случайными посетителями соцсетей, интересующихся какой-либо темой. Этому давно обучена нейросеть. Она просто методом копирования отслеживает, что пользователи, купившие дорожный чемодан, потом начинают интересоваться билетами. Таких примеров можно привести миллион, важно, что этим занимаются не люди, а нейронные сети. Подобные закономерности можно выявлять сотнями тысяч и на их основе строить эффективные рекламные кампании.

Секрет кроется в технологии, которая носит название «психологический поведенческий анализ», который проводится по так называемой «модели океана». Разработала и внедрила эту методику в практику рекламы уже упомянутая компания Cambridge Analytica. Она занимается не только политическим консалтингом, но и таргетированной рекламой.