Большие данные – это сфера, в которой только начинают разбираться и пользователи, и сам бизнес, который использует эти данные для организации различных процессов. Почти 60% компаний до сих пор ничего не знают о своей аудитории, потому что не освоили технологии Big Data. Разбираемся, что это такое, какие российские разработки есть в сфере AdTech, и почему в рекламе они оказались нужнее всего.
Как работает наука о данных
Летом на Яндекс.Кью появился вопрос: как объяснить бабушке, что такое Data Science? И простое описание этому направлению нашел всего один пользователь – Сослан Табуев, Data Scientist крупного банка:
«Если бабушка верит в приметы, то можно сказать ей, что это область, где новые приметы находит компьютер, если рассказать ему о случившихся событиях и тому, что им предшествовало. Можно привести пример предсказания погоды», – ответил на вопрос эксперт.
И это действительно наглядное объяснение, которое поможет понять суть аналитики данных. Люди тоже наблюдают явления, находят закономерности и на их основе делают предположения, просто компьютеры делают это эффективнее. Учитывая, что поток информации удваивается в объеме каждые 18 месяцев, возникла необходимость автоматизировать его обработку и это открыло большое количество возможностей.
Big Data или «большие данные» – общее обозначение данных всех возможных видов, которые можно обработать или структурировать. Они собираются в базы данных, а для управления базами разрабатывают целые системы, которые смогут эти данные хранить, обрабатывать и выдавать очень точные отчеты.
Big Data в повседневности
На анализ данных опирается прогнозирование в самых разных сферах, без их использования уже не получится получить кредит, купить продукты или заказать доставку. По последнему опросу Хабр, уже 37% бизнеса внедрило в свою деятельность технологии работы с большими данными, а это почти каждая третья компания.
Откуда собираются данные:
- соцсети, блоги и СМИ;
- данные о мобильных устройствах: тип устройства, браузер, ПО, геолокация;
- интернет вещей (IoT) и подключенные к нему устройства;
- данные компаний: транзакции, заказы товаров и услуг.
Банки используют Big Data-технологии, чтобы анализировать платежеспособность клиентов при выдаче кредитов. Это не составляет сложности, потому что у них есть вся информация о том, сколько денег на вашем счете, какие есть регулярные и нерегулярные источники дохода, сколько вы тратите в месяц и даже на что именно и в какое время.
Ритейл, то есть розничные магазины анализируют данные о продажах, чтобы закупать нужный объем товара, который не будет долго задерживаться на полках. Это особенно важно для сегмента скоропортящихся продуктов, так как компания не несет убытки, а покупатели всегда видят в магазине свежий товар.
E-commerce, то есть все торговые площадки в интернете, тоже анализируют, что покупают их пользователи, когда и в каких объемах. Им это необходимо для того, чтобы персонализировать предложения и предлагать аудитории те категории товаров, которые ей необходимы. Например, молодым родителям – товары для детей, предпринимателям – технику и все для бизнеса, а тем, кто недавно переехал – мебель и строительные материалы.
Big Data в рекламе
Индустрия рекламных технологий объединяет все направления экономики, перечисленные выше, потому что каждый продукт нужно продвигать. Банки предлагают свои финансовые услуги, ритейл и маркетплейсы – продукты, товары первой необходимости и множество других категорий товаров, которые интересны абсолютно разным людям.
В сфере рекламы возможность отслеживать действия людей, их предпочтения, интересы, перемещение, круг общения и поведенческие особенности стала прорывом, потому что действия людей наиболее правдивы, чем слова. Отзывы, которые собирают о продукте маркетологи могут не соответствовать действительности, так как при личном общении много факторов могут заставить людей солгать.
«Нейросети, которые анализируют поведение потребителей, не обращают внимание на наш субъективный оральный фидбек, ведь если люди платят, смотрят, покупают, значит миссия выполнена, даже если интуитивно это не так очевидно. И в этом преимущество работы с большими данными», – отмечает в своем блоге популяризатор науки Артур Шарифов.
Например, мобильные устройства собирают данные о местоположении владельца. Как правило, они хранятся мобильными операторами, а те в свою очередь продают эти данные владельцам бизнеса или компаниям, которые занимаются настройкой рекламных компаний.
Яндекс с помощью аналитики данных о геолокации, формирует отчеты о загруженности любого общественного пространства, чтобы пользователи планировали свой день, а бизнес мог отслеживать приток клиентов. Этот отчет общедоступен, чтобы его увидеть, нужно ввести в поисковой строке браузера название места или заведения, которое вы планируете посетить, а система аналитики выдаст вам отчет о потоках людей в данной точке:
Российский стартап BackAd нашел способ использования геолокации даже для показа рекламы оффлайн там, где обитает целевая аудитория клиента. Делается это с помощью курьеров на заданной геолокации, для реализации идеи команда спроектировала и разработала компактное переносное устройство с FullHD-экраном. Курьеры надевают эти смарт-рюкзаки и отправляются по маршруту аудитории.
Социальная дилемма
Возможности такой «социальной слежки» периодически пугают общественность. С одной стороны ситуация выглядит, как «win-win», когда все оказываются в плюсе. Бизнес не тратит ресурсы на бесполезную рекламу а пользователи видят в лентах своих смартфонов только то, что им действительно необходимо, и спасаются от медийного шума. Но с другой стороны ни одно действие не остается незамеченным, и вокруг каждого человека формируется «информационный пузырь», состоящий только из того, что его интересует. Так люди перестают замечать проблемы других и даже изменения в обществе. Об этом в 2020 Netflix выпустил документальный фильм «Социальная дилемма».
Но все-таки большие опасения у людей вызывает вопрос их собственной безопасности и то, насколько надежны те системы, которые хранят и обрабатывают данные. Одну из таких платформ, которая сейчас востребована во всем мире, как раз разработали в России. Это платформа ClickHouse, она позволяет обрабатывать огромные массивы данных о клиентах в реальном времени.
Система может вмещать до десятка триллионов записей и петабайтов данных, умеет запрашивать, вставлять, изменять или удалять данные, а главное защищает их от передачи третьим лицам в соответствии с законом. Гарантом надежности ClickHouse стала востребованность разработки среди таких техно-гигантов, как Uber, Tesla, Spotify, eBay, ByteDance (владелец соцсети TikTok), Alibaba, Tencent, а также «ВКонтакте» и Wildberries.
Но чтобы усилить собственную безопасность, пользователям самим стоит помнить о правилах элементарной безопасности в интернете, которые обеспечат сохранность данных и даже включены в некоторые программы школьных уроков ОБЖ:
- Двухфакторная аутентификация: установите подтверждение входа с помощью смс-подтверждения после того, как введете логин и пароль от аккаунта.
- Установка приложений из проверенных источников. Телефоны – наше самое уязвимое устройство, в нем хранится огромное количество данных, которые нужно защищать. Установка пиратских приложений с вредоносным ПО может сильно навредить вашей безопасности и конфеденциальности.
Умная среда: инструкция по применению