О Big data говорят многие, но, увы, только единицы знают, что это такое. В этой статье мы разберемся, какое значение имеет термин, как его применить в современном мире и узнаем, какие особенности и опасности имеют большие данные. Понятие Big data подразумевает комплекс всевозможных методов и способов анализа, использования, а также хранения данных. Но сегодня все так устроено, что на все есть своя причина, цель и заинтересованность. Конечно же, большие данные – не исключение. О данном термине весь мир узнал всего лишь 10 лет назад от журналиста издания Nature Клиффорда Линча. Он опубликовал статью, в которой рассказал, что объем информации с каждым днем становится просто невероятным, хотя, возможно, ранее эти данные просто не были доступны рядовому пользователю.
Таким образом, когда по телевизору, в новостной колонке или посте в социальной сети вы видите два простых слова «Big data», то, вероятней всего, они обозначают хранение и анализ информации.
Большие данные как социальный феномен
Можно с уверенностью сказать, что сегодня большие данные – это своего рода ноу-хау, настоящий социальный феномен, который повлек за собой развитие технологий, о которых ранее мы не знали. А теперь разберем всё это на простом примере. Представьте перед собой магазин, в котором кефир стоит на одной полке с бальзамом для волос, а пена для бритья храниться в мясном отделе. С появлением такого социального феномена как Big data, покупателю представилась возможность находить и выбирать продукты максимально быстро, с учетом маркировок и широкого изобилия похожей продукции.
Как работает технология больших данных?
Основная цель обработки большого массива информации заключается в том, что это необходимо пользователь. На выходе мы получаем абстрактный информационный продукт, который может быть эффективно использован.
А если проще, то Big data – это современный аналог уже устаревшим системам управления и хранения массивов информации.
McKinsey выделяет следующие действенные технологии и методики анализа: Data Mining, смешение и модернизация данных, автоматизированное обучение, краудсорсинг, аналитика на перспективу, пространственный анализ, искусственные нейронные сети и т.д. Этот перечень можно продолжать очень долго, так как он впечатляет своим разнообразием.
Стоит отметить, что всем «большим данным» присущие некоторые характеристики. Еще 17 лет назад Meta Group удалось сформулировать концепцию «Трех V»:
- «Variety» — одновременная работа с несколькими типами информации;
- «Volume» — величина (в контексте мощности) физического объёма. «Velocity» — взаимосвязь темпов прироста и актуализации быстрой обработки информации для оперативного получения необходимых отчетов.
Большие данные: возможности о которых вы не знали
В современных условиях достаточно непросто справиться с обработкой большого массива информации. Вручную это сделать невозможно, в силу темпов поступления новых данных и их разной типологии. Но как быть, ведь без анализа крупным компаниям достаточно сложно справиться с повседневными задачами. Именно в таких случаях и используется Big data. В первую очередь такая технология обеспечивает оптимизацию всех сфер жизни человека — от правительственного до бытового уровня. В России больше всего внимания такому способу обработки информации уделяет ПАО «Сбербанк», а также «Билайн». Давайте посмотрим, как им это удается.
Необычные решения от Сбербанка и Билайн
Не секрет, что оператору сотовой связи «Билайн» приходится ежедневно обрабатывать огромные массивы информации о своих клиентах. Но эти данные необходимы не только для работы с клиентами, но и для разработки необычных аналитических решений. Приведем пример. Сотрудники компании «Билайн» несколько лет назад начали сегментацию базы и позаботились о защите клиентов от мошеннических операций и хакерских атак. Для хранения были применены HDFS и Apache Spark, а анализ информации происходил с помощью технологии Python.
Помните ли вы о АС САФИ от Сбербанка? Система существует уже больше четырех и основывается на биометрической платформе. Причина создания понятна и проста: увеличение количества мошенничества. После внедрения системы, число подобных операций сократилось в десятки раз.
О рынке Big data в России
К концу прошлого года мировой доход на российском рынке больших данных превысил отметку в 150,8 млрд долларов, опередив на 12,4% показатели 2016 года. Безусловно, на фоне всего мира, отечественный рынок технологий big data ничтожно мал. В нашем государстве технологии методики обработки информации активно используют кредитно-финансовые учреждения, промышленный сектор, организации в сфере торговли и туризма, логистики и т.д.
Российский рынок данных только начинает развиваться. Информация «добывается» из многих источников, но самыми популярными сегодня считаются следующие:
— интернет (социальные сети, средства массовой информации, информационные площадки, блоги и пр.);
— документационные архивы корпораций;
— показания автономных и различного рода счетчиков.
Big data и кредитно-финансовые организации
Кроме тех систем, о которых мы поговори выше, «Сбербанк» при создании стратегии на 2014-2018 гг. отметил необходимости анализа больших массивов информации для создания качественной системы взаимодействия с клиентами, а также минимизации мошеннических операций. Уже сегодня корпорация активно использует данную технологию для противостояния мошенникам и оценки благонадежности клиентов. Кроме того, Big data применяется для эффективной работы с кадрами, созданию прогнозов об очередях в филиалах, определения вклада каждого сотрудника в развитие Сбербанка и т.д.
«ВТБ24» также старается не отставать. Помимо целей своего непосредственного конкурента, сотрудники данного банка с помощью технологий больших данных проводят анализ комментариев в Интернете, а также обрабатывают квартальную отчетность.
Кроме того, с «большими данными» работает «Альфа-Банк», «Тинькофф», а также еще несколько крупных банков.
Современные решения для бизнеса
С целью оптимизации расходов внедрение Big data произошло и в «Магнитогорском металлургическом комбинате». Не секрет, что который год подряд он является лидером на мировом рынке производства стали. Два года назад сотрудники предприятия начали внедрение специального сервиса, который получил название «Снайпер».
Система специализируется на обработке данных и самостоятельно формирует отчеты, который помогают существенно экономить на производственных издержках.
Не отстает и «Сургутнефтегаз», который разработал платформу обработки информации для управления бизнес-процессами и совершенствует ее по сей день.
Технологии, которые помогают маркетологам
Для тех, кто работает в маркетинге, не будет новостью тот факт, что с появлением технологии Big data, жизнь стала гораздо проще. Используя этот современный инструмент, маркетологи имеют отличную возможность не только анализировать результаты своей работы, но и делать важный прогнозы. К примеру, обработка данных помогает узнать необходимую информацию о своих потребителях и эффективно настроить рекламную кампанию.
Big data меняет мир?
Технологии делают нашу жизнь проще и насыщенней, к тому же, от прогресса нам никуда не спрятаться. Уже сегодня «большие данные» начали немного менять мир, проникая в наши рабочие компьютеры, мобильные телефоны и конечно же, головы. Прогнозы делать не будет, но такие тенденции явно опережают ход времени.