Данные повсюду — начиная от алгоритмов Тиндера, который «матчит» вас с далеко не случайными людьми, и заканчивая информационными войнами, которые ведут политики. Никого уже не удивляет, что за каждым нашим шагом пристально следят: будь то история запросов в браузере телефона или ваши действия в оффлайне. Задержитесь на секунду у витрины спортивного магазина — ждите его таргетированную рекламу в соцсетях с минуты на минуту. Расскажите коллеге, что натворил ваш кот — сухие корма и наполнители тут как тут в вашей ленте.
Особо впечатлительные могут впасть в паранойю - но данные в этом не виноваты. Все зависит от того, в чьи руки они попадут. С анализом данных связано очень много мифов, а data scientist — одна из самых перспективных и "сексуальных" профессий будущего. В своей книге я намерен развенчать мифы и рассказать, как все обстоит на самом деле. Надеюсь, читатель, ты, как и я, окажешься на "светлой" стороне силы.
Я закончил МФТИ в начале нулевых и тогда же возглавил аналитический отдел интернет-магазина Ozon.ru, где создал аналитические системы с нуля. Я консультировал инвестиционные фонды, гигантов ритейла и гейм-индустрии, а восемь лет назад стал сооснователем и совладельцем маркетинговой платформы для интернет-магазинов RetailRocket.ru. Сейчас компания не просто является безусловным лидером на рынке в России, но и успешно работает на рынках Чили, Голландии, Испании и Германии. В 2016 году прочитал лекцию в концертном зале MIT в Бостоне про процессы тестирования гипотез. В 2020 году номинировался на премию CDO Award.
Считается, что нужно потратить 10000 часов для того, чтобы стать очень хорошим специалистом в свой области. Анализом данных я занимаюсь с 2002 года, когда это не было так популярно и хайпово. Так вот, чтобы получить эти заветные 10000 часов, нужно проработать 10000 часов / 4 часа в день / 200 дней в году = 12.5 лет. Я в полтора раза превысил эту цифру, поэтому надеюсь получилось написать книгу, которая будет очень полезна для вас, дорогие читатели.
Эта книга о том, как превращать данные в продукты и решения. Она основывается не на академических знаниях, а на моем личном опыте анализа данных длиной почти в двадцать лет. Сейчас существует очень много курсов по анализу данных (data science) и машинному обучению (machine learning). Как правило, они узкоспециализированы. Отличие этой книги от них в том, что она, не утомляя читателя частностями, дает цельную картину, рассказывая о том
- как принимать решения на основе данных
- как должна функционировать система
- как тестировать ваш сервис
- как соединить все в единое целое, чтобы на выходе получить "конвейер" для ваших данных