Карьера в Data Science: что нужно знать и кем работать
Что такое Data Science
Data Science — это набор методов для анализа данных и поиска оптимальных решений на их основе. Некоторые ошибочно думают, что Big Data и Data Science — это одно и то же, но это не так: дата сайентисты могут работать не только с большими массивами данных (Big Data), но и с маленькими данными.
Data Science включает в себя сбор, хранение и обработку данных, а также поиск данных, которые будут полезны для конкретной задачи. Не все данные можно хранить и обрабатывать единым способом — к некоторым данным нужен особый подход из-за их объема или уникального типа. Придумать как к ним подступиться — тоже задача дата сайентиста.
После сбора данных наступает этап анализа. Data Scientists изучают имеющиеся данные, визуализируют их, ищут закономерности, составляют гипотезы и формируют решения на основе всей информации.
Специалисты по Data Science используют методы машинного обучения и Big Data — облачные вычисления, инструменты создания виртуальной среды разработки и многое другое.
«Умение собирать данные, обрабатывать их и визуализировать, понимать их значение и извлекать из них ценность — чрезвычайно важный навык ближайшего десятилетия», — Хэл Вэриан, главный экономист Google и профессор Калифорнийского университета.
Как применяется Data Science
Благодаря Data Science и технологиям искусственного интеллекта, можно больше узнать о том, что предпочитает человек и создавать более персонализированный продукт. Например, проанализировав звонки абонента, можно предложить ему выгодный тариф для междугородних звонков — человек останется доволен сэкономленными деньгами, а бизнес — лояльным клиентом.
Анализ демографии жителей конкретного района позволит понять, какой бизнес сможет занять в нем свою нишу. Изучение поведения пользователей в интернете подскажет, какой контент будет интересен и в какое время его лучше опубликовать, чтобы получить наибольший охват.
Data Science можно применять не только в бизнесе. Полиция Лос-Анджелеса смогла сократить число краж на 33%, благодаря анализу вероятности совершения преступлений. Крупная железнодорожная компания США, Union Pacific Railroad, обрабатывает данные о состоянии колес и железнодорожного полотна. Это помогло им снизить число схождений составов с рельсов на 75%.
Какие есть профессии в Data Science
- Аналитик — анализирует метрики, проводит эксперименты, строит прогнозы;
- Разработчик баз данных — обеспечивает работоспособность баз данных;
- Архитектор баз данных — проектирует хранение данных;
- BI-специалист — занимается визуализацией информации и созданием интерактивных дашбордов;
- Data Engineer — отвечает за извлечение, преобразование, загрузку данных и их обработку;
- Data scientist — разрабатывает продукт, основанный на данных;
- ML Engineer — разрабатывает и отвечает за развитие Data Driven продуктов.
Проще всего стать Data scientist, если до этого вы занимались разработкой или аналитикой. Программисты, веб-аналитики, product manager могут переквалифицироваться в аналитиков данных, а бухгалтеры и маркетологи в BI-аналитиков.
Какие знания и навыки нужны для работы в Data Science
- Математика — если хорошо разбираетесь в этой науке, вам будет проще влиться в Data Science. В любом случае, без математических знаний не обойтись;
- Технический английский — большинство годных материалов по изучению Data Science выходят на английском языке, поэтому «ай донт андестенд» не пройдет. Для начала можете изучить основные термины и их значение;
- Статистика — для входа в сферу понадобятся хотя бы базовые знания статистики. Рекомендуем изучить все доступные бесплатные материалы на Coursera или аналогичных ресурсах;
- Программирование — речь, в основном, о языке Python, R и SAS. Базовые навыки программирования можно приобрести и самостоятельно, например, с помощью бесплатных курсов и платформ;
- Работа с базами данных — чтобы мыслить в контексте данных, нужно понимать, как работают базы реляционных данных.
В зависимости от специализации также требуются знания электронных таблиц и инструментов доступа и обработки данных (СУБД, хранилища данных, SQL, ETL), а также Power BI, Tableau, инструментов OLAP и майнинга.
Можно ли начать карьеру в Data Science с нуля
Скорее нет, чем да. Учиться по ходу дела не получится — нужно понимать, как все устроено. Идеально, если у вас уже есть технический бэкграунд и вы не будете с нуля вникать в статистику, анализ и программирование, без которых не обойтись в Data Science.
Войти в сферу Data Science довольно трудно из-за объема необходимых знаний, но оно того стоит — помимо невероятно интересной работы, сферу отличают большие зарплаты и кадровый спрос, превышающий предложение.
В конце 2018 года портал Superjob на основе опять-таки данных выяснил, что спрос на аналитиков данных будет только расти. Средний заработок по Москве у таких специалистов 140-150 тыс. рублей, но часто зарплата доходит и до 250 тыс. рублей.
Самостоятельно с нуля разобраться в Data Science очень сложно. Для начала можно изучить бесплатные курсы, почитать доступные книги об анализе данных, а уже потом задуматься о прохождении серьезной подготовки.