Карьера 18 октября 2019 705

Карьера в Data Science: что нужно знать и кем работать

Все слышали, что будущее за Data Science, но не все до конца понимают, что это вообще такое. Мы постарались в общих чертах объяснить, как применяется Data Science, кем работать в этой области и можно ли начать карьеру дата сайентиста с нуля. Изучайте!


Что такое Data Science

Data Science — это набор методов для анализа данных и поиска оптимальных решений на их основе. Некоторые ошибочно думают, что Big Data и Data Science — это одно и то же, но это не так: дата сайентисты могут работать не только с большими массивами данных (Big Data), но и с маленькими данными.

Data Science включает в себя сбор, хранение и обработку данных, а также поиск данных, которые будут полезны для конкретной задачи. Не все данные можно хранить и обрабатывать единым способом — к некоторым данным нужен особый подход из-за их объема или уникального типа. Придумать как к ним подступиться — тоже задача дата сайентиста.

После сбора данных наступает этап анализа. Data Scientists изучают имеющиеся данные, визуализируют их, ищут закономерности, составляют гипотезы и формируют решения на основе всей информации.

Специалисты по Data Science используют методы машинного обучения и Big Data — облачные вычисления, инструменты создания виртуальной среды разработки и многое другое.

«Умение собирать данные, обрабатывать их и визуализировать, понимать их значение и извлекать из них ценность — чрезвычайно важный навык ближайшего десятилетия», — Хэл Вэриан, главный экономист Google и профессор Калифорнийского университета.


Как применяется Data Science

Благодаря Data Science и технологиям искусственного интеллекта, можно больше узнать о том, что предпочитает человек и создавать более персонализированный продукт. Например, проанализировав звонки абонента, можно предложить ему выгодный тариф для междугородних звонков — человек останется доволен сэкономленными деньгами, а бизнес — лояльным клиентом.

Анализ демографии жителей конкретного района позволит понять, какой бизнес сможет занять в нем свою нишу. Изучение поведения пользователей в интернете подскажет, какой контент будет интересен и в какое время его лучше опубликовать, чтобы получить наибольший охват.

Data Science можно применять не только в бизнесе. Полиция Лос-Анджелеса смогла сократить число краж на 33%, благодаря анализу вероятности совершения преступлений. Крупная железнодорожная компания США, Union Pacific Railroad, обрабатывает данные о состоянии колес и железнодорожного полотна. Это помогло им снизить число схождений составов с рельсов на 75%.



Какие есть профессии в Data Science

  • Аналитик — анализирует метрики, проводит эксперименты, строит прогнозы;
  • Разработчик баз данных — обеспечивает работоспособность баз данных;
  • Архитектор баз данных — проектирует хранение данных;
  • BI-специалист — занимается визуализацией информации и созданием интерактивных дашбордов;
  • Data Engineer — отвечает за извлечение, преобразование, загрузку данных и их обработку;
  • Data scientist — разрабатывает продукт, основанный на данных;
  • ML Engineer — разрабатывает и отвечает за развитие Data Driven продуктов.

Проще всего стать Data scientist, если до этого вы занимались разработкой или аналитикой. Программисты, веб-аналитики, product manager могут переквалифицироваться в аналитиков данных, а бухгалтеры и маркетологи в BI-аналитиков.



Какие знания и навыки нужны для работы в Data Science

  • Математика — если хорошо разбираетесь в этой науке, вам будет проще влиться в Data Science. В любом случае, без математических знаний не обойтись;
  • Технический английский — большинство годных материалов по изучению Data Science выходят на английском языке, поэтому «ай донт андестенд» не пройдет. Для начала можете изучить основные термины и их значение;
  • Статистика — для входа в сферу понадобятся хотя бы базовые знания статистики. Рекомендуем изучить все доступные бесплатные материалы на Coursera или аналогичных ресурсах;
  • Программирование — речь, в основном, о языке Python, R и SAS. Базовые навыки программирования можно приобрести и самостоятельно, например, с помощью бесплатных курсов и платформ;
  • Работа с базами данных — чтобы мыслить в контексте данных, нужно понимать, как работают базы реляционных данных.

В зависимости от специализации также требуются знания электронных таблиц и инструментов доступа и обработки данных (СУБД, хранилища данных, SQL, ETL), а также Power BI, Tableau, инструментов OLAP и майнинга.



Можно ли начать карьеру в Data Science с нуля

Скорее нет, чем да. Учиться по ходу дела не получится — нужно понимать, как все устроено. Идеально, если у вас уже есть технический бэкграунд и вы не будете с нуля вникать в статистику, анализ и программирование, без которых не обойтись в Data Science.

Войти в сферу Data Science довольно трудно из-за объема необходимых знаний, но оно того стоит — помимо невероятно интересной работы, сферу отличают большие зарплаты и кадровый спрос, превышающий предложение.

В конце 2018 года портал Superjob на основе опять-таки данных выяснил, что спрос на аналитиков данных будет только расти. Средний заработок по Москве у таких специалистов 140-150 тыс. рублей, но часто зарплата доходит и до 250 тыс. рублей.

Самостоятельно с нуля разобраться в Data Science очень сложно. Для начала можно изучить бесплатные курсы, почитать доступные книги об анализе данных, а уже потом задуматься о прохождении серьезной подготовки.