Data Engineer (Стажёр)
- Москва
- Стажировка
- IT
Мы приглашаем на оплачиваемую стажировку Data Engineer с возможностью перехода в штат компании.
Наш стек: Oracle Exadata (SQL, PL/SQL), Cloudera Hadoop, Hive, Spark, PySpark, Python (sklearn, xgboost, pandas, etc), Linux bash, Airflow. Система контроля версий: git.
Чем предстоит заниматься
- Работа с разнородными источниками данных (Oracle, Hadoop)
- Подготовка, очистка и предобработка данных, построение агрегатов
- Ad-hoc аналитика
- Разработка и продуктивизация витрин данных и ETL-процессов
- Поддержка актуальности и качества данных в витринах и ETL-процессах
Что для этого нужно
- Высшее или неоконченное высшее техническое образование
- Аналитический склад ума
- Знание Python, SQL и Hadoop
- Необходимый стэк: Python, PySpark, Hadoop, SQL, Airflow, MLFlow
- Опыт работы в области Data Science от 3х лет