• знание Python 3 от 1 года
• опыт работы с реляционными базами данных (PostgreSQL, MySQL, Oracle)
• знание PySpark
• опыт работы по построению ETL процессов и их оптимизация с использованием PySpark
• знания CI/CD процессов
• умение работать в команде
• способность решать комплексные проблемы
• желание обучаться новому
• английский на уровне Intermediate
• опыт работы с Hadoop ecosystem (HDFS, Yarn)
• знание основ Jenkins, NiFi, AirFlow
• опыт работы с нереляционными базами данных (MongoDB, Cassandra)
• опыт работы с Аgile-методологией
• понимание принципов построения хранилищ данных (Data Warehouses) на одном из клаудов (AWS, Azure, GCP)
• знания принципов контейнеризации, включая Docker и Kubernetes
• опыт работы в machine learning
• лучший офис в самом центре города и легендарные корпоративы
• оплачиваемое участие в самых масштабных отраслевых конференциях мира
• отличные возможности и перспективы профессионального роста в компании с
• достойный уровень вознаграждения
• премии за высокие результаты работы
• возможность обучения: курсы внутри компании, участие в конференциях от компании, курсы английского
• медицинскую и спортивную программу, бухгалтерскую поддержку
ТЫ ПОЛУЧИШЬ ВОЗМОЖНОСТЬ:
• приобрести колоссальный опыт по обработке, генерации и агрегации больших данных
• решать сложные и нетривиальные задачи, непосредственно влияющие на качество продукта
• работать с передовыми технологиями (такими как PySpark, Kubernetes, облачными хранилищами и др.)
• координироваться с участниками проекта со всего мира
• участия в проектах компаний, входящие в рейтинг ТОП-100 компаний мира
• стремительного профессионального роста — высокий уровень код-ревью, личный план развития