Sigma Software входить до топ 100 найкращих IT компаній світу за рейтингом The Global Outsourcing 100. Компанія входить до складу шведської корпорації Sigma Group, яка налічує 3200 осіб по всьому світу. Понад 1000 проектів реалізовано для клієнтів із Західної Європи, США та України.
17 травня 2024

Senior Data Engineer (IT Solutions)

Київ, Харків, Львів, Дніпро, Одеса, Вінниця, Івано-Франківськ, Луцьк, Полтава, Суми, Тернопіль, Черкаси, Чернівці, Бургас (Болгарія), Варшава (Польща), Краків (Польща), Лісабон (Португалія), Познань (Польща), Прага (Чехія), віддалено

Seeking Senior Data Engineer to lead a small team, modernize a simple data platform into a cloud-based self-service analytics project.

CUSTOMER
Sigma Software provides top-quality software development, graphic design, testing, and support services. Systems developed to deliver customer benefits in automotive, telecommunications, aviation, advertising, gaming, banking, real estate, and healthcare industries.

PROJECT
Within an internal project at Sigma Software, we have two primary goals: to automate reporting and to create a self-service data analytics system for our company.
You will be responsible for designing and modeling data into DWH and Data Marts using Spark and MS SQL, exposing this data to, and collaborating with, BI engineers making reports in Apache Superset, and other roles consuming such data. Additionally, you’ll work with various other team members who rely on this data. Part of your task will involve transitioning our on-premises solution to a cloud-based environment.

RESPONSIBILITIES
• Our goal is to create an efficient system for collecting, processing, analyzing, and visualizing large amounts of data from various sources
• Lay down the foundation and model the data
• Develop a platform for building and maintaining data pipelines that collect data from different sources
• Create Data Warehouse
• Analyze and prepare domain descriptions in collaboration with Business analytics
• Create Data Marts
• Design a permission model with flexible control over vertical and horizontal access to data

REQUIREMENTS
• Conceptual knowledge of data analytics fundamentals, e.g., dimensional modeling, ETL/ELT, reporting tools, data governance, data warehousing, structured and unstructured data
• Strong SQL knowledge and experience with RDBMS, confident knowledge of database fundamentals
• Experience in database development and data modeling, ideally with Databricks/Spark
• Experience with Python
• Experience with Azure
• Working knowledge of serialization formats and their trade-offs (columnar vs. row-based)
• Experience debugging and optimizing Spark jobs
• Strong written and verbal communication skills
• At least an Upper-Intermediate level of English
• BS in Computer Science or a related field
• Experience with a Business Intelligence tool is a nice-to-have

Ми шукаємо старшого інженера з обробки даних, який очолюватиме невелику команду, що перетворить просту платформу даних на сучасний аналітичний проєкт із самообслуговуванням на основі хмарних технологій.

ЗАМОВНИК
Sigma Software надає високоякісні послуги з розробки програмного забезпечення, графічного дизайну, тестування та підтримки. Системи, розроблені для забезпечення потреб клієнтів в автомобільній, телекомунікаційній, авіаційній, рекламній, ігровій, банківській сферах, нерухомості та охороні здоров’я.

ПРОЄКТ
У рамках внутрішнього проєкту в Sigma Software ми маємо дві основні цілі: автоматизувати звітність і створити систему самообслуговування для аналізу даних для нашої компанії.

Ти відповідатимеш за розробку та моделювання даних у DWH і Data Marts за допомогою Spark і MS SQL, надання цих даних BI-інженерам та співпрацю з ними, створення звітів у Apache Superset та інші задачі, що стосуються використання цих даних. Крім того, ти працюватимеш з іншими членами команди, які використовують ці дані. Також частиною твоєї роботи буде перенесення нашого локального рішення в хмарне середовище.

ОБОВ’ЯЗКИ
Наша мета — створити ефективну систему для збору, обробки, аналізу та візуалізації великих обсягів даних із різних джерел

• Створити основу та моделювати дані
• Розробляти платформу для побудови та підтримки конвеєрів даних, які збирають дані з різних джерел
• Створити сховище даних
• Аналізувати та готувати описи доменів у співпраці з бізнес-аналітиками
• Створювати вітрини даних
• Розробити модель дозволів із гнучким керуванням вертикальним і горизонтальним доступом до даних

ВИМОГИ
• Концептуальне знання основ аналітики даних, наприклад, розмірного моделювання, ETL/ELT, інструментів звітності, управління даними, сховищ даних, структурованих і неструктурованих даних
• Глибокі знання SQL і досвід роботи з RDBMS, впевнене знання основ баз даних
• Досвід розробки баз даних і моделювання даних, в ідеалі з Databricks/Spark
• Досвід роботи з Python
• Практичні знання про формати серіалізації та їхні компроміси (стовпчикові vs. рядкові)
• Досвід налагодження та оптимізації завдань Spark
• Сильні навички письмової та усної комунікації
• Рівень володіння англійською мовою не нижче Upper-Intermediate
• Ступінь бакалавра в галузі комп’ютерних наук або суміжних галузях
Досвід роботи з інструментом бізнес-аналітики — буде плюсом

LinkedIn