Sigma Software входить до топ 100 найкращих IT компаній світу за рейтингом The Global Outsourcing 100. Компанія входить до складу шведської корпорації Sigma Group, яка налічує 3200 осіб по всьому світу. Понад 1000 проектів реалізовано для клієнтів із Західної Європи, США та України.
24 квітня 2024

Middle Data Scientist with NLP/LLM expertise (Data Competency Center)

Київ, Харків, Львів, Дніпро, Одеса, Вінниця, Івано-Франківськ, Луцьк, Моршин, Полтава, Суми, Тернопіль, Черкаси, Чернівці, Будапешт (Угорщина), Бургас (Болгарія), Варшава (Польща), Краків (Польща), Лісабон (Португалія), Познань (Польща), віддалено

Join us at Sigma Software as a Data Scientist, where you’ll lead initiatives in Natural Language Processing (NLP) and Large Language Models (LLMs) within our Data Competency Center. This pivotal role involves driving solution assessment, engaging in pre-sales activities, and shaping architecture design, all while pushing the boundaries of NLP and LLM technologies.

PROJECT
We are a team of 160+ professionals. We are very different, but a few things make us a true team: a genuine passion for our work, friendliness, and inexhaustible optimism, no matter what.

As a Middle Data Scientist joining Data Competency Center, you will be pivotal in shaping and driving its endeavors.

RESPONSIBILITIES
— Collaborate closely with clients and Team Leads to precisely define technical requirements and expectations, particularly focusing on NLP and LLM technologies
— Lead the charge in translating complex business issues into clear, actionable NLP and LLM hypotheses and solutions
— Develop and implement cutting-edge NLP techniques and LLM frameworks (e.g., BERT, GPT, RAG) to analyze, generate, and interpret extensive natural language datasets
— Integrate classical machine learning methodologies, including statistical analysis, clustering, classification, and recommendation engines, into NLP solutions to enhance model performance and insights
— Manage the full lifecycle of NLP and LLM solutions, from data collection and preprocessing to model training, deployment, and maintenance
— Ensure seamless deployment of NLP and LLM models into production environments, maintaining scalability and performance
— Communicate complex NLP and LLM insights and model outcomes to stakeholders, effectively bridging technical solutions with business strategies
— Actively participate in the evaluation of new tools for analytical data engineering or data science

REQUIREMENTS
— Profound expertise in NLP and familiarity with LLMs, backed by solid experience in Python
— Demonstrated ability to deploy NLP models to address real-world challenges, with a strong foundation in classical ML techniques and various data sources
— Proficiency in data visualization tools (e.g., Matplotlib, Seaborn, Tableau, Power BI) to articulate model outcomes and insights effectively
— A robust portfolio of projects showcasing the application of NLP and classical ML techniques to derive actionable insights from diverse data sources
— Continuous learner, keen on staying updated with the latest in NLP, and LLM advancements
— English proficiency: Confident Intermediate level or higher (both written and spoken)

WOULD BE A PLUS:
— AWS/Azure general understanding and experience
— Upper-Intermediate level of English

Приєднуйся до нас у Sigma Software на посаду Data Scientist, де ти будеш керувати ініціативами в галузі обробки природної мови (NLP) та великих мовних моделей (LLM) у нашому Центрі компетенцій з обробки даних. Ця посада передбачає оцінку рішень, участь у передпродажних заходах та формування архітектури, розширюючи межі технологій NLP та LLM.

ПРОЕКТ
Ми — команда зі 160+ професіоналів. Ми дуже різні, але кілька речей роблять нас справжньою командою: непідробна пристрасть до своєї роботи, дружелюбність та невичерпний оптимізм, незважаючи ні на що.

Приєднавшись до Data Competency Center на посаду Middle Data Scientist, ти відіграватимеш вирішальну роль у формуванні та розвитку його діяльності.

ОБОВ’ЯЗКИ
— Тісно співпрацювати з клієнтами та тімлідами, щоб точно визначити технічні вимоги та очікування, особливо зосереджуючись на технологіях NLP та LLM
— Очолювати процес перетворення складних бізнес-проблем у чіткі, дієві гіпотези та рішення на основі NLP та LLM
— Розробляти та впроваджувати передові методи NLP та фреймворки LLM (наприклад, BERT, GPT, RAG) для аналізу, генерації та інтерпретації великих наборів даних на природній мові
— Інтегрувати класичні методології машинного навчання, включаючи статистичний аналіз, кластеризацію, класифікацію та механізми рекомендацій, у рішення NLP для підвищення продуктивності моделей та отримання більш глибоких знань
— Керувати повним життєвим циклом рішень NLP та LLM, від збору та попередньої обробки даних до навчання, розгортання та обслуговування моделей
— Забезпечувати безперешкодне розгортання моделей NLP та LLM у виробничих середовищах, підтримуючи масштабованість та продуктивність
— Доносити складні ідеї NLP і LLM та результати моделювання до зацікавлених сторін, ефективно поєднуючи технічні рішення з бізнес-стратегіями
— Брати активну участь в оцінюванні нових інструментів для аналітичної інженерії даних або науки про дані

ВИМОГИ
— Глибока експертиза в NLP і знання LLM, підкріплені значним досвідом роботи з Python
— Вміння ефективно впроваджувати моделі NLP для вирішення реальних завдань, маючи глибокі знання класичних методів машинного навчання та різноманітних джерел даних
— Володіння інструментами візуалізації даних (наприклад, Matplotlib, Seaborn, Tableau, Power BI) для ефективного формулювання результатів моделювання та інсайтів
— Солідне портфоліо проєктів, що демонструють застосування NLP та класичних методів ML для отримання практичних висновків з різноманітних джерел даних
— Безперервне навчання, прагнення бути в курсі останніх досягнень в галузі NLP та LLM
— Знання англійської мови: Впевнений рівень Intermediate або вище (як письмово, так і усно)

ПЕРЕВАГОЮ БУДЕ:
— Загальне розуміння та досвід роботи з AWS/Azure
— Рівень володіння англійською мовою Upper-Intermediate

LinkedIn