Data Scientist NLP/LLM, Маркетплейс, Инструменты поддержки и CRM
Мы команда в Ozon Tech, которая занимается автоматизацией коммуникаций с нашими пользователями. Для этого мы разрабатываем чат-ботов, сервисы речевой аналитики и развиваем собственный диалоговый ИИ, чтобы наши клиенты получали быстрые и качественные ответы на любые вопросы. Наши продукты интегрированы с различными внутренними сервисами Ozon, чтобы иметь всю необходимую информацию для общения. В работе мы используем современные технологии в области NLP и постоянно их улучшаем, а также пробуем что-то новое. В команде своя культура с ресерч-днями, чилл-скиллами и митапами, на которых мы разбираем свежие технологии, что в последствии ложится в основу наших решений.
Будем заниматься полным циклом разработки решений - от ресерча до поставки в продакшн. Работаем и с классическим NLP и с SOTA, основной упор делаем на внедрение генеративных нейросетей во все продукты компании. В нашем зоопарке проектов - чатботы (кластеризация/классификация и NER/суммаризация/перефразирование/RAG), помощники операторов (классификация/qa-генерация/ретриверы), построение трендов (кластеризация/генерация названий и описаний/суммаризация статей), боты генерации изображений, суммаризации переписок и много другое. Прорабатываем свою LLM. В бэклоге десятки прорывных проектов, а идей на новые еще больше, при этом нет задач «в стол».
Наш стек:
git, bash, linux, docker, k8s, vertica, redis, s3, ssh, python, fastapi, grpc, triton inference server, pytorch
Вам предстоит:
- Доработка моделей суммаризации, перефразирования, генерации названий и проблематик обращений.
- Построение ретриверов и RAG на данных компании.
- Проработка оценки генерации моделей и разметки данных с применением LLM.
- Проработка архитектуры и написание сервисной части на Python + Triton Inference Server.
- Исследование рынка NLP-технологий.
- Кластеризация и классификация текста, в рамках применения в пред/пост-обработке генеративных нейросетей.
Мы ожидаем:
- Коммерческий опыт работы от 2-ух лет.
- Опыт работы с генеративными моделями, fine-tuning LLM моделей.
- Анализ данных, парсинг, обработка, API.
- Умение писать продакшн-код.
- Желание выдвигать гипотезы по улучшению процессов, общаться с бизнесом.
- Умение объяснять сложное простым языком.
Мы предлагаем:
- Динамичный и быстроразвивающийся бизнес, ресурсы, возможность сделать вместе сделать лучший продукт на рынке e-commerce.
- Свободу действий в принятии решений.
- Достойный уровень заработной платы.
- Профессиональную команду, которой мы гордимся.
- Возможность развиваться вместе с нашим бизнесом.