
Пахотина Ксения Евгеньевна
ML-инженер
- OpenAI
- Git
- Python
- Работа с нейросетями
- LLM
- PROMT
- GPT
- NLP
- VLLM
- Английский — B2 — Средне-продвинутый
ML- инженер в IT - стартап:
- Мы успешный быстрорастущий венчурный стартап на базе ИИ (психологическая игра).
- Собственная технология поверх языковых моделей, чат-боты, генерация изображения, звука, видео.
- Продукту год, очень быстро растет, закрыли недавно seed раунд. За год мы выросли x10 и хотим вырасти x10 еще раз.
- Сейчас мы расширяем команду и ищем ML-инженера
ОСНОВНАЯ ЗАДАЧА: улучшить системный промпт для LLaMa-2, чтобы модель давала качественные ответы на пользовательские запросы с этим системным промптом.
ОБЯЗАТЕЛЬНЫЕ ТРЕБОВАНИЯ:
- знание техник промпт-инжениринга, основанное в том числе на понимании принципов работы языковых моделей, навыки написания промтов
-
NLP
-
Понимание как устроена transformers архитектура (BERT, GPT)
-
Инференс LLM, transformers, vllm
-
Знание английского B2 или выше
БУДЕТ ПЛЮСОМ:
- умение писать простые скрипты на Python (например, в Jupyter Notebook)
- опыт в data science, базовое понимание мат. статистики
- умение дообучать модель (fine-tune, LoRA, настройка гиперпараметров)
- умение запускать языковую модель локально
- умение работать не только с текстовыми, но и с графическими моделями
- NLP (знание и опыт применения алгоритмов кластеризации/классификации, классический ML, Файнтьюн LLM, P-tune, LoRA, RLHF, хотя бы часть)
- CV (сверточные сети, ViT, опыт работы с Comfy, создания workflow в нем, написание своих нод - вообще супер)
- NLP (опыт в построении диалоговых систем, опыт с role-play файнтьюнами) - этот пункт мечта для нас:)
Для понимания специфики работы:
В данный момент NLP часть продукта состоит из диалогового roleplay движка и генератора пользовательских сценариев.
Движок как точку входа принимает сценарий(конфиг) и позволяет пользователю взаимодействовать с прописанными а нем персонажами. Генератор сценариев позволяет пользователю сгенерировать сценарий по идеи, которая описана а 1-2 предложениях.
Необходимо поддерживать и улучшать текущее решение, обучение своих LLM для более узких задач, например сумммарищация и state tracking. Помимо этого нужно заниматься анализом качества диалогов, классификацией интентов юзера, классификацией легального и нелегального контента. Также а планах использование и адаптация roleplay файнтьюнов.
Генератор картинок позволяет пользователю в произвольной точке диалога сгенерировать релевантную картинку.
Для генерации картинок мы используем workflow основанный на диффузионных моделях, из больших задач сейчас: адаптация этого workflow для аниме стилистики, отделение генератора картинок от чата. Будет плюсом опыт в генерации консистентных персонажей, опыт с uncensored моделями.
Также в планах внедрять TTS, поэтому опыт в использовании и адаптации готовых решений также приветствуется.
МЫ ПРЕДЛАГАЕМ:
-
Полностью удалённый формат работы, гибкий график.
-
Возможность получить практику работы с самой хайповой и прогрессивной технологией сегодняшнего дня. Получать деньги за то, что сейчас все стараются освоить бесплатно для себя.
-
Тесный коллектив крутых профессионалов, искренне увлечённых своим делом.
-
Интересные задачи, возможность реализовывать свои идеи и развиваться.
-
Зарплата зависит от соответствия желательным требованиям, возможно также выделение опциона.
-
Отсутствие бюрократии и формализма.
Наша вакансия — отличная возможность для тех, кто готов показывать реальный результат, хочет работать в атмосфере стартапа и быть причастным к созданию крутого, востребованного продукта.
Если считаешь, что подходишь по навыкам и тебе откликается наш подход, оставляй свой отклик.
После отклика предложим тебе пройти небольшой тест, чтобы сразу понять, насколько друг другу подходим.