Пахотина Ксения Евгеньевна

ML-инженер

От 2 000 USD

Москва
Полная занятость
Удаленная работа
Нет опыта

OpenAI
Git
Python
Работа с нейросетями
LLM
PROMT
GPT
NLP
VLLM
Английский — B2 — Средне-продвинутый

ML- инженер в IT - стартап:

Мы успешный быстрорастущий венчурный стартап на базе ИИ (психологическая игра).
Собственная технология поверх языковых моделей, чат-боты, генерация изображения, звука, видео.
Продукту год, очень быстро растет, закрыли недавно seed раунд. За год мы выросли x10 и хотим вырасти x10 еще раз.
Сейчас мы расширяем команду и ищем ML-инженера

ОСНОВНАЯ ЗАДАЧА: улучшить системный промпт для LLaMa-2, чтобы модель давала качественные ответы на пользовательские запросы с этим системным промптом.

ОБЯЗАТЕЛЬНЫЕ ТРЕБОВАНИЯ:

знание техник промпт-инжениринга, основанное в том числе на понимании принципов работы языковых моделей, навыки написания промтов
NLP
Понимание как устроена transformers архитектура (BERT, GPT)
Инференс LLM, transformers, vllm
Знание английского B2 или выше

БУДЕТ ПЛЮСОМ:

умение писать простые скрипты на Python (например, в Jupyter Notebook)
опыт в data science, базовое понимание мат. статистики
умение дообучать модель (fine-tune, LoRA, настройка гиперпараметров)
умение запускать языковую модель локально
умение работать не только с текстовыми, но и с графическими моделями
NLP (знание и опыт применения алгоритмов кластеризации/классификации, классический ML, Файнтьюн LLM, P-tune, LoRA, RLHF, хотя бы часть)
CV (сверточные сети, ViT, опыт работы с Comfy, создания workflow в нем, написание своих нод - вообще супер)
NLP (опыт в построении диалоговых систем, опыт с role-play файнтьюнами) - этот пункт мечта для нас:)

Для понимания специфики работы:

В данный момент NLP часть продукта состоит из диалогового roleplay движка и генератора пользовательских сценариев.

Движок как точку входа принимает сценарий(конфиг) и позволяет пользователю взаимодействовать с прописанными а нем персонажами. Генератор сценариев позволяет пользователю сгенерировать сценарий по идеи, которая описана а 1-2 предложениях.

Необходимо поддерживать и улучшать текущее решение, обучение своих LLM для более узких задач, например сумммарищация и state tracking. Помимо этого нужно заниматься анализом качества диалогов, классификацией интентов юзера, классификацией легального и нелегального контента. Также а планах использование и адаптация roleplay файнтьюнов.

Генератор картинок позволяет пользователю в произвольной точке диалога сгенерировать релевантную картинку.

Для генерации картинок мы используем workflow основанный на диффузионных моделях, из больших задач сейчас: адаптация этого workflow для аниме стилистики, отделение генератора картинок от чата. Будет плюсом опыт в генерации консистентных персонажей, опыт с uncensored моделями.

Также в планах внедрять TTS, поэтому опыт в использовании и адаптации готовых решений также приветствуется.

МЫ ПРЕДЛАГАЕМ:

Полностью удалённый формат работы, гибкий график.
Возможность получить практику работы с самой хайповой и прогрессивной технологией сегодняшнего дня. Получать деньги за то, что сейчас все стараются освоить бесплатно для себя.
Тесный коллектив крутых профессионалов, искренне увлечённых своим делом.
Интересные задачи, возможность реализовывать свои идеи и развиваться.
Зарплата зависит от соответствия желательным требованиям, возможно также выделение опциона.
Отсутствие бюрократии и формализма.

Наша вакансия — отличная возможность для тех, кто готов показывать реальный результат, хочет работать в атмосфере стартапа и быть причастным к созданию крутого, востребованного продукта.

Если считаешь, что подходишь по навыкам и тебе откликается наш подход, оставляй свой отклик.

После отклика предложим тебе пройти небольшой тест, чтобы сразу понять, насколько друг другу подходим.

Источник вакансии

Вернуться, к списку вакансий