MITCH

AI Engineer

От 200 000 RUR

Москва
Нет опыта

Python
Docker-compose
GitLab CI
NoSQL
Linux

Разработка real-time AI-аватара человека (voice + video, RU) / Senior AI Engineer / AI Studio — Real-time Digital Human (RU)

Ищем специалиста или команду для создания real-time AI-аватара конкретного человека.

Формат: пользователь заходит на сайт, нажимает «начать диалог», и фотореалистичный 2D-аватар человека ведёт живой голосовой диалог (voice + video) в реальном времени, на русском языке, с сохранением стиля речи и логики оригинального человека.

Это не записанные видео и не чат-бот, а интерактивный разговор с минимальной задержкой.

Технические требования (зафиксированные)

Входные данные

интервью с человеком (видео + аудио)
транскрипции интервью
утверждённые формулировки и ограничения
Обязательные характеристики
язык: русский
голос: точный клон реального человека
визуал: фотореалистичный 2D talking head (лицо + плечи)
формат: real-time, не генерация заранее
задержка ответа: минимально возможная (комфортная для диалога)
одновременная нагрузка: 1 пользователь
длительность сессии: 15–60 минут
размещение: обычный веб-сайт

Функциональность MVP
вход на сайт → кнопка «начать диалог»
голосовой ввод (mic)
голос + видео-ответ аватара
контроль тем (guardrails)
таймер сессии
логирование диалогов

Что НЕ требуется
3D-персонаж в полный рост
Unreal / метавселенная
массовая нагрузка
NFT / Web3

Ожидаемый стек / опыт

(не обязательно всё, но должно быть понимание)

Real-time conversational AI
Speech-to-Text / Text-to-Speech (RU)
LLM + RAG
WebRTC / streaming
API real-time avatars (HeyGen / D-ID / аналоги) или кастомный пайплайн
опыт работы с latency, streaming, диалогами

Что присылать в отклике

релевантные кейсы (особенно real-time / voice / avatars)
примеры демо (если есть)
подход к реализации (API vs кастом)

Источник вакансии

Вернуться, к списку вакансий