Разработка real-time AI-аватара человека (voice + video, RU) / Senior AI Engineer / AI Studio — Real-time Digital Human (RU)
Ищем специалиста или команду для создания real-time AI-аватара конкретного человека.
Формат: пользователь заходит на сайт, нажимает «начать диалог», и фотореалистичный 2D-аватар человека ведёт живой голосовой диалог (voice + video) в реальном времени, на русском языке, с сохранением стиля речи и логики оригинального человека.
Это не записанные видео и не чат-бот, а интерактивный разговор с минимальной задержкой.
Технические требования (зафиксированные)
Входные данные
- интервью с человеком (видео + аудио)
- транскрипции интервью
- утверждённые формулировки и ограничения
-
Обязательные характеристики
- язык: русский
- голос: точный клон реального человека
- визуал: фотореалистичный 2D talking head (лицо + плечи)
- формат: real-time, не генерация заранее
- задержка ответа: минимально возможная (комфортная для диалога)
- одновременная нагрузка: 1 пользователь
- длительность сессии: 15–60 минут
- размещение: обычный веб-сайт
Функциональность MVP - вход на сайт → кнопка «начать диалог»
- голосовой ввод (mic)
- голос + видео-ответ аватара
- контроль тем (guardrails)
- таймер сессии
- логирование диалогов
Что НЕ требуется - 3D-персонаж в полный рост
- Unreal / метавселенная
- массовая нагрузка
- NFT / Web3
Ожидаемый стек / опыт
(не обязательно всё, но должно быть понимание)
- Real-time conversational AI
- Speech-to-Text / Text-to-Speech (RU)
- LLM + RAG
- WebRTC / streaming
- API real-time avatars (HeyGen / D-ID / аналоги) или кастомный пайплайн
- опыт работы с latency, streaming, диалогами
Что присылать в отклике
- релевантные кейсы (особенно real-time / voice / avatars)
- примеры демо (если есть)
- подход к реализации (API vs кастом)