
USETECH
Data Scientist
- ML
- accuracy\recision\recall\f1
- seq2seq, word2vec, fasttext, tf-idf
- RNN, LSTM, transformers
- BLEU, NIST, ROUGE, METEOR
- NLP
- OCR
- LLM
Юзтех – группа аккредитованных ИТ-компаний полного цикла разработки с многолетней экспертизой в передовых технологиях: DWH, BigData, AI/ML, Blockchain, BI, предиктивная аналитика, цифровые двойники производства и рисков.
ГК Юзтех является технологическим партнером таких компаний, как Mail.ru, 2Gis, НЛМК, Еврохим, ГоИнвест, Альфа-Банк, Сбер, ВТБ, МКБ, Самолет, Х5 retail Group, Газпромнефть, Леруа Мерлен, Ситилинк, Ланит, IBS. Также, ГК разрабатывает собственные IT-продукты (Usebus, Octopus, Тил Эйчар) и флагманские проекты, которыми пользуется 70% населения страны.
Приглашаем присоединиться к команде нашего заказчика, которая занимается банковским проектом: Автоматическая очистка от нерелевантных сообщений - сейчас фильтры выставляются и подбираются вручную, изменяются во времени, нет гарантии актуальности и точности.
LLM as a service(RAG) - для поиска сообщений по экстренным/актуальным новостям нужна возможность управления поисковой строкой по средствам промпт инжиниринга.
Дедубликация новостей, отбор сообщений, связанных с конкретным продуктом, суммаризация, далее увязывать со справочником корневых причин. Определение основных болей клиентов (частота / критичность) в разрезе продуктов, определение направлений развития продуктов/определение зон потенциального развития продуктов.
Распознавание пакета документов, поступающих от клиента в рамках процесса работы со сделкой или в рамках процедуры мониторинга. Автоматическое определение типа документа, NER и структурирование данных, полученных из текста документа.
Задачи:
-
Моделирование при помощи классических алгоритмов, моделирование в области задач NLP, работа с данными, разработка в области AI.
-
Решение задач, направленных на обработку и структурирование текстовой информации для разработки моделей.
-
Построение решений на базе LLM моделей \ разработка промптов.
-
Суммаризация информации для генерации кредитных меморандумов \ аналитических записок по клиенту: новости, источники – агрегаторы, кредитная история, транзакции, фин. отчетность, арбитражи и пр.
-
Генерация выводов по кредитоспособности клиента с помощью LLM.
-
Определение тональности информации по клиенту \ выделение негатива по клиенту с помощью LLM.
-
Генерация рекомендаций по структуре сделки с клиентом с помощью LLM.
-
Построение RAG сервиса базы знаний по финансовому анализу и работе с залогами.
-
Формулирование гипотез для улучшения алгоритмов и сервисов, реализация дизайна экспериментов, проведение экспериментов с анализом итоговых результатов.
Ваш опыт:
-
Высшее образование
-
Понимание классических алгоритмов классификации и регрессии ML (деревья\бустинг, линейная регрессия, наивный байес)
-
Понимание классических метрик accuracy\recision\recall\f1
-
Знание базовых алгоритмов кластеризации и метрик
-
Хорошее знание базы классического DS (модели, метрики)
-
Опыт работы и глубокое понимание seq2seq, word2vec, fasttext, tf-idf
-
Знание теории в области применения RNN, LSTM, transformers. Знание плюсов и минусов, областей применения. Опыт их применения в рабочих задачах
-
Опыт работы с текстовыми метриками, знать и уметь применять: BLEU, NIST, ROUGE, METEOR
-
Опыт файнтюнинга и алаймента
-
Понимать разницу между токенизацией, лемматизацией и стеммингом
-
Опыт работы в проектах с анализом документов, переводом текста, обработкой
-
Опыт с NLP, опыт CV (OCR)
- Знания в построении векторных представлений слови и обучении embedding моделей.
- Знания базовых архитектур нейронных сетей для работы с текстом (RNN, LSTM, BERT) 6) опыт работы с LLM (файнтюнинг LLM).
- Опыт построения RAG и работы с фреймворками langchain приветствуется.
- Уверенное программирование на языке python\numpy\pandas
Мы предлагаем:
- Карьерную и профессиональную возможность в стабильной, аккредитованной ИТ-компании;
- Расширенный полис ДМС со стоматологией, корпоративный психолог;
- Удаленную работу и гибкий график;
- Необходимую технику для комфортной работы;
- Обучение, сертификацию, Usetech English Club – онлайн изучение английского;
- Доступ к Корпоративной библиотеке и к Корпоративному университету;
- Внутрикорпоративные профильные коммьюнити;
- Заботу о детях сотрудников: корпоративные скидки, подарки, детские дни;
- Геймифицированную программу лояльности: поверь, ты будешь восторге от нашего корпоративного магазина!
- Интересную корпоративную жизнь: мы много работаем и классно отдыхаем.