Больше информации по резюме будет доступно после регистрации
ЗарегистрироватьсяБыл меньше недели назад
Мужчина, 29 лет, родился 13 ноября 1996
Москва, готов к переезду, готов к командировкам
Data Scientist/ML Engineer
Специализации:
- Дата-сайентист
- Программист, разработчик
Тип занятости: полная занятость
Опыт работы 6 лет 10 месяцев
Май 2025 — по настоящее время
1 год
MWS
Senior MLE
Разработал для умного Секретаря в звонке:
- TTS (F5-TTS) для мужского и женского голосов
- Voice cloning (Vall-e 2, Semantic F5-TTS) для пользователя в звонке
- собрал датасет на 15к аудиочасов (Yodas 2): диаризация, двойная ASR-разметка, разметка таймстемпов предложений, фильтрация музыки и ревербераций
Интеграция в сервис через связку Triton (ONNX) + Go. RTFx клонинг модели 0.5 (два раза быстрее реалтайма) на А100, TTS - 0.01 на А100
Декабрь 2022 — Апрель 2024
1 год 5 месяцев
SaluteSpeech/SaluteDevices
Старший эксперт по технологиям
RnD больших ASR/TTS моделей - PyTorch/TorchDistributed/WandB/ONNX
Автор RALLE-E и RALL-E 2(ru-версии моделей), ruBARK
- разработал модель генерации речи на основе текстового промпта и короткого звукового промпта, переноса тембра/стиля спикера на произвольный текст с контролем скорости и питча спикера
- обучал модели представления речи под задачи дообучения ASR/TTS моделей на русском языке (HuBERT, Wav2Vec 2.0, и т. д.)
- использовал обученные эмбеддинги для улучшения качества других больших TTS моделей (VALL-E, VALL-E X, и т.д.)
- использовал обученные эмбеддинги для улучшения ASR умных колонок
- проводил разбор актуальных статей по TTS для команды
RnD моделей-токенайзеров для речи: EnCodec, LanguageCodec, FACodec, WavTokenizer
Сентябрь 2020 — Ноябрь 2022
2 года 3 месяца
Sber (Special Solutions)
Главный инженер по разработке моделей
- Промаркировал клиентов с инвалидностью на основе текстов-транскрибаций (ASR + ruRoBERTa-large) - улучшение особого обслуживания при обращении клиента с инвалидностью
- Обогатил модели геохарактеристиками, признаками из текстов (отзывы клиентов) - улучшение качества базовых моделей склонности (+2.7 ROC-AUC)
- Разработал модель определения степени токсичности обращения клиента в центр поддержки (ruBERT-large) - особое обслуживание токсичных клиентов
- Разработал NER-модели на текстах клиентов с инвалидностью (BERT-like) - полезные признаки для других моделей
- Менторил инженеров по машинному обучению младших позиций
Июль 2019 — Август 2020
1 год 2 месяца
Роснефть-Эксплорейшн
Специалист отдела моделирования и баз данных
Группа моделирования и баз данных геолого-геофизической службы.
- Математическое упругое моделирование и обработка сейсмических сигналов по Восточной Сибири
- Переобработка архивных данных по Восточной и Западной Сибири. Результаты помогли значительно улучшить качество сигналов
Октябрь 2018 — Июль 2019
10 месяцев
Роснефть-Эксплорейшн
Стажер
Группа моделирования и баз данных геолого-геофизической службы.
- Математическое моделирование данных (сейсмических сигналов 2Д) по Восточной Сибири
- Разработке CV-моделей на Python для сейсмических сигналов Восточной Сибири
- Обработка сейсмических данных во временной/частотной области)
Июль 2017 — Сентябрь 2017
3 месяца
Добывающая отрасль... Показать еще
Техник-геофизик-разработчик
Сейсмический отряд №2.
- Морской рейс по арктическому шельфу Российской Федерации
- Количественный контроль базы морских данных (сейсмические сигналы) на борту судна, визуализация данных в Python
Навыки
Уровни владения навыками
Опыт вождения
Права категории B
Обо мне
Целеустремлённый выпускник МГУ, интересующийся программированием на Python и профессиональной деятельностью в области Data Science/Machine learning.
Навыки: Python, Machine Learning (Classic ML/Deep Learning), Spark, Hadoop, SQL, Linux, Bash
Любимая книга по DS: "An Introduction to Statistical Learning"
Высшее образование (Магистр)
2020
Высшее образование (Магистр)
МГУ им. М. В. Ломоносова
Геофизика и цифровая обработка сигналов, Магистр
2018
Высшее образование (Магистр)
МГУ им. М. В. Ломоносова
Геофизика и цифровая обработка сигналов, Бакалавр
Знание языков
Повышение квалификации, курсы
2022
Employer Review Competition (PB #50)
HeadHunter
2021
Coursera Специализация Высшей Школы экономики по машинному обучению
Coursera.org
2020
DataCamp Data Scientist Track
DataCamp Machine Learning Scientist Track
DataCamp.org
Тесты, экзамены
2021
ORACLE
PearsonVUE, SQL Associate
Гражданство, время в пути до работы
Гражданство: Россия
Разрешение на работу: Россия
Желательное время в пути до работы: Не имеет значения
