Больше информации по резюме будет доступно после регистрации

Зарегистрироваться
Был меньше недели назад

Мужчина, 29 лет, родился 13 ноября 1996

Москва, готов к переезду, готов к командировкам

Data Scientist/ML Engineer

Специализации:
  • Дата-сайентист
  • Программист, разработчик

Тип занятости: полная занятость

Опыт работы 6 лет 10 месяцев

Май 2025по настоящее время
1 год
MWS
Senior MLE
Разработал для умного Секретаря в звонке: - TTS (F5-TTS) для мужского и женского голосов - Voice cloning (Vall-e 2, Semantic F5-TTS) для пользователя в звонке - собрал датасет на 15к аудиочасов (Yodas 2): диаризация, двойная ASR-разметка, разметка таймстемпов предложений, фильтрация музыки и ревербераций Интеграция в сервис через связку Triton (ONNX) + Go. RTFx клонинг модели 0.5 (два раза быстрее реалтайма) на А100, TTS - 0.01 на А100
Декабрь 2022Апрель 2024
1 год 5 месяцев
SaluteSpeech/SaluteDevices
Старший эксперт по технологиям
RnD больших ASR/TTS моделей - PyTorch/TorchDistributed/WandB/ONNX Автор RALLE-E и RALL-E 2(ru-версии моделей), ruBARK - разработал модель генерации речи на основе текстового промпта и короткого звукового промпта, переноса тембра/стиля спикера на произвольный текст с контролем скорости и питча спикера - обучал модели представления речи под задачи дообучения ASR/TTS моделей на русском языке (HuBERT, Wav2Vec 2.0, и т. д.) - использовал обученные эмбеддинги для улучшения качества других больших TTS моделей (VALL-E, VALL-E X, и т.д.) - использовал обученные эмбеддинги для улучшения ASR умных колонок - проводил разбор актуальных статей по TTS для команды RnD моделей-токенайзеров для речи: EnCodec, LanguageCodec, FACodec, WavTokenizer
Сентябрь 2020Ноябрь 2022
2 года 3 месяца
Sber (Special Solutions)
Главный инженер по разработке моделей
- Промаркировал клиентов с инвалидностью на основе текстов-транскрибаций (ASR + ruRoBERTa-large) - улучшение особого обслуживания при обращении клиента с инвалидностью - Обогатил модели геохарактеристиками, признаками из текстов (отзывы клиентов) - улучшение качества базовых моделей склонности (+2.7 ROC-AUC) - Разработал модель определения степени токсичности обращения клиента в центр поддержки (ruBERT-large) - особое обслуживание токсичных клиентов - Разработал NER-модели на текстах клиентов с инвалидностью (BERT-like) - полезные признаки для других моделей - Менторил инженеров по машинному обучению младших позиций
Июль 2019Август 2020
1 год 2 месяца
Роснефть-Эксплорейшн
Специалист отдела моделирования и баз данных
Группа моделирования и баз данных геолого-геофизической службы. - Математическое упругое моделирование и обработка сейсмических сигналов по Восточной Сибири - Переобработка архивных данных по Восточной и Западной Сибири. Результаты помогли значительно улучшить качество сигналов
Октябрь 2018Июль 2019
10 месяцев
Роснефть-Эксплорейшн
Стажер
Группа моделирования и баз данных геолого-геофизической службы. - Математическое моделирование данных (сейсмических сигналов 2Д) по Восточной Сибири - Разработке CV-моделей на Python для сейсмических сигналов Восточной Сибири - Обработка сейсмических данных во временной/частотной области)
Июль 2017Сентябрь 2017
3 месяца

Добывающая отрасль... Показать еще

Техник-геофизик-разработчик
Сейсмический отряд №2. - Морской рейс по арктическому шельфу Российской Федерации - Количественный контроль базы морских данных (сейсмические сигналы) на борту судна, визуализация данных в Python

Навыки

Уровни владения навыками
Обучаемость
Креативность
Коммуникабельность
Английский язык
Python
SQL
Spark
Git
Machine Learning
Data visualization
Airflow
Hadoop
NLP

Опыт вождения

Права категории B

Обо мне

Целеустремлённый выпускник МГУ, интересующийся программированием на Python и профессиональной деятельностью в области Data Science/Machine learning. Навыки: Python, Machine Learning (Classic ML/Deep Learning), Spark, Hadoop, SQL, Linux, Bash Любимая книга по DS: "An Introduction to Statistical Learning"

Высшее образование (Магистр)

2020
Высшее образование (Магистр)
МГУ им. М. В. Ломоносова
Геофизика и цифровая обработка сигналов, Магистр
2018
Высшее образование (Магистр)
МГУ им. М. В. Ломоносова
Геофизика и цифровая обработка сигналов, Бакалавр

Знание языков

Русский — Родной

Английский — C1 — Продвинутый

Повышение квалификации, курсы

2022
Employer Review Competition (PB #50)
HeadHunter
2021
Coursera Специализация Высшей Школы экономики по машинному обучению
Coursera.org
2020
DataCamp Data Scientist Track DataCamp Machine Learning Scientist Track
DataCamp.org

Тесты, экзамены

2021
ORACLE
PearsonVUE, SQL Associate

Гражданство, время в пути до работы

Гражданство: Россия

Разрешение на работу: Россия

Желательное время в пути до работы: Не имеет значения