Больше информации по резюме будет доступно после регистрации

Зарегистрироваться
Был более двух недель назад

Мужчина, 25 лет, родился 5 августа 2000

Москва, готов к переезду, готов к командировкам

Machine learning engineer NLP LLM

300 000  на руки

Специализации:
  • Программист, разработчик

Тип занятости: полная занятость, частичная занятость

Опыт работы 4 года 9 месяцев

Октябрь 2022по настоящее время
3 года 8 месяцев

Москва

Услуги для населения... Показать еще

Machine Learning Engineer
- Обучил RoBERTa на бинарной классификации, на атрибутах двух товаров - Обучил BERT задаче MLM и дообучил на Triplet loss. Дало прирост по roc auc score по косинусоидному растоянию на 17% относительно старого берта - Оптимизировал самую большую джобу в проде с 6 часов до 2х часов (Spark). - Все этапы обучения модели поиска соответствия продукта, начиная со сбора и фильтрации данных, обучения модели, выбора пороговых значений и развертывания в рабочей среде. За первые два месяца модель нашла 19,8 млн уникальных матчей (экономия ~500.000$). - Написание фичей. Оптимизированы и исправлены старые фичи и созданы новые, которые лучше коррелируют с таргетом - Переобучение старых моделей новым фичами (из предыдущего пункта). За первые две недели новые модели нашли на 7 млн уникальных матчей больше, чем старые (экономия ~160.000$) - Все этапы обучения модели ранжирования соответствия продукта от написания фичей, сбора и фильтрации данных, обучения модели до развертывания в проде. Модель увеличила полноту всех моделей в сумме с 60% до 90%. Скорость работы джобы увеличена с 2 часов до 30 минут для новой модели - Дежурил, чинил прод, ходил к другим командам когда таблички не доезжали, писал хотфиксы к джобам чтоб пробежали - Погружал новых коллег в работу, обьясняя тонкости и детали нашего пайплайна, помогал получать доступы и все что касается анбординга
Сентябрь 2021Октябрь 2022
1 год 2 месяца

Москва, rabota.sber.ru/

Финансовый сектор... Показать еще

Computer Vision Engineer
Detection, Segmentation, OCR, Layout Analysis, Yolov5, Hugging Face, Transformers * Формированием инструкций для разметчиков данных, валидацией их работы, сбором датасетов из открытых источников, написанием к датасетам адаптеров, манипуляцей данных на серверах. * Graph neural network: На данный момент решаю задачу связывания слов в линии с помощью трансформера LayoutLMv3 (в модель подаются боксы слов, из модели получаются ембединги для каждого бокса, для них строится косинусоидная мера близости и для каждой бары боксов считается BCE loss) Пайплайн был написан мной, начиная от изучения способов решения этой задачи, до выбора трансформера, лосса, написания препроцессинга, обучения, написания постпроцессинга, квантизации и добавления модуля в проект. Качество было улучшено с 77.0% в базовом модуле до 92.0 * segmentation: Обучал пайплайн имплементированный не мной по этой статье, https://arxiv.org/pdf/1911.08947.pdf . Проводилась модернизация пайплайна для обучения на 2х таргетах, а именно решалась задача сегментации линий и параграфов. Качество было улучшено с 77.0% в базовом модуле до 90.6 * detection: (YoloV5) Решалась задача детекции таблиц, для определенного клиента, было улучшено качество на датасете клиента с 35% до 93%, метрика AP.095 * Занимался модулем алгоритмического связывания боксов слов в линии, проводил множество гипотез и тестировал их для алгоритма. Разрабатывал метрику для оценки различных моделей для этой задачи. Писал тесты для проекта. По итогу работы ускорил модуль на 10% и увеличил качество на 8.5%

Навыки

Уровни владения навыками
Английский язык
Python
Linux
PyTorch
Numpy
Pandas
Docker
deep learning
Git
albumentations
scikit-learn
scipy
PostgreSQL
torchvision
Spark
SQL
Computer Vision
Машинное обучение
Machine Learning
ML
Hadoop
Hive
Airflow
sklearn
XGBoost
Big Data
NLP
ClickHouse

Обо мне

Резюме на английском (Чаще обновляю) https://disk.yandex.ru/d/oKya6wGrN6KMZA На данный момент интересен NLP и LLM Красный диплом бакалавра, средний балл 4.71, по всем техническим предметам имею оценки отлично, не испытываю проблем с математикой, из-за того, что знаю, каждая задача решаема, нужно только в ней разобраться, а не бросать На данный момент обучаюсь в магистратуре по направлению Мобильные технологии, в данной программе уделяется важное место нейросетям, от рассказа про легкие архитектуры, до оптимизации и ускорения нейросетей Также, дипломная работа была на тему reverse image search, где я провел исследование, собрал датасеты, выбрал модель и обучил ее ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- Дальше будет довольно подробно про проекты, которые я делал на первых курсах и не возвращался к ним, ни для рефактора, ни для улучшения подходов. ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- 1) Semantic Segmentation Крайним моим проектом является решение задачи сегментации лиц человека. Для задачи я взял CelebAMask-HQ датасет, на 16 классов на которых обучал модель. Была имплементирована U-net модель. После обучения модель давала качество в ~63% по метрике IoU, когда случайная маска давала качество в 1,9%. 2) Classification + Detection Имплементировал ResNet с двумя головами, где одна голова предсказывала собака или кошка на изображении, вторая голова предсказывала координаты бокса описывающего морду животного. По условию, на картинке было только одно животное 3) Multiclass classification (table data) Попал в топ 12% участников на Kaggle в соревновании, задачей которого было предсказывать мультиклассификацию с 206 классами на разряженном датасете, в своем решении использовал PCA, добавлял фичи и подбирал количество скрытых слоев у нейросети, помимо нейросетей написанных на PyTorch использовал нейросеть TabNet, также поскольку датасет был разряжен, было принято решение обучить несколько моделей на разных сидах и усреднить их ответы для получения более робастного решения. 4) Age regression + Sex classification Реализовал проект телеграмм бота, который предсказывает возраст и пол людей на загружаемом фото. Для предсказания возраста, была выбрана, resnet18, которая была дообучена на датасете который я собрал из 2х открытых датасетов которые нашел и отфильтровал от выбросов, возраст в проекте предсказывается регрессией. Для предсказания пола была выбрана resnext50_32x4d модель, которая хорошо себя показала в распознавании лиц, датасет был предоставлен компанией. В проекте использовалась СУБД PostgreSQL, в которую записывается уникальный номер фото и предсказания к нему, сделанные 2мя моделями. Проект был завернут в Docker и установлен на AWS server. 5) Reverse image search Делал проект для вуза, который распознавал плагиат среди картин, для которого были найден готовый датасет и датасет, который я спарсил из открытой галереи, из датасетов были взяты самые популярные классы для обучения.Мною была обучена обучена модель InceptionV3, после обучения из модели был срезан последний слой, для получения векторов изображений предсказанных нейросетью, после для поиска самых похожих картинок на данную использовался KNN, алгоритм c косинусоидальной мерой близости. В итоге проект с некоторыми дополнениями стал моей дипломной работой, по которому получил "отлично". Также есть учебные проекты по предсказанию зарплат, предсказание выживет ли человек в катастрофе Титаника, Распознавание цифр и предсказание грязная/чистая тарелка на фото GitHub: https://github.com/Windmen05 Kaggle: https://www.kaggle.com/windmen

Высшее образование (Магистр)

2024
Высшее образование (Магистр)
Информационные технологии, (Магистр) Мобильные технологии (Информационные системы и технологии)
2022
Высшее образование (Магистр)
Институт принтмедиа и информационных технологий, (Бакалавр) Информационные и автоматизированные системы обработки информации и управления

Знание языков

Русский — Родной

Английский — B2 — Средне-продвинутый

Тесты, экзамены

2020
stepik
Samsung Research Russia Open Education, Neural networks and computer vision
2020
stepik
Bioinformatics Institute, Основы статистики
2020
stepik
Computer Science Center (CS центр), Математическая статистика
2019
stepik
Computer Science Center (CS центр), Теория вероятностей

Гражданство, время в пути до работы

Гражданство: Россия

Разрешение на работу: Россия

Желательное время в пути до работы: Не имеет значения