Больше информации по резюме будет доступно после регистрации
ЗарегистрироватьсяБыл вчера в 03:27
Мужчина
Москва, готов работать удалённо, готов к редким командировкам
Data scientist/ML Engineer
Специализации:
- Аналитик
- Дата-сайентист
Тип занятости: полная занятость, частичная занятость
Опыт работы 5 лет 6 месяцев
Июнь 2025 — по настоящее время
11 месяцев
Информационные технологии, системная интеграция, интернет... Показать еще
Ведущий разработчик
Разработка классических алгоритмов CV, а так же deep learning, для определения границ, трекинга объекта, кластеризации объектов.
Разрабатывал модели компьютерного зрения на C#/.Net. Помогал команде разработчиков C# встраивать в приложение, писал инференс код. Оптимизировал код на C#/.Net.
Разработка проекта по сканированию архивных документов и применения dewarp технологий на микрокомпьютере одноплатнике Nvidia jetson.
Работа с LLM моделями (RAG, LoRa, PEFT) . Разработка автокомплита и чата.
Разработка интеллектуального поиска по миллионам документов.
Разработка агентов посредством Langflow.
Июнь 2024 — Май 2025
1 год
Data Scientist
Взаимодействие с заказчиком, определение потребности, ведение проекта.
Проекты:
Разрабатывал автоматическую валидацию документов.
Классификация видов документов (~200 классов) и определение ключевых атрибутов: сравнение адреса, наличие подписи на документах.
Решаемые задачи:
OCR: (DBNet, TROCR), NLP: NER, классификация текста (sbert, roberta); LLMs (Phi-3-vision, Rolmocr)
Задачи детекции (YOLO, DETR)
Document understanding (TATR, DONUT, LayoutLM)
Деплой пайплайна на Flask.
Июнь 2022 — Июль 2024
2 года 2 месяца
Информационные технологии, системная интеграция, интернет... Показать еще
Data scientist
Ведение проекта, начиная с определения потребности, до реализации продукта.
Проведение R&D.
Разработка высоконагруженной системы распознавания документов с выделением ключевых
полей (Document Optical Character Recognition with Key Information
Extraction)
Разработка NLP моделей:
SentenceBert, RoBerta, AlBert.
Разработка OCR: исследование существующих решений;
обучение и оптимизация моделей Document Classification, Text Detection и Text Recognition;
Реализация KIE: Transformer
и мультимодальные модели (BLM) text+layout+image;
работа с тулбоксами MMOCR, PaddleOCR.
Деплой и поддержка микросервисов.
Разработка, квантование и интеграция мобильных детектором, сегментаторов YOLOv8 на edge устройства (TFLite).
Работа с серверами AWS, GCP, Azure
Работа с БД SQL: Postgresql, msSQL
Ускорение пойплайна с помощью TensorRT.
Руководил командой разметки.
Руководил командой CV специалистов.
Составлял тз на разметку.
Управлял и разворачивал DS инфраструктуру (настраивал сервера, разворачивал и поддердивал инструменты для внутреннего пользования (mlflow, label-studio, cvat, etc.))
Июнь 2021 — Май 2022
1 год
Mindset
Data Scientist
Работа с компьютерным зрением. Разработка ml-пайплайнов:
- anomaly detection: исследование классических методов детектирования аномалий в табличных данных.
- super-resolution:
Провёл рисерч современных моделей. Провёл тестирование. Задеплоил модель.
- object detection (на основе mmdetection):
На основе two-stage detector'a (Mask R-CNN) разработал мультиклассовую систему детектирования этажей зданий на строящимся объекте. Также встроил построцессинг подсчёта этажей поклассово.
- facial keypoints detection.
Задача: поиск глаз и губ на закрытом паранжой лице.
Провёл исследование по современным готовым решениям задачи. Обучил и протестировал несколько подходящих моделей.
Создание сервисов на основе FastAPI.
Май 2020 — Ноябрь 2020
7 месяцев
Информационные технологии, системная интеграция, интернет... Показать еще
Разработчик CV
Разрабатывал алгоритмы для беспилотной (self-driving) машины AVRORA.
Разрабатывал алгоритмы на C++ с помощью OpenCV.
Был ответственен за разработку модуля компьютерного зрения на автопилоте:
детекции движущихся объектов, вектор направления движения и оценка скорости.
Навыки
Уровни владения навыками
Продвинутый уровень
Обо мне
Люблю и хочу учиться! Я разрабатывал систему детектирования грабежа для грузовых машин и имел опыт разработки с замечательной командой от которой многому научился! Хочу стать лучше в области Data science в целом.
Telegram: @One_Day_You_May1
CV: https://lehashark.github.io/#about
Высшее образование (Бакалавр)
2024
Высшее образование (Бакалавр)
Институт вычислительной математики и информационных технологий, Машинное обучение и Компьютерное зрение
2021
Высшее образование (Бакалавр)
ИТИС, Программное обеспечение вычислительной техники и автоматизированных систем (инженер)
Знание языков
Гражданство, время в пути до работы
Гражданство: Россия
Разрешение на работу: Россия
Желательное время в пути до работы: Не имеет значения
