Предоставлена выборка фотографий номеров грузовых вагонов с аннотацией.
Построить модель распознавания(детектирования) изображений.
- YoloV8
- TrOCRProcessor
- VisionEncoderDecoderModel
- Roboflow
- PIL
- IPython
- seaborn
- numpy
- pandas
- matplotlib
- Загружены данные и проведена предобработка.
- Построена модель распознования изображений на архитектуре YoloV8m.
- Проведен анализ и визуализация работы модели.
- Отработано альтернативное решение на архитектуре TrOCR(оптического распознавания печатных символов).
Модель YoloV8m показывала хорошие результаты, производительность модели на разных уровнях сложности обнаружения на тестовой выборке mAP50-95 = 0.87, mAP50 = 0.995. Модель имеет небольшие трудности с распознанием единиц при сложном уровне обнаружения, что является следствием плохого качества изображения этого класса распознания.