THE METHOD FOR STOPPING THE STRING OBJECT RECOGNITION PROCESS IN A REAL-TIME VIDEO STREAM

Authors

DOI:

https://doi.org/10.31891/2219-9365-2024-79-32

Keywords:

real-time object recognition, machine learning integration, string objects, video streams, Optimal stopping, computational efficiency, dynamic confidence scoring

Abstract

 

У статті досліджується проблема оптимальної зупинки процесу розпізнавання рядкових об'єктів у відео потоці реального часу, що є критично важливою для систем з обмеженими обчислювальними ресурсами, такими як мобільні пристрої. Проблема формалізується як задача прийняття рішень, націлена на знаходження балансу між обчислювальними витратами та точністю розпізнавання. Представлена математична модель, яка вводить правило зупинки на основі очікуваної відстані між поточними та наступними інтегрованими результатами розпізнавання, забезпечуючи ефективність і точність у динамічних умовах. Розроблено алгоритм, який використовує нормалізовану відстань Левенштейна як метрику для оцінки точності розпізнавання, інтегруючи результати, отримані за допомогою алгоритму ROVER. Експериментальна перевірка була проведена на наборі даних MIDV-500, що містить різні рядкові об’єкти як елементи ідентифікаційних документів, зокрема, дати, зони для машинного зчитування, номери документів та власні імена. Використовуючи OCR-фреймворк Tesseract (версій 4.1.1 та 5.5.0), метод продемонстрував значні покращення точності розпізнавання та ефективності використання ресурсів порівняно з традиційними підходами, орієнтованими на використання фіксованих кроків й порогів. Результати дослідження підкреслюють надійність і універсальність запропонованого підходу, оскільки він безперешкодно адаптується до різних середовищ та алгоритмів розпізнавання тексту. Стаття підкреслює широку застосовність методу, пропонуючи розширення на інші типи об'єктів, включаючи фото та захисні зображення. Крім того, запропонована інтеграція з моделями машинного навчання та динамічним оцінюванням коректності розпізнавання для покращення точності прийняття рішень.

Downloads

Published

2024-08-29

How to Cite

GUANXIANG, X., & KOVTUN, V. (2024). THE METHOD FOR STOPPING THE STRING OBJECT RECOGNITION PROCESS IN A REAL-TIME VIDEO STREAM. MEASURING AND COMPUTING DEVICES IN TECHNOLOGICAL PROCESSES, (3), 243–250. https://doi.org/10.31891/2219-9365-2024-79-32