МЕТОДИ РОЗПІЗНАВАННЯ РЯДКОВИХ ОБ’ЄКТІВ У ВІДЕО ПОТОКАХ РЕАЛЬНОГО ЧАСУ
DOI:
https://doi.org/10.31891/2219-9365-2024-80-41Ключові слова:
відео потік реального часу, розпізнавання рядкових об’єктів, розпізнавання тексту, динамічне програмування, відео-оптичне розпізнавання символів, інтеграція результатів розпізнавання, зменшення впливу спотвореньАнотація
У статті досліджується проблема підвищення точності розпізнавання рядкових об’єктів у відео потоках реального часу. Досліджуваний процес характеризується динамічністю та присутністю в аналізованому відео потоці таких типів спотворень, як дефокусування, відблиски та артефакти руху. Представлено новий метод, який інтегрує результати розпізнавання з кількох відеокадрів, враховуючи альтернативні варіанти класифікації для кожного рядкового об’єкта. Методпоєднує принципи динамічного програмування та сучасні метрики, такі як узагальнена відстань Левенштейна, для ефективного агрегування результатів розпізнавання. Експериментальна перевірка на наборі даних MIDV-500 демонструє перевагу запропонованого методу над традиційними підходами, зокрема методом ROVER, у зниженні помилок розпізнавання різних типів рядкових об’єктів. Результати підкреслюють надійність і масштабованість методу для застосувань у сфері оцифровки документів, автоматизованого екстрагування даних та розпізнавання тексту мобільними пристроями. Майбутні напрями досліджень будуть спрямовані на оптимізацію обчислювальної ефективності представленого методу, його адаптацію до розпізнавання рядкових об’єктів, утворених різними мовами, та перевірку продуктивності на наборах даних, які відтворюють реалістичні сценарії застовуаання відповідних систем розпізнавання.