Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций
Конференция: Решетневские чтения; Красноярск; Красноярск
Год издания: 2025
Ключевые слова: poorly structured documents, optical character recognition, transformer architecture, artificial neural networks, слабоструктурированные документы, оптическое распознавание символов, трансформерная архитектура, искусственные нейронные сети
Аннотация: В работе рассматривается эволюция методов оптического распознавания символов (OCR) - от традиционных подходов до современных моделей. Основное внимание уделено детальному анализу модели TrOCR (Transformer-based Optical Character Recognition). Ключевым преимуществом данной архитектуры является способность к контекстуальному анализу Показать полностьювсего документа для интерпретации данных с вариативным макетом. This work examines the evolution of optical character recognition (OCR) methods, from traditional approaches to modern models. The main attention is paid to the detailed analysis of the TrOCR (Transformer-based Optical Character Recognition) model. Key advantage of this architecture is the ability to contextually analyze the entire document to interpret data with a variable layout.
Журнал: Решетневские чтения
Номера страниц: 219-221
Место издания: Красноярск