ПоставщикамБлог

OCR - Оптическое распознавание символов

OCR - Оптическое распознавание символов

Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные, использующиеся для представления символов в компьютере (например, в текстовом редакторе). Распознавание широко применяется для преобразования книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание символов позволяет редактировать текст, осуществлять поиск слов или фраз, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения.

Системы оптического распознавания текста требуют калибровки для работы с конкретным шрифтом; в ранних версиях для программирования было необходимо изображение каждого символа, программа одновременно могла работать только с одним шрифтом. В настоящее время больше всего распространены так называемые «интеллектуальные» системы, с высокой степенью точности распознающие большинство шрифтов. Некоторые системы оптического распознавания текста способны восстанавливать исходное форматирование текста, включая изображения, колонки и другие нетекстовые компоненты.

Точное распознавание латинских символов в печатном тексте в настоящее время возможно, только если доступны чёткие изображения, такие, как сканированные печатные документы. Точность при такой постановке задачи превышает 99 %, абсолютная точность может быть достигнута только путём последующего редактирования человеком. Проблемы распознавания рукописного «печатного» и стандартного рукописного текста, а также печатных текстов других форматов (особенно с очень большим числом символов) в настоящее время являются предметом активных исследований.

Точность работы методов может быть измерена несколькими способами и поэтому может сильно варьироваться. К примеру, если встречается специализированное слово, не используемое для соответствующего программного обеспечения, при поиске несуществующих слов, ошибка может увеличиться.

Распознавание символов онлайн иногда путают с оптическим распознаванием символов. Последний — это офлайн-метод, работающий со статической формой представления текста, в то время как онлайн-распознавание символов учитывает движения во время письма. Например, в онлайн-распознавании, использующем PenPoint OS или планшетный ПК, можно определить, с какой стороны пишется строка: справа налево или слева направо.

Онлайн-системы для распознавания рукописного текста «на лету» в последнее время стали широко известны в качестве коммерческих продуктов. Алгоритмы таких устройств используют тот факт, что порядок, скорость и направление отдельных участков линий ввода известны. Кроме того, пользователь научится использовать только конкретные формы письма. Эти методы не могут быть использованы в программном обеспечении, которое использует сканированные бумажные документы, поэтому проблема распознавания рукописного «печатного» текста по-прежнему остаётся открытой. На изображениях с рукописным «печатным» текстом без артефактов может быть достигнута точность в 80 % — 90 %, но с такой точностью изображение будет преобразовано с десятками ошибок на странице. Такая технология может быть полезна лишь в очень ограниченном числе приложений.

Ещё одной широко исследуемой задачей является распознавание рукописного текста. В данное время достигнутая точность даже ниже, чем для рукописного «печатного» текста. Более высокие показатели могут быть достигнуты только с использованием контекстной и грамматической информации. Например, в ходе распознания искать целые слова в словаре легче, чем пытаться выявить отдельные знаки из текста. Знание грамматики языка может также помочь определить, является ли слово глаголом или существительным. Формы отдельных рукописных символов иногда могут не содержать достаточно информации, чтобы точно (более 98 %) распознать весь рукописный текст.

Для решения более сложных задач в области распознавания используются, как правило, интеллектуальные системы распознавания, такие, как искусственные нейронные сети.

Для калибровки систем распознавания текста создана стандартная база данных MNIST, состоящая из изображений рукописных цифр.

Наиболее популярные продукты категории OCR - Оптическое распознавание символов Все продукты категории

ABBYY FLEXICapture
3
20
ABBYY FINEREADER
12
19

F.A.Q. OCR - Оптическое распознавание символов

Что такое программное обеспечение OCR?

OCR или оптическое распознавание символов - это программное обеспечение, которое находит и идентифицирует все символы (цифры, буквы, знаки пунктуации и т.д.) в изображении, PDF или другом документе.

Какая технология оптического распознавания символов лучше?

Есть много хороших механизмов распознавания. Наилучшие результаты, однако, достигаются системами, которые используют «механизм голосования» для объединения нескольких механизмов/технологий OCR.

Как я могу улучшить точность распознавания?

Эффективная предварительная обработка может значительно улучшить результаты распознавания. Кроме того, технология компьютерного зрения может использовать «контекстные ключи» для дальнейшего повышения точности.

Может ли OCR обнаруживать линии, формы, цвета или другие функции на странице?

Нет, любые механизмы распознавания текста только получают текст. Чтобы обнаружить другие функции, вам нужно более комплексное программное обеспечение для сбора данных.

Включает ли OCR анализ макета документа?

Нет, анализ макета документа требует технологии компьютерного зрения, которая выходит за рамки возможностей базового механизма распознавания. Некоторые из более продвинутых поставщиков OCR начали включать анализ макета документа, чтобы помочь правильно расположить текст на странице для понимания таблиц и электронных таблиц.

OCR читает почерк?

Некоторые механизмы OCR утверждают, что извлекают рукописный текст, но их скорость распознавания намного ниже, чем для печатного текста, и недостаточно точна для включения в более широкое решение для автоматизации.

Работает ли OCR для любого языка?

Механизмы OCR могут быть запрограммированы на распознавание практически любого языка. Однако после запуска они могут распознавать только тот язык, на котором они были установлены. Иногда один компьютер может быть настроен на распознавание двух или трех похожих языков, но чем больше языков должен распознавать компьютер, тем ниже будет его точность.

В чем разница между OCR и OMR?

OCR определяет конкретные символы. OMR, или оптическое распознавание меток, распознает метки на документе, но не пытается идентифицировать эти метки. OMR можно использовать, например, для определения того, заполнена ли ячейка или пузырь на экзамене или опросе с несколькими вариантами ответов.

Материалы