Оптическое распознавание символов
Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод на новый заказ в Автор24. Это бесплатно.
Оптическое распознавание символов (англ. Optical Character Recognition – OCR) – одна из фундаментальных проблем в области распознавания образов, состоящая в поиске и идентификации рукописного, машинного или печатного текста на изображениях и последующем его извлечении в текстовые данные, которые могут быть использованы для представления в различных компьютерных программах. OCR является актуальной проблемой компьютерного зрения и активно применяется для решения целого ряда прикладных задач, таких как восстановление документов, распознавание автомобильных номеров, публикация текста на веб-странице, оцифровка книг, автоматизация систем учета в бизнесе, определение номера банковской карты.
Системы OCR подразделяются на две основные группы в зависимости от типа вводимых данных в системе: печатные и рукописные . В печатном режиме в качестве входных данных на вход в систему поступают различные шрифты печатных машин, компьютерных клавиатур, принтеров и т.д. В этом режиме входные данные обычно имеют хорошее качество, потому что генерируются машинным способом. Следовательно, процесс распознавания проще, чем для второй группы, и эффективность системы заметно отличается в лучшую сторону. Эти системы обычно используются для распознавания печатных документов, таких как книги, газеты и другие подобные документы.
Рукописные документы создаются разными людьми в разных ситуациях. Следовательно, распознавание рукописных символов считается одной из самых сложных и захватывающих областей исследований в области распознавания образов. Отчасти это связано с разнообразием ориентации, толщины и размера символов в рукописных текстах, обусловленных различными привычками письма, стилями, уровнем образования, настроением, состоянием здоровья и другими условиями пишущих. Кроме того, другие элементы, такие как пишущие инструменты, поверхности письма и методы сканирования, а также другие проблемы, такие как нежелательные символы, которые могут накладываться в предложениях на любом языке, делают распознавание рукописных текстов очень трудным.
Таким образом, в отличие от печатных систем оптического распознавания символов, рукописные системы оптического распознавания все еще остаются открытой областью исследований, и до конечных целей в этой предметной области еще далеко.
Компьютерное зрение
Компьютерное зрение занимается извлечением значимой информации из содержимого цифровых изображений или видеозаписей. Это отличается от обработки изображений, которая включает в себя манипулирование визуальной информацией на уровне пикселей. Приложения компьютерного зрения включают в себя классификацию изображений, визуальное детектирование, реконструкцию трехмерных сцен по 2D-изображениям, поиск изображений, дополненную реальность, машинное зрение и автоматизацию движения .
Сегодня машинное обучение является необходимым компонентом многих алгоритмов компьютерного зрения . Такие алгоритмы могут быть определены как комбинация алгоритмов обработки изображений и машинного обучения. Эффективные решения требуют алгоритмов, которые могут справляться с огромным количеством информации, содержащейся в изображениях, и, что очень важно, для многих приложений могут выполнять вычисления в режиме реального времени .
Исследования в области компьютерного зрения в течение многих лет сводились к проблеме обработки изображений. До сих пор точно не определено, являются ли компьютерное и машинное зрение разными названиями одной и той же области
Зарегистрируйся, чтобы продолжить изучение работы
. Термины «машинное зрение» и «компьютерное зрение» возникли много лет назад, когда ситуация сильно отличалась от сегодняшней. В первые дни компьютерное зрение подразумевало изучение «зрения» и возможное проектирование связанного с ним программного обеспечения, тогда как под машинным зрением понималось изучение не только программного обеспечения, но и аппаратной среды, а также методов получения изображений, необходимых для реальных приложений, так что это был гораздо более инженерно-ориентированный предмет. В настоящее время компьютерные технологии настолько продвинулись, что значительная доля приложений для использования в реальном времени может быть реализована на простых персональных компьютерах. Это и многие другие изменения в знаниях в этой области привели к значительному сближению между терминами, в результате чего они могут использоваться практически взаимозаменяемо .
Системы машинного зрения полагаются на цифровые датчики, защищенные внутри промышленных камер специальной оптикой для получения изображений, чтобы компьютерное оборудование и программное обеспечение могли обрабатывать, анализировать и измерять различные характеристики для принятия решений. Другими компонентами системы машинного зрения являются освещение, объектив, устройство для анализа и обработки и устройство для использования данных. Освещение указывает на проверяемую деталь, позволяя ее признакам выделиться, чтобы их было хорошо видно с помощью камеры. Объектив захватывает изображение и представляет его сенсору в виде света. Датчик в камере машинного зрения преобразует этот свет в цифровое изображение, которое затем отправляется в процессор для анализа. Обработка зрения состоит из алгоритмов, которые просматривают изображение и извлекают необходимую информацию, проводят необходимую проверку и принимают решение. Наконец, связь обычно осуществляется с помощью дискретного сигнала ввода-вывода или данных, отправляемых через последовательное соединение на устройство, которое регистрирует информацию или использует ее .
Некоторые попытки формализации правил, определяющих способность живых организмов видеть, в определенных обстоятельствах можно считать вполне успешными. Компьютерное зрение как набор задач для обработки изображений может быть описано следующим образом:
Захват изображения – изображение захватывается (фотоаппаратом, камерой или другим аналогичным устройством) и оцифровывается;
Предварительная обработка – оцифрованное изображение модифицируется таким образом, чтобы подчеркнуть наиболее важные признаки (например, выполняется уменьшение шума, нормализация контрастности и т.д.);
Сегментация – выбор некоторых признаков (границы изображений, похожие линии или поверхности);
Описание – извлечение радиометрических, фотометрических дескрипторов, описывающих объект набором выбранных признаков;
Классификация – средства, позволяющие выполнить классификацию объекта.
Несмотря на то, что машинное обучение как научная дисциплина существовало со второй половины двадцатого века, в течение долгого времени его методы не находили широкого применения в задачах обработки изображений и компьютерного зрения. Решение сложных проблем достигалось за счет предварительного упрощения информации, содержащейся в изображении, до того, как само изображение подавалось на вход модели машинного обучения
50% курсовой работы недоступно для прочтения
Закажи написание курсовой работы по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!