С развитием новых технологий становится возможным расширить круг задач, которые могут быть выполнены компьютерами. Задачи, на решение которых обращают внимание современные исследователи и программисты, различны по своей природе, но все они должны иметь практическое значение и быть полезными для пользователей. Данный обзор литературы направлен на изучение работ, посвященных распознаванию геометрических форм. В нем основное внимание уделяется распознаванию геометрических образов в машинном обучении, обсуждаемому в современных статьях из высококачественных научных источников.
Распознавание геометрических и других закономерностей в машинном обучении уже давно не стало популярной темой исследований. В своем исследовании, посвященном методам распознавания текстур, Ojala et al. сосредоточить внимание на мультиразрешительном подходе к классификации текстур на черно-белых изображениях с помощью «однородных локальных бинарных шаблонов» (985). Преимущества рассмотренного выше метода заключаются в простоте использования, способности давать точные результаты и применимости в ситуациях, связанных с неравномерно освещенными сценами.
Создание алгоритмов, распознающих простые геометрические формы, полезно во многих сферах деятельности, включая фотографию, тесты «запрос-ответ» и производство. Как ясно из работ, посвященных истории распознавания геометрических фигур, способность компьютеров различать различные формы является ключевым аспектом понимания диаграмм, проблематизированным в двадцатом веке (Song et al. 936). Методы распознавания форм широко используются в современных программных системах, способных работать как с цифровыми, так и с нарисованными от руки изображениями (Song et al. 936). Разнообразие подходов к распознаванию геометрических фигур позволяет создавать программы под конкретные задачи.
Говоря о других тенденциях в распознавании геометрических образов, обсуждаемых современными экспериментаторами, крайне важно сосредоточиться на преобразовании Хафа и его использовании. Как утверждают Фернандес и др., преобразование Хафа — популярный метод, используемый для распознавания форм и обнаружения сложных элементов в 2D-изображениях (3901). Методика была изобретена почти сорок лет назад, но до сих пор используется при машинном анализе различных изображений.
Что касается полезных свойств преобразования Хафа, современные исследователи отмечают его положительные результаты при работе с неоднородными условиями освещения, изображениями низкого качества или шумами изображения (Mukhopadhyay and Chaudhuri 993). Несмотря на преимущества этого метода распознавания форм, некоторые авторы утверждают, что процесс голосования необходимо улучшить. Например, Спратлинг считает, что необходимость голосовать за многочисленные значения параметров приводит к «ложным пикам и эффектам квантования» (16). Учитывая это, некоторые аспекты метода нуждаются в улучшении для обеспечения более точных результатов.
Анализ главных компонентов или PCA — это еще один метод, используемый для обучения компьютеров различать различные геометрические формы. Упомянутый метод основан на выделении главных компонент — ряда некоррелированных переменных, полученных с помощью ортогональных преобразований. PCA лежит в основе многочисленных подходов к распознаванию геометрических фигур в машинном обучении; например, Ахмед и Арадья используют его для проверки подпространственного метода распознавания изображений (10).
Как видно из обзора Сонга и др., другие популярные и широко используемые методы распознавания форм для 2D-изображений включают «однопроходное обнаружение» и «рандомизированное обнаружение» (937). Кроме того, исследователи перечисляют использование глобальных геометрических свойств входных элементов для дальнейшей фильтрации и распознавания.
В конце концов, научив компьютеры распознавать простые и сложные геометрические формы, можно решить ряд визуальных задач, связанных с анализом изображений, защитой данных и даже контролем качества. В настоящее время методы машинного обучения широко используются для создания систем, способных распознавать геометрические закономерности в различных типах изображений, в том числе бинарных. Популярные методы распознавания и извлечения форм основаны на хорошо известных методах, таких как преобразование Хафа.
Процитированная работа
Ахмед, Музамиль и Манджунат Арадхья. «Исследование подхода с использованием подшаблонов в распознавании двумерных форм с использованием PCA и Ridgelet PCA». Международный журнал грубых множеств и анализа данных (IJRSDA), том. 2, нет. 3, 2016, стр. 10–31.
Фернандес, Ариэль и др. «Оптическая реализация обобщенного преобразования Хафа с полностью некогерентным светом». Письма об оптике, вып. 40, нет. 16, 2015, стр. 3901-3904.
Мухопадхьяй, Приянка и Бидют Б. Чаудхури. «Обзор трансформации Хафа». Распознавание образов, том. 48, нет. 3, 2015, стр. 993-1010.
Охала, Тимо и др. «Классификация текстур с множественным разрешением и инвариантной вращением с локальными двоичными шаблонами». Транзакции IEEE по анализу шаблонов и машинному интеллекту, том. 24, нет. 7, 2002, стр. 971–987.
Сонг, Дэн и др. «Извлечение геометрической информации из изображений: случай рисованных диаграмм». Интеллектуальный анализ данных и обнаружение знаний, том. 31, нет. 4, 2017, стр. 934-971.
Спратлинг, Майкл В. «Нейронная реализация преобразования Хафа и преимущества объяснения». Image and Vision Computing, vol. 52, 2016, стр. 15–24.