본문 바로가기
  • AI와 함께 세상을 아름답게
인공지능(AI)이란? - 기초 개념 및 이론

이미지 인식기술의 응용

by neo-Lee 2023. 6. 7.

    여기서는 이미지 인식기술의 응용 분야문자인식, 얼굴인식, 유사 이미지 검색에 관해 알아봅니다.

1. 문자인식

    문자인식은 대상 이미지에 포함된 문자를 읽어오는 기술로, OCR(Optical Character Reader)로 실용화되었습니다. OCR은 인쇄 문자인지 손으로 쓴 문자인지에 따라 구분됩니다. 손으로 쓴 문자인식은 종이에 기록한 정적인 문자 정보를 대상으로 하는 경우와 펜의 움직임과 같은 동적인 정보를 이용하는 온라인 문자인식의 경우로 분류되는데, 동적인 정보를 이용하는 기술은 OCR과는 다른 기술입니다.

 

문자인식 과정

    템플릿 매칭(template matching)은 문자인식의 단순한 한 가지 방식입니다. 인식 대상인 템플릿을 준비해서 대상 이미지와 계산한 후 유사도가 가장 높은 문자를 인식 결과로 합니다. 그러나 이 방법은 인쇄 문자에서 인식 대상이 한정되는 경우에는 적용할 수 있으나 다양한 글씨체가 포함되어 있는 문자나 이미지 변형에선 대응하기 어려울 뿐만 아니라 손으로 쓴 문자에는 적용하기도 어렵습니다. 

    탬플릿 매칭처럼 문자를 이미지로 직접 다루는 대신 문자의 특징을 추출해서 백터를 작성하고 특정 벡터의 유사도로 문자를 인식하는 방법이 있습니다. 이 방법은 문자를 구성하는 세로줄과 가로줄 등의 직선이나 연속한 도형이지만 도중에 굽은 곡선과 같은 특징을 추출해 그 분포 상황을 특징량으로 수치화합니다. 그리고 사전에 준비한 특정량의 데이터와 비교하여 문자를 인식합니다. 또한 특정량을 적절하게 고르면 단순한 템플릿 매칭으로는 인식하지 못하던 손으로 쓴 문자도 인식할 수 있게 됩니다. 

    문자는 단순한 이미지가 아닌 언어의 표현입니다. 그래서 언어가 가진 특징을 이용하면 문자인식의 정밀도를 향상할 수 있습니다. 예를 들어 주어진 문자의 배열이 형태소 표현으로 적절한지 어떤지, 문법 지식과 대조하여 자연어 표현으로 가능한지 아닌지 같은 것을 조사할 수도 있습니다.

2. 얼굴인식

    얼굴인식은 이미지 속에서 사람의 얼굴을 찾아내고 그 이미지의 주인이 누구인지를 식별하는 기술입니다. 얼굴인식은 스마트폰의 사용자 인증이나 감시카메라 이미지에서 특정 인물을 추출하는 등 널리 활용되고 있습니다.

    얼굴인식을  구현하기 위해서는 우선 이미지 중에서 얼굴이 찍힌 영역을 추출해야 합니다. 이 기술을 얼굴인식이라고 합니다. 얼굴인식을 위해서는 얼굴을 특징짓는 선험적 지식을 이용해 이미지 전체에서 얼굴 영역을 추출합니다. 얼굴 영역의 이미지적인 성질로는, 가령 눈의 영역에서는 눈 주변이 바로 아랫부분보다 휘도가 낮다거나 얼굴에서는 코 영역의 휘도가 높다는 등의 특징이 있습니다. 이것을 활용해 이미지 속 얼굴 영역을 찾아내는 것입니다. 

    그다음에는 찾아낸 얼굴 영역의 특징을 이용해 얼굴을 식별합니다. 이것을 얼굴 대조라고 합니다. 얼굴 대조 방법은 얼굴 영역에서 눈이나 코 등의 특징적인 부분을 단서로 이마지 영역의 크기나 방향을 정규화한 후 사전에 준비된 탬프릿 이미지를 대조해서 얼굴을 특정하는 것입니다. 최근에는 얼굴 대조에도 딥러닝(deep learning) 기술, 특히 합성곱 신경망(CNN; convolutional neural network)을 이용해 과거보다 대조 정밀도를 향상하고 있습니다. 

3. 유사 이미지 검색

    이미지 인식을 응용해 이미지 데이터베이스에 저장해 둔 대량의 이미지 데이터에서 유사 이미지를 검출하는 이미지 검색기술이 있습니다.

    이미지 데이터 검색에는 TBIR(Text Based Image Retrieval)이나 CBIR(Content Based Image Retrieval) 방법을 이용합니다. TBIR은 미리 개개의 이미지에 부여한 키워드를 이용해 이미지 검색을 구현하는 방법입니다. 한편 CBIR은 이미지 자체를 대상으로 이미지를 검색하는 방법입니다. 검색에서 이미지를 직접 비교 대조하는 방법 외에, 이미지 데이터 검색에서 많이 사용되는 CBIR의 방법을 간략하게 알아봅니다.

    이미지특징량에 근거해서 검색하는 방법이 있습니다. 이 방법은 이미지에서 해시(hash) 값을 구하고 해시 값을 특징 벡터로 이용하는 방식입니다. 여기서 말하는 해시 값이란 어떤 이미지 데이터에 대응하는 해시 함수  의 출력값입니다. 여기서 해시 함수는 하나의 디지털 데이터가 주어질 때 그 데이터에 임의의 계산을 해서 데이터를 반영한 수치를 얻는 계산을 말하며, 해시 값을 구하는 계산에는 pHash(perceptual hash)나 average Hash 등의 알고리즘을 이용합니다. 이러한 방법으로 특징량을 추출해 특징 벡터를 작성하고 이것을 검색 대상으로 삼는 것입니다.

    특징 벡터의 작성에 딥러닝과 합성곱 신경망(CNN)을 이용하는 방법도 있습니다. 특징 벡터를 작성할 때 처음에는 딥러닝 신경망을 분류 문제로 학습시키고, 이미지 구분을 위해 합성공 신경망을 학습시킨 후에 네트워크 후단의 가중치를 꺼내어 특징벡터로 이용합니다. 전단의 기하학적 분류와 이미지의 특징을 합하여 더욱 이미지 특징을 표현한다고 생각하는 것입니다.

 

2023.06.06 - [인공지능(AI; Artificial Intelligence)] - 이미지 인식(Image recognition)

728x90

댓글