전체 글49 이미지 인식(Image recognition) 이미지 인식(Image recognition)은 정지 이미지나 동영상으로 주어진 이미지에서 문자나 숫자를 읽어 내거나 이미지의 특징을 추출해서 이미지에 찍힌 것이 무엇인지를 식별하는 기술입니다. 그리고 이미지 인식 결과를 이용해서 구체적인 정보를 처리하는 기술을 이미지 이해라고 합니다. 이미지 인식분야는 전통적으로는 이미지를 정확하게 분류해 내는 이미지 분류(Image Classification) 영역에 집중하고 있었지만, 현재의 이미지 인식 분야에서는 객체 탐지(Object Detecting)와 이미지 분할(Image Segmentation) 영역이 새로 등장하였습니다. 그리고 객체 탐지의 경우 이미지에 한정되지 않고 영상에서도 객체 탐지를 적용해 사용하고 있습니다. 현재는 컴퓨터가 이런 이미지와 영상.. 2023. 6. 6. 자연어처리(NLP; Natural Language Processing) - 음성인식 (5) 3. 음성인식 음성인식(voice recognition, speech recognition)은 자연어처리 시스템에 문자 대신 음성으로 입력이 가능한 인식기술입니다. 즉, 음성인식(speech recognition)은 마이크 등의 입력장치를 통해 얻어진 음성 신호를 컴퓨터가 텍스트 등의 언어 데이터로 전환하는 기술입니다. 음성인식은 기본적으로는 음성을 사용한 문자 입력 방식을 개발하는 데서 출발하였습니다. 1952년 벨 연구소에서 단일 화자에 의한 숫자 인식기가 개발된 이후, 특정 화자의 음성 신호를 데이터로 전환하는 기술이 지속적으로 개발되어 왔습니다. 3.1 음성의 인식 아래 (그림 6)은 일반적인 음성인식 시스템의 구성 및 처리 절차를 나타낸 것입니다. 음성인식 시스템에 음성이 주어지면 음성에 포함된.. 2023. 6. 5. 자연어처리(NLP; Natural Language Processing) - 딥러닝을 이용한 자연어처리 (4) 2. 머신러닝을 이용한 자연어처리 앞서 설명한 바와 같이 자연어처리 기술은 수작업으로 문법이나 사전을 사전에 구성하는 (종래형) 방법에서 대규모 말뭉치(corpus)를 전제로 한 통계적 방법으로 발전했습니다. 그러나 대규모 데이터 처리에는 통계적 방법뿐만 아니라 머신러닝(machine learning), 특히 딥러닝(deep learniing)이 유용하게 사용되고 있습니다. 통계기반 기계번역과 인공신경망 기계번역은 딥러닝을 활용합니다. 사람은 학습 데이터를 수집하고 가공해서 컴퓨터에 던져주고, 컴퓨터는 입력된 학습 데이터를 바탕으로 스스로 공부합니다. 학습(learning)이 끝나면 번역 프로그램이 스스로 공부한 바를 바탕으로 새로운 문장을 보더라도 번역할 수 있는 능력을 키울 수 있습니다. 2.1 딥러.. 2023. 6. 3. 자연어처리(NLP; Natural Language Processing) - 통계적 처리 및 기계번역 (3) 1.4 의미 분석(semantic analysis) 의미 분석(semantic analysis)은 형태소 분석이나 구문 분석의 결과를 이용해서 자연어의 독립된 의미표현을 작성하는 과정입니다. 의미표현 방법으로는 필모어(Charles J. Fillmore)가 제창한 격문법(case grammar)이 유명합니다. 격문법에서는 주격이나 목적격 등 언어로 표현된 표층격(surface case)에서 언어에 의존하지 않는 심층격(deep case)을 추출해서 의미를 표현합니다. 아래 (표 1)은 표층격의 예입니다. (표 1) 격문법의 심층격 예 격의 명칭 설 명 행위주격(A) 행위의 주체 경험 주격(B) 행위의 영향을 받거나 경험하는 실체 도구격(I) 사건의 원인이나 자극을 주는 대상 대상격(O) 이동이나 변화의 .. 2023. 6. 2. 자연어처리(NLP; Natural Language Processing) - 구문 분석 (2) 1.3 구문 분석(syntactic analysis) 구문 분석(syntactic analysis)은 형태소 분석의 결과를 이용해서 주어진 문장이 어떤 구조로 이루어졌는지를 조사합니다. 구문 분석을 위해서는 문장 구조에 관한 지식인 문법(grammar) 지식이 필요합니다. 1) 문법표현: 구(句) 구조문법(phrase structure grammar) 문법표현에는 다양한 방법이 있지만 여기에서는 언어학자 촘스키(Noam Chomsky)가 제창한 구(句) 구조문법(phrase structure grammar)의 표현 방법을 공부해 봅니다. 구(句) 구조문법(phrase structure grammar)은 다음의 4가지 요소로 구성됩니다. (1) 바꿔 쓰기 규칙 (2) 단말 기호 (3) 비단말 기호 (4) .. 2023. 6. 1. 자연어처리(NLP; Natural Language Processing) - 종래형 자연어 처리 (1) 자연어 처리(NLP; Natural Language Processing)는 인공지능 연구의 주요 분야 중 하나로, 1950년대부터 기계번역과 같은 자연어 처리 기술이 연구되기 시작했습니다. 1990년대 이후에는 대량의 말뭉치(corpus) 데이터를 활용하는 기계학습 기반 및 통계적 자연어 처리 기법이 주류가 되었으며, 최근에는 심층 기계 학습(딥러닝; deep learning) 기술이 기계 번역 및 자연어 생성 등에 적용되고 있습니다. 우선 용어를 정리하겠습니다. 한국어, 영어, 프랑스어 등과 같이 인간사회의 형성과 함께 자연발생적으로 생겨나고 세월의 흐름과 함께 진화하고 일상의 생활 속에서 서로 의사소통을 행하기 위한 수단으로써 사용되고 있는 언어 (language)를 자연어라고 합니다. 반면에 컴퓨터.. 2023. 5. 31. 이전 1 2 3 4 5 6 7 ··· 9 다음 728x90