문자 인식 개요 NR-LAB 강 동 구
1. 문자 인식의 방법 신경 회로망 템플릿 매칭 특징 추출 인간의 신경 체계인 뉴론의 모형을 기반 각 문자의 대표 문자를 바탕으로 유사도 측정 특징 추출 여러 이미지 변환을 통하여 특징을 추출 그 문자만이 가진 독특한 특성을 이용
2. 신경 회로망을 이용한 문자인식 수상돌기 7 축색 세포체 “7” 이면 활성화 그렇지 않으면 비활성화
3. 신경 회로망의 구조 뉴런들의 집합으로 구성되어 있다. 뉴런의 수상돌기는 돌기가 가지는 저항치(가중치)와 곱해져서 그 합이 뉴런의 세포체로 들어간다. 뉴런의 노드는 주어진 조건에 의해 출력값을 생성하고 축색으로 보낸다. 축색으로 보낸 값은 또 다른 뉴런의 수상돌기로 향한다.
4. 신경회로망의 특성 신경망은 프로그램 되지 않는다. 정보를 분산된 형태로 코드화 예제를 통한 학습 : 지도학습 정보를 분산된 형태로 코드화 네트웍의 일부가 파손되어도 작동 가능 이 내용에 대한 실재 구현은 어려움 분류 작업을 수행하는데 필요한 두드러진 특징을 발견한다. 훈련 세트간의 차이점이 어디에서 나타나는지를 스스로 찾아낸다.
5. 템플릿 매칭을 이용한 방법 템플릿이란? 문자들의 기준이 되는 대표 문자 입력값과 템플릿들의 유사도를 분석하여 가장 유사한 템플릿이 가지는 문자가 입력 문자로 판단 유사도를 측정하는 방법이 필요
7. 간단한 유사도 측정 방법 틀린것이 3개 존재 템플릿 : 틀린것이 12개 존재 따라서 3과 가까움 입력 :
7. 템플릿 매칭의 특징 자동차 번호판과 같이 고정된 문자의 인식 별도의 인식을 위한 처리과정이 필요 없이 간단히 구현 필기체 문자 인식에는 부적합 NR배 숫자 인식 경진대회에 적용하기도 부적합
8. 특징 추출을 통해서 인식 각각의 문자들이 가지는 고유한 특성을 찾아내어 그 특징을 종합하여 인식 예를 들어 7 과 6을 구별하는 방법은 이미지를 반으로 잘라서 위쪽에 검정 픽셀이 많으면 7, 그 반대는 6으로 인식
9. 문자인식에 많이 사용하는 특징추출 ( 1. 프로젝션 ) 9. 문자인식에 많이 사용하는 특징추출 ( 1. 프로젝션 )
9. 문자인식에 많이 사용하는 특징추출 ( 2. convex deficiencies ) 3 3 4 2 1 2 4 4 1 2
9. 문자인식에 많이 사용하는 특징추출 ( 3. chain code ) 1 1 1 4 4 4 3 2 4 1
9. 문자인식에 많이 사용하는 특징추출 ( 4. Resampling ) 2 4 3
10. 문자 인식 경진 대회 문자셋의 특징 세선화 문자( 한 픽셀 굵기의 문자) 굵은 폰트의 문자 잡음이 많이 섞인 문자 한글의 여러 폰트를 리사이징한 문자 자세한 내용은 http://harmony.cs.pusan.ac.kr