이미지 및 동영상에 포함된 텍스트 정보 추출에 기반한 지능적 시각 응용시스템 구현에 관한 연구

Slides:



Advertisements
Similar presentations
Number Recognizer. Team 이성우 컴퓨터소프트웨어학과 조윤성 전자통신공학과
Advertisements

자료의 표현 1. 문자 자료의 표현 2. 멀티미디어 자료의 표현. 컴퓨터일반자료의 표현 학습 목표 ◆ 컴퓨터에서 사용하는 문자 데이터의 표현 방법을 이해할 수 있다. ◆ 컴퓨터에서 사용하는 멀티미디어 데 이터의 표현 방법을 설명할 수 있다.
Cinema Manager System 최종 발표 조 team05 발표자 : 임 창목 1.
영화 예매 시스템 - 많이 봤다이가 ? CSE Corp. PM 송진희 김성욱 김보람 천창영.
항공 예약 시스템 1 조 ( 김민철, 김영주, 이혜림, 장유정, 조윤주, 문하늘 ). 목차 차세대 전산시스템 도입의 필요성 현재 항공 시스템 ( 대한항공 ) 항공 시스템의 변화 미래항공 시스템.
컴퓨터와 인터넷.
컴퓨터 운영체제의 역사 손용범.
                                  9장 컴퓨터 기반 데이터 수집의 기초.
의사 결정 트리(decision tree)
네트워크 기술을 통한 현재와 미래 소개.
과학과 감성이 공존하는 꿈꾸는 영화 공작소.
신호처리 실험 (Signal Processing Lab)
졸업 작품 3~4월 진도진행서 김 상 덕 김 영 근 백 강 수
Hybrid INDIGO project 중간보고
25W급 RF에너지 전송 설계 기술 ETRI Technology Marketing Strategy
PTZ카메라를 이용한 Target Tracking
Open Graphics Library 팀 명 : Spes 송정웅 김정환
openGL Project 제안서 - 해상 전투
RFID (Radio Frequency Identification)
Number Recognizer.
소프트웨어 30일 평가판 사용후기 (CY10Q4 프로모션 응모용)
디지털영상처리 및 실습 대구보건대학 방사선과.
디지털시스템설계 과목 담당교수 : 원 충 상 한국교통대학교 컴퓨터공학과
FTP 프로그램 채계화 박재은 박수민.
멀티미디어 시스템 (아날로그 이미지,신호를 디지털로 변환 방법) 이름 : 김대진 학번 :
WinCE Device Driver 실습 #2
자료구조: CHAP 4 리스트 (3) 순천향대학교 컴퓨터공학과 하 상 호.
이동식 다 관절 로봇팔 Removable Articulated robot arm
멀티미디어.
8051기반의 음성 인식 프로세서 설계 Chang-Min Kim and Soo-Young Lee
근거리에서의 얼굴 인식 시스템 연구 (BR-1-7)
제 1장. 멀티미디어 시스템 개요.
Grade Server Team14. Attention Seeker
Transmission & Analysis
2장. 데이터베이스 관리 시스템 데이터베이스 관리 시스템의 등장 배경 데이터베이스 관리 시스템의 정의
마인드 맵.
PTZ카메라를 이용한 Target Tracking
기능안전 설계 지원 프로세서 코어(알데바란) 06
HEVC기반 실시간 Full-HD 비디오 플레이어 기술)
PDF Consulting Modomi Paper
Mobile braille system for the blind
USN(Ubiquitous Sensor Network)
Computer vision 정보과학부 최영준.
자율주행 차량용 드라이빙 컴퓨팅 하드웨어 플랫폼 05
Tiny OS와 NesC Tiny OS Part1. Won Mi Sun – 17 지능제어 연구실.
ASP.NET AJAX / AJAX Control Toolkit 응용 2008 컴퓨터공학실험( I )
기상 레이더 정보를 이용한 획기적인 LID시설 제어 방법 GIST대학 물리학부 정희원 GIST대학 기초교육학부 박연준, 기태윤
국가 간 불평등 현상과 해결방안 본 연구물은 학교 수업을 위해 개발된 것으로 교육 이외의 목적으로 사용될 수 없습니다.
2강_첫번째 안드로이드 프로젝트 에뮬레이터(AVD) 만들기 처음 만들어 보는 프로젝트 전체적인 구성 살펴보기
차량 번호판 영상인식을 이용한 주차장 출입통제 시스템
[첨부] 지원서 양식 및 과제 요강 삼성전자 VIP센터 2017 대학생 IDEA POOL 11기 모집.
웹사이트 분석과 설계 (화면 설계) 학번: 성명: 박준석.
자동차 사고 용의 차량 번호판 인식 시스템 개발 디지털정보융합학과 심영복.
메카트로닉스공학과 메카트로닉스공학과란? 홈페이지 │
영상인식분야 개발계획서 ○ ○ 대학교 팀명 제13회 현대자동차그룹 미래자동차 기술공모전
QR Code 김정민 김준보.
XML (eXtensible Markup Language) 개요
헤드라인 헤드라인 헤드라인 헤드라인 헤드라인 헤드라인 헤드라인 헤드라인 헤드라인 헤드라인 헤드라인 헤드라인 텍스트 샘플 텍스트
주요 패턴 (한)문화방송 14 HY울릉도M 13 [ Bottom-Up ] 휴먼새내기체 12 [ Top-Down ]
클러스터 시스템에서 효과적인 미디어 트랜스코딩 부하분산 정책
이미지 및 동영상에 포함된 텍스트 정보 추출에 기반한 지능적 시각 응용시스템 구현에 관한 연구
네이버 CCL 도입 현황 및 계획 서비스정책센터 최인혁.
아두이노와 충격감지센서, GPS를 활용한 자전거 주행 중 응급 상황 발생 시 자동 신고 시스템
창의적 공학 설계 < 사용자 중심의 공학설계 > : Creative Engineering Design
사회과 서술형 평가 문항 자료집 -중학교 일반사회 영역 -.
Animating Pictures with Stochastic Motion Textures
생산기술 향상 교육 과정 안내 교육신청은 접수를 원칙으로 합니다.
Naver & Google 이덕중 최보람 도현호 여민기
(Motion fusion based static and dynamic hand gesture recognition)
웹 사이트 분석과 설계 학과 : e-biz 경영학과 2-2 학번 : 이름 : 이재섭.
Presentation transcript:

이미지 및 동영상에 포함된 텍스트 정보 추출에 기반한 지능적 시각 응용시스템 구현에 관한 연구 이미지 및 동영상에 포함된 텍스트 정보 추출에 기반한 지능적 시각 응용시스템 구현에 관한 연구 뇌신경정보학 2단계 자유공모과제 (M10107000009-01A220000500) 연구책임자: 최영우 숙명여자대학교 컴퓨터과학과

차 례 연구 배경 연구 목표 어려움/가능성 관련 연구 추진 계획 연구 내용 기대성과/활용방안

연구 배경(1) 텍스트 정보는 가장 기본적이며 중요한 정보 텍스트 종류 지식 표현 및 습득의 기본 이미지 내용을 함축적, 구체적으로 표현 다른 객체보다 특징이 분명하여 빠른 추출이 가능하고 산업성이 높음 텍스트 종류 문서(Document) 텍스트 그래픽(Graphic) 텍스트: 인위적으로 삽입한 자막 헤드라인, 이름, 시간, 스포츠 점수 등 장면(Scene) 텍스트: 자연스럽게 포함된 이미지의 일부 간판, 안내 표지판, 광고, 화물/물건 코드, 차량 번호 등

연구 배경(2) 그 동안 수동적, 이미지 위주의 정형화된 문서/그래픽 텍스트 정보 추출 OCR, 문서 인식시스템 이미지/비디오 검색시스템 앞으로 능동적, 동영상에서의 다양한 장면 텍스트 정보 추출 이동 로봇시스템 시각장애인/환자 보조시스템 차량 자동주행시스템, 차량 번호판조회시스템 공장/창고자동화: 무인 분류/이동 비디오 검색시스템

장면 텍스트 예

연구 목표 이미지/동영상에 포함된 다양한 종류의 장면 텍스트를 빠르고 정확하게 추출 지능적 시각 응용시스템에 적용 다양한 종류: 폰트 종류, 위치, 방향, 크기, 색, 배경에 무관 빠르고 정확한 추출: 사용자의 불편함을 최소화 시키는 관점에서의 기준 설정 지능적 시각 응용시스템에 적용 이동 로봇시스템 시각장애인/환자 보조시스템 차량 자동주행시스템

어려움 및 가능성 어려움 객체 추출 및 인식 관점: 장면 텍스트 실시간 처리 필요 가능성 객체 추출 및 인식 관점 자유로운 위치, 크기, 색, 간격, 다양한 폰트 등 기울어짐, 원근감 존재 조명, 기상 여건, 시간대에 따른 이미지 수준의 차이 실시간 처리 필요 가능성 객체 추출 및 인식 관점 다른 객체에 비해 비교적 강한 규칙성(특징) 존재 꾸준한 문자인식 기술 개발 결과 활용 가능 하드웨어 기술과 처리 기술의 지속적인 발전

Thresholding, Region growing Texture 정보, Wavelet, 신경회로망 이용 관련 연구 연구자 대 상 방 법 제약 조건 김희승[2000] 디지털 카메라 이미지 몰포로지, 공간적 변화 이용 적절한 조명, 기울지 않은 텍스트 Lee, Kankanhalli[95] 화물 콘테이너 명도 이미지 Thresholding, Region growing 수평방향, 고립된 콘테이너 코드 텍스트 Smith, Kanade[95] 비디오 이미지 자막 에지 정보 수평방향 텍스트 A. K. Jain[95] CD/책 표지 이미지 색 정보, 공간 편차 정보 수평방향, 균일한 색, 제한된 크기의 텍스트 A. K. Jain [98] CD/책 표지, 비디오 이미지 색 정보 Doermann[98] 비디오 이미지 Texture 정보, Wavelet, 신경회로망 이용

추진 계획 1차년: 텍스트 영역 추출 2차년: 텍스트 영역 확정 및 질 개선 3차년: 응용시스템 구현 다양한 동영상 데이터 수집 색 이미지, 명도 이미지 분석 검증 방법 개발 2차년: 텍스트 영역 확정 및 질 개선 후보영역 병합/여과 방법 개발 이미지 개선 방법 개발 3차년: 응용시스템 구현 텍스트 인식 시스템 구현, 보완

연구 내용: 1차년 텍스트 영역 추출 응용 환경을 고려한 동영상 데이터 수집 색 이미지 분석: 텍스트의 색 연속성 이용 이미지 샘플링 방법 개발 색 이미지 분석: 텍스트의 색 연속성 이용 색 줄임: Bit-dropping, 색 묶음(Clustering) 수행 각각의 색 이미지에서의 연결요소 추출 연결요소 제거 및 병합 방법 개발 명도 이미지 분석: 텍스트 영역의 공간 주파수 특징 이용 이미지 향상 수행, 에지 검출 긴 선 추출 및 제거, 텍스트 영역 강조 방법 개발 검증 영역 특징 추출, 신경회로망 분류 방법 이용

색 이미지 분석 예 색 이미지 색 줄임 i 번째 색 분석 후보영역 선정 (9개 색) (4개 색)

명도 이미지 분석 예 명도 이미지 긴 선 추출/제거 에지 추출 텍스트 영역 강조

연구 내용: 2차년 텍스트 영역 확정 및 질(質) 개선 후보 영역 병합/여과 방법 개발 이미지 개선 방법 개발 색 이미지와 명도 이미지에서 선택한 후보 영역의 상호 보완 및 검증 연구 병렬(Parallel) 및 순차적(Serial) 병합/여과 방법 개발 응용 환경의 요구(처리시간, 정확성)에 따라 선택적 적용 이미지 개선 방법 개발 성공적인 인식을 위해서는 이미지 개선 과정이 필수임 획 정보를 고려한 고급 이진화 방법 개발 기울어짐, 원근 보정 방법 개발 잡영 제거 필터 개발

연구 내용: 3차년 응용시스템 구현 텍스트 인식 시스템 구현, 보완 상용 OCR 결합, 성능 평가 후처리(폰트 정보, 영역 지식 표현 등) 기술을 이용한 인식 성능 개선 시스템 구현, 보완 프로그램 소형화, 최적화 수행 현장 시연 및 문제점 보완

기대성과/활용방안 기대성과 활용방안 고난도 기술의 개발: 텍스트 추출의 최종 단계 기술 지능적인 시각 기반 응용분야의 확대 및 활용 연구 인력 양성 활용방안 응용시스템 구축 시각기반 이동 로봇시스템 시각장애인/환자 보조시스템 차량 자동주행시스템 산업체 협력: 연구개발 2차년 후반기 예정