1 음성언어정보연구부 IT 신성장 동력 분야별 기술개발 계획 ( 안 ) 2003. 7. 한국인 발성 영어 인식기술 ( 평가용 ) 2011. 7. 20.

2 2 음성언어정보연구부 기술 개요 한국인 발성 영어 음성인식 기술 한국인 발성 영어인식 기술 ( 예 : 영어 게임 응용 들 )

3 3 음성언어정보연구부 기술이전 내용 및 범위 기술명 : 한국인 발성 영어 음성인식 기술 기술이전의 범위 - 기술명 : 한국인 발성 영어 음성인식 기술 Windows PC 환경에서 실행 가능한 Library 형태의 오브젝트와 인식용 이미지파일. 영어 음성인식 엔진. 윈도우용 G2P 생성 툴. 윈도우용 이미지 빌딩 툴 특허 - 모바일 플랫 기반 개인 맞춤형 자연어 연속어 음성인식 서비스 시스템 (DP20101224, 2010.12.14) 외 1 건 기술문서 - ETRI 영어 G2P 발음사전 작성 외 1 건

4 4 음성언어정보연구부 기술료 제안 ( 예상기술료 ) 기술개발 기간 : 2010. 3. 1 ~ 2011. 5. 31.(15 개월 ) 투입 연구비 : 1,263,494,250 원 ( 인건비 : 670,511,210 원, 직접비 : 592,983,040 원 ) 예상기술료 구분 공동연구 참여기업일반 기업 비고 중소기업대기업중소기업대기업 기술료 조건 착수기본료 ( 천원 ) --20,00040,000 매출정률사용 료 (%) -- 지재권 비중 특허 비중 (%) 20% 노하우 비중 (%) 80%

5 5 음성언어정보연구부 별첨 – 음성인식 엔진 (LASER) 개요  LASER(Large Scale Speech Recognizer) is developed to recognize very large scale of recognition domain on both high-end servers and resource-limited embedded devices.

6 6 음성언어정보연구부 별첨 - LASER Specifications ConsiderationHigh-end deviceLow-end embedded device LanguageSupporting languagesKorean, English PlatformSupporting platformsLinux, WindowsWindows, Android, iphone, nucleus Recognition Mode Continuous Vocabulary size>100K (140M trigrams)> 10k RTF1.6xRT1.0xRT One-shot Vocabulary size-> 450k VDE entries RTF-2.6 Minimum H/W requirements CPU2.6 GHz620MHz Storage memory30GB50MB Running memory40GB14MB etcGrammar definitionARPA, BNF, JSGF

7 7 음성언어정보연구부 별첨 - LASER Architecture  Base layer Wrapper for platform independency  Decoding layer Acoustic search Lexical search Rescoring Multi-stage search  Interface layer low-level APIs : DLLs Script-level interfaces : python, java

8 8 음성언어정보연구부  Core 2 search components Acoustic search  Weighted finite state transducer-based speech recognizer Lexical search :  discrete HMM-based lexical level noisy channel decoder  Recognition modes Various recognition modes for different domain and system configurations 별첨 - LASER Architecture

9 9 음성언어정보연구부 별첨 - LASER Application areas H/W Spec Application area 0.2GHzCommand-and-control Voice activated dialing 1GHz20k dictation One-shot voice destination entry 3GHzVoice search

