언어교육 게임SW를 위한 음성인식 기술 2012. 6. IT 신성장 동력 분야별 기술개발 계획(안) 2003. 7.
기술 개요 언어교육 게임SW를 위한 음성인식 기술 한국인 발성 영어인식 기술 (영어교육 게임의 예)
기술이전 내용 및 범위 기술명 : 언어교육 게임SW를 위한 음성인식 기술 기술이전의 범위 기술이전의 범위 윈도우 환경에서 동작하는 언어 교육용 음성인식 SDK - 음성 인식 엔진 (LASER-Speak) - 발음 변환 프로그램 (G2P) - 음성 인식용 이미지 생성 도구(build_laser_image) - 예제 응용 프로그램 샘플 코드 - 음성 인식용 이미지 생성 예제 - SDK 매뉴얼 특허 - 언어 학습자의 발음 수준에 따른 가변 자동 발음 평가 기술 (출원번호 2011- 0135892) 외 4건
기술료 제안 (예상기술료) 기술개발 기간 : 2010. 3. 1 ~ 2012. 2. 28.(24개월) 투입 연구비 : 1,187,200,000원 예상기술료 구분 공동연구 참여기업 일반 기업 비고 중소기업 대기업 기술료 조건 착수기본료(천원) - 120,000 240,000 매출정률사용료(%) 일백원(₩50) /월 x (본 기술이 적용된 서비스의 월별 실제 결제 계정 수) 단, 이는 월별 실제 결제 계정 수가 최초 1만건 이상이 되는 시점 또는 계약체결 후 1년이 되는 시점부터 지급함 일백원(₩100) /월 x (본 기술이 적용된 서비스의 월별 실제 결제 계정 수) 지재권 비중 특허 비중(%) 20% 노하우 비중(%) 80% * 기술이전 조건 특기 사항 - “한국인 발성 영어 음성인식 기술(평가용)”을 기 이전해간 기관에게는 해당 기술이전 비용(대기업 4천반원, 중소기업 2천만원) 만큼을 본 기술이전의 착수기본료에서 제함
별첨 – 음성인식 엔진(LASER) 개요 LASER(Large Scale Speech Recognizer) is developed to recognize very large scale of recognition domain on both high-end servers and resource-limited embedded devices.
별첨 - LASER Specifications Consideration High-end device Low-end embedded device Language Supporting languages Korean, English Platform Supporting platforms Linux, Windows Windows, Android, iphone, nucleus Recognition Mode Continuous Vocabulary size >100K (140M trigrams) > 10k RTF 1.6xRT 1.0xRT One-shot - > 450k VDE entries 2.6 Minimum H/W requirements CPU 2.6 GHz 620MHz Storage memory 30GB 50MB Running memory 40GB 14MB etc Grammar definition ARPA, BNF, JSGF
별첨 - LASER Architecture Base layer Wrapper for platform independency Decoding layer Acoustic search Lexical search Rescoring Multi-stage search Interface layer low-level APIs : DLLs Script-level interfaces : python, java
별첨 - LASER Architecture Core 2 search components Acoustic search Weighted finite state transducer-based speech recognizer Lexical search : discrete HMM-based lexical level noisy channel decoder Recognition modes Various recognition modes for different domain and system configurations
별첨 - LASER Application areas H/W Spec Application area 0.2GHz Command-and-control Voice activated dialing 1GHz 20k dictation One-shot voice destination entry 3GHz Voice search