Download presentation
Presentation is loading. Please wait.
Published byLouisa Becker Modified 5년 전
1
언어교육 게임SW를 위한 음성인식 기술 IT 신성장 동력 분야별 기술개발 계획(안)
2
기술 개요 언어교육 게임SW를 위한 음성인식 기술
한국인 발성 영어인식 기술 (영어교육 게임의 예)
3
기술이전 내용 및 범위 기술명 : 언어교육 게임SW를 위한 음성인식 기술 기술이전의 범위
기술이전의 범위 윈도우 환경에서 동작하는 언어 교육용 음성인식 SDK - 음성 인식 엔진 (LASER-Speak) - 발음 변환 프로그램 (G2P) - 음성 인식용 이미지 생성 도구(build_laser_image) - 예제 응용 프로그램 샘플 코드 - 음성 인식용 이미지 생성 예제 - SDK 매뉴얼 특허 - 언어 학습자의 발음 수준에 따른 가변 자동 발음 평가 기술 (출원번호 ) 외 4건
4
기술료 제안 (예상기술료) 기술개발 기간 : 2010. 3. 1 ~ 2012. 2. 28.(24개월)
투입 연구비 : 1,187,200,000원 예상기술료 구분 공동연구 참여기업 일반 기업 비고 중소기업 대기업 기술료 조건 착수기본료(천원) - 120,000 240,000 매출정률사용료(%) 일백원(₩50) /월 x (본 기술이 적용된 서비스의 월별 실제 결제 계정 수) 단, 이는 월별 실제 결제 계정 수가 최초 1만건 이상이 되는 시점 또는 계약체결 후 1년이 되는 시점부터 지급함 일백원(₩100) /월 x (본 기술이 적용된 서비스의 월별 실제 결제 계정 수) 지재권 비중 특허 비중(%) 20% 노하우 비중(%) 80% * 기술이전 조건 특기 사항 - “한국인 발성 영어 음성인식 기술(평가용)”을 기 이전해간 기관에게는 해당 기술이전 비용(대기업 4천반원, 중소기업 2천만원) 만큼을 본 기술이전의 착수기본료에서 제함
5
별첨 – 음성인식 엔진(LASER) 개요 LASER(Large Scale Speech Recognizer) is developed to recognize very large scale of recognition domain on both high-end servers and resource-limited embedded devices.
6
별첨 - LASER Specifications
Consideration High-end device Low-end embedded device Language Supporting languages Korean, English Platform Supporting platforms Linux, Windows Windows, Android, iphone, nucleus Recognition Mode Continuous Vocabulary size >100K (140M trigrams) > 10k RTF 1.6xRT 1.0xRT One-shot - > 450k VDE entries 2.6 Minimum H/W requirements CPU 2.6 GHz 620MHz Storage memory 30GB 50MB Running memory 40GB 14MB etc Grammar definition ARPA, BNF, JSGF
7
별첨 - LASER Architecture
Base layer Wrapper for platform independency Decoding layer Acoustic search Lexical search Rescoring Multi-stage search Interface layer low-level APIs : DLLs Script-level interfaces : python, java
8
별첨 - LASER Architecture
Core 2 search components Acoustic search Weighted finite state transducer-based speech recognizer Lexical search : discrete HMM-based lexical level noisy channel decoder Recognition modes Various recognition modes for different domain and system configurations
9
별첨 - LASER Application areas
H/W Spec Application area 0.2GHz Command-and-control Voice activated dialing 1GHz 20k dictation One-shot voice destination entry 3GHz Voice search
Similar presentations