Download presentation
Presentation is loading. Please wait.
1
제품 소개서 2004년 ㈜에이치씨아이랩
2
목 차 음성합성 제품 현황 음성인식 제품 현황
3
음성합성 제품 현황
4
음성 합성 솔루션 서버용 음성 합성기 중용량 음성 합성기 단말기용 음성 합성기 특징 주요 응용 제품 주용 응용 제품
5화자 제공 (여자 3, 남자 2) 합성 DB 크기 600MB ~ 1.4GB 주요 응용 제품 다양한 전화망 음성 정보 서비스 중용량 음성 합성기 특정 영역 음질 최적화를 위한 편집합성 서버용 대비 성능 98% 이상 (Dictation율) 음성 DB 크기 50 ~ 64MB PC 번들용 / 高 사양 PDA용 단말기용 음성 합성기 음성 DB 크기 10MB ~ 15MB 단말기용 S/W 최적화 (속도 빠름) WinCE / Palm / Linux 지원 주용 응용 제품 Navigation S/W 멘트용 HCI PowerTTS Player 파일(F) ….. 심리학자들은 기온이 높이 올라갈수록 사람들에게는 공격적이거나 충동적인 심리가 커진다고 한다. 이 같은 사실은 장마가 끝난 뒤 무더위가 기승을 부리고 불쾌지수가 치솟을 때는 각종 범죄율이 높아지는 것으로도 알 수 있다. 또 기온이 크게 높아지면 부주의에 따른 안전사고가 점차 늘어나게 된다. 준비 HCI Lab 속도 볼륨 준비중 지혜 미진 영선
5
특징 및 장점 – PowerTTS-Server
OS 및 하드웨어 Resource 지원 OS : Windows 계열, Linux, Solaris DB Size 0.6GB ~ 1.4GB 최소 스펙 P-3, 128MB RAM (채널 당 1.0MB) 기술적 특징 합성기에 특화 된 뛰어난 한국어 언어처리기술 적용 국내최고의 형태소해석 및 구문분석기 사용 Waveform 유사도를 이용한 음편접속 기술 사용 기존 PSOLA방식의 음질열화 문제 해결 PSOLA 방식의 문제점 : 갑작스러운 억양 변화 및 접속 잡음발생 일반 숫자와 digit에 대한 자동 분리로 서로 다른 합성기술 적용 계좌번호, 전화번호, 카드번호 등에 대한 자연스러우면서도 명확한 합성을 제공 이름 합성 기능 보유
6
특징 및 장점 – PowerTTS-Server
기능적 특징 사용자 사전 지원 멀티채널 지원 채널별 별도의 사용자 사전 수용 가능 (개인용 VAD에 필요) 채널별 서로 다른 목소리 지원 이름 합성 기능 보유 한국인의 이름 합성을 위한 별도의 API 제공 선택적 음절 합성 기능 제공 합성음에 대한 File 및 Buffer 출력 지원 Buffer size 조절 가능 합성음에 대한 direct sound 출력 지원 (Windows OS에 한함) Server Client API 지원 속도, 불륨, 피치 조절 기능 제공 한글 이외의 영어, 일어, 한자 처리 기호, 심볼 처리
7
음성인식 제품 현황
8
음성인식기 Line-up S_PASR E_PASR-HS E_PASR-HF E_PASR-NC
Adverse Noise Cancellation & Name Dialing Hand Set Name Dialing Hands Free Name Dialing VAD CTI 연동 E_PASR-HS E_PASR-HF E_PASR-NC S_PASR PDA폰 Cell Phone 텔레매틱스 단말기 Car Navigation Hands Free Kit 텔레매틱스 단말기 Home Automation 단말기 Tablet-PC Car Navigation Hands Free Kit Telephony 시장 PC Application ASR
9
PowerASR - 기술 개요 PowerASR 기술 PowerASR 특징
음성검출 기술 (기술명-다양한 잡음환경에 강인한 알고리즘) 특징추출 기술 (기술명-입력기기의 변동을 반영) 음향모델 기술 (기술명-한글 음가 충실한 반영) 인식후처리 기술 (기술명-인식결과의 신뢰도 및 인식률 향상) 다양한 플랫폼 (휴대폰 / PDA / MP3 / PC / 서버) 응용지원 기술 (Voice Portal, 텔레매틱스 단말기) PowerASR 특징 음성인식률의 우수함 서비스 안정성과 인식성능을 최우선 실제 사용 환경에서 얻어진 데이터를 기반으로 음향모델링 보이스 유저 인터페이스 강화 잡음제거 성능과 음성검출 성능의 차별화 연속숫자음 인식 성능 인식스펙의 우수함 Resource를 적게 차지하여 대형시스템 접목에 용이 휴대폰을 비롯한 다양한 플랫폼에 맞는 인식기 (OS, CPU, Tool) 지원체계의 우수함 고객의 요구에 따라 특정 환경에 대한 tuning이 가능 다양한 API 제공으로 구현이 용이 엔진 개발과는 별도로 고객 지원을 위한 팀이 구성 음성 입력 잡음제거 음성검출 특징추출 음향모델 디코딩 발음사전 거부 인식결과
10
PowerASR 기능 연결어 인식 연속숫자음(전화번호) 인식
인식성능 : 1천 단어, 1.5초 응답속도, 사무실 97% / 차량주행 85% (2백 단어기준) 하드웨어 : ARM9 CPU, RAM 2.7MB, ROM 0.5MB 주요용도 : 휴대폰 Name Dialing, 텔레매틱스 단말기 Voice Navigation 연속숫자음(전화번호) 인식 인식성능 : 임의 전화번호, 0.5초 응답속도, 사무실 96% / 차량주행 85%(가변 4자리기준) 하드웨어 : ARM9 CPU, RAM 0.8MB, ROM 0.5MB 주요용도 : 휴대폰 Digit Dialing 잡음제거 제거성능 : SNR 10dB 정도 개선, 인식에러율 60% 정도 개선 하드웨어 : ARM9 CPU, RAM 0.1MB, ROM 0.1MB 주요용도 : 차량용 단말기 음질개선/음성인식 PowerASR 장점 플랫폼 : Windows, WinCE, Palm, Linux, RTOS 제품화 : 안정성을 바탕으로 한 성능 검증 완료
Similar presentations