SpeechRecognition 20111687 최해진 20111651 이동규.

Slides:

Advertisements

Similar presentations

3. 메소드와 변수 SCJP 자격증 프로젝트 발표자 : 최선웅. 1. 메 소 드 개 념 2. 메 소 드 양 식 3. 메 소 드 변 수 4. 메 소 드 예 제 5. 참 고 문 헌 / 자 료 목 차.

Advertisements

Format String Attack! 포맷 스트링 공격 경일대학교 사이버보안학과 학년 남주호.

2010 – 06 – 24 주간 보고서.

목 차 C# 언어 특징 .NET 프레임워크 C# 콘솔 프로그램 C# 윈도우 프로그램 실습 프로그래밍세미나 2.

Chapter 16 : Struts 프레임워크 2. chapter 16 : Struts 프레임워크 2.

기초C언어 제1주 실습 강의 소개, C언어 개요, Cygwin/Eclipse 사용 컴퓨터시뮬레이션학과 2016년 봄학기

OpenCV 안드로이드 연동 환경설정 OpenCV-Android 를 다운 받습니다.

소리가 작으면 이어폰 사용 권장!.

Local Connection과 InkPresenter 학기, 소프트웨어 설계 및 실험(Ⅰ)

컴퓨터프로그래밍 1주차실습자료 Visual Studio 2005 사용법 익히기.

Image & Video processing

1. 신뢰할 수 있는 싸이트 등록 인터넷 익스플로러 실행 후 실행

코크파트너 설치 가이드 Window 7.

인공지능실험실 석사 2학기 이희재 TCP/IP Socket Programming… 제 11장 프로세스간 통신 인공지능실험실 석사 2학기 이희재

5강. Servlet 본격적으로 살펴보기-I 프로젝트 만들기 doGet() doPost()

윤 홍 란 다이알로그(대화상자) 윤 홍 란

Hostname 변경 및 Service open

조 병 규 Software Quality Lab. 한국교통대학교

나민영 서경대학교 컴퓨터공학과 CGVR Lab 같이만들어보자 5주차 OpenCV 설정 및 기초.

4장. 웹로직 서버상에서의 JDBC와 JTA의 운용

CHAPTER 02 OpenCV 개요 PART 01 영상 처리 개요 및 OpenCV 소개.

25강. Security-I 보안 관련 프로젝트 생성 보안 관련 라이브러리 추가 보안 관련 설정 파일 만들기

C / C++ Programming in multi platform

Visual Basic .NET 처음 사용하기.

Communication and Information Systems Lab. 황재철

동영상 편집은 사용하기 쉬운 Premiere Pro가 좋다.

SqlParameter 클래스 선문 비트 18기 발표자 : 박성한.

Error Detection and Correction

AutoBase10 설치 / 데모 프로젝트 실행.

D / K / I / T / E / C / H / N / O / L / O / G / Y

소프트웨어 분석과 설계 Struts2 & JBOSS 설치하기

메시지 큐[5] – test1.c 메시지 제어: msgctl(2) #include <sys/msg.h>

10장. 예외처리.

속성과 리스너 초기화 파라미터 외 파라미터에 대해 이해한다. 리스너를 생성해보고 사용에 대해 이해한다.

스크래치 언어 이해 스크래치 이용법 습득 고양이가 말을 하며 움직이는 예제 작성

13. 연산자 오버로딩.

10강. JSP 본격적으로 살펴보기-II 스크립트릿, 선언, 표현식 지시자 주석 Lecturer Kim Myoung-Ho

Method & library.

설치 환경 □ 운영체제 버전 : CentOS Linux 7.2 □ 리눅스 커널 버전 :

IPython Notebook + Spark + TensorFlow on MacOS

24장. 파일 입출력.

Day-27(Tue_10.16) 파일 서비스 설정 AD 가 설치된 환경에서 DHCP 설치 할 경우 권한 자격을 주어야함.

Chapter6 : JVM과 메모리 6.1 JVM의 구조와 메모리 모델 6.2 프로그램 실행과 메모리 6.3 객체생성과 메모리

KELS 영어능력향상프로그램 이용 방법 KETS 영어교육실 KETS 영어교육실

USN(Ubiquitous Sensor Network)

15강. 폼 데이터 값 검증 Validator를 이용한 검증 ValidationUtils 클래스

Python 및 OpenCV 설치.

11. 어댑터뷰 제목. 11. 어댑터뷰 제목 리스트뷰와 그리드뷰 활용법을 배운다. 갤러리와 스피너의 사용법을 익힌다.

( Windows Service Application Debugging )

학습목표 처음 만드는 비주얼 베이직 프로그램 프로그램 실행과 실행 파일 생성. 학습목표 처음 만드는 비주얼 베이직 프로그램 프로그램 실행과 실행 파일 생성.

청각장애인용 APP 구성 및 사용법.

12강. 컨트롤러 컨트롤러 클래스 제작 요청 처리 메소드 제작 뷰에 데이터 전달

OpenCV 설정 2.21 만든이 딩딩.

STS 또는 Eclipse 에서 프로젝트를 Export 하고 Import 하는 방법

1차 발표: 프로젝트 발표 안내 및 형식 학번: 이름: 김경우.

영상처리 실습 (OpenCV + MFC) Chonbuk National University A.I. Lab.

13주 실습강의 학기, 소프트웨어 설계 및 실험(Ⅰ).

2D 게임프로그래밍 프로젝트 발 록 런 김대호.

Tensorboard in Windows

기초C언어 제2주 실습 프로그래밍의 개념, 프로그램 작성 과정 컴퓨터시뮬레이션학과 2016년 봄학기 담당교수 : 이형원

MIDP 네트워크 프로그래밍 ps lab 김윤경.

9 브라우저 객체 모델.

동적메모리와 연결 리스트 컴퓨터시뮬레이션학과 2016년 봄학기 담당교수 : 이형원 E304호,

JSP Programming with a Workbook

Installation Guide.

아두이노 프로그래밍 2일차 – Part4 아날로그 키패드 활용하기 강사: 김영준 목원대학교 겸임교수

CODE INJECTION 시스템B 김한슬.

Wireless Java Programming

20 XMLHttpRequest.

Presentation transcript:

SpeechRecognition 20111687 최해진 20111651 이동규

목표 1. 앱에서 소리파일의 음성을 인식하여 transcription

Transcription Basics(1) 1. SFSpeechRecognizer: 음성인식 프레임워크의 주 컨트롤러이다. 주 역 할은 recognition task를 생성하고, 그 결과를 리턴받는 것이다. 2. SFSpeechRecognitionRequest: 음성인식을 요청하는 기본 클래스이 다. 역할은 인식기를 오디오 소스에 가리키게 하고, 트랜스크립션을 발생 시키는 요청을 하는것이다. 오디오 소스는 크게 두가지로 나눌 수 있다. SFSpeechURLRecognitionRequest: 소리파일 SFSpeechAudioBufferRecognitionRequest: 버퍼

Transcription Basics(2) 3. SFSpeechRecognitionTask: 이 오브젝트는 인식기가 요청을 했을 때 만들어지고 진행과정을 tracking한다. Transcription result를 만들어내 게 된다. 4. SFSpeechRecognitionResult: 이 오브젝트는 오디오의 한 chunk transcription을 갖는다. 각각의 결과는 single word에 대응된다.

Audio file speech transcription(1) 사용할 라이브러리: Speech ( import Speech ) Info.plist: Privacy – Speech Recognition Usage Description을 추가

Audio file speech transcription(2) 1. Recognizer를 설정. Locale(지역) 을 지정하지 않으면 default로 해당 device의 locale로 설정된다. isAvailable은 준비가 되었는지를 체 크해주는 역할이다. 2. updateUI는 예제 프로젝트에서 transcribe 버튼을 눌렀을때 애니메 이션을 시작하게 하는 코드이고, 파 일 음성인식이므로 URL을 사용한다.

Audio file speech transcription(3) 3. 2번에서 만든 요청을 매개변수로 넣어 task를 만든다. Result, error를 만들고, error일 경우 에러메시지를 띄워준다. 4. isFinal 프로퍼티는 모든 transcription이 끝났을 때 True이다. 완료된 후 UI업데이트를 해주고, bestTranscription은 가장 정확도 높 은 transcription을 포함하고 있 다.formattedString은 text view로 화면에 display한다.

Audio file speech transcription(4) Locale 지역을 설정해주어, 정확도를 높일 수 있다. 위의 코드를 아래처럼 바꾸면 파라미터로 locale을 지정할 수 있다. 만약 locale을 지정하지 않으면 현재 device의 locale로 설정되도록 한다.

Live speech recognition(1) 사용할 라이브러리: Speech ( import Speech ) Live transcription은 Audio transcription과 유사하다. 큰 차이점은 request type이 SFSpeechAudioBufferRecognitionRequest Connection audio buffer : audio engine을 구성하고 recognition request를 연결해야함. Open Info.plist : Privacy – Microphone Usage Description을 추가

Live speech recognition(2) Speech Recognition에 접근권한을 얻기 위해 requestAuthorization 호 출. 실패할 경우 에러메시지 호출.

Live speech recognition(3) 1. 마이크로부터 오는 input audio node들을 가져옴 2. 노드의 output bus의 tap을 설치하 고 버퍼가 채워지면 SFSpeechAudioBufferRecognitionRe quest에 append된 live input node들 을 closure가 반환해줌. 3. recording을 준비하고 시작한다.

Live speech recognition(4) Live audio가 transcription이 시작 되면 호출된다. 결과로부터 bestTrascription을 얻어 transcription을 출력하는 Label을 update한다.

Live speech recognition(5) Stop: releases all resources endAudio : stop listening Cancel : free up resources