Automatic Music Transcription

Slides:



Advertisements
Similar presentations
Chapter 8. TEXT CLUSTERING 서울시립대 전자전기컴퓨터공학과 데이터마이닝 연구실 G 노준호.
Advertisements

출석수업 과제 – 총 5문제, 10월 25일 제출 정보통계학과 장영재 교수.
CPU 품 명 PERSONAL COMPUTER 모델번호 HP 6000Pro 제 조 사
임피던스(Impedance) 측정 일반물리 B실험실 일반물리실험 (General Physics Experiment)
제2장 주파수 영역에서의 모델링.
신호조절*(Signal Conditioning)
Report #5 - due: 4/13 다음 10*5의 희소 행렬 A, B를 고려하라.
팀원: 고채은, 위혜서,임지안, 정희준,장민규,이연재
유전자 알고리즘(Genetic Algorithm)
Excel 일차 강사 : 박영민.
Report #2 - Solution 문제 #1: 다음과 같이 프로그램을 작성하라.
컴퓨터 프로그래밍 기초 [Final] 기말고사
10장 랜덤 디지털 신호처리 1.
전자기적인 Impedance, 유전율, 유전 손실
수학10-나 1학년 2학기 Ⅳ.삼각함수 1. 일반각과 호도법(1/12) 삼각함수 수업계획 수업활동.
실험 3 - 비선형 연산 증폭기 회로와 능동 필터 전자전기컴퓨터공학부 방 기 영.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
Error Detection and Correction
멀티미디어 시스템 (아날로그 이미지,신호를 디지털로 변환 방법) 이름 : 김대진 학번 :
Progress Seminar 선석규.
보고서 #5(제출기한: 10/14) 다음 문제를 해결하시오.
생체계측 강의록 Medical instrucmentation#11
초음파를 이용한 거리 측정과 음성구현 1 조 한 형 래 김 요 섭 안 정 민.
Fourier Transform Nuclear Magnetic Resonance Spectrometer
임피던스 측정 B실험실 일반물리실험 (General Physics Experiment).
Progress Seminar 선석규.
10장 컴퓨터 기반 데이터 획득 응용 프로그램 LabVIEW 사용법
d g b a z w h j x l k y s n m c p [ t v r q
수업명 또는 그 외 PPT 주제를 넣으세요 PPT주제를 영어로.
코다이 교수법 이 가 원.
제4장 제어 시스템의 성능.
메모리 관리 & 동적 할당.
학습 주제 p 일률 측정하기.
MCL을 이용한 이동로봇 위치추정의 구현 ( Mobile robot localization using monte carlo localization ) 한양대학교 전자전기전공 이용학.
Chapter6 : JVM과 메모리 6.1 JVM의 구조와 메모리 모델 6.2 프로그램 실행과 메모리 6.3 객체생성과 메모리
시뮬레이션 기반 가상 보조기구 알고리즘 최적화
ITQ 정보기술자격 국가공인 Excel 2007 Ⅱ 함수- 11회차 강사 : 박영민.
4 장 신호(Signals) 4.1 아날로그와 디지털(Analog and Digital)
3D 프린팅 프로그래밍 01 – 기본 명령어 강사: 김영준 목원대학교 겸임교수.
Clipping 이진학.
보고서 (due 5/8) 다음과 같은 방식으로 문제를 해결하시오. 문제 분석 알고리즘 작성 프로그램 작성 테스트 및 검증
두 모집단에 대한 검정.
데이터 베이스 DB2 관계형 데이터 모델 권준영.
연구 진행 상황 보고서 연구 결과 문제점 및 대책 목표 및 계획 어지럼증 기타 임상시험 설계 및 준비
Progress Seminar 선석규.
아날로그-디지털 부호화(1/7) 아날로그 정보를 디지털 신호로 변환 아날로그-디지털 부호화 과정.
진동이란 무엇인가?.
차세대통신시스템 3. 진폭 변조 (2) April 11 – 12, 2011 Yongwon Lee
공명과 화음(resonance and harmony)
Cakewalk Sonar Graphic EQ.
클러스터 시스템에서 효과적인 미디어 트랜스코딩 부하분산 정책
PCA 개선 서울대학교 박노열.
11장 배열 1. 배열이란? 1.1 배열의 개요 1.2 배열의 선언과 사용.
비교분석 보고서 Template 2015.
9 브라우저 객체 모델.
여 신 도 회 가 첫 새 벽 별- 빛- 빛 나 네 벗 들 아 모 여 라 진 리 의 깃- 발- 날 린 다 뭉 쳐 서 나 가 세.
상관계수.
Week 4: 다변수(2변수) 데이터분석 5장_1(산포도: scatter plot) 동영상 1,2,3,4,5
컴퓨터공학과 손민정 Computer Graphics Lab 이승용 교수님
통계학 R을 이용한 분석 제 2 장 자료의 정리.
조 제 민 류 은 미 정 성 훈 한성대학교 정보통신공학과
트리 (Logical) Data Structures Linear list Tree Graph Linear structures
와인잔 연주 양동 중학교 2학년 김다희 류보라.
Automatic Music Transcription
아두이노 프로그래밍 2일차 – Part4 아날로그 키패드 활용하기 강사: 김영준 목원대학교 겸임교수
영역 기반 처리.
NACST progress report 신수용.
아날로그 신호를 디지털 신호로 변환하는 A/D 변환기 A/D 변환 시 고려하여 할 샘플링 주파수 D/A 변환기
교착 상태 해결 : 교착 상태 탐지 교착 상태 탐지(Deadlock Detection)
Progress Seminar 양승만.
Presentation transcript:

Automatic Music Transcription A.I.Lab 형아영

Syllable Segmentation 기존의 산토끼 악보 WaveForm(산토끼_Male) Mel-filterbank Coefficient

Syllable Segmentation Preprocessing 끝점 검출(End-Point Detection) : STE, ZCR Syllable Segmentation 음절에는 하나의 모음이 반드시 들어있고, 모음은 큰 에너지를 유지 에너지 곡선 : 음절의 수(단어)에 따른 에너지 펄스를 나타냄 모음 (formant) 부분 검출 : 지속시간이 60msec를 넘지않으면 잡음 (예: 에너지의 값이 40dB를 넘는 점이 생기면 모음부분의 시작으로 여기고 다시 40dB를 내려가는 점이 나오면 음절의 모음부분 찾게 됨) - 모음의 시작과 끝 부분에 150msec 의 구간을 자음위치로 추정

Syllable Segmentation Fixed frame : 에너지 윤곽선 추출 → smoothing Pitch간격에서 최대값을 이용 : 음성의 최대값을 연결하여, deep을 경계로 예측

Pitch Detection 12음계의 어떤 음에 해당하는가? (옥타브)

Pitch Detection Pitch Detection Peak spectrum : 피크 성분 추출(audio spectrum – smoothed spectrum) Pitch candidate selection : peak index 생성 → 해당 오디오 프레임 후보 피치 Comb filtering : 후보 피치 들 중에서 대표 피치 값 결정(주파수 영역) 주파수 인덱스 : 12음계 단위(한 옥타브에 12개의 음을 배치) 인접한 두 개의 음은 일정한 비율의 주파수를 나타냄 α12 = 2, α=10log2/12 = 1.05943

Pitch_SIDE Autocorrelation function 이용한 Pitch Detection

Pitch_SIDE SIDE 알고리즘 이용(iteration = 200)

Musical Note Duration

Musical Note Scale 미 솔 파 높은 도 도 레

Musical Note Scale 옥타브의 주파수와 음높이 실험 데이터 : 134~160(도), 142~151(레), 160~169(미), 174(파) 184~207(솔), 251~60(높은 도)

Node detection_Intensity 0.01 초 마다 데이터 추출(dB단위)

Node detection_Intensity 프로그램 수행 결과(30dB, 0.3초) 2 1

Node detection_Intensity 애국가 악보

Node detection_Intensity 프로그램 수행 결과(60dB, 0.3초) 4 3 5 1 7 2 6

Node detection_Pitch Data ↓ ④ ③ ↓ ⑤ ① ↓ ⑦ ② ↓ ⑥

Node detection_Pitch Data ② ⑤ ③ ④ ①

Node detection_Pitch Data ↓ ↓ ③ ② ① ④

Node detection_Pitch Data ④ ③ ① ↓ ↓ ②

Music Scale Recognition 절대음정 1옥타브 : 반음은 두 음 사이의 주파수라 가정(단위 Hz) SIDE 적용 후 주파수 표(남녀 각 1명) 성별 도 레 미 파 솔 라 시 남 126 143 161 173 195 216 244 264 여 260 299 333 350 393 439 494 523

Music Scale Recognition 절대음정 근사(approximation) 남성의 음정 모델을 이용 산토끼 인식률(반음을 고려치 않음) 25음절 중 5개 오류(80% 인식) 여성의 음정 모델을 이용 꼬마눈사람 인식률(반음을 고려치 않음) 42음절 중 8개 오류(80% 인식)

Music Scale Recognition 상대음정 앞 음과의 상대적인 변화를 측정하여 변화정도로 음정을 결정함 음역이 다름으로 인해 생기는 개인차를 고려하지 않음 첫 음의 음정을 알고 있어야 함 제안 : 표준음표 혹은 남성 모델에서 첫 음을 결정

Music Scale Recognition 상대음정 근사(approximation) 남성의 음정 모델을 절대값으로 이용 첫 음(기준음)이 “ 솔 ” , 200Hz 산토끼 인식률(반음을 고려치 않음) 25음절 중 5개 오류(80% 인식) 음정 도 레 미 파 솔 라 시 주파수 133 149 167 177 200 211 251 266 비율 1.000 1.122 1.260 1.335 1.498 1.682 1.888 2.000

Music Scale Recognition 상대음정 근사(approximation) 꼬마눈사람 여성의 음정 모델을 이용(기준음 389Hz, “솔”) 42음절 중 13개 오류(70% 인식) B여성의 음정 모델을 이용(기준음 345Hz, “솔”) 42음절 중 3개 오류(92.86% 인식) 음정 도 레 미 파 솔 라 시 주파수 259 290 326 345 389 435 488 518 비율 1.000 1.122 1.260 1.335 1.498 1.682 1.888 2.000 음정 도 레 미 파 솔 라 시 주파수 230 258 289 307 345 386 434 460 비율 1.000 1.122 1.260 1.335 1.498 1.682 1.888 2.000

Node detection 휴지기 정보를 이용 마디를 기준으로 근접한 점을 찾아냄 ↑ 0.25 0.5 0.75 1.25 1.5 1.75

Node detection 산토끼 마디 정보 ↑ ↑ ↑ ↑ ↑ ↑ ↑ 31 4.110812 14 1.120812 31 4.110812 14 1.120812 24 2.120812 4 3.110812 10 5.110812 21 6.100812 1 7.060812 ↑ 기준 ↑ ↑ ↑ ↑ ↑ ↑

Node detection 애국가 ↑ ↑ 마디 정보 ↑ ↑ ↑ ↑ ↑ 71 23.993334 47 6.083333 71 23.993334 47 6.083333 55 12.003333 45 18.093332 35 30.093332 66 36.113335 45 42.133331 ↑ ↑ 기준 ↑ ↑ ↑

Node detection 애국가 마디 정보 ↑ ↑ ↑ ↑ ↑ 53 9.233083 11 2.333083 48 4.583083 53 9.233083 11 2.333083 48 4.583083 10 6.933083 12 11.513083 ↑ ↑ ↑ ↑ 기준 ↑

Node detection 애국가 마디 정보 ↑ ↑ ↑ ↑ ↑ ↑ ↑ 43 5.313390 11 1.373390 43 5.313390 11 1.373390 39 2.673390 40 4.003390 3 6.523390 2 8.063390 5 9.113390 ↑ ↑ ↑ ↑ 기준 ↑ ↑ ↑

Accent Measure 눈꽃송이(4분의3박자) 마디 1 : 91(약)/107(강)/5(약)/17(강)/10(약)/86(강)/8(약) 마디 2 : 42(강)/7(약)/35(강)/13(약)/124(강)/56(약) ↑ ↑

Accent Measure 반달(8분의 6박자) 마디 1: 44(약)/362(강)/138(약) 마디 2: 72(강)/9(약)/26(강)/19(약) 62(강)/17(약)/228(강)/67(약) ↑ ↑