Automatic Music Transcription A.I.Lab 형아영
음성 신호의 기호화 Auto Music Transcription(자동채보) 선행 과제 : 연속음성 신호를 음운단위 (단어 또는 음절, 음소 등)로 분리(segmentation) 고려 사항 : music scale(음계) duration(음의 길이) 음소 단위로 분리 하기로 함 음절(한 글자) 단위로 분리 시에는 연결음 에서의 duration을 파악하지 못하는 일이 발생할 것으로 예상
Phoneme segmentation 음향적 변화를 나타내는 parameter를 관측 Static : 단시간 power, 저주파역.중역.고주파역에 대한 각 대역 power , 영교차율(ZCR) 등 Dynamic : spectral envelope의 시간변화, power의 시간변화 연속음 : 모음일지라도 신호가 완전히 정상적인것은 아님 (무성음과의 구별) 동적 분리에서는 음운의 경계에서 언어음의 변화만을 정확히 검출하는 것이 가능한 특성 parameter를 사용해야 함
Segmentation System 음성 신호의 구분 무성음 구간(unvoiced region) 유성음 구간(voiced region) : 자음과 모음(formant) 각각의 양분 단위를 미세 구간으로 나누어, 각각의 segment가 음소 또는 음소적 단위에 대응해야 함 음소적 단위 Segmentation Parameter 영차(zero-th order) mel cepstrum 계수 영교차수(ZCR), 유성음 검출(voiced region detection) 계수 영차 mel cepstrum 시간 변화(time derivative) 영교차수 시간변화(zero cross number time derivative) Spectral 포락 시간변화(envelope time derivate)
Segmentation System Block Diagram 음성 신호 Spectral Envelope 추출 Segmentation Parameter 계산 유성음 무성음 분리 유성음 구간에서 음소경계의 검출 무성음 구간에서 음소경계의 검출 음소군 Labeling 음소 Segment
Segmentation Parameter NEXT… Parameter 와 Labeling 에 대하여…