DNN 을 활용한 메일 분류 임영욱 백창훈 정강우
DNN(Deep Neural Network)
DNN – 학습과 Backpropagation Algorithm
DNN 의 여러가지 활용 자동음성인식 현재 모든 주요 상업 음성인식 시스템 (MS 코타나, 스카이프 번역기, 구글 나우, 애플 시리 등등 ) 이 딥 러닝 기법에 기반하고 있다. 영상인식 Geoff Hinton 과 그의 제자들은 2012 년 가을에 대규모 ImageNet 대회에서 당시 최 신 기계학습 방법들의 성능을 뛰어넘는 결과를 보여 주었고 이로 인해 컴퓨터 비전의 주요 분야인 영상 인식 및 사물 인식 분야에서의 딥 러닝의 중요성이 대두 되었다. 이 미지 분류분야는 자동 영상 캡셔닝이라는 도전적인 분야로 확장되었고 자동 영상 캡셔 닝은 딥러닝을 핵심 기반 기술로 사용하는 분야이다. 적용 사례로는 360 도 카메라 화 면을 이해 할 수 있도록 딥 러닝을 통해 학습된 자동차 탑재용 컴퓨터 등이 있다.
DNN 의 여러가지 활용 자연어 처리 DNN 은 자동 번역 (machine translation), 감정 분석 (sentiment analysis), 정보 검색 ( information retrieval) 을 비롯한 다양한 자연언어처리 관련 연구에서 최첨단 기술로서 쓰이고 있다. 약물 갈견과 독성학 2012 년 George Dahl 의 팀은 다중 DNN 을 약의 효험을 예측하는 데에 활용하여 "Merck Molecular Activity Challenge" 에 우승하였고, 2014 년 Sepp Hochreiter 의 팀은 예상치 못한 다른 작용을 사전에 탐지하기 위해 딥 러닝을 활용하여 "Tox21 Data Challenge" 에서 우승하였 다. 이러한 성공은 딥 러닝이 약학에 있어 가상 실험 방법 (Virtual Screening Method) 에 적합함 을 보여준다. 현재 많은 수의 연구자들이 여러가지 데이터를 조합하여 약물을 발견하는 데에 딥 러닝을 활용하고 있다 고객 관계 관리 최근 직접 마케팅 기획, 고객 관계 관리 자동화를 위한 수단 적합성 산출 등에 직접적으로 심층 강 화 학습을 활용하여 성공하는 사례들이 알려지고 있다.
팀 프로젝트 DNN 을 활용한 스팸 mail 분류 서비스 메일 광고, 업무 ( 부탁, 지시 ), 소셜 메일, 스팸 메일
팀 프로젝트 대부분의 사람들은 메일의 내용을 보면 해당 메일이 어떤 메일인지 쉽게 판단 이는, 해당 메일이 어떠한 종류의 문장들로 구성되어 있는지를 확인함으로써 이루 어짐 예를 들어, 욕이나 선정적인 내용을 담은 문장 위주로 구성되어 있을 경우 이는 스 팸 메일일 가능성이 높음. 따라서 스팸 메일을 구성하는 문장들의 다양한 유형을 학습 하고, 특정 메일의 text 가 주어졌을 때, 학습한 문장들과 유사한 문장들의 구성 비율을 계산함으로써 스 팸 메일의 분류가 가능
단계 1. 단계 - Client –Server model 구축 2 단계 – DNN 학습 모델 설계 3 단계 - 2 단계 설계한 모델을 이용하여 테스트 4 단계 – 2,3 단계에서 구현한 방법을 활용하여 메일을 더 세부적으로 구분 ( 메일 광고, 업무 ( 부탁, 지시 ), 소셜 메일 등 )
이번 학기 목표 이번 학기에 수행할 내용 Client –Server model 구축 -> 본 프로젝트의 가장 핵심인 DNN 에 관한 설계는 파이썬을 통해 수행 -> 하지만 실제적은 input 과 output 에 대한 처리는 아이폰의 App 을 통해 이루어 져야함 (Swift 로 설계 ) -> 따라서 아이폰에서 입력한 정보를 파이썬 루틴에 넘겨 주고, 해당 루틴이 처리한 결과를 다시 아이폰 으로 보내주는 작업이 필요
이번 학기 목표 따라서 다음의 과정을 수행 Client 의 기능을 수행하는 아이폰 application 설계 -> 메일을 작성 파이썬 코드를 수행하는 Server 구축 -> 수신 기능만 구현 :app 상에서 메일 (text) 를 작성하여 Server 로 전송하면, 해당 Server 는 메일을 수 신하고 수신한 메일을 다시 app 으로 전송 -> Server 와 client 간에 제대로 송, 수 신을 수행하는지 확인 2 학기 에는 Server 의 기능을 프로젝트의 취지에 맞게 확장하여 실제적인 스팸 메 일 분류를 수행
reference learning/lecture/1z9WW/backpropagation-algorithm