Machine Learning using Neural Networks 인공지능 과제#1 BioIntelligence Lab.
과제 #1 정의 2 개 데이터 집합에 대해 뉴럴넷 학습 Pima Indians Diabetes Databases Iris 각 데이터 집합에 대해 최적의 일반화 성능과 이 때의 네트워크 구조 찾기 BioIntelligence Lab.
데이터 집합 Pima Indians Diabetes Databases Iris 768 examples 학습데이터 (diabetes_train.txt) 테스트데이터(diabetes_test.txt) 설명 (diabetes_names.txt) 8 attributes + 1 class Iris 150 examples 학습데이터 (iris_train.txt) 테스트데이터(iris _test.txt) 설명 (iris _names.txt) 4 attributes + one of three classes BioIntelligence Lab.
Pima Indians Diabetes Database 6,148,72,35,0,33.6,0.627,50,1 1,85,66,29,0,26.6,0.351,31,0 Brief statistical analysis: Attribute number: Mean: Standard Deviation: 1. 3.8 3.4 2. 120.9 32.0 3. 69.1 19.4 4. 20.5 16.0 5. 79.8 115.2 6. 32.0 7.9 7. 0.5 0.3 8. 33.2 11.8 BioIntelligence Lab.
Iris 5.1 3.5 1.4 0.2 1 0 0 4.9 3 1.4 0.2 1 0 0 Statistics: Min Max Mean SD Class Correlation sepal length: 4.3 7.9 5.84 0.83 0.7826 sepal width: 2.0 4.4 3.05 0.43 -0.4194 petal length: 1.0 6.9 3.76 1.76 0.9490 (high!) petal width: 0.1 2.5 1.20 0.76 0.9565 (high!) BioIntelligence Lab.
보고서 제출 사용한 뉴럴넷 패키지에 대한 간략한 조사 데이터 전처리 과정 기술 각 데이터 집합에 대한 학습 성능 vs 일반화 성능 변화 그래프 찾아낸 최대 일반화 성능 및 뉴럴넷 구조 (은닉층은 하나로 고정) 은닉 노드의 수와 학습 능력 사이의 상관관계에 대한 각자의 의견 기술(은닉노드수를 1개부터 하나씩 늘려감에 따라 학습 성능의 변화 관찰) 기타 필요하다고 생각되는 토론 사항( 신경망의 가중치 초기화에 따른 학습 경향, 신경망의 학습률 변화에 따른 학습 경향 등) BioIntelligence Lab.
참고 사항 기한 9월 26일 (301동 419호 오장민) 데이터 출처 강의 홈페이지 내 프로젝트 홈페이지 참고 UCI repository http://www.ics.uci.edu/~mlearn/MLSummary.html 강의 홈페이지 내 프로젝트 홈페이지 참고 http://bi.snu.ac.kr/Courses/4ai01/project1.html BioIntelligence Lab.