생활 습관과 학교 성적의 통계분석 조장: 이태훈 조원: 이진원
+ 목차 I. 서론 II. 데이터 설명 및 통계 분석 III. 결론 1. 연구 목적 2. 데이터 1. 이산형 변수 2. 연속형 변수 3. 통계 분석 III. 결론 + 소감
I. 서론 2. 데이터 1. 연구 목적 일상생활에서 습관이 성적에 미치는 영향과 남녀별 과목 간 점수차이 등을 알아보고자 변수 변수 설명 칼럼수 변수값의 설명 ID 일련번호 5 5자리 숫자 Gender 성별 1 1. 남자 2. 여자 Age 연령 2 20~49세, 무응답 99 Q1_1 학과 1. 문과, 2. 이과, 3. 기타 Q1_2 졸업평점 4 0~5 Q1_3 국어 Q1_4 영어 Q1_5 수학 Q1_6 사회 Q1_7 과학 Q1_8 수능 6 0~400 Q2_1 과식하지 않는다 절대 그렇지 않다. 그렇지 않다 그저 그렇다 그런 편이다 매우 그렇다 9. 무응답 Q2_2 운동은 규칙적으로 하지 않는다 Q2_3 규칙적으로 화장실에 간다 Q2_4 운동은 필요 없다 Q2_5 학교 내 운동시설에 만족한다 일상생활에서 습관이 성적에 미치는 영향과 남녀별 과목 간 점수차이 등을 알아보고자 이를 R프로그램을 이용해 통계를 분석하는 것이 목적이다. I. 서론 ※ 출처 : 사회조사분석사 실기 시험에서 사용하는 데이터로 총 150명 이다
ㄴ (계수치): 헤아려 얻는 것 (불량품수, 사고건수 등) 1. 이산형 변수 ㄴ (계수치): 헤아려 얻는 것 (불량품수, 사고건수 등) (2) 식사량 (4) 화장실 규칙도 (1) 성별 (5) 운동 필요도 (3) 운동 규칙도 (6) 학교 운동시설 만족도 만족1 만족2 만족3 만족4 만족5 총합 남자 1 (0.66%) 22 (14.66%) 40 (26.66%) 39 (26%) 12 (8%) 114 여자 5 (3.33%) 14 (9.33%) 36 만족1 만족2 만족3 만족4 만족5 총합 남자 1 (0.66%) 22 (14.66%) 40 (26.66%) 39 (26%) 12 (8%) 114 여자 5 (3.33%) 14 (9.33%) 36 운동필요1 운동필요2 운동필요3 운동필요4 운동필요5 종합 남자 31 (20.66%) 33 (22%) 38 (25.33%) 10 (6.66%) 2 (1.33%) 114 여자 8 (5.33%) 14 (9.33%) 5 (3.33%) 1 (0.66%) 36 남자 여자 N 114 36 화장실1 화장실2 화장실3 화장실4 화장실5 총합 남자 2 (1.33%) 15 (10%) 35 (23.33%) 38 (25.33%) 24 (16%) 114 여자 3 (2%) 10 (6.66%) 13 (8.66%) 36 운동규칙1 운동규칙2 운동규칙3 운동규칙4 운동규칙5 총합 남자 39 (26%) 21 (14%) 37 (24.66%) 11 (7.33%) 6 (4%) 114 여자 5 (3.33%) 12 (8%) 16 (10.66%) 3 (2%) 36 II. 데이터 설명 및 통계 분석 식사량1 식사량2 식사량3 식사량4 식사량5 무응답 총합 남자 5 (3.33%) 31 (20.66%) 42 (28%) 26 (17.33%) 8 (5.33%) 2 (1.33%) 114 여자 6 (4%) 11 (7.33%) 36
ㄴ (계량치): 측정해 얻는 것 (시간, 온도, 무게, 길이 등) 2. 연속형 변수 1. 이산형 변수 ㄴ (계량치): 측정해 얻는 것 (시간, 온도, 무게, 길이 등) (3) 영어 (6) 과학 (4) 수학 (7) 수능 (5) 사회 (2) 국어 (1) 졸업평점 최솟값 중앙값 평균 최댓값 남자 2.290 4.060 4.005 4.910 여자 2.890 4.040 3.940 5.000 전체 3.989 최솟값 중앙값 평균 최댓값 남자 2.000 3.760 3.729 5.000 여자 2.040 3.740 3.634 전체 3.706 최솟값 중앙값 평균 최댓값 남자 114.1 342.4 338.1 379.5 여자 305.0 334.0 331.2 358.1 전체 341.1 336.4 최솟값 중앙값 평균 최댓값 남자 1.920 2.670 2.745 3.990 여자 2.280 2.875 2.918 3.900 전체 2.710 2.786 최솟값 중앙값 평균 최댓값 남자 2.690 3.975 3.914 4.930 여자 3.020 4.030 4.028 4.700 전체 3.980 3.941 최솟값 중앙값 평균 최댓값 남자 2.860 4.015 3.997 5.000 여자 2.880 4.270 4.202 4.920 전체 4.080 4.046 최솟값 중앙값 평균 최댓값 남자 2.000 4.000 3.924 5.000 여자 2.830 3.925 3.910 4.960 전체 3.921
3. 통계 분석 (1) 상관계수 (2) 산점도 (3) t 검정 귀무가설: 남녀별 졸업평점에 차이가 없다. 대립가설: 남녀별 졸업평점에 차이가 있다. -> 결론 P-value가 0.04064로 유의수준 0.05보다 작으므로 귀무가설을 기각한다. 그러므로 남녀별 졸업평점에 차이가 있다고 할 수 있다. t df p-value 졸업평점 -2.0904 62.625 0.04064 국어 -1.3871 57.47 0.1708 영어 0.68941 47.732 0.4939 수학 0.13448 60.001 0.8935 사회 -2.4025 60.363 0.01938 과학 0.61781 53.26 0.5393 수능 1.7682 99.905 0.08008 (3) t 검정 (2) 산점도 (1) 상관계수 귀무가설: 남녀별 사회점수에 차이가 없다. 대립가설: 남녀별 사회점수에 차이가 있다. -> 결론 P-value가 0.01938로 유의수준 0.05보다 작으므로 귀무가설을 기각한다. 그러므로 남녀별 사회점수에 차이가 있다고 할 수 있다. 국어와 사회의 상관계수가 가장 높다 수학과 수능의 상관계수가 가장 낮다
III. 결론 • 이산형변수는 변수가 취할 수 있는 값을 하나하나 셀 수 있는 경우이고, 연속형 변수는 변수가 구간 안의 모든 값을 가질 수 있는 경우를 말한다. • 이산형 변수에 대한 각각의 자료의 개수, 막대 그래프, 연속형 변수에 대한 기초 통계량과 히스토그램 등을 보면 여러가지 정보가 한 눈에 들어오게 된다. • 통계분석을 통해서 각 과목들이 얼마나 밀접하게 연관이 되어 있는지 확인 할 수 있고, t 검정을 통해서 남녀별 차이가 있는 과목에 대해 알 수 있다. III. 결론
감사합니다 소감 태훈(조장) : 산출물 대회를 하면서 R프로그램을 유용하게 쓸 수 있게 되었다. 조원이 두명이라서 힘든점도 있었지만, 조원이 적어 단합도 잘 되고, 조교쌤이 도와주셔서 수월해졌던 것 같다. 재미있었다. 진원(조원) : 이산형 변수, 연속형 변수는 이름만 들어도 어느정도 알 수 있었지만, 상관계수등 모르는 것들이 나와서 혼잡했다. 모르는 용어들을 이제 알게 되었고, 그래서 새롭게 통계 용어를 알아가는 과정이 정말 좋았다. 나중에 용어를 더 찾아볼 기회가 된다면 찾아보고 싶은 생각도 든다. 소감