중간보고서 김도엽, 김현일, 이상훈.

Slides:



Advertisements
Similar presentations
생활과학개론 발표 보고서 11 조 이상일 / 김종화 / 고현봉 / 김규동.
Advertisements

1/15 16 기 장영일 Ext File System. 2/15 처음에 Minix 가 사용되었다 ( 제약사항 ) 최대로 저장할 수 있는 파일의 크기 – 64M : 16bit 정수로 블록 주소 지정 -> 1024( 블록 기본 사이즈 ) * (2^16) = 64M.
10장. 시기별 학급경영 11조 염지수 이 슬 권용민 신해식.
KB 스타 경제 · 금융교실 나는 용돈관리왕. KB 스타 경제 · 금융교실 나는 용돈관리왕 선생님은 ? KB 2  이름 : 김국민  별명 : 스타 왕자  소속 : KB 국민은행 소비자 보호담 당 ( 간단한 자기 소개 : 교육 대상이 흥미 를 가질 수 있는 이미지와.
일본 근세사. (1) 에도막부의 개창 ( ㄱ ) 세키가하라의 전투 (1600) - 히데요시의 사후 다섯 명의 다이로 ( 大老 ) 가운데 최대 영지 (250 만석 ) 를 보유하고 있던 도쿠가와 이에야스가 급부상. 이에 이에야스와 반목해 온 이시다 미쓰나리 ( 石田三成 ),
아니마 / 아니무스 송문주 조아라. 아니마 아니마란 ? 남성의 마음속에 있는 여성적 심리 경향이 인격화 한 것. 막연한 느낌이나 기분, 예견적인 육감, 비합리적인 것에 대 한 감수성, 개인적인 사랑의 능력, 자연에 대한 감정, 그리.
대구가톨릭대학교 체육교육과 06 학번 영안중학교 체육교사 신웅섭 반갑습니다. 반야월초등학교 축구부 대륜중학교 축구부 대륜고등학교 대구가톨릭대학교 차석 입학 대구가톨릭대학교 수석 졸업 2014 년 경북중등임용 체육 차석 합격 영안중학교 체육교사 근무 소개.
교수님 영상 제 2 장 관세법 일반 제 1 절 통칙 제 2 절 법 해석의 원칙 등 제 3 절 기한과 기간 제 4 절 서류의 송달 등 제 5 절 관세의 부과 및 징수 제 6 절 납세의무의 소멸 등.
일장 - 1 일 24 시간 중의 명기 ( 낮 ) 의 길이 ( 밤은 암기, 낮은 명기 ) 광주기성 - 하루 중 낮의 길이의 장단에 따라 식물의 꽃눈 형성이 달라지는 현상 일장이 식물의 개화현상을 조절하는 중요한 요인 단일식물 - 단일조건에서 개화가 촉진되는 식물 장일식물.
2 학년 6 반 1 조 고은수 구성현 권오제 김강서.  해당 언어에 본디부터 있던 말이나 그것에 기초하여 새로 만들어진 말  어떤 고장 고유의 독특한 말  Ex) 아버지, 어머니, 하늘, 땅.
한국산업기술대학교 온라인 기술교육 교재 개발 차세대 모바일 디지털 컨텐츠 15. WML 개발 - I 이번 시간에는... 지난 시간에는 WAP 의 WTA 프로토콜의 기능과 구성, 서비스 예에 대해서 학습하고, WAP 보안을 위한 WTLS 와 WAP 애플리케이션 레이어 보안,
2014년도 교원 및 기간제교사 성과상여금 전달교육 개 회 국기에 대한 경례 - 인사말
마을기업 더폴락 협동조합 방문일시 : 방문조원 : 3조 김영순 김춘옥 박경해 정경숙.
선진 고양교육 “유아교육 행정 업무 연수” 유치원 회계실무 및 유아학비 연수 경기도고양교육청.
서울시 ‘찾아가는 동 주민센터’ 사업 시행 이후 지역사회의 변화
묵자 겸애, 비명, 비공, 상현, 상동, 천지, 명귀, 삼표 법.
내 아이를 위한 구강관리.
14주차 1교시 강화계획 [학습목표] 1. 강화계획의 정의를 안다 [학습내용] 1. 단순한 강화계획 2. 간헐적 강화 3. 복합 계획 4. 선택과 대응법칙 [사전학습] 강화계획이 일어날 수 있는 사례를 생각해본다.
제16장 원무통계 • 분석 ☞ 통계란 특정의 사실을 일정한 기준에 의하여 숫자로 표시한 것을 말한다.통계로서 활용할 수 있는 조건으로는 ① 동질성을 지녀야 하고 ② 기준이 명확하고 ③ 계속성이 지속되어야 하며 ④ 숫자로 표시하여야 한다 경영실적의.
연장근로와 야간·휴일근로 김영호 노무사 나눔 노사관계연구소 소장 연세대 일반대학원 박사 수료 고려사이버대 법학과 외래교수
서울지방세무사회 부가세 교육 사진클릭-자료 다운 세무사 김재우.
건축가 조사 기초설계 이동숙교수님 건축학과 학번 강민성.
02장 ㅎㅎ 디지털 영상 빛과 색, 시각 컬러 모델 디지털 영상의 생성 디지털 영상의 종류 한빛미디어(주)
치매의 예방 김 은민 윤금 노인요양원 치매의.
알고리즘(Algorithm)  알고리즘 개요 (효율, 분석, 차수) Part 1 강원대학교 컴퓨터과학전공 문양세.
패전후 일본의 욕망과 소비 욕망자연주의 이길 때까지는 원하지 않는다 사치는 적이다에서 사치는 훌륭하다로 패전 후의 궁핍생활
학습 목차 4장_ 국내출원 등록절차 1 특허출원 2 특허출원의 심사 3 특허등록절차.
공 지 사 항 5월 14일 그룹웨어시스템을 오픈합니다. ☞ 그룹웨어를 사용하기 위해서는 페이지 3에 있는 그룹웨어설치방법에 따라 시스템을 설치하여야 합니다. 5월 13일(저녁)에 최종 설치파일을 업로드할 예정이니 14일 출근하시면 설치를 진행해 주십시오. 이미 기존에 설치하여.
Multimedia Programming 06: Point Processing3
Progress Seminar 선석규.
Gamma(감마) 발표일 : 발표자 : 임정환.
Communication and Information Systems Lab. 최정훈
본교에 오심을 환영합니다 나주공산중학교 교 직 원 일 동.
마산에 대하여 만든이 : 2204 김신우, 2202 권성헌.
BLACK OUT 신개념 연합동아리 블랙아웃에서 1기를 모집합니다!
부록 A Matlab 활용.
Lab Assignment 3 Deep Learning 1 1.
Progress Seminar 선석규.
알고리즘(Algorithm)  알고리즘 개요 (효율, 분석, 차수) Part 년 봄학기
HDTV 영상제작의 변화 발표조:10조.
좋은징조 담당교수 : 조성제 김도엽 김현일 이상훈.
■ 화성공장 산학인턴 버스 노선 확인 안내 문의 전화 : 안내페이지 접속 1
천안시 호재 정리 ▶ 천안 원 도심재개발 정비예정구역 총괄 : 80개 구역 규모 : 3,130,235 ㎡(약94.7만평)
KB스타 경제·금융교실 은행에 가요.
nauten Compiler – Report Ver.3 Mini-C (주간)
호서대학교 조교 사용자 설명(종합정보) 2014년 05월 15일.
CHAPTER 04 파일 설계(FiLE Design).
Chapter 2 밝기 변환과 공간 필터링을 위한 퍼지 기법 사용 중원대학교 의료공학과 조정래
교육방법 및 평가방법 안내.
6장 마케팅 조사 박소현, 김중호, 박기찬.
3D 프린팅 프로그래밍 04 – 도형 회전 (하트 열쇠고리 만들기) 강사: 김영준 목원대학교 겸임교수.
3단원 디지털 세상 속으로 1. 0과 1의 비밀.
한밭대학교 창업경영대학원 회계정보학과 장 광 식
히스토그램 그리고 이진화 This course is a basic introduction to parts of the field of computer vision. This version of the course covers topics in 'early' or 'low'
2013년도 상반기 고객만족도 조사 결과 보고서
2013년도 하반기 고객만족도 조사 결과 보고서
기본 테이블세팅(로맨틱) 푸드스타일리스트 전공 김선아.
음양오행과 물리학 조 원 : 김용훈, 양범길, 박수진, 윤진희, 이경남, 박미옥, 박지선 (11조)
12월 KB손해보험 설계사 시상 Ⅱ. 전략상품 FC 주차시상<닥플(연만기),아이좋은자녀,운전자보험>
이야기 치료에 대하여 <8조 학문적 글쓰기 발표> 주희록 최은지
성전기공식(안) 식 순 1. 기공미사 2. 기 공 식 3. 축 하 연 천주교 수원교구 퇴촌성당.
30% 투팩, 더 블랙 스마트 백팩 TWOPACK, THE BLACK SMART BAGPACK 안전성 甲, 노트북 전용 포켓
성공적인 입사지원서 작성법 제이비커리어 교육수석 소 은 선.
IO FND 소스분석 & 실행결과.
유예 X-FILE *조사자* 1301권희원 1315이예지 1317장아정 1322홍자현.
Progress Seminar 선석규.
Progress Seminar 선석규.
중국 어선들의 불법 조업을 단속하려 하는 한국 경찰
중국문학개론 한부와 겅건안문학 중어중국학과 ㅇ이진원 한부와 건안문학.
KB스타 경제·금융교실 화폐가 태어났어요.
Presentation transcript:

중간보고서 김도엽, 김현일, 이상훈

목차 1. 방법 2. 결과 3. 문제파악 4. 개선

dex의 파일구조 /x68, /x6C 이미지 - softdx’s blog

방법 다음과 같은 4가지의 방법으로, dex파일을 이미지로 만들었습니다. 1. Dex를 단순히 이미지화 2. Black or White 3. Lossless Black or White 4. Variance Graph 추가로 실험한 방법 5. 1D Convolution for Dexfile

실험 모든 dex파일은 크기가 다른데, Deep Learning 학습을 위해서는 Input Feature를 맞춰줘야 하기 때문에 Resize를 해줘야 합니다. 학습 과정에서 인공신경망이 어떤 특징을 가지고 악성 프로그램과, 정상프로그램을 구분하는지 알아보기 위해서 Resize 과정에서 손실되는 데이터를 줄이거나, 의도적으로 데이터의 손실을 유도합니다. ->1번은 Base Line, 2번은 의도적으로 손실을 유도, 3번은 손실되는 데이터를 줄입니다. Dex를 이미지가 아닌 신호로 바꾸거나, 1D convolution을 적용 -> 4번은 신호로 변경, 5번은 1D Convolution을 적용

성능 정확도는 82~86%에 육박하지만, 이 정확도는 신뢰할 수 없기 때문에 비교할 수 없습니다. 정확도를 신뢰할 수 없는 이유 : Black or White 방법은 단순히 dex파일에 얼마나 많은 정보들이 들어있는지로 판 단 하는데 성능이 82%나 나와서 문젭니다. 가장 성능이 잘 나오는 것은, Variance Graph나 lossless Black or white 방법이지만, 성능차이는 4%입니다. 이미지화를 하기 위해서는 현재와는 다른 방법이 필요함.

성능 정상 프로그램은 대부분 정상 프로그램이라고 잡아냅지만, 악성코드는 잘 못 잡아내고 있습니다. 문제점을 발견하기 위해서, 빨간색 원에 해당하는 데이터들만을 따로 뽑아서 히스토그램을 추출해야 할 거 같습니다.

분석(File Size Graph) R = 악성 B = 정상 악성 프로그램들은 용량이 정해져있는 경우가 많고, 정상 프로그램은 잘 분산 되어 있습니다. 단위는 kb단윕니다.

분석(Average Dex Brightness) 평균 밝기로 보게 되면 악성이랑 정상 프로그램 사이에 큰 차이가 없습니다. 분포의 평균과 분산으로 보면 거의 유사합니다.

Average Dex Brighteness tp tn fp fn

tp,tn,fp,fn Average Dex Brightness

Appendix

실험 1) 단순히 이미지화 dex파일의 binary 값을 byte단위로 읽어와서 (0~255)의 값을 가진 pixel로 변환 단점 : 파일 크기가 큰 경우에 resize되면서 주변 값의 영향을 받을 수 있음. 좌측 그림 같은 경우는 4바이트가 보간되지만, 현재 데이터셋에서는 93~128바이트단위로 보간이 될수도 있음

변환된 이미지들 악성코드 정상코드 20번 2379번 2385번(실질적으로 원한 이미지) 152번(실질적으로 원한이미지) 30번 악성코드 정상코드 20번 2379번 2385번(실질적으로 원한 이미지) 152번(실질적으로 원한이미지) 30번 878 번

성능(84%) Val Graph Train Graph 학습은 잘되니 모델은 이상 없음 1.데이터 부족으로 오버 피팅,(100) 2.val acc가 올라가는 건 normalize한 결과가 아 님. 신뢰 불가

실험 2) Black or White 0 = 1~255 -> 255 0 = 1~255 -> 255 resize되는 값중 단 하나라도 1이상의 값을 가지고 있다면 흰색으로 판단 (메모리 내에서 값이 있는지 없는지가 중요한가를 판단하기 위함) resize값이 10이라서 10바이트가 1개의 바이트로 resize된다면, 다음과 같이 됩니다.

변환된 이미지들 악성코드 정상코드 20번 152번(실질적으로 원한이미지) 2379번 2385번(실질적으로 원한 이미지) 악성코드 정상코드 20번 152번(실질적으로 원한이미지) 2379번 2385번(실질적으로 원한 이미지) 878 번 30번

성능(82%) Val Graph Train Graph 학습은 잘되니 모델은 이상 없음 1.데이터 부족으로 오버 피팅,(100) 2.val acc가 올라가는 건 normalize한 결과가 아 님. 신뢰 불가 100에폭에서 로스가 오 르면 acc가 떨어짐. 저게 정상.

실험 3) Black or White 0 = 1~255 -> 255 0 = 1~255 -> 255 resize 값에 따라서 gray intensity를 정함 (ex resize를 통해 5배씩 줄어든다면) 이 방식을 이용하게 된다면, 위의 Black or White에서 발생한 문제 에서 Intensitiy의 다양성을 줌으로써, 문제를 단순화하면서도 해결 이 가능한 것으로 보입니다. 0, 65, 130, 195, 255

변환된 이미지들 악성코드 정상코드 2379번 20번 152번(실질적으로 원한이미지) 2385번(실질적으로 원한 이미지) 30번 악성코드 정상코드 2379번 20번 152번(실질적으로 원한이미지) 2385번(실질적으로 원한 이미지) 30번 878 번

성능(86%) Val Graph Train Graph 학습은 잘되니 모델은 이상 없음 1.데이터 부족으로 오버 피팅(100) 2.val acc가 올라가는 건 normalize한 결과가 아 님. 신뢰 불가 접근 방법에 문제가 있 는 것을 확인 데이터 전 처리 필요성 확인

4) variance로 그래프(혹은 신호로) 만들기(trash값으로부터의 variance로) bit로부터의 분산을 기준으로 만들어지는 분산 그래프입니다. 0 60 128 128 200 255의 5가지 값이 있고, 가장 많이 반복되는 값(혹은 trash 값)을 μ(평균값)로 가정. μ가 128일때 그래프는 다음과 같이 그려집니다. value 128 -128 1 2 3 4 5 offset

성능(86%) 학습이 매우 빠르지만, 오버피팅이 빨리 일어나고, 성능의 향상은 없었습니다.