Presentation is loading. Please wait.

Presentation is loading. Please wait.

연구실 인턴쉽 안내자료 컴퓨터공학과 2017학년도 1학기.

Similar presentations


Presentation on theme: "연구실 인턴쉽 안내자료 컴퓨터공학과 2017학년도 1학기."— Presentation transcript:

1 연구실 인턴쉽 안내자료 컴퓨터공학과 2017학년도 1학기

2 연구실 인턴쉽 제도란 ? 배경 및 필요성 수행 방법 컴퓨터공학과 고학년 학생들(3-4학년)의 프로젝트 수행 능력 향상
본교 대학원 연구실에서 수행하는 연구에 대한 이해 증가 학교 내에서 산업체 인턴쉽에 참여한 것과 유사한 환경 제공 취업 시 실적으로도 이용 가능 수행 방법 연구실 별(참여한 연구실)로 진행 가능한 프로젝트 리스트를 최대 2개까지 공지 (홈페이지에 공지 예정) 학생들이 선호도에 따라 신청 (5월 2일까지) – 담당 교수 면담 가능 담당 교수님(연구실)께서 지도 가능 학생(팀) 선정 연구실 내에서 프로젝트 수행 (산업체와 연계 가능) – 중간고사 후 11월 말 경 전산제 시 참여 프로젝트에 대한 개발 경진대회 실시 수상자에 대하여 장학금 지금 및 전원 SW중심대학 마일리지 적립

3 연구실 별 프로젝트 리스트 현재 총 12개 연구실 (총 26개 프로젝트) 참여 융합 소프트웨어 연구실 컴퓨터 그래픽스 연구실
IoT 기기의 블록체인 연동 개발 및 기기 식별 방안 연구 컴퓨터 그래픽스 연구실 Vulkan API와 OpenGL API와의 비교를 통한 차세대 3D 그래픽스 프로그래밍의 이해 Google Tango API를 사용한 증강 현실 기술의 이해 데이터마이닝 연구실 의료 데이터 마이닝을 통한 신장암 판별 동영상 데이터로 부터 관심 이벤트 추출 및 주석 생성 재활 로봇 컨트롤 알고리즘 개발 핀테크 거래 내역 분석 시스템 실내 공기 품질 예측 시스템 LASS 연구실/차세대 시스템 소프트웨어 연구실 Flash 메모리 기반 SSD Firmware 개발 Secure SSD의 Key Management를 위한 Linux 디바이스 드라이버 개발 및 SSD Firmware 수정/개발 분산 클라우드 연구실 Openstack 을 이용한 클라우드 자원 관리 (CPU, Network, Storage) Ceph 오브젝트 Storage에서 통신 Scheduler 개발 CAD & Security 연구실 저전력 및 타이밍 최적화를 위한 Clock Tree Synthesis 컴퓨터비전 & 영상처리 연구실 원거리 물체 인식 카메라 개발 드론 응용 프로그램 개발 Internet Communication and Control 연구실 게임이론 기반의 스마트 그리드 최적 전력 수요 스케쥴링 및 가격 최적화 기술 게임이론 기반의 효율적인 IoT 트래픽 처리를 위한 Data Offloading기법 연구 데이터베이스 연구실 서로 다른 서비스 사용자간 동일 인물 추론 기법 개발 트위터 사용자 프로파일링(User Profiling)시스템 모듈 구현 자연어처리 연구실 개체명 인식 시스템 개발 및 적용 멀티미디어 연구실 그래픽 콘텐츠에 대한 유사 콘텐츠 검색 엔진 개발 삼성 Tizen 단말기 상에서 멀티미디어 데이터를 처리하는 응용 프로그램 개발 (Native 응용) 데이터공학 연구실 대용량 지리 정보 데이터에 대한 LBS(Location Based Service) 질의 처리 기법 개발 분산 환경에서 Hadoop을 이용한 Grid-Based Skyline 질의처리 기법 구현 Hadoop을 이용한 Clustering 질의처리 기법 구현 Keyword-set based partitioning clustering 알고리즘 개발

4 Windows 기반에서 아두이노 개발 툴(C++) 과 Pycharm(Python)으로 구현
융합소프트웨어 연구실 (1/1) 프로젝트 제목: IoT 기기의 블록체인 연동 개발 및 기기 식별 방안 연구 - IoT 기기(아두이노R3)와 블록체인(SEChain)과의 데이터 통신 개발 - 기기와 블록체인 네트워크 연동 후 기기 식별 방안 연구 참여 가능 인원: 2~3명, 예상기간: 6개월 프로젝트 개요 개요 IoT 기기간의 통신 보안성 향상 및 탈중앙화를 위하여 기기 자체가 블록체인 노드가 되어 분산화된 환경에서의 기기간 연결을 추진하고 기기의 적합성 판단을 위해 식별 방안을 연구 내용2(응용) 블록체인의 기본 개념을 이해하고 이에 대한 응용 방안으로 IoT 기기를 블록체인 노드로서 활용하고 이에 기반한 응용 서비스 개발이 최종 목표(Ex. 이더리움 스마트컨트랙트 기반의 물류 서비스 개발) 구현언어 및 환경 Windows 기반에서 아두이노 개발 툴(C++) 과 Pycharm(Python)으로 구현

5 컴퓨터 그래픽스 연구실 (1/2) 제목: Vulkan API와 OpenGL API와의 비교를 통한 차세대 3D 그래픽스 프로그래밍의 이해 참여 가능 인원: 팀 당 1~3명, 예상기간: 6 ~ 8개월 전후 프로젝트 개요 Vulkan은 고성능 PC부터 게임기, 그리고 저성능의 임베디스 시스템까지 여러 플랫폼의 GPU 상에서 활용할 수 있는 차세대 3D 그래픽스 프로그래밍 API임 (2016년 2월 Vulkan 1.0 발표 / 본 프로젝트에서는 기존의 OpenGL API와의 비교를 통하여 Vulkan API를 이해하고, 향후 다양한 플랫폼 상에서의 그래픽스 프로그래밍에 대한 기술을 습득함을 목표로 함 <예상 내용> OpenGL API와 Vulkan API와의 비교 기술 문서 작성 기존의 OpenGL 기반 프로그램의 변환을 통한 Vulkan API의 이해 Vulkan API에 최적화된 3D 그래픽스 응용 프로그램 제작 Vulkan API를 이용한 비 그래픽스 문제에 대한 many-core processing 기반 고성능 병렬 처리 프로그램 제작

6 컴퓨터 그래픽스 연구실 (2/2) 제목: Google Tango API를 사용한 증강 현실 기술의 이해
참여 가능 인원: 팀 당 1~3명, 예상기간: 6 ~ 8개월 전후 프로젝트 개요 AR/VR 응용 소프트웨어의 제작에 있어 가상의 공간에서 실제 카메라(RGB 카메라/Depth camera)의 pose(위치와 방향)를 실시간으로 정밀하게 인식하는 것은 매우 중요한 작업임. 본 프로젝트에서는 Google Tango 기술이 적용된 스마트폰을 활용하여 증강현실(AR) 응용 프로그램을 개발함으로써 Depth camera 활용 기술을 습득함. 성공적으로 관련 기술을 습득할 경우 본 연구실에서 개발하고 있는 depth camera의 트래킹 기술과 접목할 예정임. 참고: <예상 내용> Tango API의 이해 및 기술 문서 작성 기본적인 예제 프로그램의 이해 자신이 제작할 증강현실(AR) 프로그램의 설계 설계한 프로그램의 개발 및 최적화 시연 및 평가

7 데이터마이닝 연구실 (1/5) 프로젝트 제목: 의료 데이터 마이닝을 통한 신장암 판별 참여 가능 인원: 2~3명
예상기간: 4개월 프로젝트 개요 TCGA (The Cancer Genome Atlas) 의 유전, 임상 및 역학 데이터로 부터 신장암 임상 지표 판별을 위한 기계학습 알고리즘 개발(예: 딥러닝) 생존 가능성과 같은 예후 예측 암의 병기 예측 생물학적 의미 발굴 고성능 GPU를 활용한 병렬 처리 모델 도출

8 데이터마이닝 연구실 (2/5) 프로젝트 제목: 동영상 데이터로 부터 관심 이벤트 추출 및 주석 생성 참여 가능 인원: 2~3명
예상기간: 4개월 프로젝트 개요 동영상으로부터 음성 및 이미지 데이터를 추출 동영상에 캡션을 추가할 수 있는 기계학습 알고리즘 개발 추출된 이종(multimodal) 데이터로 부터 다양한 이벤트를 판별, 추출할 수 있는 기계학습 알고리즘 개발 (예: 딥러닝) 고성능 GPU를 활용한 병렬 처리 모델 도출

9 데이터마이닝 연구실 (3/5) 프로젝트 제목: 재활 로봇 컨트롤 알고리즘 개발 참여 가능 인원: 2~3명 예상기간: 4개월
프로젝트 개요 안구, 근전도, 뇌파 등의 생체정보 같은 다양한 데이터를 이용하여 기본적인 재활 로봇 구동을 위한 딥러닝 기계학습 알고리즘 개발 병원에서 수집된 실제 환자 데이터에 적용하여 검증 고성능 GPU를 활용한 병렬 처리 모델 도출

10 데이터마이닝 연구실 (4/5) 프로젝트 제목: 핀테크 거래 내역 분석 시스템 참여 가능 인원: 1~2명 예상기간: 4개월
프로젝트 개요 거래 내역 분석 시스템은 거래 내역을 분석하여 패턴에서 벗어난 거래를 탐지할 수 있고, 더 나아가 사용자의 소비패턴을 파악할 수 있는 시스템을 의미 기존 머신러닝 알고리즘 및 딥러닝을 활용하여 거래 내역 분석 알고리즘 개발 고성능 GPU를 활용한 병렬 처리 모델 도출

11 데이터마이닝 연구실 (5/5) 프로젝트 제목: 실내 공기 품질 예측 시스템 참여 가능 인원: 2~3명 예상기간: 4개월
프로젝트 개요 공기 품질 측정은 측정 대상의 공기 환경의 상태 유지, 외부 변인으로 인한 상태 변화와 이상 현상을 검출하기 위한 방법 데이터의 변화 추이가 다음 대기 환경에 어떤 변화를 가져다 줄지 예측하는 모델 개발 시계열 데이터 분석에 적합한 딥러닝을 통해 높은 예측 정확도를 갖는 알고리즘 개발

12 LASS 연구실/차세대 시스템 소프트웨어 연구실 (1/2)
프로젝트1 제목: Flash 메모리 기반 SSD Firmware 개발 SSD 펌웨어 동작을 이해하고 복제를 기반으로 하는 주소 매핑 테이블 기법 구현 참여 가능 인원: 1~2명, 예상기간: 3~4개월 프로젝트 개요 목표 반도체 강국으로 국내 삼성전자와 SK 하이닉스에서 개발하고 있는 SSD의 내부 구조를 이해하고 임베디드 시스템 소프트웨어 개발을 통해 ** 시스템 소프트웨어 ** 개발자로서의 자질을 높인다. 내용 SSD 내부 펌웨어를 개발을 수행한다. 최근 NAND 플래시 기반 SSD는 내부 여러개의 Channel들로 구성된다. Page 기반 Address Mapping Table을 사용하는 경우 논리적인 주소와 물리적인 주소의 Mapping Table 전체가 플래시에 존재하는데, Channel의 상태에 따라서 접근 지연이 발생할 수 있다. 본 연구에서는 Mapping Table를 플래시에 여러개 복제하여 Idle Channel에 주소 매핑 엔트리를 접근하는 플래시 펌웨어를 개발한다. 구현언어 및 환경 C언어를 이용하여 OpenSSD Jasmine Board 기반에서 Flash Translation Layer (Address Translation Layer과 Garbage Collection) 구현 코드를 이해하고, Channel의 Busy 상태에 따라 Mapping redirection을 구현 Figure 1.3. Block Diagram for FTL Firmware in SSD Figure 1.1. Samsung Solid State Drive (Example) Figure 1.2. Jasmine OpenSSD Platform

13 LASS 연구실/차세대 시스템 소프트웨어 연구실 (2/2)
프로젝트2 제목: Secure SSD의 Key Management를 위한 Linux 디바이스 드라이버 개발 및 SSD Firmware 수정/개발 SATA 프로토콜을 이해하고, 리눅스 디바이스 드라이버에 블록 Key 생성기를 작성한 후 디바이스로 통신하는 프로토콜 개발 참여 가능 인원: 1~2명, 예상기간: 3~4개월 프로젝트 개요 목표 SSD 기반 스토리지 시스템의 보안 문제를 확인하고 해결 방안으로 암호화/복호화 방법과 별도로 Key 기반 Access-Control Mechanism을 시스템 소프트웨어로 개발한다. 과제를 통해 임베디드 시스템 프로그래밍과 리눅스 디바이스 드라이버 개발 경험을 쌓는다. 내용 탈착이 가능한 SSD의 데이터 보안성을 높이기 위해 암호화/복화화 기법을 사용한 디스크 개발이 되었다. 본 연구에서는 블록당 Key 값을 부여하여 Two-level 보안 기법을 개발한다. 개발을 위해 Linux Host 시스템 디바이스 드라이버에서 블록당 Key를 부여하는 Key Manager를 개발하고, SSD 디바이스 Firmware에서 Key 값에 따른 Access Control를 수행하여 기존의 암호화/복호화 기법과 별도로 한층 더 깊은 보안벽을 쌓기 위한 기술을 소프트웨어로 개발한다. 구현언어 및 환경 C언어를 이용하여 OpenSSD Jasmine Board (or Cosmos Board) 기반에서 개발한다. Linux 커널 공부를 수행하며 특히 SATA 디바이스 드라이버 코드를 분석하여 Key 값을 블록당 Assign하는 메커니즘을 개발한다. 반면 SSD FTL 펌웨어에서 블록당 Key 관리 기법을 구현한다. Figure 1.3. 운영체제 파일 시스템 계층과 Data Security Attack Figure 1.1. Security + NAND Flash SSD Figure 1.2. Cosmos OpenSSD Platform

14 분산 클라우드 연구실 (1/2) 프로젝트1 제목: Openstack 을 이용한 클라우드 자원 관리 (CPU, Network, Storage) IaaS 형태의 클라우드 컴퓨팅 오픈소스 프로젝트인 Openstack을 이용하여 클라우드를 구축하고 Openstack 상에서 클라우드 자원 Auto Scaling 알고리즘 개발 참여 가능 인원: 2~3명, 예상기간: 4개월 프로젝트 개요 내용1 IaaS 형태의 클라우드 컴퓨팅 오픈소스 프로젝트인 Openstack을 이용하여 클라우드를 구축. 이를 이용한 클라우드 자원 관리. 클라우드의 다양한 자원들을 효율적인 방법으로 관리하는 방법에 대한 연구 내용2(응용) 자원 관리하는 방법에 대한 연구에서 더 나아가 자원 관리 방법을 최적화 시키거나 동적으로 관리할 수 있는 연구를 진행할 수 있음. 개발 언어 및 사용 기술 Linux 환경 / Openstack / 파이썬(Python) / C언어

15 분산 클라우드 연구실 (2/2) 프로젝트2 제목: Ceph 오브젝트 Storage에서 통신 Scheduler 개발
오픈소스 오브젝트 Storage인 Ceph에서 Client의 Workload에 따른 Load balancing 알고리즘 개발 참여 가능 인원: 2~3명, 예상기간: 4개월 프로젝트 개요 내용1 오픈소스 오브젝트 Storage Ceph에서의 Client의 Workload에 따른 Load balancing 알고리즘 개발 내용2(응용) 연구를 통해 개발한 Load balancing 알고리즘과 현재 나와있는 Load balancing 알고리즘과의 비교 분석을 할 수 있고, Load balancing 알고리즘을 Ceph에 적용했을 때 성능에 끼치는 영향 분석. 개발 언어 및 사용 기술 Linux 환경 / Ceph / C++ / Network programming / Thread programming

16 CAD & Security 연구실 (1/1) 프로젝트 제목: 저전력 및 타이밍 최적화를 위한 Clock Tree Synthesis 회로가 주어진 Timing constraints를 만족하며 동작하기 위한 효율적인 clock tree 설계 및 최적화 (현재 삼성전자 S.LSI와 프로젝트 진행 중) 참여 가능 인원: 2~3명, 예상기간: 2~3개월 (인건비 지급 예정) 프로젝트 개요 개요 공정 변이에 따른 회로의 신뢰성이 중요해지고 회로가 점점 복잡해짐에 따라 저 전력 설계에 대한 필요성이 대두되고 있다. 파워 소모가 가장 많은 clock은 회로에서 가장 중요한 요소이다. 그래서 저 전력 및 신뢰성 높은 회로의 설계 및 최적화에 대한 연구가 필요하다. 내용 회로의 성능 분석을 위해 필수적인 정적 시간 분석기 구현 신뢰성 향상을 위한 공정변이 및 aging 현상을 고려한 clock tree 합성 저전력 설계를 위한 새로운 clock tree 구조 분석 및 개발 구현언어 및 환경 C 언어를 이용하여 회로의 clock tree 구성 및 path finder 모듈 구현. Hspice를 이용한 회로 성능 분석 (교육 예정) Figure 1. 공정변이 Figure 2. Clock skew

17 컴퓨터비전 & 영상처리 연구실 (1/2) 프로젝트1 제목: 원거리 물체 인식 카메라 개발
PTZ 카메라와 정적 카메라의 조합으로 원거리 물체 인식이 가능한 카메라 시스템 개발 참여 가능 인원: 2명, 예상기간: 3~4개월 프로젝트 개요 내용1 정적 카메라로부터 물체의 위치를 파악하고 PTZ 카메라를 이용하여 고배율 영상을 획득한다. 내용2(응용) 근적외선 투시광, 근적외선 카메라를 이용하여 야간 원거리 영상 획득을 지원한다. 구현언어 및 환경 C++를 이용하여 PC 환경에서 구현 PTZ camera Static camera Dark box Beam splitter PTZ view Static view 카메라 시스템 개념도 프로토타입 카메라 시스템

18 컴퓨터비전 & 영상처리 연구실 (2/2) 프로젝트2 제목: 드론 응용 프로그램 개발
영상을 이해하고 자율적으로 운행할 수 있는 드론을 개발하고, 유용한 응용 문제를 찾아본다. 참여 가능 인원: 2명, 예상기간: 3~4개월 프로젝트 개요 내용1 영상 처리 기술과 드론 조정 기술을 결합하여 드론에게 다양한 임무를 부여할 수 있도록 한다. 내용2(응용) 영상 기반으로 주행하는 드론을 이용하는 유용한 응용 문제를 개발한다. 구현언어 및 환경 C++/C#, PC 환경 특징점 기반 이미지 인식 예

19 Internet Communication and Control Lab (1/2)
프로젝트 1 제목 : 게임이론 기반의 스마트 그리드 최적 전력 수요 스케쥴링 및 가격 최적화 기술 참여 가능 인원 및 예상기간 : 2~3명, 2~3개월 프로젝트 개요 본 연구는 전력 제공자의 입장과 전력 사용자의 양측의 환경을 고려한 최적의 가격 과 수요를 결정하여 높은 전력 사용량 시간대의 전력을 낮은 전력 사용량 시간대로 변경을 유도하여 최고조 전력 사용 시간대의 전력 사용량을 감소시켜, 전력 제공자의 부담을 줄여, 전력 사용자의 지불 금액을 감소 시키는 수요 최적화 연구이다. Smart Energy Controller Modeling Team 과 Mechanism Design for Smart Grid Team 의 이원화된 팀 구성을 통해 각 팀 모두 [구축/지원] → [개별 최적화] → [통합 최적화]의 3단계 구성으로 진행한다. 특히 본 연구팀의 연구를 통한 구축, 지원 및 최적화 기술의 상용화 수준 검증을 위해 먼저 실제 상황을 모델링하여 프로토타입을 구축 한다. 참여 학부생은 개별 최적화 부분에서의 관련 논문 연구에 집중 할 예정이다. Figure 1. 스마트 그리드 최적화 모델

20 Internet Communication and Control Lab (2/2)
프로젝트2 제목 : 게임이론 기반의 효율적인 IoT 트래픽 처리를 위한 Data Offloading기법 연구 참여 가능 인원 및 예상기간 : 2~3명, 2~3개월 프로젝트 개요 본 연구는 게임이론 기반의 효율적인 IoT 트래픽 처리를 위한 Data Offloading기법 연구이다 VCG 메카니즘 디자인 기반의 Data Offloading 유도를 위한 최적 할인 가격 결정 Rubinstein Bargaining 기반의 Access Point Operator 협력 유도를 위한 Incentive 결정 Figure 2. IoT 통신환경과 게임이론 기반의 효율적 IoT트래픽 처리 기법

21 데이터베이스 연구실 (1/2) 프로젝트1 제목: 서로 다른 서비스 사용자간 동일 인물 추론 기법 개발
참여 가능 인원: 2~3명, 예상기간: 2~3개월 프로젝트 개요 내용1 네이버 상의 서로 다른 서비스(뉴스, 카페, 영화, 웹툰, etc)를 사용하는 사용자의 ID 정보와 사용 시간, 빈발 단어를 사용하여 동일 인물임을 추론하고 이를 통해 각 사용자에 대한 개인 프로필을 구축함 구현언어 및 환경 Python과 MongoDB를 사용하여 각 사용자 별 데이터와 프로필 정보를 관리하고, JavaScript 기반 D3 Library를 이용하여 결과를 시각화함 Structured Data UnStructured Data Crawling 개인정보 추출 서로 다른 사용자간 연결 서로 다른 서비스간 동일 사용자 추론 개인정보 DB 구축 서로 다른 서비스간 동일 사용자 추론

22 데이터베이스 연구실 (2/2) 프로젝트2 제목: 트위터 사용자 프로파일링(User Profiling) 시스템 모듈 구현
참여 가능 인원: 2~3명, 예상기간: 2~3개월 프로젝트 개요 내용1 트윗 스트리밍 데이터를 수집하고 토픽 모델링 기반 관심사를 추론한 후, 공통 관심사를 지니는 사용자 그룹을 찾아내어 트위터 사용자에 대한 프로파일링. 사용자 네트워크를 구성하고 공통 관심사 그룹을 표시할 수 있는 시각화(visualization) 모듈 구현. 내용2(응용) 트위터 위치 태그 정보를 이용해 사용자들의 주 활동영역(home location)과 부 활동영역을 구분. 사용자들의 활동 패턴을 분류한 후 사용자 프로파일링 모듈에 추가. 구현언어 및 환경 JAVA(또는 Python)언어와 JavaScript 기반 D3 Library를 이용하여 Ubuntu 기반 서버 환경에 사용자 프로필 정보를 추출하고 시각화(visualization) 모듈 구현 Unknown users Feature vector extraction Text based Estimation Community detection Community estimation Calculate degree of membership User profiling tweets List of terms Extraction of characteristic terms Feature vector extraction Training Classifier Register Known users tweets

23 서강대학교 서정연 교수님 연구실에서 인턴을 모집합니다.
자연어처리 연구실 (1/1) 프로젝트 제목: 개체명 인식 시스템 개발 및 적용 2017 국어 처리 시스템 경진 대회 출전 참여 가능 인원: 2~3명, 예상기간: 3개월 프로젝트 개요 내용 1 국립 국어원 학습 말뭉치를 이용한 개체명 인식기 개발 내용2 기계 학습을 이용한 개체명 인식기 개발 내용3 통계적 방법을 이용한 개체명 인식기 개발 구현언어 Python 혹은 JAVA 개체명 인식 예시 서강대학교 서정연 교수님 연구실에서 인턴을 모집합니다. 기관명 인물

24 멀티미디어 연구실 (1/2) 프로젝트1 제목: 그래픽 콘텐츠에 대한 유사 콘텐츠 검색 엔진 개발
Style-기반 유사 클립아트 콘텐츠 검색 엔진 개발 Layout 기반 유사 Infographic 콘텐츠 검색 엔진 개발 참여 가능 인원: 2~3명, 예상기간: 3~4 개월 프로젝트 개요 내용1 Clipart 및 Infographic가 저장되어 있는 멀티미디어 아카이브에 대하여 질의 Clipart 콘텐츠와 style이 비슷한 콘텐츠 검색 질의 Inforgraphic 콘텐츠와 layout이 비슷한 콘텐츠 검색 구현언어 및 환경 개발 환경 : Windows 환경 개발 언어 : Visual C++ 사용 라이브러리 : OpenCV 등의 이미지 분석 라이브러리를 이용하여 구현

25 멀티미디어 연구실 (2/2) 프로젝트2 제목: 삼성 Tizen 단말기 상에서 멀티미디어 데이터를 처리하는 응용 프로그램 개발 (Native 응용) 예1 :Tizen (Linux-based) 상에서 얼굴 인식 프로그램 개발 예2: Tizen상에서 mini-photoshop 개발 예3: 부가 기능을 제공하는 동영상 상영기 참여 가능 인원: 2~3명, 예상기간: 3~4 개월 프로젝트 개요 내용 삼성전자에서 OpenSW로 개발 중인 Tizen 플랫폼상에서 멀티미디어 처리 라이브러리를 이용한 native 응용 개발 (Tizen App 개발) 구현언어 및 환경 개발 환경 : Tizen 환경 개발 언어 : C 언어 + Tizen SDK 사용 라이브러리 : Tizen에서 사용 가능한 다양한 멀티미디어 라이브러리를 이용 (OpenCV, Video Codec 등) Tizen Emulator 및 실제 삼성 Z3 스마트폰상에서 개발

26 데이터공학 연구실 (1/4) 프로젝트1 제목: 대용량 지리 정보 데이터에 대한 LBS(Location Based Service) 질의 처리 기법 개발 참여 가능 인원: 1~2명, 예상기간: 2~3개월 프로젝트 개요 내용1 대상이 되는 지리 정보 데이터는 figure 1과 같은 Road Network입니다. Road network는 figure 2와 같이 그래프로 표현되며, 이런 데이터를 대상으로 shortest path, range, kNN 질의 등의 LBS 질의 처리 기법을 개발합니다. 내용2(응용) Road network는 대용량 데이터이기 때문에 분산 파일 시스템을 활용하여 저장하고, 질의 처리 알고리즘을 병렬화 할 필요가 있습니다. 따라서 우리는 figure 3에서 예로 든 NoSQL DBMS와 같은 cloud infrastructure를 사용하여 road network를 저장하는 방법과, 저장된 데이터에 대한 효과적인 질의 처리 기법을 개발합니다. 구현언어 및 환경 Hadoop, MapReduce,HBase 등의 기술을 활용합니다. 프로그래밍 언어는 java, 혹은 python을 권장합니다. Figure 1. Road Network Figure 2. Graph modeling Figure 3. NoSQL DBMS

27 데이터공학 연구실 (2/4) 프로젝트2 제목: 분산 환경에서 Hadoop을 이용한 Grid-Based Skyline 질의처리 기법 구현. Numerical Big data에서 Decision Making 등을 위한 Skyline Query 기법을 개발한다. Grid를 이용한 효율적인 Region Pruning을 이용하여 성능을 향상시킨다. 참여 가능 인원: 1~2명, 예상기간: 2~3개월 프로젝트 개요 내용1 도심의 skyline과 같이 모든 속성들에 대해 다른 데이터보다 나쁘지 않는 데이터를 찾는 skyline 질의를 Grid 기반으로 구현한다. 구현된 알고리즘은 MapReduce Framework를 사용해서 분산 병렬적으로 수행된다. 내용2(응용) 구현된 알고리즘의 단점을 보완하는 아이디어를 연구하여 향상된 알고리즘을 제안한다. 구현언어 및 환경 Linux, Java, Hadoop Framework Fig. 1. Skyline Fig. 2. Skyline Query Fig. 3. MapReduce flow

28 데이터공학 연구실 (3/4) 프로젝트3 제목: Hadoop을 이용한 Clustering 질의처리 기법 구현.
Numerical Big data에서 유사한 데이터들의 묶음을 찾는 Clustering 기법을 구현한다. Streaming data에 대한 Clustering을 수행하는 알고리즘을 구현한다. 참여 가능 인원: 1~2명, 예상기간: 2~3개월 프로젝트 개요 내용1 데이터 집합을 유사한 데이터의 묶음(cluster)으로 나누는 걸 clustering이라고 한다. MapReduce기반 clustering 알고리즘을 구현함으로써, 여러 머신들을 동시에 사용하여 Big Data에서 빠르고 정확하게 cluster들를 찾는다. 내용2 Sensor device, 혹은 IoT device 등을 통해 끊임없이 입력되는 데이터(Streaming data)를 유사한 데이터의 묶음(cluster)으로 나누는 clustering 알고리즘을 구현한다. 구현언어 및 환경 Linux, Java, Hadoop Framework Fig. 1. Clustering Fig. 2. MapReduce Fig. 3. Streaming Data

29 데이터공학 연구실 (4/4) 프로젝트4 제목: Keyword-set based partitioning clustering 알고리즘 개발. Real data인 instagram data를 crawling하여 얻은 데이터를 clustering 하는 알고리즘 개발. Jaccard similarity를 이용하여 성능 향상을 시킴. 참여 가능 인원: 1~2명, 예상기간: 2~3개월 프로젝트 개요 내용 Instagram과 같은 SNS에는 수억개의 텍스트 데이터(ex. tag)가 저장되어있다. 이 데이터를 키워드 집합으로 처리하여 clustering한다. Clustering된 결과를 통해 사람들이 직관적으로 생각할 수 있는 상관관계가 아닌, 대용량 데이터의 분석으로 알아낼 수 있는 새로운 상관관계를 찾아낸다. 구현언어 및 환경 Python, Java를 이용하여 Linux 환경에서 구현하고 실험한다. Fig. 1. Keyword Clustering Fig. 2. Categorization of keywords Fig. 3. Jaccard Similarity


Download ppt "연구실 인턴쉽 안내자료 컴퓨터공학과 2017학년도 1학기."

Similar presentations


Ads by Google