제 9장: 파일과 데이터베이스 데이터 구성에서부터 데이터 채굴 까지.

Slides:



Advertisements
Similar presentations
Web Based Data Warehouse Query Tool 이화여자대학교 2002 년 컴퓨터학과 졸업프로젝트 14 조.
Advertisements

- 1 - 사용설명서 – 전자세금계산서 (EBANK36524) [ 회계 ] ERPM3 에서 입력한 매출세금계산서 ( 계산서 포함 ) 를 전자적으로 발행합니다. ( 전자세금계산서발행 메뉴 ) ** 국세청전송 년 11 월 1 일부터 시범운영.
한글워드프로세서 목 차 1. 한글 워드 프로세서의 변천사 2. 키보드 사용법 3. 한글 워드 프로세서 실습.
1 SQL 정보보호학과 양 계 탁. 2 SQL 개요 SQL 개요 3 Database u 연관된 데이터들의 집합 u 데이터를 쉽게 관리하는 프로그램 종 류종 류 관계형 데이터베이스 객체지향형 데이터베이스 계층형 데이터베이스 네트워크 데이터베이스 데이터를 2 차원적인 테.
제5장제5장 데이터베이스처리. Q1 데이터베이스의 목적은 무엇인가 ? Q2 데이터베이스는 무엇을 포함하는가 ? Q3 DBMS 란 무엇이며, 어떻게 사용하는가 ? Q4 데이터베이스 애플리케이션이 무엇인가 ? Q5 전사적인 것과 개인적인 DBMS 의 차이점은 무엇인가 ?
1 인사급여관리 시스템 컴퓨터응용과학부 4 학년 오 미 현오 미 현 2 업무적용 입사 신상정보 퇴직급여산정 퇴사 근무 근태상황, 급여관리 전산화.
대기전력저감프로그램 인터넷 신고 방법 에너지관리공단 효율표준실 1.
메모장 다루기 A. 메모장 실행법 시작>모든 프로그램> 보조 프로그램>메모장 Notepad
소프트웨어시스템 실험 Software Systems Lab. (2012년 2학기) 강의 소개
06장. <A> 태그로 하이퍼링크 설정하기
소리가 작으면 이어폰 사용 권장!.
Chapter 7 데이터웨어하우징 의사결정지원시스템.
문서 PARSONS/OJA 문서, 워크시트, 데이터베이스 Page 1 1.
질의어와 SQL 기본 SQL 고급 SQL 데이타의 수정 데이타 정의 언어 내장 SQL
Qman QMan QMan 이란? QMan은 문제등록 및 관리하는 프로그램으로 문제분류별 관리, 문제입력, 문항분석, 동영상, 이미지, 음성, 수식입력, 일괄입력 기능, 오류문제 수정 기능 등을 이용하여 편리하게 문제은행을 구축할 수 있습니다.
2017년 충청북도교육청 개인정보보호 및 정보보안 교육자료 실무 중심의 개인정보보호 및 정보보안 적용방안
주요공지사항.
효과적인 DB암호화 구축을 위한 애슬론 v1.5 제안
Chapter 05 SQL 인젝션 공격.
JDBC 프로그래밍 이수지 이동주 1.
DB 구축과 프로그래밍 CASE 도구인 ERwin을 설치하고 셋업하는 방법을 익힌다.
Information Technology
정보이론 PARSONS/OJA 데이터의 표현 1.
데이터베이스 와 JDBC 1.데이터베이스와 데이터베이스 관리 시스템은? 2.데이터베이스 장점?
데이터 베이스 란? 데이터 베이스 기능 데이터 베이스 관리 시스템 정보시스템의 구성 관게형 데이터 베이스
11장. 데이터베이스 서버 구축과 운영.
인스톨쉴드9 데브스튜디오 사용 매뉴얼 (VB6에서 개발후 배포프로그램 만들기)
제 8장. 멀티미디어 데이터베이스 및 정보검색 시스템
2007. Database Term Project Team 2 윤형석, 김희용, 최현대 우경남, 이상제
롯데마트 CRM 데이터 분석 교육 2014년 12월 > RE::VISION 전용준 리비젼컨설팅 대표
9. 데이터베이스 9.5 SQL을 사용하는 프로그램 9.6 데이터폼 작성기를 사용하는 프로그램
6장. 물리적 데이터베이스 설계 물리적 데이터베이스 설계
차례 튜닝 - 프로필러를 이용한 튜닝 프로필러 친해지기 프로필러 결과 테이블로 만들기 프로필러 결과 분석하기
담당교수 : 이형원교수님 컴퓨터응용과학부 정은영
소프트웨어시스템 실험 Software Systems Lab. 데이터베이스 기초
제 2 장 데이터베이스 시스템 개념과 아키텍처 Fundamentals of Database Systems
단일 테이블 조회를 위한 SELECT 문을 이해한다. 열 제약조건과 행 제약조건을 이해한다. 결과 집합 변경 방법을 이해한다.
Software Engineering Project
YOU Youngseok 트랜잭션(Transaction) YOU Youngseok
01 데이터베이스 개론 데이터베이스의 등장 배경 데이터베이스의 발전 과정 데이터베이스의 정의 데이터베이스의 특징
DataBase 연결 및 사용방법
장애학생 인권보호 범죄예방교육 00초등학교 도움반.
상용 DBMS에서 사용하는 다차원색인 컴퓨터과학과 이돈규 상용 DBMS에서의 다차원색인.
제 9장: 파일과 데이터베이스 데이터 구성에서부터 데이터 채굴 까지.
제 20 장 오라클에서 회복 및 백업 기능.
Database Programing 이름 : 김 수 종 학번 :
JSP 게시판 구현.
1조 김성수 백현기 석광우 김지원 박광연.
Database 중고차 매매 DB 비즈니스IT 윤동섭.
McGraw-Hill Technology Education
3장. SQL Server 2008전체 운영 실습 및 DB와 프로그램의 연동
학습목표 학습목표 본 장은 동시성 제어와 잠금(lock) 등 효과적인 트랜잭션 관리 기법 과 필요한 명령을 다룬다. 또한 데이터베이스의 장애에 대비하여 안전한 데이터의 관리를 위한 백업과 복원 기법, 서로 다른 DBMS 간이나 다른 서버 사이의 데이터 교환을 위한 데이터.
01. 데이터베이스와 SQL 개요.
McGraw-Hill Technology Education
의사결정지원시스템 개요 Database DBMS D G M S MBMS Modelbase User Interface
Ⅳ. 컴퓨터와 생활 오 산 중 학 교.
ITQ 액세스 문제풀이 TIP 한국생산성본부 ITQ센터
시스템 분석 및 설계 글로컬 IT 학과 김정기.
SQL INJECTION MADE BY 김 현중.
파일 구조의 이해 PE Format 안녕하십니까
E메일: ■ 2003년 8월 19일 ■ COEX 그랜드볼륨 (주)미소닷컴 e메일:
2015년도 스마트공장 지원사업에 대한 사업비 타당성 평가
주)INVENTORNICS 노창배 소프트웨어 김 경 순
제 8장 데이터베이스.
뇌를 자극하는 Windows Server 장. 데이터베이스 서버.
기술가정 2학년 2학기 4. 컴퓨터와 생활 >1) 소프트웨어의 활용 > 2~3/18 그림 자료는 어떻게 만들까?
Data Base Mysql.
2장. 데이터베이스 관리 시스템 데이터베이스 관리 시스템의 등장 배경 데이터베이스 관리 시스템의 정의
Presentation transcript:

제 9장: 파일과 데이터베이스 데이터 구성에서부터 데이터 채굴 까지

9.1 크고 작은 모든 DB DB는 통합된 파일들의 조직화된 집합. DB의 예 개인, 소용량 DB Pradox, Access, dBASE 5 및 FoxPro 대학원생의 연구조사, 판매원의 고객관리 정보 유틸리티(온라인 서비스) American online, CompuServe, Microsoft Network 뉴스, 날씨, 여행정보, 홈 쇼핑 서비스, 기술정보 법률 정보 시스템 대학도서관: 도서목록카드의 전자 DB화

데이터 베이스 관리자(Database Administrator:DBA) 공유DB와 분산DB 공유 DB 동일한 지역에 있는 회사나 기관의 사용자들에 의해 공유 하나의 DB가 회사의 미니컴퓨터에 저장, 사용자들이 네트워크로 연결된 터미널을 이용해 접근 분산 DB 서버/클라이언트 네트워크로 연결된 여러 컴퓨터에 저장된 DB 체인 할인 매장의 예 사용자는 DB의 위치를 모른다. 데이터 베이스 관리자(Database Administrator:DBA) DB 설계, 구현, 및 운영 사용자와의 조정:사용자의 접근권한결정, 문서 입력 절차 개발 시스템 보안: 무단접근 방지위한 시스템 설정 및 감시 백업과 복구:정기적 백업, 복구계획 수립 성능 감시: 정상가동을 위한 성능감시

9.2 데이터 저장 계층과 키 필드의 개념 데이터 저장 계층 필드 한 개 이상의 문자(바이트)로 구성되는 데이터의 단위 예) 이름, 주소, 주민등록번호 등 레코드 관련되는 필드들의 집합 예) 이름, 주소 그리고 주민등록번호의 집합 파일 레코드의 집합 예) 같은 부서의 직원들에 대한 데이터 데이터 베이스(DB) 통합된 파일들의 조직화된 집합 예) 전/현직 종업원들에 대한 모든 정보

패널 9.3 데이터 저장 계층에 대한 고찰

키 필드 정의: 레코드를 쉽게 검색하거나 처리할 수 있도록 유일하게 레코드를 식별하기 위해 선택된 필드 예: ID 번호, 주민등록 번호, 고객의 계좌번호 이름은 키필드로 사용될 수 없다. 같은 이름을 가진 사람이 존재 9.3 파일관리: 기본개념 파일관리 기능 생성, 명명, 저장, 삭제, 복사 불러오기, 수정 및 인쇄 업로드, 다운로드, 압축 가져오기(import), 보내기(export)

파일의 종류 파일의 추적 확장자를 보고 구분 프로그램 파일(EXE, COM, DLL) 데이터 파일(DOC, MDB, XLS) ASCII파일(TXT) 이미지 파일(TIF, JPG, BMP) 오디오 파일(WAV, MID) 비디오 파일(AVI, MPG) 파일의 추적 운영체제가 기능제공 디렉토리(폴더)들을 생성하여 효율적 관리 운영체제는 파일할당 테이블(file allocation table) 유지

데이터 파일의 두 종류: 마스터 파일과 트랜잭션 파일 정기적으로 갱신되는 비교적 영구저장을 목적으로 하는 레코드를 담고 있는 파일이다. 예) 한 학교의 모든 재학생에 대한 주소-라벨 파일 트랜잭션 파일 마스터 파일을 추가, 삭제, 수정에 의해 갱신하는데 필요한 모든 변동사항을 일시적으로 저장하는 파일 예) 새로 추가되거나 삭제되는 학생들의 정보 파일 데이터 변경 방법 일괄처리(Batch Processing) 데이터를 몇 일 또는 몇 주에 걸쳐 수집한 다음 한꺼번에 처리 온라인 처리(실시간 처리) 트랜잭션이 일어나는 컴퓨터 시스템에 그 트랜잭션을 입력하여 마스터 파일을 즉시 갱신. 현금인출기, 항공사의 예약 서비스

오프라인 저장과 온라인 저장 오프라인(offline) 저장 내용을 담은 테이프나 디스크가 입력장치에 로드 되기 전까지는 데이터에 직접적으로 접근할 수 없는 것 중앙처리장치의 직접적인 통제를 즉시 받지 않는다. 온라인(online) 저장 데이터를 처리하기 위해 직접적인 접근을 할 수 있는 것 중앙처리장치의 직접적인 통제를 즉시 받는다

9.4 파일 관리 시스템 정의:파일 관리 시스템 혹은 파일 관리자는 한번에 한 파일씩 파일을 생성하고, 검색하며, 조작하는 소프트웨어 배경:초기 컴퓨터는 마그네틱 테이프를 저장 매체로 사용하고 레코드와 파일이 순차적으로 저장 예:대학과 같은 큰 조직은 서로 다른 목적을 위한 여러 개의 다른 파일들을 가진다. 파일 관리 시스템의 단점 데이터 중복: 서로 다른 파일 내에 같은 데이터 필드가 존재 데이터 무결성의 부족 무결성은 데이터가 정확하고, 일관성 있고, 최신이라는 것을 의미 같은 데이터 필드의 내용이 서로 다른 파일 내에서 다른 경우가 쉽게 발생 프로그램 독립성이 부족 각 데이터 마다 별도의 포맷사용

패널 9.4 파일 관리 시스템

9.5 데이터 베이스 관리 시스템(DBMS) 마그네틱 디스크의 사용: 직접 접근 저장 파일 관리 시스템의 문제점 해결 DBMS 소프트웨어: DB의 구조와 데이터 접근을 관리

DBMS의 장점과 단점 장점 줄어든 데이터의 중복 개선된 데이터 무결성(데이터의 정확성 및 일관성확보) 향상된 프로그램 독립성 증가된 사용자 생산성 증가된 보안성(사용자 권한 제한) 단점 (설치 및 훈련) 비용이 많이 든다. 보안성 문제 프라이버시 문제

9.6 데이터베이스 구조의 종류 계층형 데이터베이스 계층형, 네트워크 형, 관계형, 객체 지향형 정의 필드나 레코드는 상위 레벨 레코드에 종속되는 하위레벨 레코드를 가진 가계도를 닮은 관련된 그룹으로 배열 하위 레코드는 자식(child), 상위레코드는 부모(parent), 최상부의 부모를 루트(root) 레코드 일대다 관계: 부모는 하나이상의 자식을 가질 수 있고 한 자식은 오직 한 부모만 가진다. 특징 구조(레코드 간 관계)가 미리 정의 -> 접근과 갱신이 빠르다. 새로운 필드를 추가하려면 전체 DB를 재정의

패널 9.6 계층형 DB: 유람선 예약 시스템

네트워크형 데이터베이스 정의 계층형과 비슷하나, 각 자식 레코드는 하나 이상의 부모 레코드를 가질 수 있다. 멤버(member) 라고 불리는 자녀 레코드는 하나 이상의 부모를 통해서 접근할 수 있으며 이 때 그 부모를 소유자(owner)라고 한다 특징 계층형 보다 유연하다. 구조가 미리 정의 링크 수에 제한

패널 9.7 네트워크형DB: 대학의 수업 스케줄링 시스템

관계형 데이터 베이스 객체 지향형 데이터베이스 정의 데이터 요소들을 행과 열로 만들어진 테이블에 저장 테이블을 관계, 행은 튜플(레코드), 열은 속성(필드) 모든 테이블은 각 행을 유일하게 식별하는 키 필드를 가져야 함 특징 사용하기 쉬워 가장 많이 사용됨, 계층형/네트워크형 보다 더 융통성을 가짐, 테이블의 요소를 추가 삭제 수정 용이, 검색 시간이 많이 걸린다 객체 지향형 데이터베이스 정의 멀티미디어 데이터를 통합하고 저장 목적 작고 재사용 가능한 덩어리인 객체를 기본 요소로 사용 객체는 (1)텍스트, 음향, 비디오 및 사진의 형태로 된 데이터와 (2) 데이터에서 취할 행동에 대한 명령어로 구성 특징 높은 개발 비용, 멀티미디어 데이터를 저장하고 가공 용이

패널 9.8 관계형 DB: 자동차 DB의 주정부 부서의 예

9.7 DBMS의 특성 데이터 사전, 유틸리티, 질의어, 보고서 생성기, 접근보안, 시스템 복구 데이터 사전 데이터 입력 시 정의와 부합하는 지 검사 누가 그것에 접근할 권한을 가졌는지 지적 유틸리티 데이터, 레코드와 파일을 생성, 편집, 삭제 함으로써 DB 유지하는 프로그램 질의어(Query language) DB에 질의하고 선택된 레코드를 검색하는데 사용하는 컴퓨터 언어, EX) SQL, QBE, 자연어 SQL 질의의 예 SELECT PRODUCT.NUMBER, PRODUCT.NAME FROM PRODUCT WHERE PRICE < 100.00

예에 의한 질의(QBE:query by example) 원하는 레코드에 대한 자격을 정의하는 샘플레코드를 사용하여 레코드를 선택 질의의 예(적절한 필드에 원하는 검색조건 입력) 자연어 질의 “얼마나 많은 판매 대리인들이 1월에 서부지역에서 백만달러 어치 이상의 책을 판매했는가? NAME CITY STATE ZIP AMOUNT OWED BEVERLY HILLS CA >=3000

보고서 생성기 DB의 전체나 일부를 화면이나 인쇄된 문서로 출력하기 위해 사용하는 프로그램, 미리 보고서의 포맷을 명시 접근 보안 논리적 보호 권한을 부여 받지 않은 접근과 파괴를 근절 한 그룹의 사용자는 갱신과 삭제 권한 소유, 다른 그룹의 사용자는 검색만 가능 물리적 보호 백업된 디스크를 통제된 보호 저장실에 보관

시스템 복구 HW 혹은 SW 장애가 발생했을 때 관리자가 DB의 내용을 복구할 수 있는 기능 4가지 방법 미러링 : 물리적으로 DB를 두개의 사본으로 유지 동시복사 빈번히 행함, 빠른 복구 재처리 : 알려진 과거의 시점에서부터 작업을 재처리 주기적인 DB복사, 그 시점부터 트랜잭션들 저장 롤포워드 :재처리의 변형 복잡한 버전의 트랜잭션 로그를 사용 롤백 : 원치않는 변경의 취소

패널 9.9 DBMS의 중요특징 요약

9.8 데이터 채굴, 데이터 창고 및 데이터 시프트 데이터 채굴(data mining) 대규모 병렬 데이터 베이스 컴퓨터들은 수십 개의 가장 빠른 주변의 마이크로 프로세서를 함께 모아서 수분 내로 복잡한 데이터 베이스 질의에 반응하는 매력을 준다 데이터 채굴(data mining) 데이터 채굴( 지식의 발견) 의미를 발췌하고 새로운 지식을 발견하기 위해 방대한 양의 데이터를 분석하고, 정밀 조사하는 컴퓨터의 보조에 의한 처리 과정 목적: 과거의 추세를 기술하고, 마케팅, 생산 그리고 재정적 데이터를 정밀 조사하고 무엇이 가치, 있는 데이터인지 식별 응용 예 마케팅(고객의 기호와 소비형태 이해), 건강(선수들에 영향을 미치는 요소 분석), 과학(유전 데이터, 분자구조, 지구의 온도 변화들에서 새로운 패턴발견)

데이터 채굴 처리과정

발견과 분석을 위한 “시프트 웨어” 데이터 채굴의 몇 가지 함정 목적 데이터 채굴을 수행하기 위해 즉, 업무를 찾고 분석하는 일을 수행하기 위해 사용 종류 질의 및 보고 도구 다차원 분석 도구 지능 에이전트 데이터 채굴의 몇 가지 함정 몇 가지 이상한 것은 순수한 우연 어떤 선입견을 지지하기 위해 증거가 발견 과다한 요소는 더 많은 관계를 산출 할 수 있다.(valid or not) 설명이 그럴 듯해야 한다.

9.9 데이터베이스 사용에 관한 윤리 부정확하거나 불완전한 데이터 베이스 데이터베이스가 정확한지를 확신할 수 있는가? 데이터베이스가 프라이버시를 지키는 면에서 안전한지를 확신할 수 있는가? 정확성 및 완전성 ( 데이터 베이스의 한계 ) 전체 이야기를 알 수 없다(DB는 정보를 얻기 위한 시발점) 그것은 복음성가가 아니다(컴퓨터에서 본 것의 확증 찾기 필요) 범위를 알아라.(DB 구축 범위) 올바른 검색 단어(keyword)를 찾아라. 역사가 제한되어 있다.(대부분 1980년대 이후)

프라이버시 문제 사람들이 자신에 대한 정보를 밝히지 않을 권리 Computer Matching and Privacy Protection Act ( 1988 년 ) 금융 자신의 신용 관련 기록에 접근 허용 이의를 제기할 수 있는 권리 신용이 거절되더라도 접근을 무료로 행할 수 있음 건강 미국에는 의료기록을 보호하는 연방 법안 없음 의료관계 질문지나 기록에 일상적으로 기입하지 않는 것이 가장 좋은 방법 담당의사에게 최소한의 정보 공개 요구 담당의사나 병원에 자신의 의료기록 복사본 요구

고용 고용주가 지원자에게 신용관계 기록이 고용의 일부 조건으로 사용되고 있음을 알리고 신용 관계 기록을 조사하는 것에 대해 허락을 받도록 기업은 사적으로 대화하는 사원의 말을 엿듣는 것을 금한다. 사업관련 전화의 통화 내용을 들을 수 있고, 모든 구어가 아닌 개인 통신을 감시할 수 있다. 회사의 전자우편 시스템에서 이루어지는 전자우편은 회사의 소유가 된다. 상거래 벌거벗은 소비자 예외적인 경우를 제외하고 기업들이 어떤 목적으로 개인에 대한 정보를 수집하여 동의 없이 이를 다른 목적으로 사용하는 것이 금지되어 있지 않다. 운전면허 기록과 같은 공용 정보 출처와 보증 카드와 같은 상거래 모두에서 수집 비디오 관련 프라이버시 보호에 관한 법령: 소매업자들이 고객의 동의나 법원의 명령 없이 비디오 대여 기록을 폭로하는 것을 금한다.

향후 개발 : 정보 중개업( information brokering ) 정보 독점 하나의 기업이 회사 소유의 데이터베이스에 대한 독점적인 디지털 권리를 갖고 있는 것에 아무런 윤리적인 문제가 제기되지 않는가? 향후 개발 : 정보 중개업( information brokering ) 특정 주제에 관련해서 기록되고 출판된 모든 것을 탐색 (컴퓨터 데이터베이스와 통신망) 한 명 혹은 두 명으로 구성된 회사 적은 투자로 자신의 사업체 소유 시간상의 유연