제 2 장 컴퓨터의 자료 표현 2.1 자료 표현 단위 2.2 자료 표현 방법 2.3 수치형 자료 표현 2.4 비수치형 자료 표현
2.1 자료 표현 단위 비트 (BIT) 2 진법 한 자리를 기억하는 자료 표현의 최소 단위로서, 반도체 회로에 전류가 흐르는 상태 와 흐르지 않는 상태, 스위치가 ON 되어 있는 상태와 OFF 되어 있는 상태 등과 같은 요소를 가지고 있는 소자를 개념적으로 (Binary digit) 비트라고 한다. 2 진법에서 2n 개의 이산 원소의 집단을 나타내기 위해서는 최소한 n 개의 비트 가 필요하다.
2.1 자료 표현 단위 니블 (Nibble) 4 개의 비트들이 기억 공간에 연속적으로 모여 서 이루어진 단위를 의미한다. 즉, 1Nibble = 4 비트이다.
2.1 자료 표현 단위 바이트 (BYTE) 하나의 문자 또는 숫자를 표현하는 최소 단위로서, 8 개의 비트가 모여 구성되는 비트의 집합을 의미하는 데, 컴퓨터의 기종에 따라 6 개의 비트들이 1 바이트로 하는 것도 있다. C 존 비트디지트 비트 패리티 비트 - 바이트 표현 -
2.1 자료 표현 단위 워드 (World) 컴퓨터 내에서 정보가 저장되고 연산될 때의 기본 처리 단위 를 의미한다. 일반적으로 CPU 의 레지스트 (Register) 크기를 의 미하는 것으로 워드의 크기가 16 비트인 컴퓨터와 32 비트인 컴 퓨터의 연산 속도 및 기타 성능의 차이는 대단하다. 워드 반워드 (Half World) 전워드 (Full World) 배워드 (Double World) 16 비트 : 2 바이트 32 비트 : 4 바이트 64 비트 : 8 바이트 - 워드의 종류 및 표현 -
2.1 자료 표현 단위 필드 (Field) 필드 (Field) 란 특정한 의미를 나타내기 위해서 하나 이상의 바 이트로 구성된 것을 말하는데, 이는 프로그램의 처리 단위가 된 다. 또한 필드는 레코드를 구성하는 기본 구성 단위로서 항목 (Item) 이라고도 한다. 번호성명성별생년월일우편번호출신지역 001 김은조여 부산 002 이진경여 경기 003 이왕효남 경기 004 이웅효남 경남 필드 레코드 파일 - 주소록 파일 -
2.1 자료 표현 단위 레코드 (Record) 여러 개의 항목이 모여서 하나의 단위로 취급될 수 있는 연관성을 가진 자료로서 파일의 구성 요소이다. 일반적으로 레코드는 논리적 레코드와 물리적 레코 드로 구분되는데, 논리적 레코드는 프로그램에서 처 리되는 1 개의 레코드의 단위를 의미하며, 물리적 레코 드는 레코드를 입출력하는 단위로서 몇 개의 논리적 레코드로 구성되며, 보통 블록 (Block) 이라고도 한다.
2.1 자료 표현 단위 파일 (File) 파일 (File) 이란 정보 처리의 목정상 하나의 단 위로서 연관된 레코드의 집합을 의미한다.
2.2 자료 표현 방법 자료 수치형 자료 비수치형 자료 정수형 실수형 10 진수 표형 방식 2 진수 표현 방식 팩형 10 진수 형식 존형 10 진수 형식 문자형 논리형 포인터형 고정 소수점 방식 부동 소수점 방식 표준 BCD 코드 ASCII 코드 EBCDIC 코드 한글 코드 기타 코드 부호화된 절대치 부호화된 1 의 보수 부호화된 2 의 보수
2.3 수치형 자료 표현 컴퓨터에서 취급되는 수치형 자료는 정수형 과 실수형으로 분류된다. 정수형 표현은 10 진 수와 2 진수 표현 방식으로 구분되며, 실수형 표 현은 소수점의 위치가 고정되어 있는 고정 소 수점방식과 소수점의 위치가 이동 가능한 부동 소수점방식이 있다.
2.3 수치형 자료 표현 정수형 자료 표현 [1] 10 진수 표현 방식 10 진수 표현 방식 – 팩형 10 진수 방식, 존형 10 진수 방식 ① 팩형 10 진수 형식 1 바이트에 2 개의 숫자를 표시하고, 자료의 부호는 최하위 바 이트의 하위 4 비트에 나타내는 방식 d n-1 d n-2 d n-3 d n-4 …….d3d3 d2d2 d1d1 d0d0 S D= 10 진수 숫자 양수는 16 진수 C( ) 음수는 16 진수 D( ) 바이트 - 팩형 10 진수 표형 방법 -
2.3 수치형 자료 표현 정수형 자료 표현 ② 존형 10 진수 형식 1 바이트에 1 개의 숫자를 나타내며, 부호는 자료를 표현하는 최하위 바이트와 상위 4 비트를 사용하여 나타낸다. Fd n-1 Fd n-2 Fd n-3 …Fd2d2 Fd1d1 Sd0d0 바이트 존 영역으로 1111 을 표시 + : C(1100) - : D(1101) - 존형 10 진수 형식 표현 방법 -
2.3 수치형 자료 표현 [2] 2 진수 표현 방식 2 진수 표현 방식 – 부호화된 절대치, 부호화된 1 의 보수, 부 호화된 2 의 보수 ① 부호화된 절대치 방식 최상위 1 비트를 부호로 사용하고, 나머지 비트에 수의 크기를 나타내는 방법이다. ② 부호화된 1 의 보수 상식 2 진수의 각 비트에서 1 은 0 으로, 0 은 1 로 바꾸어 얻어지는 방 법이다. ③ 부호화된 2 의 보수 방식 1 의 보수에서 1 을 더하여 숫자를 표현하는 방법이다. 부호화 절대값 1 의 보수 2 의 보수 -2 n - 1 ~ +2 n n ~ + 2 n - 1
2.3 수치형 자료 표현 실수형 자료 표현 [1] 고정 소수점 방식 소수점 위치가 가장 오른쪽 끝에 고정되어 있다고 가정하고, 전체의 수를 정수 상태로 표현하는 방법이다. S (15) 바이트. 부호 비트 소수점 정수 - 고정 소수점 방식 (16 비트 )
2.3 수치형 자료 표현 [2] 부동 소수점 방식 소수부와 지수부로 구성 되는데, 소수부는 유효숫자, 지수 부는 소수점의 위치를 나타낸다. s s 1 바이트 지수부소수부 부호 비트 1 바이트 - 부동 소수점 방식 (32 비트 ) -
2.4 비수치형 자료 표현 문자형 자료 표현 [1] 표준 BCD 코드 소수점 위치가 가장 오른쪽 끝에 고정되어 있다고 가정하고, 전체의 수를 정수 상태로 표현하는 방법이다. CBA8421 존 비트디지트 비트 체크 비트, 패리티 체크 00 : 숫자, 01 : 문자 (A~I) 10 : 문자 (J~R), 11 : 문자 (S~Z) - 표준 BCD 코드 구성 -
2.4 비수치형 자료 표현 문자형 자료 표현 [2] ASCII 코드 미국 표준 코드라고 하며, 국제표준기구에서 개발되고, 미 국국립표준연구소에 의해 제정되었다. ASCII 코드는 7 비트와 8 비트의 2 종류가 있다. 8 8 존비트디지트 비트 패리티 비트 8 비트 ASCII 코드 존비트디지트 비트 비트 ASCII 코드 100 : 문자 A-O 101 : 문자 P-Z 011 : 숫자 ASCII 코드 구성 -
2.4 비수치형 자료 표현 문자형 자료 표현 [3] EBCDIC 코드 ▷ 1 바이트는 8 비트로 구성 ▷ 확장된 2 진화 10 진 코드로서 IBM 에서 개발, 현제 대부분의 컴퓨터에서 많이 사용하고 있는 코드 0 0 존비트디지트 비트 A 영역 B 영역 00 : 여분 01 : 특수문자 10 : 영문자 ( 소문자 ) 11 : 영문자 ( 대문자 ) 00 : 영문자 (A-I) 01 : 영문자 (J-R) 10 : 영문자 (S-Z) 11 : 숫자 (0-9) - EBCDIC 코드 구성 -
2.4 비수치형 자료 표현 문자형 자료 표현 [4] 한글 코드 → 조합형 코드 : 영문 구분을 위해 1 비트 사용하고 15 비트를 5 비트씩 3 개로 나누어 초성 19 자, 중성 21 자, 종성 28 자를 조합한 것이다. → 완성형 코드 : 음절 중심의 코드로서 2 바이트를 사용한다. 즉 가나다 순으로 완성된 하나의 음절을 14 비트로 코드화 하는 방식이다. 1 바이트 초성 중성종성 1 - 한글 조합형 코드 구성 -
2.4 비수치형 자료 표현 문자형 자료 표현 [5] 기타 코드 → 가중치 코드 : 대표적인 가중치 코드인 8421 코드, 코드, 2421 코드, 5421 코드, 7421 코드, 코드, 코드가 등이 있다. → 비가중치 코드 : 엑세스 3 코드, 2 Out of 5 Code, 쉬프트 카운터 코드 또는 존슨 코드, 그레이 코드 등이 있다. → 오류 검출 코드 : 10 진법을 코드화하여 2 진법으로 나타냈을 때, 잘못된 정보 를 검출하거나 정정할 수 있는 기능을 가질 수 있도록 하는 코드로서 패리티 체크, 비퀴너리 코드, 링 카운터 코드, 해밍 코드 등이 있다.
2.4 비수치형 자료 표현 논리형 자료 표현 논리 자료는 사용자나 프로그래머가 관념적으로 생 각하는 자료의 형태로서, 논리 값이 참 (TRUE) 또는 거짓 (FALSE) 의 2 가지 상태만을 나타내는 자료이다. 프로그래밍 언어논리 자료비 고비 고 FORTRAN TRUE 또는 FALSE PASCAL TRUE 또는 FALSE ALGOL TRUE 또는 FALSE PL/1 ‘1’B 또는 ‘0’B LISP T 또는 NIL - 프로그래밍 언어에서 논리 자료 표현 방법 -
2.4 비수치형 자료 표현 포인터형 자료 표현 포인터란 어떤 객체에 대한 참조, 위치, 주소이다. 포 인터 변수는 객체를 참조하기 위한 주소를 값으로 취 하는 변수이다. Int *a : 정수형 변수의 주소값을 가질 수 있는 포인터 변수 a 를 선언 float *b : 실수형 변수의 주소값을 가질 수 있는 포인터 변수 b 선언 Char *c : 문자형 변수의 주소값을 가질 수 있는 포인터 변수 c 선언 & : 주소 연산자 – 해당 변수의 주소를 의미 * : 참조 연산자 - 해장 변수에 저장된 값에 대한 참조를 의미
2.4 비수치형 자료 표현 포인터형 자료 표현 → 프로그램이 실행되면 동적인 객체를 생성할 수 있다. → 객체간의 다양한 관계를 쉽게 구현할 수 있다. → 필요 없는 객체는 제거하여 주기억장치의 효율을 높일 수 있다. → 다양한 방법으로 연결하고, 동일된 방법으로 모든 객체에 접근 할 수 있다.