1/26 5 장 텍스트의 표현 5.1. 문자코드 체계 5.1.1. ASCII 코드 5.1.2. 한글 코드 5.1.3. ISO 2022 코드 5.1.4. 유니코드 5.1.5. KS X 1005-1 5.2. 폰트 5.2.1. 폰트 형식 5.2.2. 문자 편집기 5.3. 텍스트.

Slides:



Advertisements
Similar presentations
1/ 편집 기능 사용하기 – 실습 1 글자 모양을 바꾸고 싶은 곳을 블록 설정 [ 글자 모양 ] 대화 상자에서 [ 글꼴 ] ‘ 궁서체 ’, [ 글자 색 ] ‘ 토마토색 ’ 으로 선택 → [ 설정 ] 클릭 → 글자 모양 변경.
Advertisements

1 멀티미디어 데이터 : 텍스트 (Text) Lecture #2. 2 멀티미디어 구성 요소  멀티미디어 구성 요소 : 1) 텍스트 2) 그래픽 & 이미지 3) 사운드 4) 비디오 & 애니메이션  미디어 접근법 : 1) 특징 : 정보표현 능력 vs 비용 등 2) 컴퓨터.
가족 문화 정보 한마당 대단원 1 – 중단원 4 영진.COm영진.COm 1. 마음이 담긴 쪽지 쓰기  워드 프로세서 (Word processor)  문서를 작성하고 편집 · 출력할 수 있는 프 로그램  워드 프로세서의 기능  문서의 입력 기능  문서의 편집.
1/29 키보드로 직접 입력할 수 없는 다양한 기호와 한자를 입력하는 방법을 알아 보자. 또한 블록으로 영역을 설정하는 여러 가지 방법에 대해 살펴본 후 블록 으로 설정된 내용을 복사하여 붙여넣거나, 잘라내고 이동하는 방법에 대해서 도 알아보자. 02_ 문서의 입력과 편집.
1/37 한글에는 전문적인 문서 편집을 위한 고급 기능이 있다. 문서를 편리하게 수 정할 수 있도록 도와주는 찾기 / 찾아 바꾸기, 다른 위치로 이동할 수 있는 책 갈피와 하이퍼링크에 대해 알아보자. 그리고 자주 사용하는 서식을 미리 정 해 놓고 쓰는 스타일 활용법과 스타일이.
자료의 표현 1. 문자 자료의 표현 2. 멀티미디어 자료의 표현. 컴퓨터일반자료의 표현 학습 목표 ◆ 컴퓨터에서 사용하는 문자 데이터의 표현 방법을 이해할 수 있다. ◆ 컴퓨터에서 사용하는 멀티미디어 데 이터의 표현 방법을 설명할 수 있다.
1 넷스팟 MAC ID 설정 방법 ( 서울캠퍼스 기준 ) 각종 스마트폰의 WiFi 를 이용시 각종 스마트폰의 WiFi 를 이용시 MAC ID 설정을 하는 방법 입니다. 아이폰의 경우는 별도의 설정없이 바로 사용이 가능하오니, 사용이 어려울 경우, 고객센터로 문의하시면 됩니다.
406 문서에 표를 작성하고 크기를 조절할 수 있다. 표에 서식을 적용하여 다양하게 표현할 수 있다. 표를 편집하여 다양한 형태로 나타낼 수 있다. 학습목표 5 부. HTML 의 기본 4 장. 표를 이용한 문서작성 - 17 주 차시 : 1/3 ∼ 3/3 배당시간 : 18.
문자코드 1 박 2 일 (4 조 ) 이경도 이준집 이수연 엄태규. 문자코드란 ? 문자나 기호를 컴퓨터로 다루기 위하여, 문자나 기호 하나하나에 할당 시키는 고유의 숫자를 말하는 것이다.
컴퓨터와 인터넷.
조원 : 김영재(코딩) 이지영(스토리) 임병욱(그래픽)
재료수치해석 HW # 박재혁.
파워포인트 2007.
2장. 프로그램의 기본 구성. 2장. 프로그램의 기본 구성 2-1"Hello, World!" 들여다 보기 /* Hello.c */ #include int main(void) { printf("Hello, World! \n"); return 0;
1. 신뢰할 수 있는 싸이트 등록 인터넷 익스플로러 실행 후 실행
피티라인 파워포인트 템플릿.
1장. 이것이 C 언어다.. 1장. 이것이 C 언어다. 프로그래밍 언어 1-1 C 언어의 개론적 이야기 한글, 엑셀, 게임 등의 프로그램을 만들 때 사용하는 언어 ‘컴퓨터 프로그래머’라는 사람들이 제작 C 언어(C++ 포함)를 가장 많이 사용함.
Report #2 - Solution 문제 #1: 다음과 같이 프로그램을 작성하라.
뇌를 자극하는 Windows Server 2012 R2
윤성우의 열혈 C 프로그래밍 윤성우 저 열혈강의 C 프로그래밍 개정판 Chapter 12. 포인터의 이해.
4. 디지털 코드 디지털 코드의 종류와 의미를 알고, 이를 표현할 수 있다. BCD 코드로 표현한 자료끼리 연산할 수 있다.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
SqlParameter 클래스 선문 비트 18기 발표자 : 박성한.
제 2 장 WML 시뮬레이터 및 무선인터넷 서버 설치
Error Detection and Correction
멀티미디어 시스템 (아날로그 이미지,신호를 디지털로 변환 방법) 이름 : 김대진 학번 :
23장. 구조체와 사용자 정의 자료형 2.
UTF ENCODING (UTF-8,16,32) 발표자 - 김규호.
홈페이지용 그림 활용법 그림 삽입 태그 <IMG> 배경 그림 다루기 그림과 문자열의 어울림
학습목표 학습목차 다른 홈페이지의 HTML 파일 코드를 보는 방법에 대해 알아봅니다.
뇌를 자극하는 Windows Server 장. 장애 조치 클러스터.
Method & library.
27장. 모듈화 프로그래밍.
메모리 관리 & 동적 할당.
Java의 정석 제 5 장 배 열 Java 정석 남궁성 강의 의
2018년 11월 05일 박성진 Web & Internet [08] 레이아웃 P1 2018년 11월 05일 박성진
HTTP 프로토콜의 요청과 응답 동작을 이해한다. 서블릿 및 JSP 를 알아보고 역할을 이해한다.
☆ASCII☆ 김연주.
Adobe 제품 다운로드 및 설치 방법 안내 Adobe Creative Cloud Adobe License 권한을 받으신 분
뇌를 자극하는 Windows Server 장. 원격 접속 서버.
USN(Ubiquitous Sensor Network)
(개정판) 뇌를 자극하는 Red Hat Fedora 리눅스 서버 & 네트워크
컴퓨터 프로그래밍 기초 - 10th : 포인터 및 구조체 -
자바 5.0 프로그래밍.
ARM Development Suite v1.2
컴퓨터 프로그래밍 기초 - 8th : 함수와 변수 / 배열 -
1. 2진 시스템.
객체기반 SW설계 팀활동지 4.
( Windows Service Application Debugging )
Cold Spring Harbor Laboratory Press 저널 이용 매뉴얼
디버깅 관련 옵션 실습해보기 발표 : 2008년 5월 19일 2분반 정 훈 승
STS 에서 웹 서버 설치 방법.
제 15 강 문자와 코드 shcho.pe.kr.
에어 PHP 입문.
4장. 데이터 표현 방식의 이해. 4장. 데이터 표현 방식의 이해 4-1 컴퓨터의 데이터 표현 진법에 대한 이해 n 진수 표현 방식 : n개의 문자를 이용해서 데이터를 표현 그림 4-1.
쉽게 배우는 알고리즘 2장. 점화식과 점근적 복잡도 분석
리더 : 이동주 스토리 : 김현 그래픽 : 최혁진 코딩 : 최재근
9 브라우저 객체 모델.
슬라이드 쇼의 설정 슬라이드 쇼의 실행 파일과 폴더의 관리 글꼴을 포함해서 저장 웹 페이지로 게시 압축 파일
한글 워드프로세서 현재 주로 사용되고 있는 워드프로세서 한글과컴퓨터사의 글 마이크로소프트사의 워드 삼성전자의 훈민정음
1장 C 언어의 개요 C 언어의 역사와 기원 C 언어의 특징 프로그램 과정 C 프로그램 구조 C 프로그램 예제.
 6장. SQL 쿼리.
윈도우에서의 유니코드.
피티라인 파워포인트 템플릿.
8주 실습강의 학기, 소프트웨어 설계 및 실험(Ⅰ).
플래시MX2004 디자인스쿨 Chapter 11. 플래시와 사운드.
7 생성자 함수.
6 객체.
BoardGame 보드게임 따라가기.
20 XMLHttpRequest.
Presentation transcript:

1/26 5 장 텍스트의 표현 5.1. 문자코드 체계 ASCII 코드 한글 코드 ISO 2022 코드 유니코드 KS X 폰트 폰트 형식 문자 편집기 5.3. 텍스트 파일의 형식 TXT RTF DOC/HWP PDF 마크업 텍스트 5.4. 메모장과 워드패드

2/26 개 요개 요  멀티미디어 구성요소 중 가장 많이 사용되는 것은 텍 스트이다. 텍스트는 다른 미디어 들보다 저장 공간을 극히 적게 차지하면서 가장 많은 정보를 담을 수 있 는 효율성이 매우 우수한 미디어이다.  우리는 ‘ 독서를 많이 하라 ’ 는 말은 많이 듣지만 라디 오를 많이 듣거나 TV 나 영화, 만화를 많이 보라는 얘 기는 거의 들을 수 없다.  텍스트가 주로 사용된 책에는 심오한 지식이나 인생 의 철학 등을 담을 수 있으나 다른 미디어로는 이것 이 거의 불가능하기 때문일 것이다.

3/26 문자코드 체계  컴퓨터에서 텍스트는 2 진수 코드로 인코딩 (encoding) 되어 표현된다.

4/26 ASCII 코드  ASCII(American Standard Code for Information Interchange) 코드는 1 개의 문자를 8 비트를 사용하여 표현하는 방식으로 최 대 256 개의 문자를 표현할 수 있다.  그러나 영문자를 표현하기 위해서는 7 비트면 충분하기 때문 에 나머지 128 개는 그래픽 문자를 표현하기 위해 사용된다.

5/26 한글 코드  ASCII 코드는 영문자를 표현하기 위한 것이 기 때문에 한글을 표현하기 위해서는 당연히 별도의 코드 체계가 필요하다

6/26 글자수 계산  영어권의 문자를 표현하기 위해서는 7 비트만 으로 충분하다.  우리의 한글 문자를 표현하기 위해서는 표 5 ‑ 3 에서 계산된 11,172 자를 표현할 공간이 필 요하여 2 바이트를 사용해야 한다.

7/26 2 바이트 조합형 코드  한글의 구현 원리에 따라 초성, 중성, 종성을 구분하여 만든 코 드이다. 초성, 중성, 종성에 각각 5 비트씩을 할당하여 그림 5 ‑ 2 와 같이 한글 문자를 표현하고 있다.  제 1 바이트의 최상위 비트 (MSB: Most Significant Bit) 가 0 이 면 영문자, 1 이면 한글 문자를 나타낸다.

8/26 상용 조합형 코드의 일부

9/26 2 바이트 완성형 코드  2 바이트 완성형 코드는 한글 문자에 기반을 두고 코드를 부여 한 것이다.  자주 사용되는 2,350 자를 추출하여 이들 글자 하나 하나를 완 성된 글자로 보고, 가나다 순으로 배열한 것이다.

10/26 조합형 코드와 완성형 코드의 비교

11/26 ISO 2022 코드  ASCII 코드 체제는 컴퓨터가 영어권 이외의 아시아, 아프리카, 남 미 등의 문화권으로 확산됨에 따라 문제점이 나타나게 되었다. 그것은 바로 한글이나 한자와 같이 글자 수가 많은 언어들은 1 바 이트로 표현할 수 없다는 것이다.  이러한 점은 상업적인 측면에서 미국 등의 유수의 S/W 와 H/W 업 체들이 동양권의 컴퓨터 시장을 공략하기 위해 가장 시급히 해결 해야 할 문제였다. 이 문제를 해결하기 위해서는 ASCII 에서 사용 하는 8 비트 코드 체계가 아닌 16 비트 즉 2 바이트 코드 체계로 변 경하는 것이 유일한 해법이었다.  ISO(International Standards Organization) 는 ASCII 코드를 확장 하여 2 바이트 이상의 문자 코드를 사용할 때 준수해야 할 부호 확장법에 대한 규격을 ISO 2022 라는 이름으로 발표하였다. 그러 나 이것 역시 문자를 배정할 수 있는 영역이 최대 8,836 자로 제한 되어 있고, 영어권 외에서 국제간에 정보를 교환할 때 혼란을 가 져올 수 있다는 단점이 있었다.

12/26 유니코드  한 문자를 표현하기 위해 영어는 7 비트, 비영어는 8 비트, 한글, 한자, 일본어는 16 비트가 필요한데, 유니 코드는 이들 문자를 모두 16 비트로 표현하도록 통일 하였다. 그래서 유니코드에서 최대로 수용할 수 있는 문자 수는 65,536 자가 된다  이 코드 체계에 따르면 한글은 기존처럼 한 음절 당 2 바이트로 표현되고, 자소 분리가 용이하며 최대 11,172 자까지 표현할 수 있다. 또한 기존에 뒤죽박 죽이었던 배열과는 달리 완벽하게 가나다 순으로 배 열되었기 때문에 조합형 코드의 장점과 완성형 코드 의 장점을 모두 취하게 되었다.

13/26 유니코드에서 지원하는 11,172 자 한글 코드

14/26 유니코드로 인코딩하는 방식  UTF(UCS Transformation Format)-8 과 UTF-16 이 있 다. UTF-8 은 유니코드의 각 문자를 표현할 때 1 바이 트에서 3 바이트까지로 가변적으로 표현한다.  즉 유니코드 값 F 까지는 1 바이트를 사용 하여 표현하고, 그 다음부터 07FF 까지는 2 바이트, 그 다음부터 FFFF 까지는 3 바이트를 사용한다.  예를 들어 ' 가 ' 라는 글자는 UTF-8 로 인코딩하면 0xEAB080 으로 3 바이트로 표현된다.  이에 반해 UTF-16 은 일반 유니코드 즉 Unicode 2.0/ ISO UCS-2 와 같은 것으로 모든 문자를 2 바 이트로 표현한다

15/26  Internet Explorer 의 [ 인터넷 옵션 ] 에서 ‘URL 을 항상 UTF-8 로 보냄 ’ 은 URL 을 UTF-8 로 인코딩하여 웹 서버에게 보내겠다는 의미이다. 이 옵션이 설정되어 있을 때 URL 에 한글이나 특수 문자 등이 있으면 대부분의 웹 서버가 이를 제대로 인식하지 못하므로 이 옵션을 선택하지 않는 것이 좋다.

16/26 KS X  유니코드 (ISO/IEC 10646) 를 국내 표준화한 것이 KS X 이다.

17/26 폰트  문서를 작성할 때 적절한 폰트 (font) 를 사용하 는 것은 문서의 가독성과 품질에 있어 매우 중요하다. 폰트는 동일한 크기의 글꼴 한 벌 을 지칭하는 용어이다.  다음 그림에서 ‘ 바탕, 바탕체 ’ 하는 것들이 글 꼴이고, ‘ 바탕, 크기 10’ 이라고 크기까지 지칭 할 때 비로소 폰트라고 한다. 그러나 경우에 따라 폰트와 글꼴이란 용어가 같은 의미로 사 용되기도 한다

18/26 MS Word 에서 글꼴의 속성들

19/26 폰트 형식  폰트를 표현하는 방법에 따라 크게 비트맵 (bitmap) 폰트와 벡터 (vector) 폰트로 구분한 다.

20/26 비트맵 폰트  비트맵 폰트 (bitmap font) 는 그림 5-7 처럼 폰트를 비트맵으로 표현한다. 즉 그림에서 A 자를 구성하는 검정색 부분에 대한 픽 셀의 비트 값을 1, 그 외 부분을 0 의 값으로 표현하여 저장시키 는 것이다.

21/26 벡터 폰트  벡터 폰트 (vector font) 는 그림 5-10 처럼 문자의 윤곽선을 수학 함수를 이용하여 표현한다. 즉 그림의 A 자 모양에서 고동색 점 과 점 사이를 직선, 곡선 등을 표현하는 수학 함수로 표현하여 저장시키는 것이다

22/26 벡터 폰트의 특성  이러한 수학 함수의 특성으로 벡터 폰트는 함 수의 매개 변수 값을 변경시켜 문자 크기를 조절하거나, 수학적인 연산을 통해 쉽게 문자 모양을 변형시킬 수 있다.  따라서 한 종류의 폰트를 제작하는 것만으로 여러 종류의 폰트를 제작하는 효과를 얻을 수 있다.  일반적으로 벡터 폰트를 트루 타입 (true type) 폰트라고도 한다.

23/26 문자 편집기  Windows 에서 제공하는 사용자 정의 문자 편 집기를 이용하여 특수 문자나 로고 등을 6,400 개까지 만들 수 있다.  실습 p.103

24/26 텍스트 파일의 형식  TXT  서식이 없이 텍스트에 대한 문자 코드 ( 유니코드, ANSI, UTF-8, KS X 등 ) 만 저장하는 형식으로 메모장이 대표적으로 이러한 형식을 사용하고 있다.  RTF  RTF(Rich Text Format) 형식은 대부분의 문서편집기에서 지원하나 완전한 표준화가 되어 있지 않아 만족할 만한 효과는 기대할 수 없다. 특히 ‘ 한 / 글 ’ 과 MS Word 간에 RTF 파일로 교환하면 ‘ 표 ’ 와 같은 서식에서 많은 문제점을 야기시킨다.  DOC/HWP  DOC 은 MS Word 에서 사용하며, HWP 는 한글과컴퓨터사의 ‘ 한 / 글 ’ 에서 사용하는 문서 저 장 형식이다. HWP 는 대부분의 Windows 용 문서 편집기들이 완성형 한글코드 체계를 사용 하는 것과는 달리 조합형 한글코드 체계를 사용하고 있다.  PDF  PDF(Portable Document Format) 는 Adobe 사가 개발한 문서 형식으로 Acrobat Reader 라는 프로그램을 통해 읽을 수 있다. 이 형식은 각기 다른 운영체제 (Unix, Windows, Mac OS 등 ) 에서 작성된 문서라도 모두 똑같은 형태의 문서를 제공하기 때문에, 인터넷에서 문서를 교 류하기 위해 많이 사용되고 있다.

25/26 마크업 텍스트  마크업 (Markup) 문서를 만들기 위해서는 PostScript 언어와 HTML(Hypertext Markup Language) 언어가 사용되고 있다. 다음 표는 이들을 사용하여 작성된 간단한 마크업 텍스트를 보여 주고 있다.

26/26 맺는말  Unicode 의 최대의 수혜자는 소프트웨어 절대 강국인 미국이다. Unicode 가 나오기 전에는 영문판 소프트웨어가 한글화 되기 위 해 보통 6 개월 정도의 시간이 소요 되었다. 그래서 미국에서 최신 버전이 나오면 6 개월쯤 뒤에 국내에 한글판이 출시되었던 것이 다.  그러나 Unicode 가 사용된 소프트웨어에서는 프로그램 소스 (source) 에서 수정해야 할 필요가 거의 없이 수행 프로그램 (.EXE, DLL) 을 가지고 스트링 (string) 치환 연산에 의해 영어 표현을 한 글로 바꾸어 줄 수 있다.  폰트는 80 년대 후반까지 매우 활발하게 연구가 진행되고 폰트 개 발이 한창이었다. 그러나 이 또한 충분한 형태의 폰트가 제작되 어 이에 대한 논의도 일단락 되었다고 할 수 있다.  텍스트 표현에서 아직 미흡한 부분은 텍스트 파일간의 호환성 문 제이다. 현재 ‘ 한 / 글 ’ 과 MS Word 간에 문서를 완전하게 교환할 수 없다. 이러한 문제는 기본적으로 두 개의 편집기를 어느 정도 다 룰 줄 알아야 한다는 부담을 사용자에게 안겨 주고 있다.