인코딩.

Slides:



Advertisements
Similar presentations
AhnLab V3 Zip 2.0 Copyright (c) AhnLab, Inc All rights reserved. AhnLab V3 Zip 2.0 글로벌 표준압축 유틸리티 비즈니스 매너의 시작.
Advertisements

- C-style formatting - format() method.  file = open(‘file.txt’, [mode]) ◦ Mode  ‘r’: for reading (default)  ‘w’: for writing (truncate if already.
1 멀티미디어 데이터 : 텍스트 (Text) Lecture #2. 2 멀티미디어 구성 요소  멀티미디어 구성 요소 : 1) 텍스트 2) 그래픽 & 이미지 3) 사운드 4) 비디오 & 애니메이션  미디어 접근법 : 1) 특징 : 정보표현 능력 vs 비용 등 2) 컴퓨터.
1. 2 최종 사용자. “ 이런 한글 깨지네.” Unicode 에 대해 전혀 모르는 개발자. UTF-8 을 쓰니 Unicode 완비되었다고 생각하는 사람. 세상에는 여러 종류의 인코딩이 존재하고 있다는 것을 아는 사람. UTF-8 이 곧 Unicode 가 아니라는 것을.
Chapter 03. 디지털 코드. 다양한 디지털 코드를 구분하여 이해할 수 있다. 문자와 숫자를 나타내는 코드를 이해할 수 있다. 가중치 코드와 비가중치 코드를 이해하고 이를 활용할 수 있다. 에러 검출 코드를 이해하고 이를 활용할 수 있다. 01. BCD 코드와 3.
북한기도제목 1 월 1 주 (1/1-1/7). 1. 북한정치 - 북한의 대남정책 전반을 관장하는 김양건 북한 노동당 비서 겸 통일전선부장이 교통사 고로 지난 29 일 사망했다고 조선중앙통신이 30 일 보도했습니다. 한편 김양건 노동당 비 서의 죽음이 의도적인 암살 가능성이.
날씨 브리핑 11 조 최현경 장지연. 이번 주 일기분석 (3 월 17 일 ~ 3 월 23 일 )
3. 자료형. 담당교수 : 이 성 우 C++ 프로그래밍 상수와 변수 (3) 1. 변수 (variable)  프로그램 수행 도중에 자료  변수를 위해 은 변하지 않음  선언 시에 반드시 그. ※ 저장 정보의 구성 ① 정보의 종류 ② 저장 값 ③ 저장 위치 int Num.
인공지능 연구실. 1. OpenAPI 2. Mashup 3. How can use OpenAPI 4. Various OpenAPIs 5. 실습 2.
UNICODE Seminar – 한국에서 프로그래머 하기 By bleujin.
1/37 Chapter 4: 프로세서 성능과 휴대성을 위한 하드웨어 © The McGraw-Hill Companies, Inc., 세기의 가장 중요한 발명품 : 마이크로 프로세서 일상생활에 널리 사용됨 프로그램에 의한 적응성.
컴퓨터의 구조 2006년 2학기 컴퓨터의 개념 및 실습.
아름다운 문화를 만들어가는 좋은 사람들- 좋은상조그룹
제 3 장 변수와 자료형.
두벌식 자판과 완성형 코드가 잘못된 까닭과 속내
어서와 Java는 처음이지! 제2장 자바 프로그래밍 기초.
2003년도 성신양회(주) 경영현황 과 비전. 2003년도 성신양회(주) 경영현황 과 비전.
수치제어선반 절삭가공.
3 디지털 코드 IT CookBook, 디지털 논리회로.
정보이론 PARSONS/OJA 데이터의 표현 1.
논리의 표현 진법과 숫자 표현 2진수와 10진수 문자의 표현
문자코드 변환 콘코던서 형태소분석기 한국어 정보의 전산처리
장. 문법 구조(Syntax) 컴퓨터공학과 권기태 프로그래밍언어론.
정보(information) 데이터(data) 어떤 사물에 대한 소식이나 자료 가공된 데이터
의약품 GS1-128 코드 활용 안내 (수).
컴퓨터 시스템의 개요.
제 2장 컴퓨터의 등장과 발전.
UTF ENCODING (UTF-8,16,32) 발표자 - 김규호.
TCP/IP 통신망 특론 2장 Link Layer 컴퓨터 네트워크 실험실 이희규.
osp.chungbuk.ac.kr/2012년 강의자료
작업장에서 불의의사고로 절단사고가 발생했다면
손에 잡히는 vim (3/4) 김선영 버 전: 버 전: 인사이트 출판사 가메출판사 저자홈페이지.
Chapter 03. 디지털 코드.
2 데이터 표현과 컴퓨터 연산 IT CookBook, 컴퓨터 구조와 원리 2.0.
유니코드의 다양한 이해 Samsung Software Membership – 22기 백재현.
2007년 1학기 전산학개론 성신여자대학교 컴퓨터정보학부
9. 아두이노를 이용한 FND 제어 - 스마트 폰으로 제어하는 아두이노 -.
프로토콜이란 무엇인가?.
4장. 데이터 표현 방식의 이해. 4장. 데이터 표현 방식의 이해 4-1 컴퓨터의 데이터 표현 진법에 대한 이해 n 진수 표현 방식 : n개의 문자를 이용해서 데이터를 표현 그림 4-1.
제2장 데이터형과 표준 입출력문 문봉근.
문자 인코딩에 관하여 팀 E.E 강재문, 윤영호 백진후, 조남훈.
21. 숫자가 만드는 문자, 문자 코드 문자 정보 문자 정보를 이진수로 표현하는 방법을 이해한다.
“정보의 표현” 이 점 숙 컴퓨터와 인터넷 “정보의 표현” 이 점 숙
“소프트웨어의 표현” 이 점 숙 컴퓨터와 소프트웨어 “소프트웨어의 표현” 이 점 숙
1. 기계와 기구 1.1 기계는 저항력이 있는 물체를 조합하여 한정된 범위내에서 상대운동을 하며, 공급된 에너지에 의해 외부에 일정한 일을 하는것으로, 즉 “사람을 대신하여 일을 하는 도구”로 정의 될 수 있다 1.2 기계의 구비조건 1) 저항력이 있는 물체를 조합한.
☆ASCII☆ 김연주.
윤성우의 열혈 C 프로그래밍 윤성우 저 열혈강의 C 프로그래밍 개정판 Chapter 05. 상수와 기본 자료형.
기업경영진단 방법론.
환경관리 규정 - 목 차 – 1.적 용 범 위 9.환경관리 교육 2.목 적 10.환경 점검
천안시 호재 정리 ▶ 천안 원 도심재개발 정비예정구역 총괄 : 80개 구역 규모 : 3,130,235 ㎡(약94.7만평)
디 지 털 공 학 한국폴리텍V대학.
문자코드 변환 콘코던서 형태소분석기 한국어 정보의 전산처리
교육방법 및 평가방법 안내.
3단원 디지털 세상 속으로 1. 0과 1의 비밀.
(제9강) ISO26000상의 CSR의 7대 핵심요소 1-1)조직지배구조 : 투명성, 참여성, 효과성
작동 원리 Keypad 박민호.
농원 사업계획서.
(생각열기) 횡파와 종파를 구분하는 기준은 무엇인가?? 답 : 진동하는 방법의 차이
문자코드, 문자 입출력 한국어 정보의 전산 처리
학교 내 환자 관리 연수 학교 내 환자 및 응급환자 관리계획(도연학사생 포함) 명진고-2077 ( )
거래처 매뉴얼 리 얼 시 스 템 주 식 회 사.
조선업 안전시설기준의 운영상 문제점과 개선방안
성공적인 입사지원서 작성법 제이비커리어 교육수석 소 은 선.
*컴퓨터 구조 4장 연습문제 천재성.
Introduction to Computer System 컴퓨터의 이해 3: 데이터 표현
박성진 컴퓨터 프로그래밍 기초 [03] 변수와 자료형 박성진
거래처 매뉴얼 리 얼 시 스 템 주 식 회 사.
제03장 정보의 표현.
고령친화산업의 특징과 대상 고령친화산업 분류 고령친화산업의 현황(1) - 의료관련 서비스업
두손Order 푸드팩토리 두손Order Ver 1.0 ㈜시소이드.
Presentation transcript:

인코딩

인코딩 컴퓨터에서 문자를 수로 표현하는 방법 꼭 알아둬야할 인코딩들 ASCII EUC-KR CP949 UTF8

16진수 Hexadecimal (흔히 hex) 0~F까지 16개의 수로 한 자리를 나타냄 2진수 4자리 = 16진수 1자리 A B C D E F 10 11 12 13 14 15

Bit와 Byte Bit: 2진수 1자리 (0 or 1) Byte = 8bit 0x00 ~ 0xFF 0000 0000 ~ 1111 1111

ASCII American Standard Code for Information Interchange 미국 정보 교환 표준 부호 7bit 코드: 0x00 ~ 0x7F까지 128개 000 0000(2) ~ 111 1111(2) 알파벳, 문장부호 등을 포함 첫 1bit는 parity bit (1의 개수가 홀수면 1) 에러 검출 목적

ISO 8859 8bit: 0x00 ~ 0xFF까지 256개 공백이 2종류 ASCII에서 쓸 수 없는 문자들까지 포함 언어권에 따라 여러 가지 변형 서유럽용 ISO 8859-1을 가장 많이 씀(Latin-1) 공백이 2종류 0x20 Space 0xA0 NBSP

한글 인코딩 현대 한글: 11,172글자 조합형: 초성(19개) X 중성(21) X 종성(28) 14bit (0~16,384) 필요 한자도 있음 조합형: 16bit 한글 한글표시 1bit + 초성 5bit + 중성 5 bit + 종성 5bit 장점: 모든 현대 한글을 표현 단점: 처리가 복잡

완성형 EUC-KR EUC-KR ISO 8859에서 A1~FE 까지 94 글자 범위 이용 KS X 1001 행망용, KS C 5601 ISO 8859에서 A1~FE 까지 94 글자 범위 이용 영어는 1 byte, 한글은 2 byte로 표현 94 x 94 = 8,836 글자 표현 가능 현대 한글 2,350자만 사용(쓩, 쌰 등 제외) 0x5C Backslash를 원화 표시로 대체

확장완성형 CP949 현대 한글 11,172자 모두 표현 비표준: CP 949, MS 949 국내에서 널리 사용 ASCII(0x00-0x7F)와 완성형(0xA1-0xFE) 사이의 남는 영역 사용 비표준: CP 949, MS 949 EUC-KR로 잘못 표기되는 경우가 흔함 국내에서 널리 사용

인코딩 중간 정리 ASCII EUC-KR CP949

유니코드 UNICODE U+AC00 ~ U+D7AF에 한글 11,172글자 할당 대부분 OS, 프로그래밍 언어 내부에 사용 모든 문자를 포함하는 국제표준 21bit 2,097,152 글자 U+를 앞에 붙임 U+00A0 == 0x00A0 기존 표준과 호환 U+AC00 ~ U+D7AF에 한글 11,172글자 할당 대부분 OS, 프로그래밍 언어 내부에 사용

UTF-8 유니코드 인코딩 방식 중 하나 ASCII와 호환 대부분 웹 사이트에서 사용 (국내는 아님) 1~4 byte: 영어는 1 byte, 한글은 3 byte ASCII와 호환 m: U+006D  0x6D 쓩: U+C4E9  0xEC 0x93 0xA9 대부분 웹 사이트에서 사용 (국내는 아님)

인코딩 정리 UTF-8 ASCII EUC-KR CP949