- C-style formatting - format() method.  file = open(‘file.txt’, [mode]) ◦ Mode  ‘r’: for reading (default)  ‘w’: for writing (truncate if already.

Slides:



Advertisements
Similar presentations
Term Project Hints Topics Keep-alive CGI Multi-thread Multi-process Event-based.
Advertisements

전공 : 컴퓨터 공학 전공 과목 : 인터넷 정보 검색 학번 : , 이름 : 조 항 두, 오 철 원.
팀 명 : 커 피 팀 원 : 정수현 외 4 명 ( 다른 학교분들 ). 목차목차 결과물 시현 및 설명 DB 설계 서비스 흐름도 개발 환경 개발 개요 개발 과정의 기술 개발 동기.
1 멀티미디어 데이터 : 텍스트 (Text) Lecture #2. 2 멀티미디어 구성 요소  멀티미디어 구성 요소 : 1) 텍스트 2) 그래픽 & 이미지 3) 사운드 4) 비디오 & 애니메이션  미디어 접근법 : 1) 특징 : 정보표현 능력 vs 비용 등 2) 컴퓨터.
1. 2 최종 사용자. “ 이런 한글 깨지네.” Unicode 에 대해 전혀 모르는 개발자. UTF-8 을 쓰니 Unicode 완비되었다고 생각하는 사람. 세상에는 여러 종류의 인코딩이 존재하고 있다는 것을 아는 사람. UTF-8 이 곧 Unicode 가 아니라는 것을.
Tcl/Tk 민 인학 한국 Tcl/Tk 커뮤니티.
- 1 - 정보 보안 개론과 실습 시스템 해킹과 보안 팀원 : 박진영 한동섭 · 권혁진.
인공지능 연구실. 1. OpenAPI 2. Mashup 3. How can use OpenAPI 4. Various OpenAPIs 5. 실습 2.
UNICODE Seminar – 한국에서 프로그래머 하기 By bleujin.
9 주차 실습강의 학기, 소프트웨어 설계 및 실험 ( Ⅰ ). Artificial Intelligence Laboratory Open API  API(Application Programming Interface)  응용 프로그램에서 사용할 수 있도록.
Linux Seminar #1 리눅스 이해하기.
제12장 표준 입출력과 파일 입출력.
Project #2-2. Pintos User Program
R 실행. 2014년 가을학기 손시운 지도 교수: 문양세 교수님.
어서와 Java는 처음이지! 제1장 기초 사항.
Department of Computer Engineering
델파이7 웹서비스 클라이언트 델파이7에서 C#으로 작성한 웹서비스 함수를 사용하기 위한 간략한 방법을 정리해 보았습니다.
정보이론 PARSONS/OJA 데이터의 표현 1.
HW#1 Source 파일 제출 3.20(수)까지 제출 학번_이름_01.c
문자코드 변환 콘코던서 형태소분석기 한국어 정보의 전산처리
Linux/UNIX Programming
제3장 이클립스 사용하기.
Oracle DBMS 설치.
Department of Computer Engineering
Embeded 기초 다지기 2015년 10월 26일 intern Sally
PHP + Eclipse + Google Code를 이용한 개발환경
Computer Architecture
처음으로 배우는 C 프로그래밍 제5부 추가적인 화제들 제 11 장 파일 처리.
Operating System System Program OS의 목적 OS의 종류 Application Program과 구별
제 2 장 변수와 상수.
UTF ENCODING (UTF-8,16,32) 발표자 - 김규호.
Department of Computer Engineering
작업장에서 불의의사고로 절단사고가 발생했다면
손에 잡히는 vim (3/4) 김선영 버 전: 버 전: 인사이트 출판사 가메출판사 저자홈페이지.
Network Programming(1)
유니코드의 다양한 이해 Samsung Software Membership – 22기 백재현.
Chapter 13 Input/Output and Files
2007년 1학기 전산학개론 성신여자대학교 컴퓨터정보학부
제 11 장 전처리기.
제10장 파일 시스템 인터페이스(File System Interface)
문자 인코딩에 관하여 팀 E.E 강재문, 윤영호 백진후, 조남훈.
21. 숫자가 만드는 문자, 문자 코드 문자 정보 문자 정보를 이진수로 표현하는 방법을 이해한다.
“정보의 표현” 이 점 숙 컴퓨터와 인터넷 “정보의 표현” 이 점 숙
“소프트웨어의 표현” 이 점 숙 컴퓨터와 소프트웨어 “소프트웨어의 표현” 이 점 숙
리눅스: Lecture 1 강의개요 중앙대학교 컴퓨터공학부 손 봉 수 교수.
IS lab. 김건영 정보검색기 구현 프로젝트 안내사항 IS lab. 김건영
인터넷응용프로그래밍 과제 실습.
Python.
파일 구조의 이해 PE Format 안녕하십니까
운영체제의 종류 장승빈.
Ⅶ. 명함관리 1. 초기 화면 설명 2. 명함 분류 관리 3. 명함 이동,공유,복사 4. 명함 등록, 수정 5. 상세검색 6.
CHAPTER 04 파일 설계(FiLE Design).
문자코드 변환 콘코던서 형태소분석기 한국어 정보의 전산처리
Command line tools 한국어 정보의 전산 처리
3단원 디지털 세상 속으로 1. 0과 1의 비밀.
2010년 DAEATi 솔루션 사업부 공채 1기 팀 프로젝트 보고
(생각열기) 횡파와 종파를 구분하는 기준은 무엇인가?? 답 : 진동하는 방법의 차이
인코딩.
문자코드, 문자 입출력 한국어 정보의 전산 처리
화 일 구 조 Chapter 3 화일의 입출력 제어.
성공적인 입사지원서 작성법 제이비커리어 교육수석 소 은 선.
9주차: Using Files and Others
3주차: Control Flow and Others
Spring, 2019 School of CSE Pusan National University
유예 X-FILE *조사자* 1301권희원 1315이예지 1317장아정 1322홍자현.
Spring, 2019 School of CSE Pusan National University
2015년도 연세대학교 의과대학 의과학자육성 장학금 신청안내
9장 부프로그램 순천향대학교 컴퓨터공학부 하 상 호.
두손Order 푸드팩토리 두손Order Ver 1.0 ㈜시소이드.
Presentation transcript:

- C-style formatting - format() method

 file = open(‘file.txt’, [mode]) ◦ Mode  ‘r’: for reading (default)  ‘w’: for writing (truncate if already exists)  ‘a’: for appending  ‘r+’: for reading and writing  ‘w+’: for reading and writing (truncate if already exists)  ‘b’: binary file  ‘U’: universal newlines (‘\n’, ‘\r\n’, ‘\r’ 를 지원 )  all = file.read()  line = file.readline() # return string ending with ‘\n’  line_list = file.readlines() # read all and return list of lines  file.write(string)  file.writelines(line_list)  fd = file.fileno() # retrun integer file descritor

 Computers are byte-oriented ◦ ASCII ◦ 영어를 제외한 대부분의 문자는 multi bytes 로 표현해야  한글 encoding 방식 ◦ EUC-KR: 2-byte 완성형, 2,350 자의 한글 표현 가능 ◦ MS 사의 CP949: 확장 완성형, 11,172 자의 한글 표현 가능 (sorting 에 문제 )  Unicode: 전세계 문자를 동시에 표현하는 단일 코드체계 ◦ 단지 유일하게 표현하는 ‘code point’ 일 뿐 전송 (transfer) 하거나 저장 /transfer 하기 위한 것은 아님  문자의 식별이나 sorting 등 컴퓨터내의 processing 에 이용 ◦ Unicode 의 encoding:  UTF(Unicode Character Set Transformation Format)  UTF-7, UTF-8, UTF-16, UTF-32  ASCII 와 호환 가능한 UTF-8 encoding 이 가장 널리 쓰임

 한글의 저장 방식 ◦ UTF-8: WWW, , UNIX/Linux, 웹서버, PHP, DB 등에서 이용  영문자는 ASCII 그대로 1 byte 로, 다국어는 2, 3, 4 bytes 로 표현  한글인 경우 3 bytes 로 encoding – 초성, 중성, 종성 ◦ CP949: MS Windows  Conversion unicode utf-8 cp949 s.decode(‘cp949’)s.decode(‘utf-8’) u.encode(‘cp949’) u.encode(‘utf-8’)

 한글이 있는 source 파일은 encoding 지정해야 ◦ UTF-8 로 지정함이 바람직 (Eclipse 도 UTF-8 로 하자.)  String ◦ Python 2: 8-bit ASCII ◦ Python 3: unicode  한글 다루기 쉽다.  File sysem encoding ◦ Python 2: byte 열로 봐서 그대로 write/read  필요하면 개발자가 바꿔야  string.decode(‘cp949’).encode(‘utf-8’) # cp949  utf-8 ◦ Python 3: OS 에 따라 자동 encoding  utf-8 encoding on Linux/UNIX/MAC  cp949 encoding on Windows  Open 할 때 encoding 을 변경 지정 가능  터미널 (stdin, stdout, stderr) encoding ◦ OS 에 따라 자동 encoding

 Source encoding 을 utf-8 으로 하자. ( 한글이 source code 에 적힌 경우는 반드시 )  Python 3 쓰면 혼선이 없다.  Python 2 에서는 ? ◦ Windows 환경에서  Eclipse 는 문제 없다. SVN 사용해서 Linux 에 변경없이 사용 가능  IDLE 은 다음 경우에 쓰자  한글없는 경우나  한글이 있는 stand-alone 으로 실행하는 프로그램 (cp949 로 ) ◦ Linux 환경에서  Utf-8 를 쓰니 별 문제 없다. ◦ 한글이 포함되는 string 이라면 unicode 로 decode 해서 처리하게 코드를 작성해야 모든 환경에 문제없다.  Socket 통신에서 utf-8 로 encoding 하자.