CHAP 7:트리 C로 쉽게 풀어쓴 자료구조 Slide 1 (of 50)
트리(TREE) 트리: 계층적인 구조를 나타내는 자료구조 트리는 부모-자식 관계의 노드들로 이루어진다. 응용분야: 개념설명 리스트, 스택, 큐 등은 선형 구조 트리는 부모-자식 관계의 노드들로 이루어진다. 응용분야: 계층적인 조직 표현 파일 시스템 인공지능에서의 결정트리 (decision tree) Slide 2 (of 50)
트리(TREE)의 예 Slide 3 (of 50)
트리의 용어 노드(node): 트리의 구성요소 루트(root): 부모가 없는 노드(A) 서브트리(subtree): 하나의 노드와 그 노드들의 자손들로 이루어진 트리 단말노드(terminal node): 자식이 없는 노드 (E,F,G,H,I,J) 비단말노드: 적어도 하나의 자식을 가지는 노드(A,B,C,D) 자식, 부모, 형제, 조상, 자손 노드: 인간과 동일 레벨(level): 트리의 각층의 번호 높이(height): 트리의 최대 레벨 차수(degree): 노드가 가지고 있는 자식 노드의 개수 A B C D E F G H I J Slide 4 (of 50)
트리 예제 A는 루트 노드이다. B는 D와 E의 부모노드이다. C는 B의 형제 노드이다. D와 E는 B의 자식노드이다. 위의 트리의 높이는 4이다. Slide 5 (of 50)
트리의 종류 이진 트리 트리 일반 트리 Slide 6 (of 50)
이진트리(binary tree) 이진 트리(binary tree) :모든 노드가 2개의 서브 트리를 가지고 있는 트리 서브트리는 공집합일수 있다. 이진트리의 노드에는 최대 2개까지의 자식 노드가 존재 모든 노드의 차수가 2 이하가 된다-> 구현하기가 편리함 이진 트리에는 서브 트리간의 순서가 존재 Slide 7 (of 50)
이진 트리 검증 이진 트리는 공집합이거나 루트와 왼쪽 서브 트리, 오른쪽 서브 트리로 구성된 노드들의 유한 집합으로 정의된다. 이진트리의 서브 트리들은 모두 이진트리여야 한다. Slide 8 (of 50)
이진트리의 성질 노드의 개수가 n개이면 간선의 개수는 n-1 높이가 h인 이진트리의 경우, 최소 h개의 노드를 가지며 최대 2h-1개의 노드를 가진다. Slide 9 (of 50)
이진트리의 성질 n개의 노드를 가지는 이진트리의 높이 최대 n 최소 Slide 10 (of 50)
이진트리의 분류 포화 이진 트리(full binary tree): 트리의 각 레벨에 노드가 꽉 차있는 이진트리 개념설명 포화 이진 트리(full binary tree): 트리의 각 레벨에 노드가 꽉 차있는 이진트리 완전 이진 트리(complete binary tree): 높이가 h일 때 레벨 1부터 h-1까지는 노드가 모두 채워져 있고 마지막 레벨 h에서는 왼쪽부터 오른쪽으로 노드가 순서대로 채워져 있는 이진트리 Slide 11 (of 50)
이진트리의 표현 개념설명 배열표현법: 모든 이진트리를 포화이진트리라고 가정하고 각 노드에 번호를 붙여서 그 번호를 배열의 인덱스로 삼아 노드의 데이터를 배열에 저장하는 방법 링크표현법: 포인터를 이용하여 부모노드가 자식노드를 가리키게 하는 방법 Slide 12 (of 50)
부모와 자식 인덱스 관계 노드 i의 부모 노드 인텍스 = i/2 노드 i의 왼쪽 자식 노드 인텍스 = 2i Slide 13 (of 50)
링크의 구현 노드는 구조체로 표현 링크는 포인터로 표현 typedef struct TreeNode { int data; struct TreeNode *left, *right; } TreeNode; Slide 14 (of 50)
링크 표현법 프로그램 #include <stdio.h> #include <stdlib.h> #include <memory.h> typedef struct TreeNode { int data; struct TreeNode *left, *right; } TreeNode; // n1 // / | // n2 n3 void main() { TreeNode *n1, *n2, *n3; n1= (TreeNode *)malloc(sizeof(TreeNode)); n2= (TreeNode *)malloc(sizeof(TreeNode)); n3= (TreeNode *)malloc(sizeof(TreeNode)); n1->data = 10; // 첫번째 노드를 설정한다. n1->left = n2; n1->right = n3; n2->data = 20; // 두번째 노드를 설정한다. n2->left = n2->right = NULL; n3->data = 30; // 세번째 노드를 설정한다. n3->left = n3->right = NULL; } Slide 15 (of 50)
이진트리의 순회 순회(traversal): 트리의 노드들을 체계적으로 방문하는 것 3가지의 기본적인 순회방법 가상실습 전위순회(preorder traversal) : VLR 자손노드보다 루트노드를 먼저 방문한다. 중위순회(inorder traversal) : LVR 왼쪽 자손, 루트, 오른쪽 자손 순으로 방문한다. 후위순회(postorder traversal) : LRV 루트노드보다 자손을 먼저 방문한다. Slide 16 (of 50)
전위순회 개념설명 1. 루트 노드를 방문한다 2. 왼쪽 서브트리를 방문한다 3. 오른쪽 서브트리를 방문한다 preorder(x) if x≠NULL then print DATA(x); preorder(LEFT(x)); preorder(RIGHT(x)); Slide 17 (of 50)
전위 순회 응용 (예) 구조화된 문서출력 Slide 18 (of 50)
중위순회 1. 왼쪽 서브트리를 방문한다 2. 루트 노드를 방문한다 3. 오른쪽 서브트리를 방문한다 개념설명 inorder(x) if x≠NULL then inorder(LEFT(x)); print DATA(x); inorder(RIGHT(x)); Slide 19 (of 50)
중위 순회 응용 (예) 수식 트리 Slide 20 (of 50)
후위순회 1. 왼쪽 서브트리를 방문한다 2. 오른쪽 서브트리를 방문한다 3. 루트 노드를 방문한다 개념설명 postorder(x) if x≠NULL then postorder(LEFT(x)); postorder(RIGHT(x)); print DATA(x); Slide 21 (of 50)
후위 순회 응용 (예) 디렉토리 용량 계산 Slide 22 (of 50)
순회 프로그램 typedef struct TreeNode { int data; struct TreeNode *left, *right; } TreeNode; // 15 // 4 20 // 1 16 25 TreeNode n1={1, NULL, NULL}; TreeNode n2={4, &n1, NULL}; TreeNode n3={16, NULL, NULL}; TreeNode n4={25, NULL, NULL}; TreeNode n5={20, &n3, &n4}; TreeNode n6={15, &n2, &n5}; TreeNode *root= &n6; Slide 23 (of 50)
순회 프로그램 (계속) // 중위 순회 inorder( TreeNode *root ){ if ( root ){ inorder( root->left ); // 왼쪽서브트리 순회 printf("%d", root->data ); // 노드 방문 inorder( root->right ); // 오른쪽서브트리 순회 } // 전위 순회 preorder( TreeNode *root ){ preorder( root->left ); // 왼쪽서브트리 순회 preorder( root->right ); // 오른쪽서브트리 순회 Slide 24 (of 50)
순회 프로그램 (계속) // 후위 순회 postorder( TreeNode *root ){ if ( root ){ postorder( root->left ); // 왼쪽서브트리 순회 postorder( root->right ); // 오른쪽서브트리순회 printf("%d", root->data ); // 노드 방문 } void main() { inorder(root); preorder(root); postorder(root); Slide 25 (of 50)
레벨 순회 레벨 순회(level order)는 각 노드를 레벨 순으로 검사하는 순회 방법 지금까지의 순회법이 스택을 사용했던 것에 비해 레벨 순회는 큐를 사용하는 순회법이다. Slide 26 (of 50)
레벨 순회 알고리즘 level_order(root) initialize queue; enqueue(queue, root); while is_empty(queue)≠TRUE do x← dequeue(queue); if( x≠NULL) then print DATA(x); enqueue(queue, LEFT(x)); enqueue(queue, RIGHT(x)); Slide 27 (of 50)
수식 트리 수식트리: 산술식을 트리형태로 표현한 것 예) 비단말노드: 연산자(operator) 단말노드: 피연산자(operand) 예) 수식 a + b a - (b × c) (a < b) or (c < d) 전위순회 + a b - a × b c or < a b < c d 중위순회 a - b × c a < b or c < d 후위순회 a b + a b c × - a b < c d < or Slide 28 (of 50)
수식트리계산 후위순회를 사용 서브트리의 값을 순환호출로 계산 evaluate(exp) if exp = NULL then return 0; else x←evaluate(exp->left); y←evaluate(exp->right); op←exp->data; return (x op y); 후위순회를 사용 서브트리의 값을 순환호출로 계산 비단말노드를 방문할때 양쪽서브트리의 값을 노드에 저장된 연산자를 이용하여 계산한다 Slide 29 (of 50)
프로그램 typedef struct TreeNode { int data; struct TreeNode *left, *right; } TreeNode; // + // * + // 1 4 16 25 TreeNode n1={1, NULL, NULL}; TreeNode n2={4, NULL, NULL}; TreeNode n3={'*', &n1, &n2}; TreeNode n4={16, NULL, NULL}; TreeNode n5={25, NULL, NULL}; TreeNode n6={'+', &n4, &n5}; TreeNode n7={'+', &n3, &n6}; TreeNode *exp= &n7; Slide 30 (of 50)
프로그램 (계속) int evaluate(TreeNode *root) { if( root == NULL) return 0; if( root->left == NULL && root->right == NULL) return root->data; else { int op1 = evaluate(root->left); int op2 = evaluate(root->right); switch(root->data){ case '+': return op1+op2; case '-': return op1-op2; case '*': return op1*op2; case '/': return op1/op2; } void main() printf("%d", evaluate(exp)); Slide 31 (of 50)
이진트리연산: 노드 개수 탐색 트리안의 노드의 개수를 계산 int get_node_count(TreeNode *node) { int count=0; if( node != NULL ) count = 1 + get_node_count(node->left)+ get_node_count(node->right); return count; } 탐색 트리안의 노드의 개수를 계산 각각의 서브트리에 대하여 순환 호출한 다음, 반환되는 값에 1을 더하여 반환 1 3 2 6 Slide 32 (of 50)
이진트리연산: 높이 서브트리에 대하여 순환호출하고 서브 트리들의 반환값 중에서 최대값을 구하여 반환 int get_height(TreeNode *node) { int height=0; if( node != NULL ) height = 1 + max(get_height(node->left), get_height(node->right)); return height; } Slide 33 (of 50)
스레드 이진 트리 G C F A B D E 이진트리의 NULL 링크를 이용하여 순환호출 없이도 트리의 노드들을 순회 NULL 링크에 중위 순회시에 후속 노드인 중위 후속자(inorder successor)를 저장시켜 놓은 트리가 스레드 이진 트리(threaded binary tree) 단말노드와 비단말노드의 구별을 위히여 is_thread 필드 필요 G C F A B D E 1 2 3 4 5 6 7 typedef struct TreeNode { int data; struct TreeNode *left, *right; int is_thread; //만약 오른쪽 링크가 스레드이면 TRUE } TreeNode; Slide 34 (of 50)
스레드 이진 트리 (후속자찾기) TreeNode *find_successor(TreeNode *p) { // q 는 p의 오른쪽 포인터 TreeNode *q = p->right; // 만약 오른쪽 포인터가 NULL이거나 스레드이면 오른쪽 포인터를 반환 if(q==NULL || p->is_thread==TRUE) return q; // 만약 오른쪽 자식이면 다시 가장 왼쪽 노드로 이동 while(q->left != NULL) q=q->left; } Slide 35 (of 50)
스레드 이진 트리 (중위순회) Void thread_inorder(TreeNode *t) { TreeNode *q; q = t; while(q->left) q = q->left; // 가장 왼쪽 노드로 간다. do { printf(“%c”, q->data); // 데이터 출력 q = find_successor(q); // 후속자 함수 호출 } while(q); } Slide 36 (of 50)
이진탐색트리 탐색작업을 효율적으로 하기 위한 자료구조 key(왼쪽서브트리)≤key(루트노드)≤key(오른쪽서브트리) 가상실습 탐색작업을 효율적으로 하기 위한 자료구조 key(왼쪽서브트리)≤key(루트노드)≤key(오른쪽서브트리) 이진탐색을 중위순회하면 오름차순으로 정렬된 값을 얻을 수 있다. Slide 37 (of 50)
이진탐색트리에서의 탐색연산 비교한 결과가 같으면 탐색이 성공적으로 끝난다. 비교한 결과가, 주어진 키 값이 루트 노드의 키값보다 작으면 탐색은 이 루트 노드의 왼쪽 자식을 기준으로 다시 시작한다. 비교한 결과가, 주어진 키 값이 루트 노드의 키값보다 크면 탐색은 이 루트 노드의 오른쪽 자식을 기준으로 다시 시작한다. search(x, k) if x=NULL then return NULL; if k=x->key then return x; else if k<x->key then return search(x->left, k); else return search(x->right, k); Slide 38 (of 50)
탐색을 구현하는 방법 순환적 방법 반복적 방법 //순환적인 탐색 함수 TreeNode *search(TreeNode *node, int key) { if ( node == NULL ) return NULL; if ( key == node->key ) return node; (1) else if ( key < node->key ) return search(node->left, key); (2) else return sear ch(node->right, key); (3) } // 반복적인 탐색 함수 TreeNode *search(TreeNode *node, int key) { while(node != NULL){ if( key == node->key ) return node; else if( key < node->key ) node = node->left; else node = node->right; } return NULL; Slide 39 (of 50)
이진탐색트리에서의 삽입연산 이진 탐색 트리에 원소를 삽입하기 위해서는 먼저 탐색을 수행하는 것이 필요 탐색에 실패한 위치가 바로 새로운 노드를 삽입하는 위치 insert_node(T,z) p←NULL; t←root; while t≠NULL do p←t; if z->key < p->key then t←p->left; else t←p->right; if p=NULL then root←z;// 트리가 비어있음 else if z->key < p->key then p->left←z else p->right←z Slide 40 (of 50)
이진탐색트리에서의 삽입연산 // key를 이진 탐색 트리 root에 삽입한다. void insert_node(TreeNode **root, int key) { TreeNode *p, *t; // p는 부모노드, t는 현재노드 TreeNode *n; // n은 새로운 노드 t = *root; p = NULL; // 탐색을 먼저 수행 while (t != NULL){ if( key == t->key ) return; p = t; if( key < t->key ) t = t->left; else t = t->right; } Slide 41 (of 50)
이진탐색트리에서의 삽입연산 // key가 트리 안에 없으므로 삽입 가능 n = (TreeNode *) malloc(sizeof(TreeNode)); if( n == NULL ) return; // 데이터 복사 n->key = key; n->left = n->right = NULL; // 부모 노드와 링크 연결 if( p != NULL ) if( key < p->key ) p->left = n; else p->right = n; else *root = n; } Slide 42 (of 50)
이진탐색트리에서의 삭제연산 3가지의 경우 1. 삭제하려는 노드가 단말 노드일 경우 2. 삭제하려는 노드가 하나의 왼쪽이나 오른쪽 서브 트리중 하나만 가지고 있는 경우 3. 삭제하려는 노드가 두개의 서브 트리 모두 가지고 있는 경우 CASE 1: 삭제하려는 노드가 단말 노드일 경우: 단말노드의 부모노드를 찾아서 연결을 끊으면 된다. Slide 43 (of 50)
이진탐색트리에서의 삭제연산 CASE 2:삭제하려는 노드가 하나의 서브트리만 가지고 있는 경우 :삭제되는 노드가 왼쪽이나 오른쪽 서브 트리중 하나만 가지고 있는 경우에는 노드는 삭제하고 서브 트리는 부모 노드에 붙여준다. Slide 44 (of 50)
이진탐색트리에서의 삭제연산 CASE 3:삭제하려는 노드가 두개의 서브트리를 가지고 있는 경우: 삭제노드와 가장 비숫한 값을 가진 노드를 삭제노드 위치로 가져온다. Slide 45 (of 50)
이진탐색트리에서의 삭제연산 // 삭제 함수 void delete_node(TreeNode **root, int key) { TreeNode *p, *child, *succ, *succ_p, *t; // key를 갖는 노드 t를 탐색, p는 t의 부모노드 p = NULL; t = *root; // key를 갖는 노드 t를 탐색한다. while( t != NULL && t->key != key ){ p = t; t = ( key < t->key ) ? t->left : t->right; } // 탐색이 종료된 시점에 t가 NULL이면 트리안에 key가 없음 if( t == NULL ) { // 탐색트리에 없는 키 printf("key is not in the tree"); return; Slide 46 (of 50)
이진탐색트리에서의 삭제연산 // 첫번째 경우: 단말노드인 경우 if( (t->left==NULL) && (t->right==NULL) ){ if( p != NULL ){ // 부모노드의 자식필드를 NULL로 만든다. if( p->left == t ) p->left = NULL; else p->right = NULL; } else // 만약 부모노드가 NULL이면 삭제되는 노드가 루트 *root = NULL; Slide 47 (of 50)
이진탐색트리에서의 삭제연산 // 두번째 경우: 하나의 자식만 가지는 경우 else if((t->left==NULL)||(t->right==NULL)){ child = (t->left != NULL) ? t->left : t->right; if( p != NULL ){ if( p->left == t ) // 부모를 자식과 연결 p->left = child; else p->right = child; } else // 만약 부모노드가 NULL이면 삭제되는 노드가 루트 *root = child; Slide 48 (of 50)
이진탐색트리에서의 삭제연산 // 세번째 경우: 두개의 자식을 가지는 경우 else{ // 오른쪽 서브트리에서 후계자를 찾는다. succ_p = t; succ = t->right; // 후계자를 찾아서 계속 왼쪽으로 이동한다. while(succ->left != NULL){ succ_p = succ; succ = succ->left; } // 후속자의 부모와 자식을 연결 if( succ_p->left == succ ) succ_p->left = succ->right; else succ_p->right = succ->right; // 후속자가 가진 키값을 현재 노드에 복사 t->key = succ->key; // 원래의 후속자 삭제 t = succ; free(t); Slide 49 (of 50)
이진탐색트리의 성능분석 이진 탐색 트리에서의 탐색, 삽입, 삭제 연산의 시간 복잡도는 트리의 높이를 h라고 했을때 h에 비례한다 최선의 경우 이진 트리가 균형적으로 생성되어 있는 경우 h=log2n 최악의 경우 한쪽으로 치우친 경사이진트리의 경우 h=n 순차탐색과 시간복잡도가 같다. Slide 50 (of 50)