Hadoop 2.완전 분산 처리.

Slides:



Advertisements
Similar presentations
ⓒ 2015 NHN Entertainment Corp. Django 로 만드는 초간단 블로그 시스템운영팀 김영태 개발환경 구축.
Advertisements

CHAP. 2 안드로이드 개발 도구 설치. © 2012 생능출판사 All rights reserved 개발 과정의 개요.
1 강. 안드로이드 개요 및 개발 환경 구축 - 안드로이드 개요 -JDK 설치 -Path 설정 - 이클립스 설치 -ADT, SDK 설치 Lecturer Kim Myoung-Ho Nickname 블스
김 연 왕 Hadoop. 준 비 사 항 하 둡 은 자 바 언어로 작성되었기 때 문에 컴퓨 터에 자 바 버 전 6 이상 하 둡 은 리 눅 스와 윈 도우에서 동작
7 장. 원격지에서 리눅스서버를 관리하자. 텔넷서버를 설치 / 운영한다. SSH 서버를 운영한다. VNC 서버를 설치 / 운영한다.
Android 프로그램개발 환경. 학습 목표 ■ 교육 목표  JDK 설치  JDK 환경 설정  Eclipse 설치  Android SDK 설치  ADT Plug-in 설치  Android Virtual Device(AVD) 설치  Android 예제 프로그램.
기초C언어 제1주 실습 강의 소개, C언어 개요, Cygwin/Eclipse 사용 컴퓨터시뮬레이션학과 2016년 봄학기
HDFS Tutorial.
자바 언어의 이해 Understanding of Java Programming
Image & Video processing
1. 신뢰할 수 있는 싸이트 등록 인터넷 익스플로러 실행 후 실행
코크파트너 설치 가이드 Window 7.
Power Java 제3장 이클립스 사용하기.
Postfix MTA SPARCS 08 진준호 ( Alex ).
하둡 설치 신현호 이영건.
Hadoop 의사분산모드 환경설정.
윈도우7 체크 설치 매뉴얼
Cross Compiler를이용한 커널 컴파일 및 포팅
Cross Compiler를이용한 커널 컴파일 및 포팅 1
MYSQL 설치.
MYSQL 설치 및 설정 아이티즌 기술연구소 김태성 연구원
툴 설치 가이드 Design Compiler SynopsysMentor.
Hands-On Exercise :Using HDFS
PHP입문 Izayoi 김조흔.
Linux/UNIX Programming
나민영 서경대학교 컴퓨터공학과 CGVR Lab 같이만들어보자 5주차 OpenCV 설정 및 기초.
Team Project : SSL 2008/05/27 정보보호 응용 발표자 : 신용철.
Windows 8 Ksystem G&I 설치.
Mysql Install on Azure
임베디드 시스템 개론 크로스 플랫폼 설치 2일차 강의 자료 Embedded System Lab.
Hadoop 김연왕
4-1장. MySQL 제13장.
CHAPTER 02 OpenCV 개요 PART 01 영상 처리 개요 및 OpenCV 소개.
8장. 원격지 시스템 관리하기.
Root Filesystem Porting
Root Filesystem Porting
Hadoop 김연왕
                              데이터베이스 프로그래밍 (소프트웨어 개발 트랙)                               퍼스널 오라클 9i 인스톨.
소프트웨어 분석과 설계 Struts2 & JBOSS 설치하기
HDFS와 대용량 데이터 처리 콘텐츠서비스연구팀 최완.
WinCE Device Driver 실습 #2
ASP.NET AJAX 비동기 게시판 작성 2007 컴퓨터공학실험( I )
Git 사용법 GitHub 가입 GitHub 새 저장소 만들기 Git 설치 로컬 저장소 만들기 로컬 저장소와 원격 저장소 연결
2장 JSP 개발 환경 설정 이장에서 배울 내용 : JSP 페이지를 작성하기 위한 개발환경을 설정하고, 웹 어플리케이션 개발을 위해 반드시 이해하여야 할 웹 어플리케이션 폴더 구조에 대해 학습한다. 또한 요청된 JSP 페이지가 어떠한 처리과정을 거쳐 응답이 이루어지는가에.
환경 : Windows7 64bit 버전 : apache-ant-1.9.7
Cross Compiler를이용한 커널 컴파일 및 포팅
반응형 웹 프로젝트
솔라리스10 3장. 솔라리스 패키지 관리.
㈜시스원이 제공하는 시스템 관리 통합 솔루션 SysmanagerOne Agent설치 안내서
IPython Notebook + Spark + TensorFlow on MacOS
영상처리 실습 인공지능연구실.
BERT Install Guide 숭실대학교 test.
툴 설치 가이드 PrimeTime SynopsysMentor.
툴 설치 가이드 Formality SynopsysMentor.
Linux/UNIX Programming
뇌를 자극하는 Windows Server 장. 원격 접속 서버.
DataScience Lab. 박사과정 김희찬 (목)
안드로이드 앱 개발과정 Step1. 기초과정 강사 : 정 훈 희.
RHEL3 + oracle8i + DB생성.
맵리듀스 Yonsei University 2nd Semester, 2014 Sanghyun Park
OpenCV 설정 2.21 만든이 딩딩.
DK-128 개발환경 설정 아이티즌 기술연구소
KISTI Supercomputing Center 명훈주
기초C언어 제2주 실습 프로그래밍의 개념, 프로그램 작성 과정 컴퓨터시뮬레이션학과 2016년 봄학기 담당교수 : 이형원
시스템 인터페이스 Lab1 X-window 및 명령어 사용.
Homework #3 (1/3) 다음을 수행한 후, 결과 파일들을 출력하여 제출한다.
FTP 스캔 설정 방법 강사 : 이성휘 대리.
Git을 이용한 버전 관리 - Branch 실습
숙제 작성 및 제출 과정 김진하 2008/03/14.
Docker Study 6~7.
Presentation transcript:

Hadoop 2.완전 분산 처리

목차 클러스터 명세 클러스터 설정 및 설치 SSH설치 하둡 환경설정 얀 환경설정 보안 하둡 클러스터 벤치마킹 하둡 클라우드

1.준비 Centos6.5 Jdk1.7 Hadoop1.2.1 eclipse

1.준비 하둡 테스트 환경 구성 정보 호스트 파일 수정(클러스터 그룹 내용 통일) vi ^ /etc/hosts 호스트명 하둡설치내용 NIL~ 네임노드 보조네임노드,데이터노드 데이터노드

1.준비 Ssh 키 생성 ? : SSH 프로토콜을 이용해 하둡 클러스터 간의 내부 통신을 수행한다 ssh-keygen ^ –t ^ rsa (입력 후 모두 엔터)

1.준비 Ssh 공개키 전송 ssh-copy-id ^ –i ^ root@호스트명 모든 데이터노드호스트에게 공개키 전달 네임노드 기준으로 (클러스터내의 모든 데이터노드에게 전송)

2.환경설정 하둡 환경설정 파일명 용도 Hadoop-env.sh Masters Slaves Core-site.xml 하둡을 실행하는 셸스크립트파일에서 필요한 환경변수 설정 Masters 보조네임노드 설정 Slaves 데이터노드 설정 Core-site.xml Hdfs와 맵리듀스의 공통 환경 Hdfs-site.xml Hdfs에서 필요한 환경정보 Mapred-site.xml 맵리듀스에서 필요한 환경정보

2.환경설정 Matsers Slaves 보조네임노드 호스트명(위치: $HADOOP_HOME/conf/masters) 데이터노드 호스트명(위치 : $HADOOP_HOME/conf/slaves)

2.환경설정 Core-site.xml Hdfs,맵리듀스 공통설정(위치: $HADOOP_HOME/conf/core-site.xml) (hdfs의 기본이름)

2.환경설정 Hdfs-site.xml Hdfs 환경설정(위치 : $HADOOP_HOME/conf/hdfs-site.xml) dfs.replication = 데이터의 복제 개수 *1인 경우 가상분산모드 dfs.http.address = 네임노드용 웹서버 의주소값 dfs.secondary.http.address = 보조네임노드용 웹서버의 주소값

2.환경 설정 Mapred-site.xml 맵리듀스 환경설정 mapred.job.tracker : 잡트래커의 주소

2.환경설정 하둡 디렉토리 복사를 위한 tar 압축 Cd ^ /usr/local tar ^ cvzf ^ hadoop.tar.gz ^ hadoop-1.2.1 결과

2.환경설정 하둡디렉토리를 데이터노드들에게 복사 scp [원본경로] [서버계정@호스트명:디렉토리] scp ^ hadoop.tar.gz ^ root@호스트명:/usr/local/ 모든 데이터노드들에 복사

2.환경설정 각 쉘에 접속하여 압축해제 모든데이터 노드에게 ssh를 이용하여 명령입력 ssh ^ 호스트명 “cd ^ /usr/local; tar ^ xvzf ^ hadoop.tar.gz; rm ^ hadoop.tar.gz”

3.실행 방화벽 서비스 정지 네임노드 초기화 service ^ iptables ^ stop chkconfig ^ iptables ^ off 네임노드 초기화 hadoop ^ namenode ^ -format

3.실행 하둡 완전분산모드 시작 start-all.sh Namenode 확인 Secondary namenode 확인

3.실행 워드 카운트 실행 cd ^ $HADOOP_HOME hadoop ^ fs ^ -put ^ conf/hadoop-env.sh ^ conf/hadoop-env.sh hadoop ^ jar ^ hadoop-examples-1.2.1.jar ^ wordcount ^ conf/hadoop-env.sh ^ wordcount_output

3.실행 결과 확인 hadoop ^ fs ^ -cat ^ wordcount_output/part-r-00000

4.이클립스 활용 데이터 다운로드 http://stat-computing.org/dataexpo/2009/ 접속 후 2008년 다운로드

4.이클립스 활용 데이터 이동 $HADOOP_HOME 에 source 디렉토리 생성 cd ^ /root/다운로드/ mv ^ 2008.csv.bz2 ^ /usr/local/source/ cd ^ $HADOOP_HOME/source/ bzip2 ^ -d ^ 2008.csv.bz2 입력 후 대기 hadoop ^ fs ^ -put ^ 2008.csv ^ input/

4.이클립스 활용 이클립스 실행 cd ^ /usr/local/eclipse ./eclipse 소스코드 다운로드

4.이클립스 활용 jar파일로 export (1) 프로젝트 오른쪽클릭 -> export

4.이클립스 활용 jar파일로 export (2) Browse 클릭

4.이클립스 활용 jar파일로 export (3) 이름 입력 후 hadoop-1.2.1/example_jar/chap5에 생성 디렉토리가 없다면 만들어 준다.

4.이클립스 활용 jar파일로 export (4) Finish 클릭

4.이클립스 활용 하둡 실행 cd ^ $HADOOP_HOME hadoop ^ jar ^ /example_jar/chap5/ DepartureDelayCount.jar ^ DepartureDelayCount ^ input/ ^ dep_delay_count

4.이클립스 활용 결과 hadoop ^ fs ^ -cat ^ dep_delay_count/part-r-00000