Hadoop 의사분산모드 환경설정.

Slides:



Advertisements
Similar presentations
ⓒ 2015 NHN Entertainment Corp. Django 로 만드는 초간단 블로그 시스템운영팀 김영태 개발환경 구축.
Advertisements

프로그램이란 프로그램 생성 과정 프로젝트 생성 프로그램 실행 컴퓨터를 사용하는 이유는 무엇인가 ? – 주어진 문제를 쉽고, 빠르게 해결하기 위해서 사용한다. 컴퓨터를 사용한다는 것은 ? – 컴퓨터에 설치 혹은 저장된 프로그램을 사용하는 것이다. 문제를 해결하기 위한.
Android 프로그램개발 환경. 학습 목표 ■ 교육 목표  JDK 설치  JDK 환경 설정  Eclipse 설치  Android SDK 설치  ADT Plug-in 설치  Android Virtual Device(AVD) 설치  Android 예제 프로그램.
난이도 : 초급 제1장 앱 인벤터 소개 및 준비.
목차 Contents 무선인터넷용 비밀번호 설정방법 Windows 7 Windows 8 Windows XP MAC OS.
기초C언어 제1주 실습 강의 소개, C언어 개요, Cygwin/Eclipse 사용 컴퓨터시뮬레이션학과 2016년 봄학기
컴퓨터프로그래밍 1주차실습자료 Visual Studio 2005 사용법 익히기.
Image & Video processing
코크파트너 설치 가이드 Window 7.
Consumer PC & AIO PC DMI Refresh 방법 설명 (UEFI DMI Ver)
ERP 전용 브라우저 설치 매뉴얼 (Windows 7)
윈도우7 체크 설치 매뉴얼
Cross Compiler를이용한 커널 컴파일 및 포팅
Cross Compiler를이용한 커널 컴파일 및 포팅 1
MYSQL 설치.
툴 설치 가이드 Design Compiler SynopsysMentor.
CUDA Setting : Install & Compile
Hadoop 2.완전 분산 처리.
Linux/UNIX Programming
뇌를 자극하는 Windows Server 2012 R2
J2ME Install 부산대학교 인공지능 연구실.
(개정판) 뇌를 자극하는 Red Hat Fedora 리눅스 서버 & 네트워크
네트워크 프로그래밍 및 실습.
ANSYS17.2 Student 제품 무료 다운로드
Ubiquitous Computing Practice - Part I (Installation) -
임베디드 시스템 개론 크로스 플랫폼 설치 2일차 강의 자료 Embedded System Lab.
한국골프대학 종합정보시스템 Windows Vista 사용자를 위한 Component 설치안내서
한국골프대학 종합정보시스템 Windows 7 사용자를 위한 Component 설치안내서
NCS 학사운영 시스템 Guide.
Hadoop 김연왕
CHAPTER 02 OpenCV 개요 PART 01 영상 처리 개요 및 OpenCV 소개.
Root Filesystem Porting
제 2 장 WML 시뮬레이터 및 무선인터넷 서버 설치
Root Filesystem Porting
                              데이터베이스 프로그래밍 (소프트웨어 개발 트랙)                               퍼스널 오라클 9i 인스톨.
Cross Compiler 설치.
SSL-VPN 설치 및 접속 설명서.
뇌를 자극하는 Windows Server 장. 장애 조치 클러스터.
환경 : Windows7 64bit 버전 : apache-ant-1.9.7
Cross Compiler를이용한 커널 컴파일 및 포팅
2장. JSP 프로그래밍을 위한 환경구성 제2장.
㈜시스원이 제공하는 시스템 관리 통합 솔루션 SysmanagerOne Agent설치 안내서
설치 환경 □ 운영체제 버전 : CentOS Linux 7.2 □ 리눅스 커널 버전 :
IPython Notebook + Spark + TensorFlow on MacOS
ERP 전용 브라우저 설치 매뉴얼 (Windows 7)
툴 설치 가이드 PrimeTime SynopsysMentor.
툴 설치 가이드 Formality SynopsysMentor.
Linux/UNIX Programming
스크린 샷 클릭가능 클릭시 영한사전 반영.
HyperWorks Apps 설치 가이드.
RHEL3 + oracle8i + DB생성.
Git 사용하기 Git 소개 Git 사용 환경 GitHub 가입 및 원격 저장소 만들기 Git 설치 Git 최초 설정
1. 스크립트 작성 마법사 2. NSIS 스크립트 컴파일
PMIS 서버 설정 환경설정 작성자 : 배경환.
빌드 성공.
STS 에서 웹 서버 설치 방법.
OpenCV 설정 2.21 만든이 딩딩.
KISTI Supercomputing Center 명훈주
 파일 아카이브와 압축 명령 익히기.
01. 분산 파일 시스템의 개요 네트워크에 분산된 파일을 사용자가 쉽게 접근하고 관리할 수 있게 해준다.
기초C언어 제2주 실습 프로그래밍의 개념, 프로그램 작성 과정 컴퓨터시뮬레이션학과 2016년 봄학기 담당교수 : 이형원
농구 로봇 따라해 보기.
시스템 인터페이스 Lab1 X-window 및 명령어 사용.
1. 인터넷 보안 옵션 레지스트리 등록 Config Setup 클릭.
IPC 펌웨어 업그레이드 방법 안내 ** 반드시 IPC를 NVR POE 포트 연결 전에 작업 하시기 바랍니다. IPC를 NVR POE 포트에 연결 하실 경우 IP 대역폭을 마추셔야 하는 작업이 필요합니다. **
소리가 작으면 이어폰 사용 권장!.
FTP 스캔 설정 방법 강사 : 이성휘 대리.
어드민 로그인 ID : admin 비밀번호 : 서보테크 1. 제품소개 등록 - MISUBISHI
Docker Study 6~7.
MOODEL SETUP MANUAL 6조 08 이대우 08 홍정무 11 강성민 11 김혜지.
Presentation transcript:

Hadoop 의사분산모드 환경설정

시작에 앞서… 기본적인 Linux 명령어와 환경변수 설정법을 꼭!! 익히고 봐주었으면 한다 PPT를 따라하는 도중에 에러가 발생할경우 GOOGLE에서 찾으면 다 나온다. HADOOP은 분산저장과 분산처리 플랫폼이다. 막히는 부분과 에러가 발생해서 해결한경우 해당 PPT를 수정해서 이어나가길 바란다. 모든 에러는 host의 주소를 알지 못하는 경우가 많다. 이 ppt에서 Linux 기본 hostname = localhost 사용 (hostname명령어를 이용하여 확인)

1.JAVA 설치 하둡은 자바 기반임. 다운로드 해당 URL로 접속

1.JAVA 설치 JAVA 8 말고 7을 설치권장함 스크롤을 내리면 7받을수 있는 버튼이 있다. 버튼 클릭

1.JAVA 설치 자바 다운로드 Accept License 체크후 자기 운영체제에 맞는 것 다운로드 현재 Centos 6.5 를 사용하고 있으므로 JDK버전-linux.x64-tar.gz *자기 자신의 운영체제 bit에 맞게 다운로드

1.JAVA 설치 압축 해제 앞으로 사용할 파일들은 기본 “/usr/local” 디렉토리로 사용할 것이다. cd ~/다운로드(다운로드 폴더)로 이동 다운로드 디렉토리에 다운받은 자바파일을 /usr/local로 이동 해당 명령어를 이용하여 압축해제

1.JAVA 설치 심볼릭 링크 걸어주기 환경변수 Jdk로 시작되는 디렉토리의 닉네임을 정해준다. 앞으로 jdk~~ 폴더는 java라는 이름으로 사용할수 있게된다. 환경변수 환경변수 설정을 하면 어디에서든지 자바명령어를 사용가능하다 여러가지 환경설정파일을 사용할수 있지만 우리는 /etc/profile 에 작성한다.(vi명령어는 텍스트 편집 도구이다.)

1.JAVA 설치 환경변수 설정 Profile 파일에 아무곳이나 해당 텍스트를 입력한다. 입력이 끝났으면 esc -> ‘:’키 누름 -> wq입력 -> 엔터 (저장하는법) 이제 source /etc/profile 을 입력하여 해당 파일을 업데이트 한다 만약 에러메시지가 나올경우 스펠링 틀린것. 해당 명령어를 입력하여 제대로 그 디렉토리로 이동이 되는지 확인

2.하둡 설치 Hadoop.apache.org 접속 왼쪽 메뉴에서 Release 버튼 클릭. Download 클릭

2.하둡 설치 하둡 다운로드 Download a release now ! 클릭 해당 미러사이트 클릭

2.하둡 설치 하둡 다운로드 Hadoop-1.2.1 이 PPT에서는 1.2.1 버전을 사용할것이다.

2.하둡 설치 하둡 다운로드 Hadoop-1.2.1-tar.gz 다운로드

2.하둡 설치 하둡 다운로드 리눅스 다운경로로 이동.(cd ~/다운로드) 하둡파일 /usr/local로 이동(mv hadoop-1.2.1.tar.gz /usr/local) Gz 압축 풀기(tar xvfz hadoop-1.2.1.tar.gz) 심볼릭링크 걸어주기(ln –s hadoop-1.2.1 hadoop) 결과 화면 하둡 폴더 hadoop-1.2.1 과 심볼릭링크로 걸린 hadoop 이 있으면 성공

2.하둡 설치 하둡 환경변수 설정 자바 설치때와 마찬가지로 hadoop폴더에 링크를 걸어주겠다. vi 에디터로 profile 수정(vi /etc/profile) 다음과 같은 구문을 추가시켜준다. * HADOOP_HOME_WARN_SUPPRESS 는 하둡실행시 뜨는 에러를 처리하기 위함

2.하둡 설치 하둡 확인 vi 에디터로 수정완료 했으면 (esc -> ‘:’ -> wq입력 -> 엔터 로 저장) source /etc/profile 을 입력하여 업데이트 해주고 Hadoop version을 입력하여 제대로 환경변수가 잡혔는지 확인 다음 그림과 같이 뜨면 정상설치

3.하둡 환경설정 하둡의 모드 독립실행 모드 의사분산 모드 완전분산 모드 자세한 설명은 책이나 구글을 찾아볼것! - 하둡개발의 환경설정만 해주는 모드 맵리듀스 테스트할때 사용 의사분산 모드 - 로컬컴퓨터 하나에서 데몬 프로세스를 여러 개 사용하는 모드 완전분산 모드 - 실제로 클러스터를 구성하고 하둡을 설정하는 모드 자세한 설명은 책이나 구글을 찾아볼것!

3.하둡 환경설정 이 PPT는 의사분산모드 목적으로 만들었으므로 의사분산 모드 환경설정을 따른다 하둡의 모드의 변경을 위해서는 hadoop 디렉토리내의 conf안에 있는 모든 파일들에게 환경을 명시해주어야 한다. 수정해야할 파일들 목록 core-site.xml ( 공통적인 환경설정) hdfs-site.xml (HDFS 에 관한 환경설정 - 저장소관련) mapred-site.xml (맵리듀스에 관한 환경설정 – 데이터분석 관련)

3.하둡 환경설정 환경설정 하둡 conf디렉토리로 이동하여 환경설정을 시작한다 cd $HADOOP_HOME/conf “core-site.xml” 수정 (vi core-site.xml)

3.하둡 환경설정 환경설정 “hdfs-site.xml” 수정(vi hdfs-site.xml) “mapred-site.xml” 수정(vi mapred-site.xml)

3.하둡 환경설정 SSH 설정 하둡은 노드간의 통신을 ssh 방식으로 사용하기 때문에 문제를 해결하기 위해 공개키를 설정해 준다. Rsa 키 생성 (ssh-keygen –t rsa 입력 [모든 물음은 다 엔터])

3.하둡 환경설정 SSH 설정 키를 자기 자신에게 설정 cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys ssh root@localhost 입력하여 비밀번호를 묻지 않는다면 성공!

4.하둡 실행 HDFS 초기화 hadoop namenode –format 명령어를 이용하여 포맷한다. start-all.sh 를 입력하여 하둡데몬프로세스 실행 Jps 명령어를 입력하여 밑에 그림과같이 6개 목록이 뜨면 실행성공!

4.하둡 실행 Jps 의 데몬포로세스의 수가 적을 경우 다음과 같은 로그가 발생했을 경우 에러만 읽어봐도. JAVA_HOME이 잡혀 있지 않다는 뜻. 이럴경우 $HADOOP_HOME/conf 에 hadoop-env.sh 파일에 자바홈 경로를 잡아주어야한다. vi $HADOOP_HOME/conf/hadoop-env.sh 로 열고 밑이 주석위치에 있는 텍스트를 다음과같이 수정

4.하둡 실행 이제 환경설정은 끝났으니 간단한 예제로 데이터 분석해보자 Wordcount를 해보자 분석할 데이터를 생성하자 Test.txt 라는 텍스트 파일을 만들고 아무단어나 입력하여 저장 HDFS에 업로드 Test.txt

4.하둡 실행 하둡 실행 하둡 디렉토리에서 다음과 같은 명령어로 실행 명령어 해석 hadoop : 하둡 실행 jar : jar파일을 사용 hadoop-example-1.2.1.jar : 해당이름의 자르파일을 사용하여 분석 wordcount : 해당 자르파일중에 wordcount 실행 test.txt : Input data가 HDFS 에 Test.txt 라는 파일을 사용하겠단든 뜻 output : 결과를 HDFS 에 output 디렉토리에 저장 하겠다는 뜻

4.하둡 실행 하둡 실행 \ 다음과 같이 수행로그가 뜨고 아무 예외가 일어나지 않았다면 성공!

4.하둡 실행 하둡 실행 다음과 같이 결과값이 나타난다면 성공 내용확인

5. TIP Start-all.sh 로 하둡 데몬프로세스를 실행 Jps 를 입력해보았더니 namenode 만 켜지지않았다.

5.TIP Start-all.sh 로 하둡 데몬프로세스를 실행 문제발생 이유를 확인(하둡 log를 이용) 로그를 확인하다 익셉션이 뜬것을 확인 문제 :Exception 확인결과. /tmp/hadoop-root/dfs/name(네임노드 경로) 디렉토리가 존재하지 않음. 해결 : hadoop namenode –format 을 이용하여 네임노드 초기화 필요

5.TIP Start-all.sh 로 하둡 데몬프로세스를 실행 문제를 확인 Name 디렉토리가 없다.

5.TIP Start-all.sh 로 하둡 데몬프로세스를 실행 해결방법 1 2 3 포맷 명령어 Hadoop namenode –format을 두번 입력하고 Y를 입력해서 포맷을 실행함

5.TIP Start-all.sh 로 하둡 데몬프로세스를 실행 다시 실행 Jps로 확인 Namenode가 실행되지만. Datanode가 사라졌다. 다시 확인해보자.

5.TIP Start-all.sh 로 하둡 데몬프로세스를 실행 문제발생 이유 확인 이유: datanode ID 와 namenode ID와 같지 않음. 해결방안 : /tmp/hadoop-root/dfs/data 디렉토리를 지우고 하둡 재시작.

5.TIP Start-all.sh 로 하둡 데몬프로세스를 실행 해결 방법 1 2 3

감사합니다 2009301080 전광영