Linked Open Data를 가능하게 하는 도구들

Slides:



Advertisements
Similar presentations
CI(Continuous Integration) 이학성. C ontinuous I ntegration? 2 지속적으로 품질관리 를 적용하는 과정 개발자가 기존 코드의 수정 작업 을 시작할 때, 코드 베이스의복사본을 받아서 작업을 시작하면서 코드의 변경.
Advertisements

빅 데이터의 정의와 특징 빅 데이터의 이용사례 빅 데이터의 문제점 or 한계점 빅 데이터의 전망.
Open Data CKAN 컴퓨터공학과 안재영 2014 – 보안시스템응용.
한국클라우드서비스협회 ▶ 제키톡 서비스 - 제키톡 서비스 ∙ 안드로이드 기반의 모바일 무료 메시지, 무전기, 채팅 어플리케이션으로 국내뿐만 아니라 전세계 대상으로 서비스 제공 중 ∙ 현재 안드로이드폰을 대상으로 서비스 중이며, 아이폰을.
Big Data & Hadoop. 1. Data Type by Sectors Expected Value using Big Data.
2008 년 11 월 20 일 실습.  실험제목 ◦ 데이터베이스 커넥션 풀  목표 ◦ 데이터베이스 커넥션 풀의 사용.
Dept. Computer Science, Korea Univ. Intelligent Information System Lab. 웹 서비스와 시멘틱 웹의 연동 방안 연구 고려대학교 지능정보시스템 연구실 이 윤 수.
2016 유성환 Hybrid MOBILE.
컴퓨터와 인터넷.
목 차 C# 언어 특징 .NET 프레임워크 C# 콘솔 프로그램 C# 윈도우 프로그램 실습 프로그래밍세미나 2.
관광 스마트 북 발행 제안 OSMD( One Source Multi Device ).
CHAP 22. 블루투스.
Oozie Web API 기능 테스트 이승엽.
Data Interface, Data mart Technology
의사 결정 트리(decision tree)
Power Java 제3장 이클립스 사용하기.
Power Java 제3장 이클립스 사용하기.
MS-Access의 개요 1강 MOS Access 2003 CORE 학습내용 액세스 응용 프로그램은 유용한 데이터를
연결리스트(linked list).
공공정보와 Linked Data 공공데이터의 LOD 활용
제 09 장 데이터베이스와 MySQL 학기 인터넷비즈니스과 강 환수 교수.
MySQL 및 Workbench 설치 데이터 베이스.
데이터베이스 및 설계 금오공과대학교 컴퓨터공학부 이 이섭.
Management Support Mi-Jung Choi, Jae-Hyun Ham DP&NM Lab.
4장. 웹로직 서버상에서의 JDBC와 JTA의 운용
31강 JAVA 네트워크 JAVA 네트워크 InetAdress, URLConnection 클래스 Socket의 이해
11 장 LAN 기본 개념과 Ethernet LAN
MICE IT 프로젝트 2011년 1학기.
Visual Basic .NET 처음 사용하기.
SqlParameter 클래스 선문 비트 18기 발표자 : 박성한.
NJM Messenger 박상원 박연호.
                              데이터베이스 프로그래밍 (소프트웨어 개발 트랙)                               퍼스널 오라클 9i 인스톨.
모바일 자바 프로그래밍 JDBC / WAP Ps lab 오민경.
HDFS와 대용량 데이터 처리 콘텐츠서비스연구팀 최완.
차세대 인터넷 - 캐나다 발표자 : 이수미( ).
ASP.NET AJAX 비동기 게시판 작성 2007 컴퓨터공학실험( I )
SK Telecom 매출 통계 시스템의 SQL Server Reporting Services 적용사례
속성과 리스너 초기화 파라미터 외 파라미터에 대해 이해한다. 리스너를 생성해보고 사용에 대해 이해한다.
1장. 데이터베이스 자료의 조직적 집합체_데이터베이스 시스템의 이해
웹 사이트 분석과 설계 (주제 : 화면설계) 학번 : 성명 : 한형진.
간지 Ⅰ. 시스템소개 Autoway Groupware User Manual Ⅰ. 시스템 소개 | 시스템 소개.
자바 5.0 프로그래밍.
2장. 데이터베이스 관리 시스템 데이터베이스 관리 시스템의 등장 배경 데이터베이스 관리 시스템의 정의
소규모 IPTV 사업자용 실시간 미디어 플랫폼 기술
Prezi 일촌조 (1조).
Openlayers를 이용한 공공서비스 구축 사례
정보화 사회의 실생활 사례 컴퓨터개론 과제 모바일 인터넷과 차성오.
15장 컬렉션 프레임워크 Section 1 컬렉션 프레임워크의 개요 Section 2 리스트 Section 3 셋
Chapter 03. 관계 데이터베이스 설계.
AUTODESK AUTOCAD ELECTRICAL 전기제어 2D 설계 소프트웨어 표준기반 설계 생산성 도구 구조도 설계
04. DBMS 개요 명지대학교 ICT 융합대학 김정호.
기말 프로젝트 계획 MVC 패턴 기반 웹 애플리케이션 개발 프로젝트명 : 팀명 : 팀원 :
데이터 베이스 DB2 관계형 데이터 모델 권준영.
CHAP 21. 전화, SMS, 주소록.
컴퓨터공학실험 (I) 년 1학기 실험계획 -.
컴퓨터 소프트웨어 설계 및 실험 년 1학기 실험계획 -.
13주 실습강의 학기, 소프트웨어 설계 및 실험(Ⅰ).
.Net Web Application 2007 컴퓨터공학실험(Ⅰ)
3장 JSP프로그래밍의 개요 이장에서 배울 내용 : JSP페이지의 기본적인 개요설명과 JSP페이지의 처리과정 그리고 웹 어플리케이션의 구조에 대해서 학습한다.
SNS마케팅 트렌드 사회복지공동봉사회 유영진 참고: 사례.
Ⅳ. User Interface 1. User Interface (UI) 정의 2. UI 환경 3. K ILC UI 구성.
멀티미디어시스템 제 4 장. 멀티미디어 데이터베이스 정보환경 IT응용시스템공학과 김 형 진 교수.
멀티미디어시스템 제 5 장. 멀티미디어 데이터베이스 개념 IT응용시스템공학과 김 형 진 교수.
ER-관계 사상에 의한 관계데이터베이스 설계 충북대학교 구조시스템공학과 시스템공학연구실
WISE OLAP.
CHAP 15. 데이터 스토리지.
 6장. SQL 쿼리.
프로젝트 개요 OPENSTACK을 이용한 교육용 CLOUD 환경 구축! 교수님(관리자)와 학생(이용자)으로 구분.
M.B.TEAM 중간 발표 (5.18) 이 제걸 백 인호.
실전 프로젝트: 홈페이지 구축 시트콤 프렌즈 팬 사이트 구축하기.
Presentation transcript:

Linked Open Data를 가능하게 하는 도구들 2014. 1. 24. 이 규 철 충남대학교 컴퓨터공학과 kclee@cnu.ac.kr

발표 순서 Ⅰ Ⅱ III Ⅳ Linked Open Data : Web of Data CKAN & OGPL LATC & LOD2 Wrap-up Ⅰ Ⅱ III Ⅳ

Linked Open Data : Web of Data

데이터베이스의 진화 [Fujitsu 2012]

Linked Data : 차세대 진화

Linked Data : DB Silo들을 연계

CKAN & OGPL

CKAN (Comprehensive Knowledge Archive Network) 모든 형태의 데이터, 콘텐츠 공개 및 접근을 가능하게 하는 오픈소스 데이터 포털 플랫폼 OKF(Open Knowledge Foundation) 산하의 프로젝트 결과물로 OKF는 2004년 설립된 비영리 단체 목표 데이터의 게시, 공유, 검색, 사용을 가능하게 하는 도구를 제공하여 정부나 회사의 데이터를 공개함으로써 누구든지 이용 가능하게 함 라이선스 Affero GPL 3.0

CKAN 적용사례 총 70개의 정부 데이터 포탈 및 데이터 커뮤니티를 구성

CKAN 기능 및 구조

CKAN Features

CKAN Features(계속)

OGPL(Open Government Platform) 인도와 미국의 공동 프로젝트 결과물로 데이터를 공개, 공유함으로써 정부의 투명성을 보장하고 시민의 참여를 장려하는 오픈 소스 플랫폼 Future roadmap of OGPL CKAN + Drupal7

Drupal 개인 또는 커뮤니티가 웹사이트의 다양한 자료들을 손쉽게 관리, 조직, 출판할 수 있도록 다양한 기능을 제공하는 오픈 소스 CMS(Content Management System) 대표적 오픈소스 CMS : Drupal, WordPress, XpressEngine 등 오픈 소스 CMS의 특징 상용 CMS는 정해진 방식대로 활용해야 하는 반면, 오픈 소스 CMS는 개발자가 원하는 대로 변형이 가능함 상용 CMS = 변신합체로봇 오픈 소스 CMS = 레고

Drupal 구성 코어 모듈 웹 사이트 제작 플랫폼 기여 모듈 코어 모듈과 결합하여 추가 기능을 부여하는 모듈

Drupal 적용사례 미국 백악관 미국 정부 사이트의 24%, 교육 기관 사이트의 26%, 세계 100대 대학의 71% 가 Drupal을 사용

LATC & LOD2

LATC LATC (Linked Open Data Around-The-Clock)는 EU FP7의 후원을 받는 프로젝트 목표 2010년 9월 ~ 2012년 8월까지 총 2년간 진행 목표 LOD 데이터 셋 사이의 데이터 링크의 정확성과 품질, 수의 증가 LOD 게시와 소비의 지원 라이선스 Apache license 2.0

24/7 Interlinking Platform LOD Cloud에서 데이터 셋간의 RDF 링크를 생성하기 위해 제공되는 솔루션 기능 데이터간의 링크 생성 LOD Cloud로 부터 데이터 셋 검색 CKAN 데이터 셋 검색 링크 품질 측정 최근 24/7 Interlinking Platform은 LOD2의 Linking 단계를 위한 도구에 포함

24/7 Interlinking Platform 구조

LOD2 LOD2는 EU FP7 의 후원을 받는 대규모 통합 프로젝트 목표 데이터의 일관성과 품질향상 관계형 데이터와 RDF 데이터 관리의 격차 해소 데이터 게시자, 사용자를 위한 LOD의 진입 장벽 낮춤 2010년 9월 ~ 2014년 8월까지 총 4년간 진행 유럽 11개국의 15개의 파트너로 구성되어 있음

LOD2 Stack 라이프 사이클 관리를 위한 통합 도구로 LOD의 게시, 관리, 소비를 위한 일련의 절차

LOD2 Stack 라이프 사이클 도구의 라이선스 Virtuoso Sponger GPL 2.0 DBpedia Spotlight Apache 2.0 Poolparty Proprietary License D2R SparQLed 도구 라이선스 Virtuoso 7 RDF Store GPL 2.0 OntoWiki RDF Author LIMES X SILK Apache 2.0 도구 라이선스 LATC SILK Apache 2.0 DL-Learner GPL 2.0 ORE LODrefine BSD SIG.MA GPL 3.0

Extraction : Virtuoso Sponger 텍스트, XML, RDB 등의 포맷으로부터 RDF 형태의 문서를 추출함 Virtuoso Sponger 다양한 데이터 형식을 RDF로 변환해주는 미들웨어 RDB, XHTML, XML, RDFa, CSV 등을 지원 SOAP, REST 인터페이스를 통해 데이터에 직접적으로 접근할 수 있는 HTTP 프록시 서비스를 제공 SPARQL Endpoint 지원

Extraction : Virtuoso Sponger(계속)

Extraction : D2R 관계형 데이터베이스의 콘텐츠를 LOD 형식으로 변환 D2R server D2RQ Engine Linked data view, HTML view, SPARQL Endpoint 기능 제공 RDB 데이터를 RDF 또는 HTML 형식으로 변환하여 보여줌 D2RQ Engine 별도의 Triple Store 없이 RDB에서 RDF 기반의 접근을 제공함 RDB에 RDF 기반의 접근을 제공하기 위해 R2RML을 사용 SPARQL Query, RDF dump 기능 제공

Extraction : D2R(계속)

R2RML 관계형 데이터베이스의 데이터를 RDF 형식으로 변환 할 수 있도록하는 매핑 언어 2012년 9월 W3C 표준으로 제정

Storage / Querying : Virtuoso RDF Store RDF 형식의 데이터를 저장하고, 저장된 데이터를 SPARQL을 통해 검색할 수 있도록 함 Virtuoso 특정 플랫폼에 상관없는 통합 데이터 관리, 접근, 통합 솔루션을 제공하는 멀티 모델 데이터 서버

Storage / Querying : Virtuoso RDF Store(계속)

Manual revision / authoring : OntoWiki 시맨틱 콘텐츠를 제작, 수정하는 것을 제공하는 인터페이스 OntoWiki 인스턴스 데이터들의 시각적 표현을 제공함 시맨틱 콘텐츠를 제작할 수 있도록 하며 RDF의 내용을 편집할 수 있는 편집 모드를 제공함

Manual revision / authoring : OntoWiki(계속) Selection of a knowledge base Selection of a class Selection of additional properties to be shown as columns in the list Further restriction of the resources in the list Selection of a resource redirects the user to a generic resource details view Representation of RDF triples in the user interface as resource attribute value notation

Interlinking / Fusing : SILK 실제로는 같은 객체이나 서로 다른 URI를 가진 자원들을 발견하여 연결함 SILK 서로 다른 두 개의 데이터 셋에서 데이터 항목 간의 관계를 발견하는 도구 데이터 셋 간의 연결을 위한 절차를 웹 애플리케이션으로 제공하여 발견 및 연결을 기능을 사용하기 쉽게 제공함

Interlinking / Fusing : SILK(계속) 연결을 수행 할 2개의 Dataset 연결할 대상이 되는 Class를 지정 Property 값 비교를 위한 규칙 생성 Class의 특정 Property를 지정 : name

Interlinking / Fusing : SILK(계속) Property(name) 값이 일치하는 경우의 결과 리스트

LATC SILK와 SILK의 비교 LATC SILK SILK 기능 LATC SILK에 추가된 기능 LATC에서 SILK에 부가적인 기능을 추가하여 만든 Interlinking 도구 SILK 기능 Workbench Console Console API Runtime LATC SILK에 추가된 기능 Data Source Inventory Metadata Store Sindice Crawler & Indexer

Classification / Enrichment : DL-Learner 상위레벨 온톨로지와의 연결 및 통합을 통해 Linked data의 폭넓은 검색 및 활용을 제공함 DL-Learner 인스턴스 데이터의 Description Logic을 학습하는 도구 특정 클래스에 대한 상위클래스에 대한 정보와 그 클래스와 비슷한 인스턴스 검색, 인스턴스 분류 등을 제공하기 위함

Classification / Enrichment : DL-Learner(계속) Father를 학습하는 예 배경지식을 가진 Description Logic에 Father에 관한 인스턴스 정보를 전달 Positive example : Father negative example : NOT Father 전달 받은 인스턴스 정보를 통해 Father Class가 가지는 Description Logic을 결론으로 도출 배경 지식 Father의 인스턴스 정보 결론 도출 : Male AND EXISTS hasChild.T Father를 학습하는 예제 다음과 같은 배경지식을 가진 Description Logic에 Father에 관한 Positive example과 negative example을 주면 이것을 통해 father class는 male 이면서 하나이상의 자식을 가진다 라는 정의를 찾아 제시한다. T : all concept names 모든 instance 올수있음

Quality Analysis : ORE Quality Analysis Linked Data의 품질을 평가하기 위한 기술 ORE (Ontology Repair and Enrichment) 구성된 온톨로지에서 잘못 작성된 개념을 수정하거나 새로운 개념을 추가함으로써 온톨로지 품질을 향상시킴 Ontology Enrichment DL-Learner를 사용하여 기존 클래스와 상위 클래스 사이의 관계를 학습함 Ontology Debugging 학습한 관계와 다른 논리적인 오류를 발견하고 그것을 수정함 논리적인 오류를 발견했을 때 그 오류에 대한 복구 계획을 만들고 그것을 통한 자동 수정이 가능함

Quality Analysis : ORE(계속)

Evolution / Repair : Zemanta LODrefine Linked data를 정제하고, 문제점 발견될 시 자동으로 복구하는 방법을 제안함 Zemanta LODrefine OpenRefine의 장점을 가져와 Linked Data에 적합하게 작동하도록 만든 도구 DBPedia 데이터 셋과 연결하여 데이터를 확장할 수 있고 Crowdsourcing 서비스를 통한 데이터 확장을 지원함

Evolution / Repair : Zemanta LODrefine(계속) 보유하고 있는 기존 정보에 대해 Extension을 수행 DBpedia와 Extension을 통해 추가적으로 얻은 정보 기존 정보

Search / Browsing Exploration : SIG.MA RDF로 만들어진 데이터를 Web을 통해 검색할 수 있도록 함 SIG.MA Web의 데이터를 Mashup하여 구조화된 데이터 형태(RDF, RDFa)로 제공함 RDF 데이터를 검색할 수 있도록 Query를 지원함

Search / Browsing Exploration : SIG.MA(계속) Web에 존재하는 Tim Berners Lee와 관련된 RDF link를 발견하여 결과로 제공함 특정 Web Site의 결과만 볼 수 있도록approve, reject 기능을 제공함

Wrap-up

Linked Open Data 도구를 잘 사용하면 ? 데이터의 가치 향상 공유 및 연결을 통한 데이터 연계 전문적인 지식이 없어도 누구나 쉽게 관련 데이터를 찾음 플랫폼 활용 다양한 지식정보 서비스 플랫폼으로 활용 시너지 효과 발생 지식화된 서비스를 통해 더 많은 창의적인 서비스창출

향후 발전 방향: 빅데이터 분석에 LOD를 활용 빅데이터 분석을 통해 생성된 데이터를 LOD로 구축하고 기존의 LOD와 연계하여 지식화된 맞춤형 서비스를 구축 빅 데 이 터 저 장 시 스 템 H A D O p

빅데이터 분석에 LOD를 활용한 예시 교통 사고 통계 빅데이터 분석 빅데이터 지식화 특정 지점에서 1년에 10회 이상 교통 사고 발생 사고 다발 지점 지정 빅데이터 분석 지난 3년간 특정 조건(날씨, 교통량, 속력 등)일 때 사고가 빈발 특정 조건에 따라 교통 사고 가능성을 측정하여 사고주의 지역 예측 사고주의 지역 진입 시 알림(보행자 및 운전자) 빅데이터 지식화 지난 3년간 특정 조건일 때 사고를 일으킨 자동차에 장착된 차량제어장치와 그 제조회사를 찾아내어 문제 장치를 진단 사고가 발생한 차량의 제동거리를 비교하여 제동장치의 문제를 진단

LOD의 증가로 인한 변화 Linked Data Big Linked Data Cloud Single Machine Master Slave Master Single Machine Cloud

Hadoop & MR을 통한 Big LOD 처리시 문제점 RDF는 Subject, Object 의 지속적인 연결로 인하여 많은 Join 연산이 발생함 Hadoop & MapReduce 는 Join 연산이 존재하지 않음 Multi-Query 시 상당한 I/O, Network Traffic 발생의 원인이 되며 상당한 성능 저하가 발생함

CNU DB Lab의 연구 방향 Indexing Partitioning Table Index for indexing RDF triples Partitioning RDF schema based hybrid partitioning, using vertical partitioning and horizontal partitioning to store related triples into the same machine Query Processing and Optimization Reducing the number of MR cycles in SPARQL query execution

감사합니다 Questions