Download presentation
Presentation is loading. Please wait.
1
OMOP CDM Structure 아주대학교 의과대학 의료정보학과 신다혜
2
목차 OMOP CDM 설명 Standardized Vocabularies Standardized clinical data
Standardized Health System Data/meta-data Standardized derived elements Standardized health economics
3
공통데이터모델 Common Data Model
OMOP CDM Source 1 Source 2 Source 3 분산연구망 (Distributed Research Network) 공통데이터모델 (Common Data Model) 공통데이터모델 Common Data Model 민감 개인정보 유출 없음 다기관 데이터 통합분석 EMR 자료 연계 이터 표준화는 협업 연구, 대규모 분석 및 정교한 도구 및 방법론 공유를 가능하게하는 공통 형식으로 데이터를 가져 오는 중요한 프로세스입니다. 왜 그렇게 중요한가요? 의료 데이터는 조직마다 크게 다를 수 있습니다. 제공자 보상, 임상 연구 및 직접 환자 치료와 같은 다양한 목적으로 데이터가 수집됩니다. 이 데이터는 다른 데이터베이스 시스템 및 정보 모델을 사용하여 다른 형식으로 저장 될 수 있습니다. 의료계에서 표준 용어가 점차적으로 사용되고 있음에도 불구하고 동일한 개념 (예 : 혈당)이 한 설정에서 다음 설정으로 다양한 방식으로 표현 될 수 있습니다. OHDSI의 OMEP 공통 데이터 모델 (OMOP Common Data Model)이라는 공통 데이터 모델의 진화와 채택에 깊이 관여하고 있습니다. 우리는 다양한 데이터 세트를 CDM으로 변환 할 수있는 자원을 제공하고 CDM 형식으로 된 데이터를 활용할 수있는 많은 툴을 제공합니다. 무엇보다 중요한 것은 CDM 변환 및 유지 보수에 도움이 될 회원들과 많은 데이터 변환 (ETL이라고도 함)을 수행 한 적극적인 커뮤니티가 있다는 것입니다. OMOP 공통 데이터 모델 (CDM)이란 무엇입니까? OMOP 공통 데이터 모델은 서로 다른 관측 데이터베이스의 체계적인 분석을 가능하게합니다. 이 접근법의 기본 개념은 공통 표현 (용어, 어휘, 코드 체계)뿐만 아니라 공통 형식 (데이터 모델)으로 변환 된 데이터베이스에 포함 된 데이터를 변환 한 다음이를 가지고있는 표준 분석 루틴의 라이브러리를 사용하여 체계적인 분석을 수행하는 것입니다. 공통 형식을 기반으로 작성되었습니다. CDM이 필요한 이유는 무엇입니까? 관측 데이터베이스는 목적과 디자인이 서로 다릅니다. 전자 의료 기록 (EMR)은 치료 시점에서 임상 진료를 지원하는 것을 목표로하고 행정 청구 데이터는 보험 상환 프로세스를 위해 작성됩니다. 각각은 다른 목적을 위해 수집되어 논리적 조직과 물리적 형식이 다르며, 의약품 및 임상 조건을 설명하는 데 사용되는 용어는 출처에 따라 다릅니다. CDM은 관리 클레임과 EHR을 모두 수용 할 수 있으므로 사용자가 다양한 소스로부터 증거를 생성 할 수 있습니다. 또한 미국 내외의 데이터 소스 전반에 걸친 협업 연구를 지원할뿐만 아니라 데이터 소유자를 위해 관리 가능하고 데이터 사용자에게 유용합니다. CDM이 있고 각 DP가 데이터를 동일한 CDM으로 변환한다고 가정 해 봅시다. 모든 DP는 동일한 구조의 데이터를 갖습니다. 누군가 자신의 데이터에 대한 분석 코드를 개발하면 분석 코드는 오류없이 다른 사람들의 데이터에서 실행됩니다. 그런 다음 분석 코드를 다른 DP로 보냅니다. 각 DP는 자신의 데이터에 대해 코드를 실행합니다. 결과 데이터를 그에게 돌려줍니다. 그는 반환 된 모든 요약 통계를 수집하고 분석합니다. 따라서 원본 소스 데이터를 수집 및 풀링하지 않고도 전 세계 여러 기관의 대규모 데이터 분석을 수행 할 수 있습니다. Analytic Method Analytic Method Analytic Method 공통 분석코드 이용가능 Results Results Results Analytic Methods Aggregated Results Analytic Methods Analytic Methods
4
* The journey of the OMOP Common data model
OMOP CDMv2 OMOP CDM now Version 5, following multiple iterations of implementation, testing, modifications, and expansion based on the experiences of the community who bring on a growing landscape of research use cases. OMOP CDMv4 OMOP CDMv5 Let’s see the CDM in detail. The initial CDM was developed by OMOP consortium. Thus the OMOP is an ancestor of OHDSI. From version 1, it continuously evolved into version 5. The corresponding vocabularies were also evolved together. Slide source: courtesy of Dr. Patrick Ryan‘s Presentation: ‘Welcome to the journey: OHDSI Symposium 2015’ Page 4
5
OMOP CDM 5.0.1 structure Standardized clinical data
Person Standardized health system data Standardized meta-data Observation_period Location Care_site CDM_source Specimen Provider Death Concept Standardized health economics Payer_plan_period Standardized vocabularies Vocabulary Visit_occurrence Domain cost Procedure_occurrence Concept_class Concept_relationship Drug_exposure Relationship Device_exposure Concept_synonym Standardized derived elements Cohort Concept_ancestor Condition_occurrence Cohort_attribute Source_to_concept_map Measurement Condition_era Drug_strength Note Drug_era Observation Cohort_definition Dose_era Fact_relationship Attribute_definition
6
Standardized Vocabularies
제공 테이블을 파악하고 Standardized Clinical data에 속하는 테이블의 레코드를 매핑 및 ETL작업 시 본 테이블들을 사용하여야 함 (총 12table) Concept Standardized vocabularies Drug strength Domain Vocabulary Relationship Domain Attribute definition Concept_class Concept relationship Concept Concept_relationship Cohort definition Relationship Concept class Concept_synonym Concept_ancestor Source_to_concept_map Source to concept map Vocabulary Concept ancestor Concept synonym Drug_strength Cohort_definition Attribute_definition
7
Standardized Vocabularies
CDM Table명 테이블 설명 Field&건수 Concept 임상정보를 표현하기 위해 사용되는 기본단위를 식별하는 레코드 Field : 10개 2,039,914건 Concept_class 제공된 vocabulary 내에 포함된 Concept을 구별하기 위해 사용되는 분류의 리스트 Field : 3개 255건 Concept_synonym Concept 에 대한 대체 이름과 설명을 저장하는 데 사용되는 테이블 3,414,874건 Concept_ancestor 모든 표준 concept들 사이의 추론된 계층(hierarchical) 관계들을 정의한 레코드 Field : 4개 15,944,963건 Concept_relationship 두 개의 Concept들 간의 직접적인 관계와 관계의 본질(nature)을 정의한 레코드 Field : 6개 12,689,562건 Relationship Concept relationship 테이블에서 임의의 두 concept을 연결하는 데 사용될 수 있는 모든 허용 가능한 관계의 종류의 참조(reference) 리스트를 제공 374건 Vocabulary 다양한 소스들로부터 모아진 vocabulary 리스트나 OMOP community에 의해 새로 생성된 리스트 Field : 5개 45건 Uniform structure • All concepts are in one table • All concept relationships are in one table, including mappings from source to standard vocabularies • Formalized integration with Common Data Model via concept domain – Direction of ETL is informed by concept domain • Relationships are bi‐directional • Hierarchical relationships have additional representation in the model to support efficient data retrieval 균일 한 구조 • 모든 개념은 하나의 테이블에 있습니다. • 모든 개념 관계는 소스에서 표준 어휘로의 매핑을 포함하여 하나의 테이블에 있습니다. • 개념 도메인을 통한 공통 데이터 모델과의 공식적인 통합 - ETL의 방향은 개념 도메인에 의해 통보됩니다. • 관계는 양방향입니다. • 계층 적 관계는 효율적인 데이터 검색을 지원하기 위해 모델에 추가적인 표현을 포함합니다.
8
Standardized Vocabularies
CDM Table명 테이블 설명 Field&건수 Domain table OMOP 공통 데이터 모델 내에 포함 된 데이터 요소의 도메인들의 리스트 Field : 3개 40건 Drug_strength 특정 의약품의 양 또는 농도 및 특정 성분 관련 단위에 대한 구조화 된 콘텐츠 포함 Field :10개 80,221건 Source_to_concept_map 소스와 컨셉사이의 관계를 정의하는 레코드 Cohort_definition 연관된 설명 및 구문을 통해 각각의 파생된 코호트를 정의하는 레코드 CERICI, HERACLES 실행 후 생성됨 Attribute_definition 연관된 설명 및 구문을 통해 각각의 속성을 정의하는 레코드
9
* Concept * Concept_ancestor
10
Standardized clinical data
총 13 table Standardized clinical data Person Observation Fact_relationship Observation_period Specimen Note Observation_period Death Visit_occurrence Visit_occurrence Person Procedure_occurrence Condition_occurrence Drug_exposure Specimen Device_exposure Device_exposure Condition_occurrence Death Drug_exposure Measurement Note Procedure_occurrence Observation Fact_relationship Measurement
11
Standardized clinical data
CDM Table명 테이블 설명 변환대상 Table 명 person 환자의 인종, 생년월일, 성별 등의 기본정보를 알 수 있는 테이블 환자기본정보 Visit_occurrence 환자가 병원에 방문한 기록으로 방문시작일과 방문종료일을 알 수 있는 테이블 외래내역, 입퇴원내역,건강검진내역, 산업의학내역 Observation_period 환자가 병원에 내원하여 치료가 완료되기까지의 기간을 알 수 있는 테이블 VISIT_OCCURRENCE Procedure_occurrence 진단 및 치료 목적을 가지고 의사에 의해 처방 및 지시된 활동 또는 프로세스를 알수 있는 테이블 처치/ 수술/ 재료/ 마취 처방 일자, 처방된 양, 처방코드 등을 알 수 있는 테이블 처치/수술/마취 처방내역 Drug_exposure 환자에게 처방된 약 정보로 처방약, 약에 노출된 일시, 중지사유, 처방일수, 처방용량, 투약방법, 복용법, 단위 등을 알 수 있는 테이블 약처방내역 Condition_occurrence 환자의 진단명, 건강상태, 진단일시, 진단의사 등을 알 수 있는 테이블 환자진단내역 Device_exposure 진단 및 치료 목적으로 사용되는 외부의 물리적인 물체 또는 기구에 환자가 노출된 기록으로 장치 이식 개체, 의료장비 및 소모품, 의료기기 사용에 대한 사용(공급)날짜, 사용 종료날짜, 사용된 장비 수, 장비코드 등을 알 수 있는 테이블 재료/장비처방 내역 PERSON • Need to create one unique record per person (not multiple rows per move) • Vocabulary for gender, race, ethnicity: HL7 administrative • No history of location/demographics: need to select latest available • Location peculiarity: foreign key to the LOCATION table that contains one record per each unique location • Year of birth required…day/month Optional VISIT_OCCURRENCE •Visits <> ‘Encounters’: –claims often need to be consolidated to minimize double‐counting –inpatient transitions are not covered •Visit Types –Inpatient –Emergency room –Inpatient/Emergency ‐ new –Outpatient –Long‐term care •Vocabulary: OMOP •Other attributes: time of visit start/end, provider, admitting source, discharge disposition. OBSERVATION_PERIOD •Spans of time where data source has capture of data •Required to run analytical methods •One person may have multiple periods if there is interruption in data capture •Challenge: determine observation periods based on the source data PROCEDURE_OCCURRENCE • Vocabularies: CPT‐4, HCPCS, ICD‐9 Procedures, ICD‐10 Procedures, LOINC, SNOMED • Procedures have the least standardized vocabularies that causes some redundancy CONDITION_OCCURRENCE • Vocabulary: SNOMED ‐> classification • Data sources: – Billing diagnosis (inpatient, outpatient) – Problem list • Individual records <> distinct episodes DRUG_EXPOSURE • Vocabulary: RxNorm‐> classifications by drug class and indication – Pharmacy dispensing – Prescriptions written – Medication history • Source fields may vary, but so inference of drug exposure end may vary DEVICE_EXPOSURE • OMOP CDM is the only data model supporting devices • Accommodates FDA unique device identifiers (UDI) even though most data sources don’t have them yet
12
Standardized clinical data
CDM Table명 테이블 설명 변환대상 Table 명 Measurement 체계적인 검사로부터 얻어진 측정값으로 측정일, 측정값 최대/최소 범위, 측정 값, 측정단위 등을 알 수 있는 테이블 병리보고서로부터 실험 결과, 활력징후, 정량적 연구 결과를 포함할 수 있음 검사결과내역 Note 자유기술문으로 노트가 기록된 일시, 노트 내용을 알 수 있는 테이블 퇴원요약지 Observation 질의 또는 진료절차, 검사 문단에서 얻어지는 환자에 대한 어떤 임상 사실을 캡쳐한 정보로 구조화되지 않은 측정값, 과거병력, 가족력 등의 정보를 포함하고 있는 테이블 기록지 Death 환자의 사망일, 원인을 알 수 있는 테이블 사망진단서 Specimen 검체 채취 날짜, 시간, 양, 위치, 단위 등을 알 수 있는 테이블 검체검사내역 Fact relationship 각 데이터 소스간의 관계에 대한 정보를 알 수 있는 테이블 ex) A환자는 B환자의 부모 x MEASUREMENT • EAV design • Vocabulary: LOINC, SNOMED • Data sources: structured, quantitative measures, such as laboratory tests • Measures have associated units – Measurement units vocabulary: UCUM • No free format for measurement results NOTE • To capture unstructured free text • Coming soon in CDM 5.x: NLP and LOINC Clinical Document Ontology (CDO) annotations OBSERVATION • Catch‐all EAV design to capture all other data: – observation: ‘question’ – value: ‘answer’ • Can be numeric, concept, or string (e.g. free text) • Instrument for CDM extension, playpen • Not all ‘questions’ are standardized, source value can accommodate ‘custom’ observations (particularly pertinent in registries) DEATH • Can have death without cause • Can only have 1 death per person SPECIMEN • To capture of biomarker / tissue bank • CDM_SOURCE – Provenance, integration, metadata – Future extension to individual domains • FACT_RELATIONSHIP – Linkage between related observations – Example: systolic and diastolic blood pressure
13
CDM DB 중 Visit_occurrence 테이블
EMR DB 중 입퇴원내역 테이블 일부 CDM DB 중 Visit_occurrence 테이블 NO 컬럼한글명 데이터 타입 1 환자번호 nvarchar 2 입원일시 datetime 3 내원구분 4 진료과 5 입원지시의사 6 주치의사 7 선택의사 8 진료자격 9 환자구분 10 퇴원일시 11 수납일자 12 수납여부 13 외래/입원구분 14 병동 15 병실 int . . . 필드명 필수사항 데이터 타입 설명 (영어 원문) visit_occurrence_id Yes integer (8) A unique identifier for each person's visit or encounter at a healthcare provider. person_id A foreign key identifier to the person for whom the visit is recorded. The demographic details of that person are stored in the person table. visit_concept_id A foreign key that refers to a visit concept identifier in the Standardized Vocabularies. visit_start_date date The start date of the visit. visit_start_time No time The time the visit started. visit_end_date The end date of the visit. If this is a one-day visit the end date should match the start date. visit_end_time The time the visit ended. visit_type_concept_id Integer (8) A foreign key to the predefined concept identifier in the Standardized Vocabularies reflecting the type of source data from which the visit record is derived.
14
Standardized health system data Standardized meta-data
Standardized Health System Data /Meta-data Location Standardized health system data Location Care_site Provider Care_site Provider Standardized meta-data CDM_source CDM_source
15
Standardized Health System Data /Meta-data
CDM Table명 테이블 설명 변환대상 Table 명 Location 물리적 위치 또는 주소정보를 캡처하는 일반적인 방법을 나타냄 사람 및 관리 사이트의 주소를 정의하는데 사용됨 우편번호정보 Care_site 의료 서비스가 시행되는 조직 단위의 고유한 목록 포함 (사무실, 병동, 병원, 진료소 등) 직접입력 Provider 의료 서비스제공자 식별 목록 포함 의료원기본정보 LOCATION • Contains one record per each unique location • Location is highly variable across sources, of limited use thus far 위치 • 고유 한 위치마다 하나의 레코드가 포함됩니다. • 위치는 제한된 용도의 소스를 통해 매우 다양합니다. CDM Table명 테이블 설명 변환대상 Table 명 CDM_source 원본 데이터베이스를 OMOP CDM으로 변환하는데 사용되는 프로세스에 대한 세부 정보 포함. x
16
CDM DB 중 Location 테이블 새우편번호 ZIPCODE 테이블
NO 컬럼한글명 데이터타입 1 새우편번호 int 2 시도 nvarchar 3 시도영문 4 시군구 5 시군구영문 6 읍면 7 읍면영문 8 도로명코드 9 도로명 10 도로명영문 11 지하여부 12 건물번호본 13 건물번호부번 14 건물관리번호 15 다량배달처명 . . . 필드명 필수사항 데이터타입 설명 (영어 원문) location_id Yes integer (8) A unique identifier for each geographic location. address_1 No varchar(50) The address field 1, typically used for the street address, as it appears in the source data. address_2 The address field 2, typically used for additional detail such as buildings, suites, floors, as it appears in the source data. city The city field as it appears in the source data. state varchar(2) The state field as it appears in the source data. zip varchar(9) The zip or postal code. For US addresses, valid zip codes can be 3, 5 or 9 digits long, depending on the source data. county varchar(20) The county. The county information is necessary because not all zip codes fall into one and the same county. location_source_value The verbatim information that is used to uniquely identify the location as it appears in the source data.
17
Standardized derived elements
Cohort_attribute Cohort Cohort Cohort_attribute Condition_era Condition_era Dose_era Dose_era Drug_era Drug_era
18
Standardized derived elements
CDM Table명 테이블 설명 참조 테이블 Cohort 지속 시간 동안 선정 기준으로 포함된 특정 세트를 충족하는 대상의 집합으로 파생된 레코드가 있음 Cohort_definition, person, provider, visit_occurrence Cohort_attribute 시간의 기간 동안 선정 기준의 주어진 집합에 의해 정의 된 바와 같이, 집단 내의 각 주제와 관련된 속성 포함 Cohort_definition, Attribute_definition, person, provider, visit_occurrence Drug_era 환자들이 특정성분에 노출 될 것으로 예상되는 시간의 길이로 정의 노출은 약물이 포함되는 개별 레코드 이며, 약물 노출의 연속적인 기간은 약 처방의 특정 규칙에 따라 결합 Concept, person, drug_exposure Dose_era 환자가 특정 성분의 일정 투여량에 노출되는 것으로 가정되는 시간 정의 Concept, person, drug_exposure , Concept_ancestor Condition_era 환자가 조건을 가진다고 가정 했을 때 나타나는 시간의 길이를 정의 Concept, person, condition_occurrence
19
Standardized health economics
Payer_plan_period cost cost Payer_plan_period Visit_cost Visit_cost Procedure_cost Procedure_cost All costs consolidated into one table COST table • Costs tied to respective observation records • Domain is determined bycost_domain_id (e.g. visit, condition, etc.) 모든 비용이 하나의 테이블 COST 테이블로 통합됩니다. • 각 관측 기록과 관련된 비용 • 도메인은 cost_domain_id (방문, 조건 등)에 의해 결정됩니다 Drug_cost Drug_cost Device_cost Device_cost
20
Standardized health economics
CDM Table명 테이블 설명 변환대상 Table 명 Payer_plan_period 환자의 보험 종류와 적용기간의 정보를 알 수 있는 테이블 외래계산내역 입퇴원계산내역 Visit_cost 시술, 약, 의료장비 노출을 제외한 모든 비용으로 식비, 구급차이용료 등의 환자가 지불하는 비용, 보험 지급자가 지불하는 비용, 환자가 부담하는 전체 금액, 세금공제가 되는 비용, 전체 비용, 이차 보험지급자가 지불하는 비용 등을 알 수 있는 테이블 Procedure_cost 환자가 받은 시술에 따라 발생한 비용으로 환자가 지불하는 비용, 보험 지급자가 지불하는 비용, 환자가 부담하는 전체 금액, 세금공제가 되는 비용,시술 전체 비용, 이차 보험지급자가 지불하는 비용 등을 알 수 있는 테이블 Drug_costs 약물 노출에 대한 비용으로 환자가 지불하는 비용, 보험 지급자가 지불하는 비용, 환자가 부담하는 전체 금액, 세금공제가 되는 비용, 약사에 의해 청구되는 약물 지급비용, 이차 보험지급자가 지불하는 비용, 약 가격 등을 알 수 있는 테이블 Device_cost 환자에게 사용한 의료기기(장비) 및 재료에 대한 비용으로 환자가 지불하는 비용, 보험 지급자가 지불하는 비용, 환자가 부담하는 전체 금액, 세금공제가 되는 비용, 이차 보험지급자가 지불하는 비용 등을 알 수 있는 테이블
Similar presentations