지식그래프 기반 능동적 약물감시 및 검증 프레임워크 개발 : 실사용데이터를 이용한 골다공증 유발 약물 탐색
Development of a Knowledge-Graph–Based Active Pharmacovigilance and Validation Framework: Identifying Osteoporosis-Inducing Drugs Using Real-World Data
- 주제(키워드) 지식그래프 , 약물 유발 골다공증 , 실사용데이터 , 전자의무기록 , 약물감시
- 주제(DDC) 570
- 발행기관 아주대학교 일반대학원
- 지도교수 박래웅
- 발행년도 2026
- 학위수여년월 2026. 2
- 학위명 석사
- 학과 및 전공 일반대학원 의생명과학과
- 실제URI http://www.dcollection.net/handler/ajou/000000035538
- 본문언어 한국어
- 저작권 아주대학교 논문은 저작권에 의해 보호받습니다.
초록/요약
지식그래프 기반 능동적 약물감시 및 검증 프레임워크 개발 : 실사용데이터를 이용한 골다공증 유발 약물 탐색 약물 유발 골다공증은 고령층에서 빈번히 발생하는 중대한 약물 안전성 이슈이지만, 자발적 이상반응 보고체계에 기반한 기존 약물감시는 과소보고 와 지연된 신호 탐지의 한계로 인해 조기 파악이 어렵다. 본 연구는 생의학 지식그래프와 OMOP-CDM 기반 전자의무기록을 통합하여 잠재적 위해 신 호를 탐지하고 실제 임상데이터로 검증하는 능동적 약물감시 프레임워크를 구축하는 것을 목표로 하였다. PrimeKG와 아주대학교병원 CDM 데이터를 온톨로지 기반으로 정합하여 총 150,357개 노드와 8,280,192개 관계를 갖는 통합 지식그래프를 구성하였으며, TransE·ComplEx·RotatE 모델을 학습하여 임베딩 성능을 비교하였다. 그 중 RotatE가 triple classification (AUROC, 0.976)과 link prediction (MRR, 0.5146; Hit@10, 0.8137) 에서 가장 우수한 성능을 보여 최종 예측 모델로 선정되었다. Link prediction 기반 약물–골다 공증 연관성 순위화 결과, H2RA (Histamine-2 receptor antagonists) 가 상위 후보로 도출되었고, 이에 따라 후향적 코호트 분석을 통해 실제 임상데이 터 기반 검증을 수행하였다. Propensity score 매칭 후 분석에서 H2RA 장기 노출군은 비노출군 대비 골다공증 발생 위험이 증가하였으며 [HR 2.35, 95% CI 1.36–4.37], 골절 위험 또한 증가하는 경향을 보였다 [HR 2.75, 95% CI 1.43–5.96]. 1년, 3 년, 5년 추적 기간을 적용한 민감도 분석에서도 결과 방향성은 일관되었으며, 6개 의료기관 CDM 데이터를 활용한 외부 검 증에서는 통합 HR 2.96 [95% CI 2.33–3.76] 으로 재현성이 확인되었다. 본 연구는 지식그래프 기반 신호 생성과 실사용데이터 기반 검증을 단일 파이 프라인으로 연결한 능동적 약물감시 구조를 제안하였으며, 이는 향후 다양한 질환 및 약물 위해 영역에서 조기 신호 탐지 및 임상 의사결정 지원을 위한 확장 가능한 분석 프레임워크로 활용될 수 있음을 시사한다. 키워드: 지식그래프, 약물 유발 골다공증, 실사용데이터, 전자의무기록, 약물감시
more초록/요약
Drug-induced osteoporosis represents an important but under-recognized safety concern, particularly among older adults with multimorbidity and chronic medication use. Traditional pharmacovigilance systems relying on spontaneous reporting are limited by underreporting and delayed signal detection, underscoring the need for proactive, data-driven approaches. In this study, we developed an active pharmacovigilance framework that integrates a large-scale biomedical knowledge graph with OMOP-CDM–standardized electronic health records to systematically identify and validate potential osteoporosis-inducing drugs. A unified biomedical–clinical knowledge graph was constructed by harmonizing PrimeKG with EHR data from Ajou University Hospital, resulting in 150,357 nodes and over 8.28 million relations. Three knowledge graph embedding models (TransE, ComplEx, RotatE) were trained and evaluated, with RotatE demonstrating the highest performance in triple classification (AUROC 0.976) and link prediction (MRR 0.5146, Hit@10 0.8137). Using the optimal model, link prediction scores were generated to rank drug–osteoporosis associations, from which histamine-2 receptor antagonists (H2RAs) emerged as high-priority candidates. Subsequent validation using a retrospective cohort study with propensity score matching showed that long-term H2RA exposure was associated with an increased risk of osteoporosis (HR 2.35, 95% CI 1.36–4.37) and fractures (HR 2.75, 95% CI 1.43–5.96). Sensitivity analyses with alternative follow-up durations yielded consistent directional effects, although wide confidence intervals reflected limited event counts. External validation across six independent OMOP-CDM hospitals demonstrated a pooled HR of 2.96 (95% CI 2.33–3.76) with negligible heterogeneity, supporting the reproducibility of the detected signal. Collectively, this study illustrates the feasibility and utility of linking knowledge graph–based signal generation with real-world validation in a standardized CDM environment, providing a scalable framework for active pharmacovigilance and early detection of potential drug safety risks. Key words: Knowledge Graph, Drug-induced Osteoporosis, Real-World Data (RWD), Electronic Health Records, Pharmacovigilance
more목차
Ⅰ. 서론 1
A. 연구의 배경 1
1. 인구 고령화와 골다공증 질병 부담 1
2. 능동적 약물감시의 발전 양상 2
3. 의료분야에서의 지식그래프 활용 3
B. 연구의 목적 8
Ⅱ. 연구 대상 및 방법 9
A. 데이터 소스 9
1. Precision Medicine Knowledge Graph 9
2. 아주대학교병원 전자의무기록 10
B. 연구 절차 개요 11
C. 단계 1 : 생의학 지식그래프와 임상 데이터 통합 13
1. 온톨로지 정합 (Ontology harmonization) 13
2. 삼항 (triplet) 구조 변환 15
D. 단계 2 : 지식 그래프 임베딩 모델 비교와 최적 모델 선정 17
1. 모델 학습 17
2. 모델 평가 20
E. 단계 3 : 후보 약물 선별 21
F. 단계 4 : 임상 데이터를 이용한 검증 22
Ⅲ. 연구결과 25
A. 통합된 지식그래프 25
B. 지식그래프 임베딩 모델 성능 비교 및 모델 선정 28
C. 지식그래프 임베딩 모델 시각화 및 후보 약물 도출 31
D. 후보 약물의 실사용데이터 (RWD) 기반 검증 35
Ⅳ. 고찰 46
A. 결과의 해석 46
1. 임베딩 모델 해석 48
2. 검증 약물과 검증 단계 해석 49
B. 연구의 한계점 51
C. 향후 연구의 방향 53
Ⅴ. 결론 54
참고문헌 55
부록 65
ABSTRACT 96

