검색 상세

다계층 네트워크 결측연결 추론방법: 바이오메디컬 응용분야

An Imputation Method for Missing Connections in a Multi-Layered Network: Biomedical Applications

초록/요약

의생명정보학에서는 인간의 질병에 영향을 주는 유전자, 단백질, 대사관계 등을 규명하고 질병의 원인 및 치료약 개발 연구에 있어서 정보학을 활용하고 있다. 바이오메디컬 데이터를 정보학을 이용하여 분석할 때, 많이 사용되는 방법은 데이터를 네트워크화 하는 것이다. 질병 네트워크는 여러 질병의 연관성을 그래프의 노드와 엣지로 표현한 네트워크로서, 최근 유전자, 단백질 등의 정보를 활용하여 질병간 연관성을 유도하는 심도있는 연구들이 활발히 진행되고 있다. 그러나 현재까지는 모든 질병에 대한 분자생물학적 정보들이 밝혀지지 않았으므로, 질병 네트워크 상에는 아직 연결되지 못한 질병들이 다수 존재한다. 바이오정보의학 측면에서 완전 연결된 질병 네트워크의 구성은 중요한 의의를 갖는다: 질병간 유전적 유사성 분석, 신약 개발, 질병 진단 및 치료에 연대한 연계성 부여 등. 본 연구에서는 유전자 및 단백질 데이터를 기초로 질병 네트워크를 구성하고, 연결이 이루어지지 않은 질병에 대해서는 이종 데이터의 정보를 활용하여 연결하는 알고리즘을 제안한다. 이종 정보로는 임상에서 보고된 공존질환(Comorbidity)에 대한 연구를 활용하고, 알고리즘은 기계학습의 준지도학습(Semi-Supervised Learning)에 기반한다. 제안한 네트워크의 성능은 대사질환군에 대한 성능평가에서 기존 네트워크의 성능을 평균적으로 25% 항샹시켰음을 검증하였다. 또한 대사질환군 중 최근에 연구가 활발히 진행되고 있는 골연화증(Osteomalacia)를 대상으로한 심화연구에서 분자생물학적 정보를 통해 얻을 수 없었던 동발질병들을 임상정보를 이용하여 확인·검증하였다.

more

목차

1. 서론
2. 응용분야 연구배경 및 기존연구
2.1 응용분야 연구배경: 질병네트워크
2.2 결측노드 연결방법론
3. 제안 알고리즘
3.1 알고리즘 배경이론: 준지도학습
3.2 제안 알고리즘: CLASH
4. 실험
4.1 데이터
4.2 실험설정
4.3 실험결과
5. 결론
6. 참고문헌

more