검색 상세

의료 정보 추출을 위한 TF-IDF 기반의 연관규칙 분석 시스템

TF-IDF based Association Rule Analysis System for Medical Data

초록/요약

최근 IT기술의 발전과 u-Health의 관심으로 인해, 의료정보 데이터 활용에 대한 요구가 급증하고 있다. 하지만 일반적인 빅데이터 분야에서는 데이터 분석과 달리 의료분야에서는 시스템에 의한 의사 결정이 아닌 의료전문가에 의한 의사 결정이 중시되어, 의료 전문가를 위한 정보제공 방법에 대한 연구가 진행 중이다. 기존 연구에서 다양한 데이터마이닝 알고리즘을 사용하여 의료정보 데이터를 처리하는데, 통계적 방법, 지식기반 방법 등을 이용한다. 본 논문에서는 연관규칙 분석을 통한 의료 전문가를 위한 병명 추론 시스템을 제안하였다. 기존 연관규칙 분석을 통한 연구에서는 특정 질병을 정해두고 증상들 간의 연관규칙을 발견하는 연구가 주를 이뤘다. 하지만 이러한 연구는 특정 질병에 관한 관계를 분석하는 부분에 유용하지만, 실생활에 적용하기 어려운 점이 있다. 또한, 의료정보 데이터의 특수성으로 인해 빈번 하지 않지만, 중요한 정보일 수 있는 항목들을 고려하지 않고 있다. 다른 연구로는 이러한 빈번 하지 않은 항목을 고려하여 연관규칙을 추론하는 시스템을 제안하였지만, 질병간의 관계에 대해서 트레이닝 데이터에 의존하기 때문에 의미적으로 맞는지 검증이 필요하다. 따라서 본 논문에서는 빈번하지 않은 항목을 고려하기 위해 TF-IDF 가중치를 이용하여 각 문서에서의 중요도가 높은 항목을 고려한 연관 규칙 분석 시스템을 제안하였다. 또한, 의료진들이 기록 목적으로 자유롭게 정리한 의료 기록물로부터 병리데이터를 마이닝 하는 시스템을 제안하였다. 마지막으로 온톨로지 기반으로 실제 후보 질병들이 각 가중치 별로 표현되어 의료 전문가 의사결정에 시각적으로 도움이 되는 시스템을 제안하였다.

more

목차

1. 서 론 1
2. 관련 연구 5
가. 데이터 마이닝 기술을 적용한 의료데이터 처리 5
나. 연관규칙 분석 8
3. 제안하는 병리데이터 병명 추론 시스템 11
가. 시스템 모델 11
(1) 전처리 단계 12
(2) 연관규칙 추출 단계 13
(3) 테스트 단계 21
4. 성능 평가 26
가. 성능평가 환경 26
나. 성능평가 결과 28
5. 결론 및 향후 과제 32

more