검색 상세

파형 생체신호 이상치 탐색을 위한 딥러닝 방법 연구

Research of deep learning methods for waveform bio-signal outlier detection

초록/요약

의학 연구에 다양한 딥러닝 방법이 소개됨에 따라 환자로부터 수집된 파형 생체 신호의 활용 사례가 늘어나고 있다. 파형 생체 신호에는 대표적으로 심전도(Electrocardiogram), 광혈류측정(Photoplethysmo-graphy), 혈압(Arterial blood pressure)등이 있으며 이를 활용하기 위한 딥러닝 방법으로는 일차원 합성곱 신경망(1-dimensional Convolutional Neural Network)이 주목받고 있다. 다양한 딥러닝 방법들이 연구되고 있는 만큼 모델에 입력될 파형 데이터의 질과 그에 따른 정제 방법 또한 연구되고 있다. 편향되지 않은 연구 결과를 얻기 위해서는 연구자들에게 보다 정확한 잡음(noise) 또는 누락 탐지 및 정제가 요구된다. 본 연구는 광혈류, 혈압, 호흡 파형의 잡음을 탐지하기 위한 딥러닝 모델을 개발하고 분석하였다. 비교를 위해 지도학습 모델(1dCNN)과 비지도학습 모델(GAAL)을 각각의 파형에서 학습하고 내부 및 외부 데이터를 활용해 평가하였다. 지도학습 모델은 기본적인 CNN의 구조를 참고하여 구성하였고, 비지도학습 모델은 적대적 생성네트워크-(Generative Adversarial Network, GAN)을 액티브 러닝(Active learning)의 형태로 구성하였다(Generative Adversarial Active Learning, GAAL). 모델의 학습 및 내부평가를 위해 오픈 데이터 베이스인 MIMIC3 waveform matched subset 데이터를 활용하였으며, 외부평가를 위해 Fantasia database를 활용했다. 데이터의 노이즈 유무는 데이터 엔지니어 2명에 의해 수동적으로 진행되었으며 훈련셋(train set)과 검증&평가셋(validation & test set)을 각자 라벨링하였다. 모델의 학습에는 MIMIC3 데이터의 80%인 훈련셋이 사용되었으며, 검증셋(10%)에서 모델의 세부설정을 조정(Hyper-parameter tuning)하였다. 모델의 과적합을 막기 위해 검증셋에서 가장 높은 AUROC를 기록한 모델을 추출하였고, 모델 학습의 무작위성을 고려해 위의 과정을 각 학습방법마다 30회 반복하였다. 마지막으로 학습한 30개 모델은 평가셋(10%)에서 평가되었으며 지도학습 모델과 비지도학습 모델이 기록한 AUROC와 AUPRC값의 평균과 표준편차를 계산하였다. 내부검증 이후, 혈압과 호흡 파형에 대해 외부검증 데이터에서도 동일한 평가가 이루어졌으며 마찬가지로 AUROC, AUPRC의 평균과 표준편차를 계산하여 비교하였다. 추가로 비지도학습 모델의 전이학습 성능을 평가하고자 Fantasia data의 훈련셋(80%)에서 비지도 전이학습을 수행했고, 동일한 외부검증 평가셋(10%)에서 기존의 모델들과 분류 성능을 비교했다. 내부 검증 결과, 지도학습 모델이 광혈류 파형(1dCNN 평균 AUROC = 0.97[0.0]; GAAL 평균 AUROC = 0.9[0.04])과 혈압 파형(1dCNN 평균 AUROC = 0.9 [0.04]; GAAL 평균 AUROC = 0.84[0.03])의 노이즈 분류에 비지도학습 모델에 비해 높은 성능을 보인 반면 호흡 파형(1dCNN 평균 AUROC = 0.73 [0.04]; GAAL 평균 AUROC = 0.75[0.03])에서는 뚜렷한 차이를 보이지 않았다. 외부검증 결과, 지도학습 모델과 비지도학습 모델 모두 호흡 파형(1dCNN 평균 AUROC = 0.39 [0.01]; GAAL 평균 AUROC = 0.4[0.07])에서 급격한 성능 저하를 보였지만, 전이학습 이후 비지도학습 모델은 호흡파형(Transfer 평균 AUROC = 0.62[0.04])에서 성능 향상을 보였다. 본 연구는 다양한 파형 생체신호(Pleth, ABP, RESP)에서 지도학습과 비지도학습 모델의 노이즈 탐지 학습 성능을 확인 및 분석했다는 의의를 갖는다. 보다 일반적인 비교를 위해 30개 모델의 평균 AUROC와 AUPRC를 내부 및 외부 데이터에서 비교하였으며, 비지도 전이학습을 통해 비지도학습 방법이 갖는 장점 또한 살펴보았다. 또한, GAAL 알고리즘을 활용한 고도화된 연구 가능성을 보았으며 몇몇 연구의 단점에 대한 분석을 통해 추후에 더욱 세밀하고 정교한 추후 연구의 필요성을 살펴보았다.

more

초록/요약

As various deep learning methods are introduced in medical research, the use cases of waveform bio-signals collected from patients are increasing. Waveform bio-signals include electrocardiogram, photoplethysmography, and arterial blood pressure. As a deep learning method to utilize them, 1-dimensional convolutional neural network is used. Various deep learning methods are being studied, as well as the quality of waveform data to be input to the model and processing methods. To obtain unbiased study results, more accurate noise detection and processing are required for researchers. In this study, a deep learning model was developed and analyzed to detect noise in the photoplethysmography (Pleth), arterial blood pressure (ABP), and respiratory (Resp) waveforms. For comparison, a supervised learning model(1dCNN) and an unsupervised learning model (GAAL) were trained on each waveform and evaluated using internal and external data. The supervised learning model was constructed with reference to the basic CNN structure, and the unsupervised learning model was composed of a generative adversarial network (GAN) in the form of active learning (GAAL). For model learning and internal evaluation, MIMIC3 waveform matched subset data, an open database, was used, and Fantasia database was used for external evaluation. The label of the noise in the data was manually conducted by two data engineers, and the training set and validation & test set were individually labelled. The training set, which is 80% of the MIMIC3 data, was used for model learning, and the detailed settings of the model were adjusted (hyper-parameter tuning) in the validation set (10%). To prevent model overfitting, the model with the highest AUROC was extracted from the validation set, and the process was repeated 30 times for each learning method considering the randomness of model learning. Trained models were evaluated in the test set (10%), and the mean and standard deviation of the AUROC and AUPRC values calculated. After the internal validation, the same evaluation was performed on the external validation data for blood pressure and respiratory waveforms, and the mean and standard deviation of AUROC and AUPRC were calculated and compared. In addition, to evaluate the transfer learning performance of the unsupervised learning model, unsupervised transfer learning was performed on the training set (80%) of Fantasia data, and the classification performance was compared with the existing models in the same external test set (10%). As a result of the internal validation, the supervised learning model showed that classification of the pleth waveform (1dCNN mean AUROC = 0.97[0.0]; GAAL mean AUROC = 0.9[0.04]) and ABP waveform (1dCNN mean AUROC = 0.9 [0.04]; GAAL mean AUROC = 0.84[0.03]) showed higher performance compared to the unsupervised learning model, but there was no significant difference in the respiratory waveform (1dCNN mean AUROC = 0.73 [0.04]; GAAL mean AUROC = 0.75[0.03]). As a result of external validation, both the supervised learning model and the unsupervised learning model showed performance degradation in the respiratory waveform (1dCNN mean AUROC = 0.39 [0.01]; GAAL mean AUROC = 0.4[0.07]), but after transfer learning, the unsupervised learning model showed a sharp decrease in performance. In the waveform (Transfer mean AUROC = 0.62[0.04]), the performance was improved. This study has the significance of confirming and analyzing the noise detection learning performance of supervised and unsupervised learning models in various waveform bio-signals (Pleth, ABP, Resp). For a more general comparison, the average AUROC and AUPRC of 30 models were compared in internal and external data, and the advantages of unsupervised transfer learning were also examined. In addition, we saw the possibility of advanced research using the GAAL algorithm, and the need for more detailed and sophisticated future research was examined through the analysis of the shortcomings of the study.

more

목차

제1장 서론 1
제1절 연구배경 1
제2절 관련연구 3
제3절 연구목적 4
제2장 연구대상 및 수집 방법 5
제1절 데이터 수집 및 라벨링 5
제1항 MIMIC3 waveform matched subset 6
제2항 Fantasia database 7
제3항 데이터 라벨링 8
제2절 연구설계 9
제1항 내부검증실험 설계 10
제2항 외부검증실험 설계 12
제3절 딥러닝모델 14
제1항 지도학습 모델 15
제2항 비지도학습 모델 18
제4절 성능평가 25
제5절 개발환경 및 라이브러리 28
제3장 결과 29
제1절 데이터 수집 29
제1항 내부검증 데이터 29
제2항 외부검증 데이터 31
제2절 모델학습 및 평가모델 선정 32
제1항 비지도학습 모델 32
제2항 잠재노이즈 파형 34
제3항 지도학습 모델 38
제3절 모델 성능 평가 39
제1항 라벨 일치도 평가 39
제2항 내부검증 결과 40
제3항 외부검증 결과 42
제4항 잠재노이즈 파형 44
제4장 고찰 46
제5장 결론 50
제6장 참고문헌 51

more