검색 상세

Bayesian Solution to Interference Problem in Medical Distributed Database

초록/요약

What do people tell their doctor? What do people expect their doctor to tell others? What do people expect their doctor to not tell others? This last question is one that is becoming more worrisome in the minds of the public. This concern is driven by the exponential increase in the value of information that comes with the ability to rapidly and transparently connect one computer with another via the internet. The problem of inference is particularly tricky in the context of medical information. One of the hallmarks of biological systems is their extreme degree of inter-relatedness. Given this degree of inter-relatedness, it is certainly possible for a user with a low classification to obtain information which will permit him to infer the value of a datum at a higher classification. The inference problem becomes even more intractable when you consider multiple inter-related databases, such as those in a hospital, an out-patient clinic, a pharmacy and insurance clearance house. Assuming that each of these DBMS have sufficient demographic information to identify an individual patient, it is possible to determined classified facts in one DB by relying on non-classified information contained in another. This thesis proposes a Bayesian approach to solve the inference problem by placing an inference inhibitor between the user and the distributed inter-related medical database. The Bayesian network can be learned from the distributed database which will help to prevent any sensitive information leaking out of the database as a result of inference by setting a threshold value for the sensitive attribute.

more

초록/요약

사람들은 의사에게 뭐라고 말하는가? 사람들은 의사가 다른 사람들에게 뭐라고 얘기하기를 기대하는가? 이 마지막 질문은 대중들이 마음속에서 안절부절못하는 문제가 되었다. 이러한 근심은 인터넷을 통해 한 컴퓨터에 빠르고 투명한 정보의 연결로 인한 정보의 가치 증가에 있다. 추론의 문제점은 의학 정보의 문맥 속에서 특히 방심할 수 없는 것이다. 생물학적인 시스템의 한 특징은 그것들간의 긴밀한 상호 연관성이다. 이런 상호 연관성으로 인해, 보안이 낮은 정보에 대한 권한을 가진 사용자가 높은 보안성을 가진 데이터에 대해 추론하는 것을 가능하게 한다. 병원, 외래, 약국, 보험회사 등과 같이 서도 다양하게 연결된 데이터베이스를 고려하면 추론 문제는 더욱 다루기 어려워진다. 이러한 데이터베이스 시스템에 각 개인 환자를 구분해 내기 위한 충분한 통계자료가 있다고 가정하면 한 데이터 베이스에 기밀로 분류되지 않은 정보를 통해 다른 데이터베이스의 기밀로 분류된 자료에 대한 유추가 가능해진다. 이 논문에서는 이러한 추론 문제를 해결하기 위해 사용자와 분산된 서로 관련 있는 의학정보 사이에 억제자를 두는 형태의 베이지언 접근법을 제시한다. 베이지언 네트워크는 분산된 데이터베이스로부터 학습이 가능하며, 이것은 민감한 정보에 임계값을 두어 추론에 의한 결과로 민감한 정보가 세어 나가는 것을 막는데 도움이 될것이다.

more

목차

Table of Contents
Chapter 1. Introduction = 1
1.1 Inference Problem = 1
Chapter 2. Causal Networks & Bayesian Networks = 4
2.1 Basic Principle for reasoning under uncertainty = 4
2.1.1 Wet Grass Example = 4
2.1.2 Explaining away = 5
2.1.3 Dependence of events = 5
2.2 Causal Networks = 6
2.3 Bayesian Networks = 9
2.3.1 The chain rule = 10
2.3.2 Bucket Elimination algorithm [16] = 11
Chapter 3. Learning Bayesian Networks = 14
3.1 Known network structure and observable variables = 14
3.2 Unknown structure and observable variables = 18
3.3 Learning Bayesian Network from Distributed Data = 22
Chapter 4. Medical Distributed Database -Inference Problem = 24
4.1 Distributed Database System = 24
4.2 Inference Problem in distributed medical database = 24
4.3 Problem Scenario = 25
4.4 Bayesian Solution to Inference Problem = 28
Chapter 5. Bayesian Inference Solution = 30
Chapter 6. Conclusions = 35
References = 36
Appendix = 38
요약 = 41

more