검색 상세

독립변수 추출과 통계적 검정, 마할라노비스 거리를 이용한 공정 이상 탐지

Detection of Process Change using Statistical Test of Extracted Independent Variables and Mahalonobis Distance

초록/요약

센서 기술과 데이터 처리 기술의 발전으로 공장에서의 품질 관리는 완성품의 품질만 관리하는 것이 아니라 생산과정부터 이루어지고 있다. 공정의 메커니즘을 이해하고 있는 엔지니어의 판단으로 고장의 주요 원인이 되는 생산과정에 센서를 부착하여 관리함으로써 불량으로 출하되는 제품의 수를 줄이고, 품질 문제로 야기되는 비용을 줄일 수 있으며 고장의 원인을 즉각 발견할 수 있게 되었다. 하지만 생산과정 중의 센서값은 산포 관리까지는 이루어지지 않고 있으며 이로 인해 다구찌 품질 관리 방법론과 같은 지속적인 품질의 개선 방법은 적용되지 못하고 있다. 또한 공정 관리의 임계값은 엔지니어의 판단에 이루어지므로 정말 일어나서는 안 되는 값에서만 관리가 이루어지거나, 혹은 엔지니어의 주관적 관점이 개입된다. 이에 본 연구는 생산 공정 중에서의 정량적 품질 관리와 불량 원인을 찾기 위한 품질 관리 모델 개발을 목표로 한다. 다변량 확률공간에서의 이상치는 마할라노비스 거리를 통해 알 수 있다. 마할라노비스 거리는 계산 과정 중 확률변수들의 선형 독립성을 만족시키게 되므로 변수들 사이의 선형 독립을 곧 확률적 독립으로 본다는 가정이 있다면 마할라노비스 거리는 카이제곱 분포를 따르게 된다. 정상 제품들의 산포를 통해 다변량 확률공간 내에서 정상 공간을 만들어내게 되면 새로 들어오는 제품이 정상 공간에서 얼마나 떨어져 있는가를 계산하여 이 제품이 정상인지 여부를 통계적으로 검정할 수 있게 된다. 상호 선형 종속성이 강한 변수들은 불량 원인의 해석을 어렵게 만든다. 선형 종속성이 강한 변수들은 상관계수를 거리로, PCA를 군집화 방법으로 사용하는 계층적 군집화를 통해 하나의 변수가 된다. 이 과정 중에서 분석가와 도메인 전문가의 협업을 기대할 수 있게 된다. 최종 분석 결과, 기존 시스템으로 잡지 못했던 2종 오류를 유의미하게 찾아낼 수 있었으며 오류의 원인 또한 통계적 지표로 알아낼 수 있었다. 통계적 엄밀함을 위한 방법론, 데이터의 보강이 있다면 현장에서 더욱 의미 있게 활용될 수 있는 모델을 만들 수 있을 것으로 기대된다.

more

초록/요약

As the development of sensor technology and data processing technology, quality control in factories is carried out not only from the quality of finished products, but also from the production process. According to the judgment of an engineer who understands the process mechanism, it is possible to reduce the number of defective products, reduce costs caused by quality problems, and immediately detect the cause of failure by attaching sensors to the production process. However, dispersion management on sensor values during the production process has not been carried out, and for this reason, continuous quality improvement methods such as the Taguchi quality Control methodology have not been applied. In addition, since the threshold of process management is based on the judgment of the engineer, management is performed only at values that should not really occur, or the engineer's subjective perspective is involved. Therefore, this study aims to develop a quality control model to quantitatively manage quality and find the cause of defects during the production process. Outliers in multivariate probability spaces can be detected by Mahalanobis distances. Since Mahalanobis distances satisfy the linear independence of probability variables during the calculation process, Mahalanobis distances is chi-squared distributed if there is an assumption that linear independence between variables is viewed as stochastic independence. Creating a normal space within a multivariate probability space through the distribution of normal products will allow you to statistically test whether the product is normal by calculating how far the new product is from the normal space. Variables with strong mutual linear dependence make it difficult to interpret the cause of the defect. Variables with strong linear dependence become one variable through hierarchical clustering using the correlation coefficient as a distance and PCA as a clustering method. During this process, collaboration between analysts and domain experts can be expected. As a result of the final analysis, it was possible to significantly find type 2 errors that could not be caught by the existing system, and also the cause of the errors could be identified by statistical indicators. If there is a methodology for statistical rigor or there is reinforcement of data, it is expected that a model that can be used more meaningfully in the field can be created.

more

목차

제1장. 서론 1
제1절. 연구 배경 1
제2절. 연구 목적 2
제2장. 관련 연구 4
제1절. 마할라노비스 거리와 카이제곱 검정 사례 4
1. MTS 기법을 활용한 품질경쟁력 평가에 관한 연구 4
2. 심장 질병 진단을 위한 마할라노비스 거리 기반 조정 가능한 분류 모델 4
3. 마할라노비스 거리와 독립성분분석을 이용한 다변량 공정 고장 탐지 5
4. 마할라노비스-다구치 시스템을 이용한 공정 이상 탐지 5
제2절. 상관계수 기반 계층적 군집분석(Correlation Based Hierarchical Clustering) 6
1. 가슴 세포 조직, 태아 심박 수, 이미지, 자연어 등의 여러 종류의 데이터 형식에 대한 특징 추출을 위한 계층적 상관계수 군집화와 임베딩 6
제3절. 이론적 배경 6
1. 단변량에서의 확률밀도함수를 이용한 이상 탐지 6
2. 다변량에서의 확률밀도함수를 이용한 이상 탐지 7
3. 다변량 가우시안 공간에서의 마할라노비스 거리와 카이제곱 분포의 관계 8
제3장. 연구 방법 11
제1절. 데이터 설명 11
1. 임가공 공정 11
2. 에이징 공정 11
3. 현금/실권(LQC) 공정 12
4. 시스템 에이징 공정 12
제2절. 통계적 양품 여부 확인 방법 13
1. 센서값의 분포상 위치 14
2. 테스트 양불 판정 방법 15
3. 공정 양불 판정 방법 17
4. 통계적 센서 사양 결정 및 사양 업데이트 방법 18
가. 초기 센서 사양 결정 18
나. 사양 업데이트 18
제3절. CBHC를 통한 변수 추출 방법 19
제4장. 연구 결과 21
제1절. 데이터 설명 21
제2절. 통계적 검정 결과 25
1. CBHC 변환 과정 설명 25
2. 상관계수 거리 기반의 계층적 군집분석에서 Scree Plot을 이용한 군집 거리 결정 26
3. CBHC 변환 27
가. 임가공 공정 27
나. 에이징 공정 29
다. 현금, 실권 공정 32
4. 양불 검정 34
제5장. 결론 39
제1절. 결과 해석 39
제2절. 향후 과제 40
참고 문헌 44

more