검색 상세

기계학습을 이용한 반도체 생산 스케쥴 로그 분석 연구:클러스터링과 의사결정트리 하이브리드 접근방법

초록/요약

반도체 생산관리는 여러 개의 프로세스가 여러 개의 설비에 할당되어야 하는 Job shop 방식으로 생산관리 방법 중 가장 어려운 것으로 꼽힌다. 반도체 칩 사이즈가 점점 줄어듦에 따라 실제 반도체 생산라인에서 하나의 제품을 만들기 위해서는 800 개가 넘는 프로세스를 진행해해야 하며 Bare wafer 투입부터 완제품에 가기까지의 소요시간(TAT: Turn Around Time)은 최대 7 개월이 걸린다. 최근 강화학습의 등장으로 생산관리 분야에서 시뮬레이션 기반으로 보상(Reward)을 최대화하는 새로운 스케쥴 방법론에 대한 연구가 나오고 있다. 하지만 실제 현업에서 생산관리 실무자들은 하루하루 정해진 물량이 정해진 프로세스 sequence 를 지나는지(cut off)를 관리하고 있다. Domain experts 는 장기간의 시뮬레이션을 통해 변동성이 많은 생산라인의 예측 시뮬레이션 결과를 믿는 것은 한계가 있다고 판단하고 있어 시뮬레이션은 현재 생산관리 자동화 분야에서 8 시간~24 시간 예측 부분에서만 제한적으로 활용되고 있다. 이 결과 실제 생산관리 전문가는 시뮬레이션보다 하루 동안 일어난 생산이 그들이 원하는 관점에서 이루어지는지 한 눈에 확인할 수 있는 솔루션이 필요하다는 니즈가 많다. 필자는 현업의 요구사항을 바탕으로 실제 반도체 Fab 에서 dispatching 된 log 를 머신 러닝으로 분석하여 Fab Automation 에 영향을 끼치는 decision making factor 를 한 번에 분석하고 보여줄 수 있는 솔루션에 대해 연구하였다. 본 연구는 복잡한 반도체 생산 스케쥴의 의사결정 팩터를 분석하고, 비전문가도 쉽게 알아볼 수 있는 의사결정 트리로 주요 특성을 시각화 하는 데 중점을 두었다. 이를 통해 반도체 Fab(생산시설) 스케줄을 결정하는 주요 인자를 파악하고, 자동화된 의사결정의 규칙과 휴리스틱 접근법의 차이를 이해할 수 있을 것이다. 또한, 고객 수요의 변화가 스케줄링에 미치는 영향을 분석하며, 비전문가도 이해할 수 있는 결과를 제공함으로써, 복잡한 생산라인을 단순화하고, 자동화된 생산라인 구축에 기여한다. 또한, 스케줄 의사결정 팩터를 파라메터화 함으로써 향후 스케줄의 방향성을 제시하여 장기적으로는 Autonomous Fab 을 구축하는 데 기반을 마련할 것으로 기대된다.

more

초록/요약

Semiconductor production management is known as one of the most complicated problems in the world. Semiconductor companies have conducted a job shop production where multiple processes are assigned to a variety kind of equipment. The complexity of Job shop scheduling problem (JSSP) is exacerbated as semiconductor chip sizes continuously shrink, requiring over 800 processes to produce a single product. From the input of a bare wafer to the output of the final product, the TAT(Turn Around Time) can take up to seven months or more. The advent of reinforcement learning has led to new research approach in production management, focusing on simulation-based methodologies that maximize rewards. However, in actual practice, production management professionals manage the daily flow of predetermined quantities through specified process sequences which is called cut-off. Domain experts are skeptical to use long-term simulation predictions due to the volatile nature of production lines. Consequently, simulations are currently limited to predicting 8 to 24 hours into the future in the field of production management automation. As a result, there is a significant need for solutions that allow production management experts to quickly ascertain whether the day's production job dispatching aligns with their objectives. Based on the requirements of the industry, I have studied a solution that employs machine learning to analyze logs of dispatched jobs in actual semiconductor Fabs. This solution aims to provide a comprehensive analysis of decision-making factors related to Fab Automation. This study focused on that analyze the decision-making factors in a semiconductor production schedule and visualize the principal components throughout a decision tree which any non-experts can understand how it works. It will contribute to develop further integration of next step of production scheduling.

more

목차

제 1 장 서론 1
제 1 절 연구배경 및 목적 1
제 2 장 이론적 배경 및 선행연구 고찰 4
제 1 절 생산관리 4
1. 생산관리 개념 4
2. 생산관리에서 케쥴링의 역할 8
3. 반도체 산업 및 스케쥴링 대한 선행연구 고찰 11
제 2 절 인공지능과 머신러닝 15
1. 지도 학습(Supervised Learning) 15
가. 의사결정 트리(Decision Tree) 16
2. 비지도 학습(Unsupervised Learning) 16
가. 피쳐 선택(Feature Selection) 17
나. 주성분 분석(PCA : Principal Component Analysis) 17
다. K-Means Clustering 18
3. 강화 학습(Reinforcement Learning) 18
제 3 절 데이터 정규화 20
1. Standard Scaler 20
2. Minmax Scaler 20
3. Max-abs Scaler 20
4. Robust Scaler 21
5. Uniform quantile Scaler 21
6. GS-quantile Scaler 21
7. L2 norm Scaler 22
제 3 장 연구 방법 23
제 1 절 연구 문제 및 제안 방법 23
제 2 절 분석 대상 및 자료수집 방법 27
제 3 절 분석 대상 및 자료수집 30
제 4 장 데이터 현황 및 데이터 전처리 31
제 1 절 스케쥴 로그 데이터 현황 31
제 2 절 데이터 클리닝 33
1. 데이터 파싱(Parsing) 33
2. 피쳐 선택(Feature selection) 33
제 5 장 실험 및 결과 분석 35
제 1 절 상관관계 분석 35
제 2 절 비지도 학습 37
1. 주성분 분석(PCA: Principal Component Analysis) 37
제 3 절 의사결정 트리 통한 연합 학습 39
1. K-means 군집화 39
2. 의사 결정 트리 41
제 6 장 결론 및 제한점 44
제 1 절 연구 결과와 요약 44
제 2 절 연구의 제한점 및 향후 연구방향 45
참고문헌 48

more