검색 상세

미래 혁신 생태계를 구상하기 위한 유망기술 식별 : 특허 데이터에 대한 기계학습 접근 방식

Identifying emerging technologies to envision a future innovation ecosystem: A machine learning approach to patent data

초록/요약

기술 및 산업 가치 사슬의 급속한 변화로 인해 기업들은 외부 파괴력에 더 잘 대응하고 새로운 비즈니스를 시작하거나 현재 비즈니스를 개선하는 데 이용될 수 있는 유망기술을 식별하는 것이 필수적이게 되었다. 유망기술을 식별하는 데 가장 일반적으로 사용되는 접근법 중 하나는 특허 분석이다. 특허는 오랫동안 기술에 대한 유용한 데이터 원천으로 간주되어 왔다. 따라서 기존의 여러 연구에서 유망기술을 정의하기 위해 특허를 사용해왔다. 하지만 대부분의 이전 연구는 유망기술을 평가할 때 특허 정보에 크게 의존한 반면, 유망성은 특허 정보로 설명되지 않는 다양한 다른 요인에 의해 결정된다. 본 연구에서는 기존 접근법의 한계를 극복하기 위해 전문가의 의견과 특허 정보를 모두 고려한 복합 접근법을 제안한다. 분석을 위해 먼저 잠재적으로 가치 있는 특허를 평가할 수 있는 일련의 기준을 선정했고, 전문가들이 그 기준에 따라 전체 특허 포트폴리오의 일부만 평가하도록 한 다음, 평가 결과를 포트폴리오의 나머지에서 잠재적으로 가치 있는 다른 특허를 식별하였다. 이때, 소량의 라벨이 있는 데이터(전문가가 평가한 특허)를 라벨이 없는 데이터(포트폴리오의 다른 특허)와 함께 사용하는 능동준지도 학습 기법을 적용하였다. 제안된 접근법은 전기차 배터리 산업 분야에 적용되어 그 유용성을 검증하였다. 분석 결과 능동 학습과 결합된 준지도 학습이 사람의 입력을 최소화하여 새로운 유망기술을 효과적으로 식별하거나 비유망 기술을 필터링하는 데 잠재력이 있음을 확인하였다. 소수의 라벨이 지정된 특허만으로도 많은 특허에 라벨을 지정할 수 있으므로 전문가가 특허를 평가할 때 드는 시간과 노력을 절약할 수 있다. 본 연구는 방법론적으로 특허 분석의 맥락에서 능동준지도 학습을 도입하려는 초기 시도이다. 또한, 실무적으로 연구 결과는 유망기술을 식별하고 미래 혁신 생태계를 구상하는 데 있어서 전문가의 의견을 효과적으로 사용하고 데이터와 전문가 중심의 의사 결정 간 균형을 맞출 수 있도록 한다.

more

초록/요약

With the rapid changes to technology as well as industry value chains, it has become essential for firms to identify emerging technologies that can better respond to external disruptive forces and be used to launch new businesses or improve current businesses. One of the most commonly used approaches in identifying emerging technologies is patent analysis. Patents have long been regarded as a useful source of data on technologies; accordingly, a number of previous studies have applied patents to define rising technologies. However, most previous studies have significantly relied on patent information in assessing emerging technologies, whereas promisingness is determined by various other factors that are not explained by patent information. To overcome the limitation of previous approaches, this study proposes a hybrid approach considering both expert opinions and patent information to identify emerging technologies. For analysis, we firstly developed a set of criteria with which to evaluate potentially valuable patents, had experts evaluate only a portion of the patents from a larger patent portfolio of interest based on the criteria, and finally used the evaluation results to identify other potentially valuable patents from the rest of patents in the portfolio. Here, an active semi-supervised learning technique was applied, in which a small amount of labeled data (patents evaluated by experts) was used with a large amount of unlabeled data (the other patents from the portfolio). An analysis model consists of two layers – patents and patent attributes – with patent attributes such as technology characteristics used to classify patents into emerging and non-emerging ones. The proposed approach was applied to the automobile industry sector, and its usability was verified; the analysis results indicated that semi-supervised learning combined with active learning has potential in effectively searching for emerging technologies or filtering non-promising technologies with less human input. With only a small set of labeled patents, a large set of patents could be labeled, which saves time and effort when experts evaluate patents. Methodologically, this is an early attempt to introduce active semi-supervised learning in the context of patent analysis. Practically, the research findings enable expert opinions to be used effectively in identifying emerging technologies and envisioning a future innovation ecosystem, making a balance between data- and expert-driven decision-making.

more

목차

제1장 서론 1
제1절 연구 배경 1
제2절 연구 목표 3
제3절 연구 구성 4
제2장 이론적 배경 5
제1절 데이터 마이닝 기반의 특허 분석 5
제2절 기계학습 접근법 7
제3장 연구 프레임워크 10
제1절 연구 아이디어 10
제2절 전체 연구 프로세스 12
제3절 세부 절차 14
제4장 분석 결과 20
제1절 데이터 수집 및 전처리 20
제2절 모델 설계 23
제3절 모델 검증 28
제4절 혁신 생태계 구상 30
제5장 고찰 38
제6장 결론 및 향후 연구 40
참고문헌 (Bibliography) 42
부록 (Appendix) 49
영문요약 (Abstract) 62

more