정류장 단위의 만석 예측 모형 연구 : 지니계수와 로지스틱 회귀를 활용하여
A Study on the Full Capacity Prediction Model at the Bus Stop Level
- 주제(키워드) 광역버스 , 만석 예측 , 로지스틱 회귀 , 지니계수
- 주제(DDC) 629.04
- 발행기관 아주대학교 일반대학원
- 지도교수 오세창
- 발행년도 2025
- 학위수여년월 2025. 2
- 학위명 석사
- 학과 및 전공 일반대학원 교통공학과
- 실제URI http://www.dcollection.net/handler/ajou/000000034758
- 본문언어 한국어
- 저작권 아주대학교 논문은 저작권에 의해 보호받습니다.
초록/요약
본 연구는 경기도 광역버스의 만석 운행 문제를 효과적으로 개선하기 위해 수도권 광역버스 재차인원 데이터를 활용하여 정류장별, 시간대별로 상이한 수요·공급 패턴을 반영한 만석 예측 모형을 개발하였다. 기존의 거시적 단위나 단순 수요 데이터를 활용한 연구와 달리, 본 연구는 정류장 단위의 세밀한 변수와 불평등한 분포를 정량적으로 나타내는 지니계수를 포함한 변수들을 활용하여 이항 로지스틱 회귀를 통해 모형을 구축하였다. 종속 변수는 노선별로 만석 운행이 최초로 가장 많이 발생하는 임계 정류장을 기준으로 만석 운행이 발생할 경우 1, 발생하지 않을 경우 0으로 설정하였으며, 설명변수는 상관 분석을 통해 선정되었다. 전진 변수 선택법과 후진 변수 제거법, 모형 적합도 검증 및 AIC를 통해 최종적으로 좌석당 수요 기준 지니 계수, 정류장 개수, 첨두_6(더미 변수), 평균 좌석당 수요(log) 등 4개의 설명 변수로 구성된 모형을 구축하였다. 구축된 모형을 활용하여 실제로 만석 운행이 빈번하게 발생했던 노선에 대해 단순 증차, 중간 배차, 노선 급행화 등 다양한 공급 대안을 적용하고 최적의 대안을 도출하였다. 그 결과, 중간 배차(30%) 방식이 운행 회차 4회 중 3회에서 가장 뚜렷한 개선 효과를 보였으며, 나머지 회차에서는 노선 급행화 증차 방식이 가장 효과적인 대안으로 분석되었다. 이러한 결과는 중간 배차와 노선 급행화가 특정 운행 회차에서 만석 확률을 효과적으로 감소시킬 수 있음을 시사하며, 대중교통 운영의 효율성과 승객 형평성 향상에 기여할 수 있음을 보여준다. 본 연구는 광역버스의 수요·공급 불균형 문제를 정류장 단위의 미시적인 접근을 통해 해결하고자 하였으며, 지니 계수를 새로운 설명 변수로 도입하여 정류장별 불균형을 정량적으로 분석하였다. 이는 기존의 단순히 승하차 인원을 활용한 예측 연구와 차별화되며, 임계 정류장의 개념을 도입하여 만석 운행을 예측하는 새로운 관점을 제공하였다. 또한, 구축한 만석 예측 모형을 실제 노선에 적용하여 최적의 공급 대안을 제시함으로써, 대중교통 운영의 효율성과 승객 만족도를 동시에 향상시키는 실질적인 방안을 제시하였다. 그러나 본 연구에서는 좌석당 수요 기반 지니 계수, 평균 좌석당 수요(log), 정류장 개수의 VIF가 6 이상 10 미만으로 다중공선성 문제가 발생할 우려가 있었으며, 특히 월요일의 예측 성능이 낮게 나타나는 등의 한계가 있었다. 또한, 모형 적용 과정에서 공급 증가로 인해 일부 정류장의 좌석당 수요가 과도하게 감소하여 지니계수가 오히려 소폭 증가하는 경향이 나타났다. 이에, 향후 연구에서는 다중공선성 문제와 연계한 추가적인 변수 고려나, 임계값 조정을 통한 모형 성능 개선이 필요할 것으로 판단된다. 또한, 지니 계수의 활용 가능성을 더욱 정밀하게 검토하고, 다양한 변수들과의 상호작용을 통해 데이터 불균형 문제를 효과적으로 완화할 수 있는 방법론을 개발할 필요가 있다. 결론적으로, 본 연구는 정류장 단위의 예측 모형 개발과 지니 계수의 응용이라는 차별화된 접근을 통해 광역버스의 수요·공급 불균형 문제를 해결하기 위한 실질적인 방안을 제시하였다. 이는 기점 상류부와 하류부 승객의 공평한 서비스 제공을 통해 불균형을 해소하고, 광역버스 운영의 효율화를 제고하는 데 도움을 줄 것으로 기대된다. 나아가, 본 연구에서 제시한 최적 공급 대안 선정 방식을 통해 특정 출근 시간대의 운행 회차에 대한 세밀한 증차를 실시함으로써, 불편을 겪었던 승객들이 체감할 수 있는 공급 대책을 수립하는 데 기여할 수 있을 것으로 기대된다. 키워드 : 광역버스, 만석 예측, 로지스틱 회귀, 지니계수
more초록/요약
This study aims to effectively address the issue of overcrowded operations in Gyeonggi-do's metropolitan buses by developing an overcrowding prediction model that reflects varying demand and supply patterns across bus stops and time slots, utilizing re-trip passenger data from metropolitan buses in the Seoul Capital Area. Unlike previous studies that employed macro-level units or simple demand data, this research utilizes detailed variables at the bus stop level and incorporates the Gini coefficient, which quantitatively represents distributional inequality, to construct a binary logistic regression model. The dependent variable was defined as 1 if overcrowded operations occurred at the critical bus stop where such operations initially occurred most frequently for each route, and 0 otherwise. Explanatory variables were selected through correlation analysis, resulting in nine variables including the Gini coefficient. Using forward selection, backward elimination, model fit verification, and the Akaike Information Criterion (AIC), the final model comprised four explanatory variables: Gini coefficient based on seat demand, number of bus stops, Peak_6 (dummy variable), and log of average seat demand. Utilizing the developed model, various supply alternatives such as simple fleet increases, intermediate dispatching, and route express services were applied to routes that frequently experienced overcrowded operations to derive the optimal alternatives. The results indicated that the intermediate dispatching (30%) method showed the most significant improvement in three out of four operation periods, while the route express service fleet increase method was identified as the most effective alternative for the remaining periods. These findings suggest that intermediate dispatching and route express services can effectively reduce the probability of overcrowding during specific operation periods, thereby contributing to the efficiency of public transportation operations and enhancing passenger equity. This study addresses the imbalance between demand and supply in metropolitan buses through a micro-level approach at the bus stop level and quantitatively analyzes the imbalance at each bus stop by introducing the Gini coefficient as a new explanatory variable. This differentiates it from previous predictive studies that solely utilized boarding and alighting numbers by introducing the concept of critical bus stops to predict overcrowded operations from a new perspective. Additionally, by applying the developed overcrowding prediction model to actual routes and proposing optimal supply alternatives, this research presents practical solutions that simultaneously enhance the efficiency of public transportation operations and passenger satisfaction. However, the study encountered limitations such as potential multicollinearity issues with the explanatory variables: Gini coefficient based on seat demand, log of average seat demand, and number of bus stops, with Variance Inflation Factor (VIF) values ranging from 6 to less than 10. Furthermore, the model’s predictive performance validation revealed that recall was lower compared to other performance metrics, particularly showing relatively poor performance on Mondays. Additionally, during the model application process, an excessive decrease in seat demand per bus stop due to increased supply led to a slight increase in the Gini coefficient for some operation periods, despite the overall increase in supply. Consequently, future research should more precisely examine the applicability of the Gini coefficient and develop methodologies to effectively mitigate data imbalance issues through interactions with various variables. It is also necessary to consider additional variables related to multicollinearity and improve model performance through threshold adjustments using Receiver Operating Characteristic (ROC) curves and Area Under the Curve (AUC). In conclusion, this study presents practical solutions to resolve the imbalance between demand and supply in metropolitan buses through a differentiated approach involving the development of a bus stop-level prediction model and the application of the Gini coefficient. This is expected to help balance the provision of equitable services between upstream and downstream passengers and enhance the efficiency of metropolitan bus operations. Furthermore, by implementing the optimal supply alternative selection method proposed in this study to conduct detailed fleet increases for specific commuting periods, it is anticipated to contribute to the establishment of supply measures that passengers who have experienced inconvenience can directly perceive. This not only enhances equity in service benefits among passengers but also improves mobility convenience for upstream passengers who experienced inconveniences due to non-stop pass-through, such as reduced travel time.
more목차
제 1장 서론 1
제 1절 연구의 배경 및 목적 1
제 2절 연구의 범위와 방법 3
제 2장 이론적 배경 5
제 1절 관련 이론 고찰 5
제 2절 선행 연구 고찰 15
제 3절 시사점 23
제 3장 데이터 수집 및 변수 가공 25
제 1절 노선별 재차인원 데이터 수집 및 가공 25
제 2절 기초통계분석 31
제 3절 변수 가공 37
제 4장 모형 구축 및 검증 50
제 1절 모형 구축 50
제 2절 모형 검증 55
제 5장 만석 예측 모형의 적용 59
제 1절 모형 적용 59
제 2절 적용 결과 64
제 6장 결론 66
<참고문헌> 68

