Travel time prediction in public transportation


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: İstanbul Ticaret Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2021

Tezin Dili: İngilizce

Öğrenci: BETÜL BOYLU

Danışman: BOYACI ALİ

Özet:

ÖZET Günümüzde toplu ulaşımda, ulaşım süresinin tahmini, bilgiye kolayca erişebilen ve günlük aktivitelerini planladıkları gibi yolculuklarını da planlamak isteyen yolcular için oldukça önemlidir. Büyük şehirlerde ulaşım süresi bazı öngörülemeyen dış faktörler nedeniyle çeşitlilik göstermektedir. Bu nedenle bu çalışma, GPS cihazları ile toplanan veriyi kullanarak, güçlü ancak sade bir Makine Öğrenmesi tekniği sunmaktadır. Teknik, geçmiş veriden öğrenerek, gelecek verisini hava durumu, yoğun saatler, haftanın yoğun günleri ve yıllın yoğun günleri gibi dış etkenleri göz önünde bulundurarak tahmin eden Çoklu Düzlemsel Regresyon algoritmasını kullanmaktadır. Tekniği doğrulamak amacı ile bir doğrulama modeli oluşturulmuştur. Doğrulama modeli geçmiş verinin ortalaması ve gerçek veri ile kıyaslanarak modelin doğruluğu ölçülmüştür. Sonuçlar tahmin tekniğinin ortalama modele göre daha iyi performans gösterdiğini ve gerçek veriye en yakın tahmini yaptığını göstermiştir. Anahtar Kelimeler: Çoklu doğrusal regresyon, makine öğrenmesi, ulaşım süresi tahmini. ABSTRACT Today, travel time prediction is essential for passengers who can easily access information and want to be able to plan their journeys as well as their daily activities. Travel time varies due to some unpredictable external factors especially in big cities. Therefore, this paper proposes a powerful but simple Machine Learning model by using data collected by GPS devices. The model uses a Multiple Linear Regression algorithm that learns from historic data and predicts future values for each bus stop interval by considering external factors such as; weather conditions, peak hours, busy week days and busy days of year. A validation model was developed to measure the accuracy of the prediction model. Then the validation model was compared to average of historic data and real data. Results show that the prediction model outperforms the average model and calculates closest travel times to the real data. Keywords: Machine learning, multiple linear regression, travel time prediction. İÇİNDEKİLER TABLE OF CONTENTS. i ABSTRACT . ii ÖZET . iii ACKNOWLEDGEMENTS . iv LIST OF FIGURES . v LIST OF TABLES. vi SYMBOLS AND ABBREVIATION . vii 1. INTRODUCTION . 1 2. LITERATURE REVIEW . 3 3. MODEL . 21 3. 1. Machine Learning Approach and Types Of ML Algorithms . 21 3. 2. Multiple Linear Regression . 22 3. 3. Line Information . 23 3. 4. Preparation . 23 3. 4. 1. Parameter selection . 23 3. 4. 2. Line selection . 25 3. 4. 3. Field observations . 28 3. 4. 4. Data collection . 31 3. 4. 5. Data cleaning . 33 3. 4. 6. Data processing . 36 3. 4. 6. 1. Travel data processing . 36 3. 4. 6. 2. Weather data processing . 37 3. 5. Model Development . 38 3. 6. Validation . 42 4. RESULTS . 44 4. 1. Comparison of Prediction Model with Historical Average and Real Travel Time. 46 5. CONCLUSION . 50 5. 1. Conclusions . 50 5. 2. Further Work . 51 REFERENCES . 52 RESUME . 56