Vehicle Routing Problem with Time Windows solved via Machine Learning and Optimization Heuristics
Vehicle Routing Problem řešený pomocí strojového učení a heuristických optimalizačních metod
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date
Abstract
Pro řešení vehicle routing problému byly navrženy nové přístupy v oblasti strojového učení, ale téměř žádná pozornost nebyla věnována variantě vehicle routing problému s časovými okny s mírným omezením (VRPTW). I přesto, že tato varianta je nutná řešit v každém produkčním řešení plánovacího logistického systému. Tato práce navrhuje novou metodu řešení VRPTW pomocí hlubokého posilovaného učení. Model je postaven na architektuře Transformer využívající Graph Attention Network pro vložení vstupní instance. Model používá nově navrženou funkci odměny, která zahrnuje omezení časových oken. Práce také zkoumá další metaheuristické metody pro řešení VRPTW, které slouží ke vyhodnocení výsledného modelu. Výsledkem této práce je end-to-end model hlubokého učení, který řeší VRPTW, který ale stále předčí metaheuristiké metody.
A novel approaches in the field of machine learning has been proposed to solve the vehicle routing problem, but yet a variant of vehicle routing with soft constrained time windows has received almost no attention. Even though it is a must for any production ready logistics planner. This thesis proposes a new method for solving a vehicle routing problem with soft constrained time windows (VRPTW) using deep reinforcement learning. The model is built upon Transformer architecture utilizing Graph Attention Network for embedding the input instance. The model is using the proposed reward function that incorporates the time window constraint. The thesis also explores other metaheuristics methods for solving VRPTW, which is used to benchmark the model performance. The result of this thesis is end-to-end deep learning model solving VRPTW but it is still outperformed by metaheuristics solvers.
A novel approaches in the field of machine learning has been proposed to solve the vehicle routing problem, but yet a variant of vehicle routing with soft constrained time windows has received almost no attention. Even though it is a must for any production ready logistics planner. This thesis proposes a new method for solving a vehicle routing problem with soft constrained time windows (VRPTW) using deep reinforcement learning. The model is built upon Transformer architecture utilizing Graph Attention Network for embedding the input instance. The model is using the proposed reward function that incorporates the time window constraint. The thesis also explores other metaheuristics methods for solving VRPTW, which is used to benchmark the model performance. The result of this thesis is end-to-end deep learning model solving VRPTW but it is still outperformed by metaheuristics solvers.