Este movimiento hacia atrás se mostró en el problema de la diligencia, en el que se encontró la política óptima, en forma sucesiva, comenzando en cada estado de las etapas 4,3,2 y 1, respectivamente. Para todos los problemas de programación dinámica, se obtiene una tabla como la siguiente para cada etapa (n= N, N-1, ....., 1).
Cuando se obtiene esta tabla para la etapa inicial (n=1), el problema queda resuelto. Como se conoce el estado de la etapa inicial, la primera decisión está especificada por x*n en esta tabla. El valor óptimo de las otras variables de decisión queda, a su vez, especificado por las otras tablas de acuerdo con el estado del sistema que resulta una vez tomada la decisión anterior.
No hay comentarios.:
Publicar un comentario