Debido a la estructura probabílistica, la relación entre fn(sn, xn) y f*2(sn+1) necesariamentees más complicada que para el caso determinístico. La forma exacta de esta relación dependerá de la forma global de la función objetivo.
Para ilustrar esto, supóngase que el objetivo es minimizar la suma esperada de las contribuciones de las etapas individuales. En este caso, fn(sn, xn) representa la suma esperada mínima de la etapa n en adelante, dado que en la etapa n, el estado es sn y la política de decisión es xn. En consecuencia
No hay comentarios.:
Publicar un comentario