DEbido a la estructura probabílistica, la relación entre fn(sn, xn) y f*s(sn+1) necesariamente es más complicada que apra el caso deterministico. La forma exacta de esta relación dependerá de la forma global de la función objetivo.
Para ilustrar esto, supóngase que el objetivo es minimizar la suma esperada de las contribuciones de las etapas individuales. En este caso, fn(sn,xn) representa la suma esperada mínima de la etapa n en adelante, dado que en la etapa n, el estado es sn y la política de decisión es xn. En consecuencia.
No hay comentarios.:
Publicar un comentario