Modelos de control markovianos: una aplicación de estimación empírica al caso con descuento
DOI:
https://doi.org/10.36788/sah.v1i2.36Resumen
En este trabajo se abordan modelos de control markovianos en tiempo discreto con espacios de estado y de control numerables, con costos acotados y distribución de perturbaciones aleatorias desconocida θ. Asumiendo perturbaciones observables y aplicando la distribución empírica como estimador de θ, el objetivo es construir políticas adaptadas, las cuales son asintóticamente óptimas en costo descontado.Descargas
Citas
Billingsley P. Convergence of Probability Measures; 1a. edic., Editorial John Wiley & Sons, Inc.; New York, U.S.A. (1968).
Dynkin E.B., Yushkevich A.A. Controlled Markov Processes; Springer-Verlag, New York. (1979). DOI: https://doi.org/10.1007/978-1-4615-6746-2
Hernández-Lerma O. Adaptive Markov Control Processes; 2a. edic., Vol. 79. Editorial Springer-Verlag; New York, U.S.A. (1989). DOI: https://doi.org/10.1007/978-1-4419-8714-3
Hilgert N.,Minjárez-Sosa J.A. Adaptive control of stochastic systems with unknown disturbance distribution: discounted criteria; Math. Meth. Oper. Res., 63, 3:443-460 (2006). DOI: https://doi.org/10.1007/s00186-005-0024-6
Leyva-Domínguez J.L. Estimación empírica en modelos de control markovianos descontados; Tesis de Licenciatura (Lic. Matem.), Universidad de Sonora, Departamento de Matemáticas. (2013).
Minjárez-Sosa J.A. Approximation and estimation in Markov control processes under discounted criterion; Kybernetika, 6, 40:681-690. (2004).
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Los artículos publicados por Sahuarus. Revista Electrónica de Matemáticas se distribuye bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivadas 4.0 Internacional, la cual permite la distribución y el uso del material publicado citando la fuente de la que proviene, prohibe la modificación y el uso con fines comerciales.