Approximate stochastic annealing for online control of infinite horizon Markov decision processes

Automatica - Tập 48 Số 9 - Trang 2182-2188 - 2012